高性能和高吞吐量
高通量基因组测序或下一代基因组测序(NGS)受低成本测序的高需求推动。 NGS并行化测序过程,一次生成数千或数百万个序列[1,2]。现在,来自454测序[3],Solexa(Illumina)[4]和Applied BioSystems(SoLiD)[5]的最新NGS测序仪通常可以产生TB级的数据。例如,SoLiD 5500xl一次运行(约7天)可生成4TB数据。由于需要参考基因组存储/访问的额外开销以及要进行的分析类型,因此需要具有成本效益,高性能和高吞吐量的集群和存储来处理这些任务。最终目标是将基因组测序的成本降低到$ 1K以内,周转时间为一周,使个性化基因组学医学变得司空见惯。当前,时间取决于群集基础架构,时间从一周到四周不等,并且成本仍然很高。下图1显示了与人类大小的发电机当前相关的成本结构