计算所创新课题
 
生物信息专用系统

课题负责人:张佩珩
起止时间:2002年5月—2003年5月

  人类基因组测序工作完成后,对基因数据的处理和分析能力提出了更高的要求。基因组学算法的特点是数据量较大、算法相对简单、并行度较高、运算类型单一、重复性较强。用现有的大规模并行机或超级服务器解决这一问题,既浪费系统的资源,使用维护方面也比较复杂。

  本项目的目的是研究基因联配算法、蛋白质折叠算法等的硬件实现技术,研究专用数据处理硬件系统的设计技术,实验通用CPU、DSP和专用FPGA技术路线,对Blast核心算法进一步分析使之适合硬件的大规模并行处理。研制Blast专用Cluster系统,以相对较低的硬件成本(1/3)达到千亿次系统的处理能力,以实现专用、高效、经济的生物信息专用系统。

研究内容:

  探索采用专用系统处理生物信息学问题的可行性,探索采用通用CPU、DSP和FPGA等技术路线实现生物信息专用系统的可行性。以生物信息处理中处理基因数据,功能基因组分析,蛋白功能分析需要的大规模数据处理为应用目标,从算法,专用体系结构,专用芯片设计,存储系统设计,快速数据传递(系统内、系统间)等几方面研究关键技术,充分利用现有的曙光超级服务器上所采用的成熟的cluster技术,探索将曙光4000L系统(x86+Linux Cluster)精简化、微型化的技术路线,以解决这类数据密集型问题。在上述研究的基础上,研究对Blast等算法进行分析改进使之适合硬件的大规模并行处理的方法,研制Blast专用Cluster系统,通过上述研究,为实现大规模的生物信息专用系统奠定理论和实践基础。

 

   
     

Copyright for NCIC All Rights Reserved
本网站版权归国家智能计算机研究开发中心所有