生物技术进展 ›› 2012, Vol. 2 ›› Issue (1): 52-56.DOI: 10.3969/j.issn.2095-2341.2012.01.10

• 技术与方法 • 上一篇    下一篇

基于高通量RNA测序数据分析的弹性云平台

吴一雷1, 闫鹏程1,刘充1,陈禹保1,赵文明2   

  1. 1.北京市科学技术研究院, 北京市计算中心, 北京 100012;
    2.中国科学院, 北京基因组研究所, 北京 100029
  • 收稿日期:2011-12-19 出版日期:2012-01-25 发布日期:2012-01-10
  • 通讯作者: 吴一雷,研究员,博士,主要从事人工智能、数据分析系统开发研究。E-mail:whyl@bcc.ac.cn
  • 作者简介:吴一雷,研究员,博士,主要从事人工智能、数据分析系统开发研究。E-mail:whyl@bcc.ac.cn

RAN-seq Data Analysis Platform on basis of Elastic Cloud Computing

WU Yi-lei, YAN Peng-cheng, LIU Chong, CHEN Yu-bao, ZHAO Wen-ming   

  1. 1.Beijing Computing Center, Beijing Academy of Science and Technology, Beijing 100012, China;
    2.Beijing Institute of Genomics, Chinese Academy of Sciences, Beijing 100029, China
  • Received:2011-12-19 Online:2012-01-25 Published:2012-01-10

摘要: 高通量RNA测序(RNA-seq)技术为研究人员提供了海量数据,如何对这些数据进行快速有效的分析,并为后续转录组、基因表达等研究提供支持,是生物信息学领域的热点方向。本文讨论了当前RNA-seq数据分析的发展水平和常用软件、算法,并设计了一系列数据处理模块和分析流程。同时,为了给用户提供更好的使用环境,我们设计了基于弹性资源管理系统的生物云平台BioCloud。该平台集成了丰富的软件,采用高灵活度、高扩展性的体系架构,在给用户提供低成本、高性能计算服务的同时,还提供个性化的流程定制服务。

关键词: 高通量测序, 转录组分析, 弹性云平台, 基因组数据库, 分布式系统

Abstract: Next generation sequencing technology is bringing huge amount of data to bioinformatics investigators. How to process these data effectively and timely, becomes a hot topic due to its importance to subsequent researches, such as transcriptome study, gene expression study etc. This paper discusses the state of the art of RNA sequencing data analysis, and discloses a data analysis service platform on top of that, which is built on elastic cloud computing technology. The platform integrates abundant software, employs high availability, high security design, provides both cost effective and high performance computing services to end users.

Key words: next generation sequencing, elastic cloud computing, genome database, distributed system