生命科学 医学科学 化学科学 工程材料 信息科学 地球科学 数理科学 管理综合
 
作者:龙九尊 来源:科学时报 发布时间:2010-9-26 20:37:37
生物质谱谱图数据库支撑蛋白质组学研究

 
□龙九尊
 
蛋白质组学是当代生物医学的最前沿和主要推动力之一。高精度、高分辨率生物质谱技术的发展,对系统化地揭示和理解蛋白质及其在细胞中的作用提供了有力支持。海量的蛋白质组谱图数据被采集,并被全球不同的课题组分析和存储。
 
浙江大学生物医学工程及仪器科学学院院长段会龙教授在日前召开的一次医疗器械论坛会上介绍了这一领域的进展。
 
段会龙说,目前的蛋白质组质谱研究依赖于蛋白质序列数据库和检索引擎产生的理论谱图。蛋白质序列数据库是由基因组系列数据基于现有理论的衍生;检索引擎再基于蛋白质序列,以及内切酶、翻译后修饰产生可能的肽段,衍生出其理论图谱。
 
“理论图谱的应用在对蛋白质组学的发展起到积极作用的同时,也限制了其推广。” 段会龙说,限制主要体现在三个方面。
 
一是理论衍生的数据难以兼顾特异性、准确性与全面性,由于引入大量的冗余计算,使得数据通常受限,并要求应用高性能集成式计算中心。
 
二是实验谱图的信息组织是三维的,包括信号出现的时间,荷质比以及强度;在理论图谱中这些多维信息被简化为一维,降低了分析的特异性,使假阳性和假阴性匹配难以避免。
 
三是理论谱图局限于肽段裂解信息,不包括其他相关的分析或生理特性,将不同课题组的研究割裂开,降低了蛋白质组学研究的可移植性和借鉴性。
 
段会龙介绍说,建立蛋白质组谱图数据库是当前建立在理论谱图基础上的蛋白质组学的重要发展,能显著提高海量数据的分析效率,降低应用生物质谱技术的门槛。蛋白质谱图数据不仅提供一系列的工具和数据集,还有效地整合大量孤立的谱图资源。基于模块化的设计,蛋白质谱图将组织为多个特异谱图数据组的集合。通过开放的交互式界面,广大生物医学学者也能参与数据的注释和校正,为蛋白质组学、生物学、临床研究者提供丰富全面的知识库,从而有机地将蛋白组学最新成果与生物医学的革新联系在一起。
 
段会龙说,他们的研究面向并服务于全世界心脏研究群体,共享蛋白组谱图数据集,提供实验质谱的检索、分析工具集,建立交互式数据交流平台。研究和构建专有的、全面的心血管蛋白质组生物医学数据库/知识库;在蛋白质组数据集成和分析,谱图数据识别和检索、蛋白质组生物医学数据库体系构建、共享上实现突破。目前,他们已完成的三项主要的工作:
 
心血管蛋白质组数据体系结构:构建了以蛋白质组信息为主体的数据库体系结构,以心脏线粒体蛋白质组为基础建立了核心数据集,该数据集包括了1663种心脏线粒体蛋白质以及与之相对应的2.7万多个生物质谱谱图。
 
心血管蛋白质组数据库搜索引擎:初步建立了数据搜索引擎,可通过蛋白、肽段序列等信息对相应的生物质谱谱图进行检索,实现了与欧洲生物信息学研究所(EBI)的IPI蛋白质数据库间的数据关联。
 
心血管生物医学数据库平台:研究并开发了相应的数据库网络公共平台(http://coblip.org)。该网络平台的首个正式版本将在2010年末面向全世界发布,通过对心血管生物医学数据信息和资源的实时共享,服务于全世界心血管研究群体。
 
《科学时报》 (2010-9-27 B4 企业·合作)
发E-mail给: 
    
| 打印 | 评论 | 论坛 | 博客 |

小字号

中字号

大字号