|
国家重点研发计划 |
复旦大学疾病研究精准医学知识库构建项目启动 |
|
科学网10月10日上海讯(记者黄辛)今天,记者从复旦大学获悉,国家重点研发计划“精准医学研究”重点项目“疾病研究精准医学知识库构建”日前在该校正式启动。据悉,这个国家重点研发计划将力争在5年后构建出具有标准规范、信息全面、开放共享、用户友好、动态更新等特点的精准医学知识库。该项目将形成“精准医学本体和语义表示标准”“精准医学知识库”和“精准医学知识库管理与共享平台”三大成果,全面支持精准医学基础研究和临床应用,填补国内精准医学知识库领域空白。
据悉,该项目由复旦大学生物医学研究院教授刘雷负责,汇集了包括复旦大学、中国军事医学科学院、中国医学科学院、中国科学院、上海生物信息技术中心等国内长期从事医学知识库构建和生物医学信息公共服务的主要力量。
精准医学是在大样本研究获得疾病分子机制的知识体系基础上,以生物医学数据特别是生命组学数据为依据,根据患者个体在基因型、表型、环境和生活方式等各方面的特异性,应用现代遗传学、分子影像学、生物信息学和临床医学等方法与手段,制定个性化的精准预防、精准诊断和精准治疗方案。因此,精准医学将产生海量数据,而精准医学的应用也将依赖于对数据和信息的深度准确分析。
帮助科研人员从海量信息中高效准确地找到相关的知识开展研究,助力临床医生通过诊断结果精准地判断疾病类型、寻找最佳治疗方案,这样的知识库体系是该项目的研发目标,也是精准医学的关键环节。精准医学知识库建成后,将为科学研究和临床诊断提供多层次的精准医学知识服务,助力发现潜在生物标志物和药物靶标,提高我国医药产业创新力;同时节省购买商业软件的支出,提高国家投入经费的效益,降低我国精准用药和临床应用研究的成本,具有巨大的潜在经济和社会价值。
知识库体系针对精准医学信息数据量庞大、数据类型复杂、资源分布不均衡、利用程度低下、标准不统一等问题,面向全疾病谱,在标准的语义网络下,整合生物医学本体和多类型文本资源,并融合多层次生物信息数据,利用先进的知识发现技术,构建统一的、规范化、机构化、开放共享的、高效准确的、可自动更新的精准医学知识库。并在精准医学大数据平台上建成基于生物医学语义和本体的可实现全文检索、文本识别、关键词分析等功能,集大规模文献整合分析与知识发现于一体,面向用户定制的精准医学研究知识库体系及知识推送系统。
据悉,包括美国NCBI、欧洲EBI在内的国际大型生物信息中心目前都在建设生物医学知识库。一些大型的信息技术公司也开展了生物医学知识库的开发,如在8月正式落地中国的Watson 肿瘤治疗和临床应用系统。国外公司还研发了GeneGo、IPA 和Pathway Studio等专业平台,通过自然语言处理技术从文档中提取信息和知识。它们为生物医学研究和药物开发提供了高效广泛的解决方案,覆盖了从药物发现到新药申请,再到临床试验等生物医学各个方面。但这些商业软件核心数据保密,需要购买使用。而更为重要的是,这些国外组织开发的知识库与我国特有的疾病谱、人群的遗传背景不相适应。
“目前,国内医学知识库建设刚刚起步,主要是基于单一信息源的医学知识库,以及一些自主构建、结构各异的专病知识库。这些知识库还需要在数据完备、标准共享等方面进行完善,与国际接轨。”刘雷表示,为了更好地为中国精准医学提供支撑,亟需构建自主开发的具有我国疾病特征的精准医学知识库。