作者:黄辛 来源:中国科学报 发布时间:2021/8/30 16:00:09
选择字号:
“华表”数据库助力罕见病精准诊疗

 

日前,《遗传学和基因组学杂志》在线发表了中国科学院院士、复旦大学教授金力团队的研究。该研究对来自中国华北地区的河南郑州、华东的江苏泰州、华南的广西南宁3个代表性汉族群体的5000名个体进行了基因组全外显子测序,初步构建了“华表”中国外显子组数据库(以下简称“华表”数据库)。“华表”数据库共包含207万个遗传变异,其中46.4%的遗传变异为该研究首次发现。

人类的健康问题受基因组遗传变异影响。这种遗传变异不仅仅因人而异,也因“人群”而异。近年来,各国纷纷启动面向本国、本地区的基因组测序计划,以发现本土人群特有的基因组变异,从而建立更加精准的参考基因组,服务于健康和医学领域。

随着新一代基因组测序技术的快速发展与成熟,基因组水平对人群样本进行大规模测序并系统揭示人群的精细遗传结构成为可能。与全基因组测序相比,新一代覆盖基因组编码区的全外显子组测序技术成本大幅降低。可在高测序深度情况下,更准确检测出临床致病的罕见变异位点。

据了解,外显子是真核生物基因的一部分,负责编码蛋白质;外显子组是基因组的蛋白质编码区域的集合。目前,国际上建立ExAC、gnomAD等多个大型公共全外显子数据库。但这些数据库的样本大多由高加索、非洲裔美国人或拉丁美洲人组成,中国汉族样本数量有限。

2017年9月,复旦大学现代人类学教育部重点实验室联合有关机构发起“华表计划”——中国全外显子组数据库项目,该项目是自主建设的中国人群公共数据库之一。作为“华表计划”的主要科学设计者,金力表示,“华表计划”第一阶段的建设目标是通过对覆盖全国、有代表性的汉族人群样本进行高质量测序,系统解析外显子区域等位基因频率,精细刻画中国汉族人群遗传结构,形成我国自主建设的中国人群基因组数据库。同时,在遵循国家人类遗传资源管理有关规定的前提下,探索推动包括基因组数据在内的各类生物医学数据的保藏与共享,为下一步的精准医学研究提供参考数据集。

经过近4年的不懈努力,复旦大学团队联合艾吉泰康采用全外显子捕获芯片技术,完成了对5000例中国汉族个体的全外显子捕获和测序,构建起“华表”数据库,完成了“华表计划”第一阶段目标。

值得一提的是,为获得高质量遗传变异信息,复旦团队在“华表计划”科研过程中,一方面始终将保证高质量原始测序数据和对测序区域的高深度覆盖放在首要位置,另一方面对得到的遗传变异信息进行多方面验证。华表数据库中的样本均与由复旦大学人类表型组研究院教授石乐明团队原创研发的“中华家系一号”生物标准物质进行了比较验证,结果显示“华表”标准品遗传数据SNP精度达到99%。同时,科研人员还将“华表”样本与同样本另一种技术路线——全基因组芯片数据进行比较,结果显示一致率达到99.8%。而“华表”数据库与gnomAD中共有遗传位点比较,两者频率高度一致。上述结果均证明“华表”数据库变异数据具有高质量和高准确性。

论文通讯作者之一、复旦大学人类遗传学与人类学系主任王久存介绍,全外显子组数据库等人群数据库对生物医学界开展罕见病具有重大意义。罕见病是指仅在极少数人身上发生、人群患病率小于万分之一的稀罕病症。统计表明,超七成罕见病是遗传性疾病,许多罕见病在患者生命早期发病,例如地中海贫血、成骨不全症等。“华表”数据库提供了中国汉族人群的低频位点频率信息,能够帮助研究人员区分罕见致病突变和高频良性变异,从而为进一步精准识别和分析中国人所患罕见病的致病分子机制、遗传机理以及基于此的罕见病精准诊疗方案提供科学基础。

详情可以通过布设在中国生物医学大数据中心(上海)网站下的数据库子站(https://www.biosino.org/wepd)快速检索相关遗传变异的频率信息。

相关论文信息:https://doi.org/10.1016/j.jgg.2021.07.013

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
变暖加速喜马拉雅高山树线向高海拔扩张 “双星合璧”制造人工日食
研究或摆脱光子时间晶体对高功率调制依赖 问答之间 | 如何开展科研之路
>>更多
 
一周新闻排行
 
编辑部推荐博文