作者:刁雯蕙 来源:中国科学报 发布时间:2024/8/24 9:29:47
选择字号:
在海量数据中找答案,他们“磨”出一篇Nature

 

415个TB是什么概念?如果每本书的平均大小是1MB,那么415TB的数据量可以存储大约42518400本书,相当于一个小型图书馆的藏书量。

近日,来自华大生命科学研究院、华大基因智惠医学研究院的研究团队与瑞典乌普萨拉大学团队的合作成果发表于《自然》。研究人员对1063例结直肠癌样本进行了全基因组及转录组测序分析,基于产生的415TB的数据中,他们找到了一系列与癌症不同阶段相关的基因,并识别结直肠癌关键预后因子,为结直肠癌的预防、治疗及预后提供了数据基础。据了解,这是目前全球最大的结直肠癌多组学研究。

审稿人在评价中指出,这项研究产生的高质量数据集将成为结直肠癌研究很好的数据资源。

刷新传统认知,破解癌症“密码”

结直肠癌是胃肠道中常见的恶性肿瘤,因早期缺乏特异性症状,因此被称为“沉默的杀手”。了解结直肠癌的基因组学特征和关键预后特征,对癌症的预防、治疗及预后有重要意义。

2018年,刚刚加入华大基因智惠医学研究院不到一年的林从,接到了一个重要任务。来自瑞典乌普萨拉大学的研究团队邀请华大的科研人员共同对瑞典癌症样本与数据库U-CAN队列中的1063例结直肠癌样本开展全基因组和转录组测序分析工作。

过往的基因组研究更多只描绘与癌症息息相关的突变基因,“但这远远不够。”论文共同通讯作者、华大基因智惠医学研究院主任科学家吴逵认为,“我们需要找到真正影响结直肠癌诊疗效果的机制和规律,为临床研究和实践提供更大价值。”为了这个目标,团队整合基因组、转录组、临床信息等多维数据,开启了大数据“挖矿”模式。

一场持续六年的跨国合作由此展开。

这项研究中,研究团队基于华大的测序平台,对结直肠癌样本的全基因组和转录组测序分析中,鉴定出了96个显著突变基因,其中,有24个为新发现的潜在驱动基因。

此外,研究人员还利用突变时序分析,推导出了9个与癌症发生早期事件相关的驱动突变基因,以及更倾向于在癌症发生后期阶段出现的突变基因。这些发现为结直肠癌的早期检测和靶向治疗的开发提供了临床研究策略,并揭示了与肿瘤后期侵袭和转移相关的重要分子变化。

研究团队将结直肠癌预后分为了5个预后亚型CRPS,与结直肠癌经典的共识分子分型CMS相比,CRPS能更加准确地预测结直肠癌的预后。

“肿瘤预后是对疾病将来的发展情况,包括痊愈、复发、恶化等情况的预测。传统的结直肠癌预后分型的认知中,CMS4类的分型被普遍认为是预后较差的肿瘤,但我们研究发现,这一分型实际上是预后较好的一类,在一定程度上刷新了传统的认知。”论文共同通讯作者、华大基因智惠医学研究院专项科学家林从说道。

这些结果提示,整合基因组和转录组数据的分子分型,能得到更精准的患者预后分层,对优化临床肿瘤分型,指导结直肠癌精准治疗具有重要意义。

值得一提的是,本次分析的结直肠癌样本中,94%的病人有完整的5年临床随访记录,这为研究人员更好地将基因数据与临床数据进行结合,破解“癌症密码”提供了可能。

论文共同通讯作者、乌普萨拉大学教授Tobias Sj?blom表示,这项研究实现了迄今为止最大规模的结直肠癌基因组和转录组的综合分析,并将分子层面的发现与高质量的临床数据相结合,从而识别关键预后因子,这是该项研究有别于其他绝大多数癌症基因组学的研究。

一步一脚印,“挤”出一个顶刊

对癌症样本组织同时开展全基因组和转录组测序,意味着技术难度和数据处理量会急剧上升,海量数据的存储、处理和分析是巨大的挑战。林从回忆,整个研究历经六年,最困难的便是处理对癌症病人样本测序后产生的海量数据,整整达到415个TB。

“把海量的数据进行分析、优化研究结论,再到写成文章,这是一个‘挤压式’的过程。对于这个研究项目,每一位团队成员都是全身心投入,看文献、数据总结、推导论证是每天的必修课。”林从说道。

跨国合作常常要兼顾时差等因素,但这并没有影响合作团队之间的学术交流,从接收样本、测序、数据分析,再到瑞典团队进行实验室验证,研究结果讨论,林从团队与瑞典的团队几乎保持两周一次学术讨论的频率。

华大研究团队(左起:李甫强、罗甜、林从、吴逵、吴美珍)受访者供图

  ?

2023年4月,当研究团队第一次将研究成果向《自然》投稿后,不到两个月的时间便收到了编辑的反馈——一封附加了长长的修改意见的邮件。

“编辑一开始没有给我们明确可以被接收的答复,而是让我们先修改,才有被接收的可能性。”林从回忆道,对审稿人的建议,研究团队花了整整53页文档进行回复,同时对论文进行打磨和修改。

“已经不记得更新了多少个版本的稿件了,我的电脑里大概有10个文件夹,每个里面都会有一两个‘final version’。”林从笑着说,庆幸的是,与编辑和审稿人的意见碰撞,让这篇研究成果变得越来越完善。

直到7月1日,研究团队收到期刊编辑发来的第三封邮件,终于确认论文被正式接收。“这一刻,我们所有的努力终于得到了认可。”论文共同第一作者、乌普萨拉大学博士Luis Nunes激动地表示。

坚信合作的力量

2017年底,林从结束在荷兰莱顿大学医学中心的博士后研究工作,正式加入华大基因智惠医学研究院。不到一年的时间,便开始与瑞典的团队开启结直肠癌基因组和转录组测序的合作项目。

林从 受访者供图

  ?

作为“职场新人”,林从感到既兴奋又倍感压力。一方面,自己还没独立负责过国际合作的大型研究项目;另一方面,尽管国际和国内都有关于结直肠癌的数据分析,但大部分仅为单基因组测序,同时进行全基因组和转录组测序的工作还较少。

“如果能从这项研究中得到一些共性结论,那么对国内的结直肠癌数据样本库和科研方法的构建将会有更好的借鉴思路。”林从介绍。

项目开展的第一步便是组建团队,林从深知,面对如此大规模的项目,需要一位经验丰富、能熟练操作各类分析程序的专业人士来承担繁重的分析任务。为此,论文共同第一作者李甫强加入了项目组,担任数据分析方向的总负责人。此外,项目组成员罗甜、吴美珍则负责样本管理和数据下游分析,确保实验背景与数据分析紧密结合。

“我和另一位论文共同通讯作者吴逵,则负责重要决策制定,以及与合作方沟通协调。”林从介绍。

这是林从第一次作为通讯作者在顶刊发表研究,她深刻地感受到,完成一项研究任务的背后,团队的力量至关重要,“团队合作与个人努力不同,它要求成员间的高度协作与默契。能够组建并维持一个高效协作的团队,本身就是科研成功的一大步。另外,科研人还需具备扎实的专业素养和不懈努力的精神,这些都是通往成功的必经之路。”

谈及下一步计划,林从介绍,这项研究不仅发现多种突变事件对预后的显著预测效应,新构建的表达谱精细分型也将在未来指导结直肠癌个体化诊疗中发挥重要作用。期望未来能更加系统深入地解析不同肿瘤的发生发展机制。

相关论文信息:https://www.nature.com/articles/s41586-024-07769-3

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
征集|2024基金放榜!你杀出重围了吗 1吨月壤可产50人1天饮水
肉眼可见!JUICE将飞越地球和月球 航迹云带来更多气候变暖
>>更多
 
一周新闻排行
 
编辑部推荐博文