作者:李晨,马昕怡 来源:中国科学报 发布时间:2026/6/20 8:05:34
选择字号:
绕过比对迷宫:拨开多倍体作物“遗传迷雾”

 

如果把基因组比作一张拼图,那么多倍体则拥有多张高度相似的拼图。从打散的拼图碎片中找到自己需要的那块,并不是一件容易的事。

6月12日,中国农业科学院深圳基因组研究所(大鹏湾实验室)研究员张兴坦团队在《自然—遗传学》上在线发表研究论文,通过开发多倍体基因组关联分析新方法KMERIA,绕过了传统序列比对和变异检测,直接利用k-mer拷贝数捕捉多倍体剂量效应,攻克了多倍体复杂基因组关联分析的难题。

该研究不仅为多倍体作物重要农艺性状的深度解析打开了全新大门,也为小麦、甘蔗、甘薯等大宗作物的精准设计育种提供了强有力的底层算法与分子工具,将大幅加速优良品种培育进程。

多倍体作物的“遗传迷雾”

多倍性是约75%栽培作物的基因组基本特征。小麦、马铃薯、棉花、甘蔗……这些支撑全球农业的骨干作物绝大多数为多倍体。多倍体赋予了它们更强的生长势、更高的产量以及更强的适应性,但同时也给遗传育种学家出了一道难题。

传统的统计遗传方法(GWAS)依赖于将测序片段与参考基因组进行比对鉴定得到的基因型信息。论文通讯作者、基因组所(大鹏湾实验室)研究员张兴坦告诉《中国科学报》,全基因组关联分析传统的方法是将碎片逐个与参考序列进行对比,从而确定每个碎片在拼图上的位置。对于只拥有一张拼图的单倍体,这种方法虽然繁琐,但能成功拼完。然而在面对多倍体时,这套方法显得“力不从心”。

在多倍体中,同源染色体高度相似,测序短片段常常会比对到多个错位地点,导致变异检测错误百出。张兴坦说,由于多倍体拥有多幅几乎一模一样的拼图,打散后的碎片混在一起,根本分不清哪块来自哪一幅。利用传统方法不仅容易拼错位置,更无法精准统计同一块拼图重复出现的次数,就像是走进了错综复杂的比对“迷宫”,不仅容易出错,还会消耗大量的算力。

论文共同第一作者、基因组所(大鹏湾实验室)博士后陈帅介绍,尤其是“剂量效应”难以捕捉,不同于二倍体的“有或无”,多倍体在同一个等位基因位点可能存在2个、3个或更多个同源拷贝,这种剂量对作物性状影响至关重要,传统方法对此无法准确捕捉。

结果是,大量与品质、抗性相关的基因被隐藏在“遗传迷雾”中。尽管多倍体作物在农业生产中举足轻重,其产量、品质和抗逆性状的遗传解析却长期滞后于二倍体模式植物。

面对多倍体分析难题,张兴坦团队决定绕过对比“迷宫”,提出一种不依赖参考序列比对的多倍体GWAS研究新方法,并在二倍体水稻、四倍体苜蓿、六倍体甘薯、多倍体栽培甘蔗上进行验证。

跳过迷宫,直奔终点

张兴坦团队开发了KMERIA,一种专门针对多倍体基因组设计的k-mer GWAS框架。KMERIA摒弃了传统基于序列比对的基因型鉴定思路,而是直接从原始测序数据中提取全基因组k-mer,通过“数k-mer”来直接反映等位基因剂量,并进行基因组关联分析。论文共同第一作者、云南省农科院研究员刘新龙介绍,KMERIA的流程包含五个步骤。

第一步k-mer计数,对所有样本的原始测序数据进行质控和修剪,然后将整个基因组序列打碎成固定长度的序列片段(k-mer),统计每种k-mer出现的频次。

第二步矩阵构建,将所有个体、所有种类的k-mer频次汇总,构建出一个庞大的k-mer原始丰度矩阵。

第三步矩阵修剪,对原始丰度矩阵进行测序深度矫正,过滤异常深度的k-mer,剔除低频罕见k-mer,并将其标准化为连续性等位基因剂量矩阵。

第四步关联测试,结合混合线性模型,将标准化后的k-mer作为基因型分子标记,进行全基因组关联分析(GWAS)。

第五步定位回归,将通过显著性检验的显著关联的k-mer,在图基因组或线性基因组中确定基因组坐标。

“通俗的说,虽然我们一开始跳过了‘迷宫’,但赢得比赛后,我们还得知道奖品在哪。KMERIA把那些‘功臣k-mer’在基因组地图中对号入座,找到决定表型差异的基因在基因组的具体位置。”张兴坦说。

破解多倍体复杂基因组遗传分析难题

KMERIA不仅在模拟数据上表现优异,在真实作物群体中也展现出了通用性。

他们在二倍体水稻中成功复现了控制直链淀粉含量的关键基因Waxy,其检测信号尤为显著。在四倍体苜蓿中首次鉴定了2个调控苜蓿植株形态的新基因。在四倍体马铃薯中不仅精准定位到成熟期基因,还挖掘出5个与马铃薯果皮颜色与果肉颜色相关的基因位点。在六倍体甘薯中重新鉴定到经典叶形调控基因IbFbox,并锁定新基因IbCUC3。而在栽培甘蔗中,面对这一传统变异检测完全失效的极端复杂基因组,传统GWAS方法几乎全军覆没,KMERIA成功定位出多个调控分蘖角度、株高和分蘖数等性状的关键基因。

为了进一步检验KMERIA在实际育种中的应用潜力,研究团队将KMERIA应用到野生甘蔗——割手密上。割手密是一种倍性跨度从4倍体到16倍体不等的基因组极其复杂的植物。该团队通过KMERIA成功锁定了割手密两大农艺性状的关联基因位点。

割手密6号染色体上检测到一个与蔗糖简纯度强关联的信号,对应镁转运蛋白基因。它抑制了镁离子的转运效率,从而负调控蔗糖的积累。这一发现为高糖甘蔗育种提供了关键分子标记。

另外,KMERIA定位到了调控甘蔗分蘖的核心基因SsNGA5。通过水稻异源过表达验证后,水稻的分蘖数显著下降了30.6%,证实了其生物学功能。此外,还挖掘到多个分蘖调控新基因。

“通过直接将序列特征与等位基因剂量结合,KMERIA让多倍体‘丢失的遗传力’有了被重新发现的可能。”张兴坦说,结合日渐成熟的图泛基因组技术,有望找到那些长期隐藏在非参考基因组区域的复杂变异。多倍体算法工具的不断创新有望加速小麦、甘蔗、马铃薯等多倍体作物分子育种从“经验育种”向“精准设计育种”跨越。

相关论文信息:https://doi.org/10.1038/s41588-026-02641-8

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
我国攻克硅基量子芯片关键材料 《自然》(20260611出版)一周论文导读
研究揭示链霉菌调控香蕉抗枯萎病分子机制 量子自旋液体存在“自旋子”首获实验证据
>>更多
 
一周新闻排行
 
编辑部推荐博文