进入四月,一批早熟棉将被陆续播种在新疆广袤的棉田中。早熟棉“中棉113”的生长周期不到4个月,而破解其基因密码,需要整整四年。
近日,中国农业科学院棉花研究所研究员马雄风团队成功构建了陆地棉主栽品种“中棉113”的端粒到端粒基因组图谱,并利用该基因组揭示了陆地棉的着丝粒演化和短季适应性遗传基础,为新疆棉业突破“早熟低产”困境、开启“设计育种”时代提供了关键钥匙。相关研究成果发表于《自然—遗传》(Nature Genetics)。
中棉113。中棉所供图
?
在中国工程院院士、中国农业科学院研究员万建民看来,该研究首次绘制了陆地棉端粒到端粒完整基因组图谱,填补了复杂重复区域的高精度序列空白,为目标性状遗传解析奠定了“精准坐标”。
中国工程院院士、华中农业大学教授张献龙指出,这项研究的一个重要创新发现是陆地棉谱系特异的D08着丝粒重定位到卫星重复区域的现象,改变了棉花着丝粒仅以转座子为主的传统认知,为后续棉花着丝粒多态性以及可能功能关联研究提供了新方向。
挑选优异性状突出的新品种作为“底盘”
“我们现在以育种为目标,想要去解析棉花优异性状的遗传机制,那么找到一个特定的、更新的资源材料,才是实现研究目标的最佳路径。”论文通讯作者马雄风告诉《中国科学报》,对“中棉113”的选择,大有讲究。
马雄风介绍,以新疆为主的西北内陆棉区作为我国棉花生产的战略核心,其冷凉干旱的生态条件对品种早熟性提出了迫切需求。然而,传统早熟棉品种普遍面临“早熟低产”困境,早熟和高产两个性状协同提升难度很大,是制约新疆棉花生产的瓶颈。
为此,研究团队创新棉花早熟育种策略,通过分子聚合育种技术,育成早熟、优质、高衣分、高产新品种“中棉113”,实现了多个性状的协同改良,特别符合新疆棉花生产的品种需求。
2019年,“中棉113”推出后,迅速得到广泛推广和应用。2022年至2024年连续3年入选农业农村部主导品种。
收获期的中棉113。中棉所供图
?
“有了‘中棉113’这样的优良早熟品种作为‘底盘’,育种工作者就能够进一步对其它迫切需要的生产性状进行改良。”马雄风说,比如让株型更适应高密度种植,同时减少荫蔽问题来提升光能利用率和机械化采收通过性;让棉铃吐絮更集中、叶片同步脱落,来降低机采籽棉杂质含量,以及提高脱叶剂使用效率等。
马雄风强调,育种是一个不断迭代更新、优中选优的动态过程。正因为“中棉113”是一个优异性状突出的新品种,和以往其它品种资源存在较大差异,进行参考基因组的组装才更加有意义和参考价值,才能为深入研究棉花遗传多样性、对目标性状进行遗传解析提供关键材料,为创新发现提供更大的空间和可能。“中棉113”作为深化品种改良选育的底盘品种,其基因组的参考价值面向未来长期育种实践的需要,将会被不断放大。
借助多项先进技术,他们完成了“中棉113”从端粒到端粒基因组的组装,实现了前所未有的基因组连续性和完整性。据了解,这是棉属物种中第一个作为现代生产品种的高质量组装,为陆地棉基因组研究提供了更为精确的参考。
高质量组装“放大”基因组细节
“高质量组装带来的惊喜是令人振奋的。”论文第一作者、中棉所研究员胡冠菁解释道,端粒到端粒(T2T)参考基因组组装,可定义为能够无缺口地覆盖所有染色体,包括对复杂的着丝粒、端粒、核糖体DNA区这些复杂“黑洞”区域的完整解析。
陆地棉是异源四倍体物种,基因组中含有A型和D型两个亚基因组,各有13对染色体,总计52条(2n=4x=52)。因为栽培棉花经历了长期的自交纯化,一对染色体之间的序列一致性很高,所以参考基因组组装出26条染色体。
胡冠菁介绍,在水稻、玉米等多种植物中,着丝粒主要由卫星重复序列组成,这是一类短而重复的DNA序列。而陆地棉的着丝粒比较特殊,主要由反转录转座子构成,这是一种可以自我复制并插入到基因组不同位置的DNA序列。
中棉113复播示范现场会。中棉所供图
?
但是,当团队获得了高质量的基因组后却意外地发现,在陆地棉全部26条染色体中,D08这条染色体着丝粒并不是反转录转座子,而是和大多数植物一样由卫星重复序列组成——由重复元件以典型的高阶重复结构排布。
结合与其它近缘四倍体棉种的比较分析,团队最终确定其它棉种中依然存在常规的反转座子D08着丝粒,唯独陆地棉中发生了原本着丝粒的失活,并形成了新的重复序列着丝粒。
“实际上,最近陆地棉标准系TM-1的基因组研究也发现了D08着丝粒所在的位置,确认该位移事件发生于异源四倍化后。而我们的研究对该位移发生时间的尺度测量要更加精细,明确是在陆地棉从其他棉种中分化后发生的。高质量组装就像放大镜,让我们看清楚基因组里的更多细节。”胡冠菁说。
“这个现象在棉花中是首次被发现,在其它物种中也极少有两类不同类型着丝粒共存和相互动态变化的报道,可以说为着丝粒的起源、演化提供了新的研究视角。”马雄风说。
“超级基因”区段有望实现设计型品种快速创制
该研究的另一个创新发现,是锁定陆地棉D03染色体上一段长达11Mb的早熟关键区段,并揭示其独特的着丝粒横跨+染色体倒位双重复合结构。
胡冠菁解释,在遗传学研究中,主效位点通常指的是那些能够解释大量表型变异的基因或染色体区域。而这一次他们发现的调控棉花早熟的主效位点很大。
在D03染色体上的这个大型倒位区段的出现,能够追溯到陆地棉的早期驯化过程中的半野生地方品种,后续进一步发生变异并受到人工选择推动早熟性状的形成。
她说,这个区域中的大量基因,包括许多与开花相关基因,互相连锁着固定下来,能够以“超级基因”的形式整体遗传。传统的遗传学方法之所以无法将陆地棉的早熟“超级基因”拆开,是因为出现了倒位结构变异——区段序列倒置,使得其中所有基因被“打包”遗传、高度连锁。
“这个超级基因区域是深入研究早熟性分子遗传机制的重要资源。”胡冠菁说。
此外,棉花的一条纤维即为一个完整细胞,在整个植物界乃至生物界都是相当大型的单细胞结构。而棉纤维性状的改变,关系到整个细胞的生长,也就是说基本上所有基因都会参与到纤维性状改变的过程中,如同动用整个宇宙的“洪荒之力”一般。
“所以很难找到个别功能特别突出的基因,能够让棉花纤维一下子变得特别长,或特别坚韧,这是它的复杂性所在。”胡冠菁说,后续将进行的早熟与纤维性状的协同改良研究至关重要。
张献龙表示,该研究充分阐释了半野生棉来源的早熟单倍型在驯化中的稳定传递机制,丰富了棉花基因组结构的认知,并为早熟分子设计育种提供了精准坐标。
万建民强调,从功能基因研究视角看,棉花D03染色体区段内的基因资源发掘具有深远意义,需要通过进一步分子网络解析突破传统遗传定位瓶颈。同时,超级基因架构为分子设计育种提供了天然模块化工具——通过定向编辑该区段,有望实现早熟、高产与高衣分的“一因多效”协同改良。建议利用基因组编辑技术定向优化超级基因区段,实现“设计型品种”的快速创制。
相关论文信息:https://doi.org/10.1038/s41588-025-02130-4
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。