▲草棉基因组(A1)、亚洲棉基因组(A2)和陆地棉A亚基因组(At1)
▲棉花A基因组起源与进化模型 武汉大学高等研究院供图
■本报见习记者 韩扬眉
我国是全球最大的棉花生产国,年均棉花产量占全球产量的24.4%,单产高于全球平均水平一倍。与此同时,我国也是全球最大的棉花进口国之一,且近年来进口量愈发增大。
“随着人们生活水平和品质的提高,对高品质棉纺织品的需求量也越来越大,但与国外相比,我国棉花的品质还不够好。因此,提高棉花品质,是我国棉花研究中非常重要的课题。”中国科学院院士、武汉大学高等研究院院长朱玉贤告诉《中国科学报》。
近日,朱玉贤团队解析了世界上首个高精度的草棉参考基因组,解决了困扰已久的棉花A基因组进化起源问题,为棉花遗传改良提供了宝贵的基因组资源,将加快培育高产优质棉花新品种的进程。相关研究成果发表于《自然—遗传学》。
棉花起源之争
棉纤维长度是判断棉花品质的重要指标之一,纤维越长,品质越好。朱玉贤指出,我国生产的棉花纤维平均长度在3厘米以下,而北美产的棉花平均长度则在3厘米以上。
短短数毫米之差,会带来很大影响。在纺织品中,必须有1/3以上的棉花纤维长度大于30毫米,否则纤维之间的接头太多,生产出来的棉布品质会很差。
破解棉纤维生长之谜,还要从棉花的起源与进化历史谈起。
棉花共有四个栽培种,其中经济价值较高的是两个四倍体栽培种——陆地棉和海岛棉,它们是由A基因组和D基因组共同组成的异源四倍体AD基因组,AD基因组是由D基因组和A基因组通过自然杂交和染色体加倍而形成。已有研究表明,全球皮棉产量约95%以上来源于异源四倍体陆地棉(AD1基因组)。
华中农业大学教授张献龙告诉《中国科学报》,从起源分布来看,A基因组二倍体棉花主要分布在亚洲和非洲,D基因组棉花主要分布在美洲,而野生异源四倍体棉花是在美洲发现的。但A和D两个基因组的祖先种如何结合形成四倍体是棉花研究中一直未阐明的问题。学界一直有着单系起源和多系起源之争。
此外,A基因组只有1.3~1.5厘米的纤维长度,D基因组仅有像蒲公英一样0.3厘米的绒毛。“这很有趣,两个‘祖先’中都没有棉纤维,组成四倍体以后怎么就产生了3厘米以上的棉纤维呢?控制棉纤维生长发育的基因是如何进化的?”朱玉贤说。
草棉(A1基因组)和亚洲棉(A2基因组)为现在仅存的两个二倍体A基因组,历史上为重要的栽培棉。朱玉贤希望从二倍体“祖先”中找到解锁陆地棉棉纤维基因的“钥匙”。
过去大量研究已形成共识,即在陆地棉中,D亚基因组供体是雷蒙德氏棉(D5基因组),但A亚基因组的供体则是未解之谜,长期处在争论之中。
“A1、A2在异源四倍体棉花中有哪些差别、它们与棉纤维的生长发育有怎样的关系、决定棉纤维的基因群究竟是哪个?这些是我们想研究清楚的。”朱玉贤说。
找到“祖先”之一
此前,朱玉贤团队便解析了亚洲棉基因组。2019年,朱玉贤开始组织团队解析亚洲草棉基因组。
经过一年的努力,研究人员利用PacBio长片段测序技术和染色质高级结构捕获技术(Hi-C)解析了世界上首个高精度的草棉参考基因组,并对陆地棉和亚洲棉基因组进行质量升级。升级后基因组在准确性和完成度等方面具有明显提高,填补了大量基因组漏洞,可作为参考基因组。
接着,研究人员通过构建物种系统发育树发现,A亚基因组的供体可能来源于A1和A2的共同祖先A0。
“为了进一步证实这个猜想,我们对棉花基因组最大的组分转座子进行了系统分析。我们从根本上革新了棉花转座子的遗传演化算法。区别于以往的算法,我们将棉花基因组中完整的和碎片化的转座子全部扫描出来,发现棉花转座子不同批次的爆发事件。”论文第一作者、武汉大学生命科学学院副教授吴志国告诉《中国科学报》。
“在以往研究中,基因组最大的组分转座子被称为‘垃圾DNA’或者‘暗物质’,源于其巨大的重复数量以及随机的碱基替换事件。”吴志国进一步解释,此研究中革新的转座子遗传演化算法完美匹配了其巨大数量和随机性等特征,使植物基因组的完整系统分析成为了可能。
随后,研究进一步证实了陆地棉At、草棉A1、亚洲棉A2来源于共同祖先A0。
从进化关系上看,A1基因组比A2基因组更接近于A0。研究揭示出,A0与D5基因组雷蒙德氏棉大约在160万年前形成异源四倍体,随后,A0基因组在大约70万年前分化形成现存的A1和A2基因组。
“我们阐明了亚洲棉与草棉独立起源的问题,即亚洲棉不起源于草棉,而是与草棉同时起源于A0,并独立驯化。”吴志国说。
值得一提的是,该研究还发现位于基因区附近的变异位点改变了重要基因的表达,可能最终导致了四倍体陆地棉相较于二倍体棉在纤维品质等性状上有明显的改良与提升。
优质棉花未来可期
“该研究发现,现存的非洲棉和亚洲棉可能都不是陆地棉A亚组的供体种,而真实的供体种可能已经不存在,这是棉花基因组进化方面的一大创新性结论。此外,非洲棉和亚洲棉是在陆地棉形成之后才独立分化出来,二者没有祖先与后代的关系。这厘清了长期关于陆地棉A亚组供体种的争论,也是本研究最显著的科学价值。”张献龙说。
事实上,自2011年起,朱玉贤受中国工程院院士喻树迅的邀请,帮助解决四倍体棉花基因组关键难题至今,他带领团队逐渐建立起了中国棉花基因组理论的框架体系,在雷蒙德氏棉基因组、亚洲棉基因组和群体、陆地棉基因组和亚洲棉转录组等领域均取得了重要突破。
但在朱玉贤等专家们看来,优质棉花之路依然任重道远。
“优质纤维比较缺乏、了解枯萎病和黄萎病等棉花严重病态的抗性机理、野生棉花种质资源挖掘,这是当前我国棉花研究的三大难题。”朱玉贤说。
张献龙也表示,两个异源四倍体栽培棉种的基因组图谱虽然已有很大改进,但仍需要进一步矫正错误和填补缺口;多倍化后,在驯化过程中转座子起什么作用值得探讨;亚基因组之间存在不对称的转录调控,这一现象在重要农艺性状形成中发挥了什么作用,以及如何利用这一特征从头驯化棉种或改良现有品种等也值得去探讨。
朱玉贤表示,未来,培育高产优质品种,一方面可通过单基因转入育种,目前相关技术手段已较为成熟,且正在试验的品种也显示出良好的效果;另一方面,则是借助分子育种手段,通过鉴定相关功能基因,解析优良性状的分子模块,设计培育高品质棉花的新品种。
“陆地棉产量高、适应性强,但纤维品质差,海岛棉纤维品质好,但栽培区域性强、产量低。若能研究清楚各个性状分别由哪些基因控制,则可以将海岛棉中控制优异纤维品质的基因导入到陆地棉,或者将陆地棉中控制产量的基因导入海岛棉中,实现产量品质的‘双得’。”朱玉贤说。
相关论文信息:https://doi.org/10.1038/s41588-020-0607-4
《中国科学报》 (2020-04-21 第3版 农业科技)