作者:李晨 来源: 中国科学报 发布时间:2025-11-6
选择字号:
打开棉花育种“总开关”
从“种什么卖什么”到“要什么种什么”

 

新疆棉花。中棉所供图

■本报记者 李晨

很难想象,一朵棉花里藏着从育种到加工的全产业链升级密码。

在新疆广阔的棉田,棉农们最关心的是棉花的纤维品质和产量。近年来,随着粮食安全重要性凸显,棉籽的品质也备受关注。过去,这些性状的改良多依赖经验和运气。如今,中国农业科学院棉花研究所(以下简称中棉所)多个研究团队合作,利用多组学数据,首次系统解析了棉花胚珠发育早期代谢网络与调控基因的动态互作机制。

这项11月3日在线发表于《自然-遗传》的研究成果,揭示了MYB基因家族成员在陆地棉驯化过程中的调控枢纽作用。其直接影响棉花最终的纤维长度、颜色及棉籽功能成分等性状,为未来面向棉花资源全值高效利用多应用场景的精准分子育种,提供了全新的理论视角与数据支撑。

小小棉籽的秘密

在棉花花朵的子房里,包含着多个未来会发育成棉籽的胚珠。

棉花开花授粉后,这些胚珠的表皮细胞会开始“分化”:一部分细胞向外凸起、伸长,最终发育成用于纺纱织布的棉纤维,俗称皮棉;胚珠本身受精后则发育成棉籽。

棉纤维是棉花的主产品,广泛应用于纺织工业。棉籽传统上被视为副产品,实则浑身是宝——棉籽仁可以榨取棉籽油,是一种重要的食用植物油;榨油后的残渣(棉籽粕)则是优质的蛋白质饲料原料。

棉纤维与棉籽的发育同时进行,二者共享母体植株供给的营养与能量。

“和动物胚胎一样,植物的很多重要表型在胚胎发育早期就已确定。”论文共同通讯作者、中棉所研究员杜雄明介绍,棉花最具经济价值的器官就是纤维和种子(即棉籽)。这项研究聚焦于棉花开花后5天的胚珠,因为胚珠发育早期正是纤维细胞分化凸起、快速伸长,以及种子开始发育的关键重叠时期。

前期大量研究表明,此时是基因表达最活跃的时期之一,许多影响纤维和种子最终表型的基因均在这个时期集中表达,代谢活动也极为旺盛,决定了后续纤维的产量、品质(如长度、强度)和种子的营养价值(如油脂、蛋白质含量)。

“研究切入点的选择,体现了团队对棉花生物学特性的深刻理解。”论文共同通讯作者、中棉所研究员何守朴说,“纤维细胞的起始和伸长、棉籽营养成分的积累等重要生物过程,均在这个阶段奠定基础。”

“在我们启动这项研究之前,纤维发育的遗传和分子机制是棉花基础研究领域的热点,已鉴定出一大批对纤维发育至关重要的关键基因,但针对棉籽发育的研究相对较少。”论文共同通讯作者、中棉所研究员马磊说。

实际上,生物表型的形成是一个多层级精细调控的复杂过程,涵盖从核苷酸序列到基因、蛋白,再到代谢物,最后呈现表型的完整链条。何守朴强调,代谢物是比基因和蛋白更“接近”最终表型的指标。

他解释说,代谢组就是“基因-蛋白”与“表型”之间的“黑箱”。过去的研究大多针对序列、蛋白、基因和表型独立开展,不同层级之间的关系并不明确。“我们团队前期积累了大量序列、基因和表型数据,只要摸清代谢物这个‘黑箱’,就可以绘制出一个棉花早期胚珠和纤维发育的完整图谱。”

为此,研究团队采用大样本多维度组学分析策略,对403份陆地棉种质资源开花后5天的胚珠开展整合分析。这种大规模、多维度的研究方法,在棉花研究领域并不多见。

基因“总调度员”和它的“开关”

经过5年攻关,研究团队取得了一系列突破性发现——成功鉴定出2960个代谢数量性状位点(mQTL)和24485个表达数量性状位点(eQTL),构建了目前棉花领域最全面的“变异组-转录组-代谢组-表型组”数据库。

“可以把我们的研究比作获得了棉花群体早期胚珠较完整的‘血液化验单’。”论文共同通讯作者、中棉所研究员崔金杰说,基因序列如同人的先天体质,基因表达类似机体对环境的即时反应,而代谢组就是那张“血液化验单”。化验单上的每一项指标,都是身体运行状态的直接读数,能将上游的基因指令与下游的可见“症状”(表型)连接起来。

团队对成百上千个代谢物进行了系统“化验”,并将其与基因表达变化和最终表型逐一对照,进而找出哪些指标异常、对应哪条通路、可能源自哪些关键基因。

他们在A07染色体上发现了一个重要的数量性状“热点”——大量代谢物的含量都与该位点相关。论文第一作者、中棉所已毕业博士生张小萌连续数周熬夜处理了数千份棉花重测序数据,通过反复比较和团队讨论,最终确定该热点区域中候选基因GhTT2_A07在棉花纤维驯化过程中扮演关键角色。

“这个基因就像代谢网络的‘总调度员’。”张小萌介绍,“它原本在拟南芥中控制棕色种皮的形成,而在棉花中功能更复杂,不仅参与纤维着色,还调控脂肪酸和激素代谢。”当GhTT2_A07基因表达量较高时,棉纤维就表现出“短而棕”,反之则表现出“长而白”。这一发现可能解释了棉花从有色野生种驯化为白色栽培种过程的关键分子机制。这一结果让整个团队倍感兴奋。

在GhTT2_A07基因上游,团队还发现了一段约520Kb的基因组倒位——这种结构变异如同基因表达的“开关”。它改变了GhTT2_A07基因的启动子结构,导致该基因在棕色纤维中活性增强,在白色纤维中降低。马磊解释,这一发现也提示,基因组结构变异是棉花从有色野生种驯化为白色栽培种的关键机制之一。

此外,团队还发现GhTT2_A07的一个“兄弟”基因——GhPAR。这两个基因同为MYB家族成员,但存在明确的功能分工——GhTT2_A07在纤维起始和伸长阶段活跃,广泛影响多种类黄酮类型及纤维品质、衣分;GhPAR则主要在胚珠早期发挥作用,主要调节原花青素类物质。

何守朴进一步解释说,棉花的衣分指一定量籽棉经加工后产出的皮棉与籽棉的重量比。衣分是衡量棉花产量的关键指标,也是棉花生产效益高低的标志,因此在生产中衣分成为筛选棉花品种的首要指标。

“这种‘功能冗余保障+时空表达特异性’的机制,既保证了代谢稳定性,又为不同性状的精准调控提供了灵活性。”何守朴说。

从“种什么卖什么”到“要什么种什么”

“基于海量代谢组数据,我们系统收录了棉籽发育早期的关键代谢物信息,结合成熟种子的营养常规评价,构建了可直接服务于下游产业的棉籽代谢物数据库。”马磊告诉《中国科学报》,该数据库就像一份详尽的棉籽分子成分说明书,清晰记录不同品种棉籽中油脂、蛋白质及关键代谢物的含量信息。

借助这一数据库,育种家可精准定位控制出油率和蛋白质合成的关键基因,通过分子标记技术定向选育专用棉花品种;下游棉籽加工企业则能依据数据库中的成分数据,针对性挑选功能成分,组成理想的棉籽原料。

“这项研究为棉花分子设计育种带来的最大变化是将育种从经验型变成精准型。”杜雄明说,通过系统分析,人们能更深入理解不同性状之间的关系及背后的调控机制,最终可权衡利弊,像“搭积木”一样组合不同的关键基因,实现纤维品质、产量和棉籽营养价值的兼顾。

“我们将根据纺织企业和棉籽加工企业的多元化需求,直接筛选携带不同‘基因配方’的种质供育种家利用,定向培育符合市场需求的棉花品种,真正实现从‘种什么卖什么’到‘要什么种什么’的产业变革。”何守朴说。

相关论文信息:

https://doi.org/10.1038/s41588-025-02363-3

《中国科学报》 (2025-11-06 第1版 要闻)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
天文学家发现有史以来最亮的黑洞光爆发 物理学家有望解决“高尔夫球手的诅咒”
撒哈拉沙漠将迎来更潮湿、更绿色的未来 斑彩菊石为何如此艳丽
>>更多
 
一周新闻排行
 
编辑部推荐博文