
盛花期的甘蔗。受访者供图
■本报记者 李晨
白糖是日常生活中普通的调味品,它背后的甘蔗却拥有复杂得犹如迷宫的基因组。时隔100年,甘蔗领域科研人员在《科学》发表第二篇长论文。
近日,广西大学教授张积森团队联合福建农林大学科研团队在《科学》发表最新研究成果。该研究首次构建了覆盖现代甘蔗主栽品种及其野生祖先物种的多尺度图泛基因组,在此基础上系统解析了甘蔗复杂混合倍体基因组结构,提出了适用于高倍体作物的剂量感知关联分析(DosageGWAS)新方法,成功锁定一批与分蘖数、产量、含糖量和叶片角度等重要农艺性状相关的关键基因,并验证了SaTB1基因显著促进分蘖、成倍提高甘蔗产量的功能。
论文评审人认为,这是一项极具趣味性且令人瞩目的创新性研究。
为了“种甘蔗”
甘蔗是全球最重要的糖料和能源作物之一,提供了世界约80%的食糖和40%的燃料乙醇。我国是世界上最早用甘蔗制糖的国家之一,已有2000多年的历史。食糖是关系国计民生的重要战略物资,除日常消费外,2000多种工业产品需要用糖作为原材料。
“然而,甘蔗基因组是植物科学领域公认的难题,国际上许多基因组学的权威科学家研究过,都认为这是基因组最复杂的物种之一。”论文通讯作者张积森告诉《中国科学报》,现代栽培甘蔗品种源于高糖的热带种甘蔗与高抗逆的野生甘蔗在百余年前的杂交回交。甘蔗的遗传结构特别复杂,“像一团乱麻”:其多为8倍体、10倍体甚至具有更高倍性,染色体数目在100~130条之间;同源多倍体与异源多倍体成分并存;染色体断裂、融合和非整倍体现象普遍;重复序列和转座子高度富集。
“这些特征使得传统的单一线性参考基因组难以同时容纳不同倍性、不同染色体数和不同遗传背景,等位基因剂量难以准确区分,测序数据在比对过程中出现大量多重比对和信息丢失等问题。”张积森说,传统方法根本理不清,单一线性基因组范式在甘蔗等复杂多倍体作物中已接近失效,急需新的基因组参考体系。
甘蔗基因组研究的挑战不仅在于其科学复杂性,更在于其产业重要性。我国每年消费食糖约1500万吨,其中自产糖约1000万吨。广西作为我国最大的蔗糖生产基地,糖料蔗种植面积稳定在1100万亩以上,蔗糖产量稳定在600万吨以上,占全国60%以上。突破甘蔗基因组研究瓶颈,对保障国家食糖安全具有战略意义。
然而,现代甘蔗育种高度依赖有限的亲本材料,遗传基础狭窄、种质资源利用不足,制约了产量和抗逆性进一步提升。“研究的初衷是破解多倍体遗传密码,利用挖掘的关键基因来进行生物技术育种。”张积森说,这份初心支撑着团队在困难面前不退缩。“如果只做基因组研究,我们的工作就失去了应用价值。”
2021年,张积森团队开始为这项研究做准备,最初想系统解析甘蔗属基因组的演化和变异规律。2022年,他从福建农林大学调任广西大学,项目正式启动。“我就是为了种甘蔗,所以来了广西大学。”他说,因为广西是我国最大的甘蔗产区,要搞甘蔗育种,必须亲自种植甘蔗;甘蔗产业是广西发展的重点产业,不到广西,就搞不清楚产业真正的需求。
这一年,在初步研究的基础上,他们发现,要想真正实现“在多倍体里找基因”,必须先为甘蔗的复杂基因组打造一个更精准的“新地图”,即图泛基因组,而不是继续在存在严重偏差的“旧地图”——线性参考基因组中摸索。
张积森解释道,线性参考基因组收集的基因变异信息太少,对甘蔗这种复杂基因组而言,可能会遗漏绝大部分有价值的遗传变异信息。而图泛基因组最大的创新和价值在于,可以建立一个统一的坐标系统,有利于准确定位基因组变异。
由此,该团队开始了在甘蔗基因组这一“世纪难题”上的持续攻坚。
从“二维”到“三维”
甘蔗基因组的复杂性超乎常人想象。“我们的工作,简单而言,就是把原来的二维基因组变成了三维基因组。”张积森说。
可以把甘蔗基因组想象成一个拥有100多本不同“书籍”(染色体)且“书籍”内容高度重复的图书馆。这些“书籍”来自不同的祖先(不同物种)、版本各异(倍性不同),但许多章节内容相似。传统的阅读方式——线性参考基因组,就像试图为每一本书单独编制目录,但由于内容交织重复,很难厘清头绪并进行跨书比较。
论文共同第一作者、广西大学教授张清介绍,甘蔗的古老祖先拥有10条核心染色体,以这10条原始染色体作为“祖宗”或“分类标签”,将测序得到来自不同物种、不同品种的所有染色体片段,与这10条“祖宗染色体”进行比对,序列相似度高、属于同源关系的片段,不管它实际来自哪条染色体,都会被划分到同一个“染色体群落”里,实现“认祖归宗”。
划分群落后,所有复杂的遗传信息就有了统一的坐标系,所有比较都可以在“群落”内部进行,结果精准。在这个统一的坐标系上,他们创新性提出了多尺度图泛基因组框架,将9套不同的基因组整合到统一的图谱中,构建出“三维”的图泛基因组。
张积森说,该图谱将充满冗余的甘蔗基因组压缩了约34%,捕获了约82%的甘蔗基因组多样性,而现有最优单一参考基因组仅能覆盖约34%。
论文共同第一作者、福建农林大学讲师黄育敏介绍,依托精确的图泛基因组,研究团队对417份甘蔗及其近缘材料开展了系统的图谱比对和群体遗传分析,材料涵盖野生甘蔗、家种甘蔗、现代栽培品种及近缘种等多个类群,证实现代栽培甘蔗中约70%~90%的遗传成分来源于热带种甘蔗。
在此基础上,研究团队发现了碳水化合物和淀粉/蔗糖代谢、植株结构发育及抗逆响应等功能通路,锁定了一批与糖运输和代谢、株型和分蘖、开花期及逆境适应相关的关键候选基因,其中超过一半是仅在图泛基因组分析框架下才发现的。
他们还发现,经典的驯化基因TB1是甘蔗分蘖的关键功能基因,敲除该基因后,甘蔗表现出显著的更多分蘖、提前分蘖,并伴随产量提升。
论文共同第一作者、广西大学研究助理张以星介绍,针对多倍体作物中传统基因组关联分析(GWAS)难以准确刻画等位剂量信息的难题,研究团队在图泛基因组框架下提出了新的分析方法——DosageGWAS。新方法显著提高了关联分析的灵敏度和解释力,不仅检测到更多显著关联位点,而且对糖分性状和叶片角度性状的遗传力解释度大幅提升,独立验证的剂量差异位点数量也明显增加。
动态演进型“甘蔗基因资源基础设施”
1926年,《科学》发表了古巴科研团队的长论文。该成果建立了甘蔗花叶病毒的接种体系并进行分级评价,为理解甘蔗病害奠定了基础。
直到100年后,《科学》才发表了第二篇甘蔗研究的长论文。两位美国科学院院士——佛罗里达大学教授Douglas E. Soltis和Pamela Soltis同期在《科学》针对这项研究发表了评述,认为研究展示了植物泛基因组学的最新水平,为植物基因组学和作物科学提供了全面、多维度的基因组资源和分析框架。
为验证方法的普适性,研究团队将这一多尺度图泛基因组策略推广至异源多倍体小麦、棉花和同源多倍体马铃薯等多倍体物种。结果表明,“多尺度图谱+DosageGWAS”框架不仅适用于甘蔗,也可跨物种、跨多倍体作物广泛推广,为复杂作物基因组研究和分子育种提供了通用工具。
3位院士对这一成果给予高度评价。中国科学院院士、中国科学院分子植物科学卓越创新中心研究员韩斌说,该研究彻底改写了人们对甘蔗基因组“不可解”的传统认知,为小麦、苜蓿、马铃薯等复杂多倍体作物精准改良提供了重要范式。
中国科学院院士、华南农业大学教授刘耀光指出,该研究有效破解了植物多倍体“难分型、难比对、难关联”的核心瓶颈,显著提升了基因组选择的准确性。
中国工程院院士、华中农业大学教授张献龙强调,该研究为复杂多倍体作物建立了可操作的遗传-育种路径,破解了长期悬而未决的关键难题。
张积森告诉《中国科学报》,该研究成果有望在多个层面加速甘蔗育种进程:支撑高质量分子标记开发与基因组预测;高效挖掘野生与稀有优良等位,为“回交导入+基因编辑”提供精准靶点;为未来“甘蔗泛基因组联盟”奠定基础,随着中国种、印度种等历史品种和区域性地方品种基因组不断发布,现有甘蔗属超级泛基因组可持续扩展,逐步形成覆盖全球甘蔗种质的动态演进型“甘蔗基因资源基础设施”。
从实验室的基因组解析到田间的育种应用,这项研究正在悄然改变着甘蔗产业的未来。“我们要真正把这个研究成果用起来。”张积森说。
相关论文信息:
https://doi.org/10.1126/science.adx1616
《中国科学报》 (2026-03-02 第1版 要闻)