|
|
首个植物功能基因组学智能问答系统PlantGPT问世 |
|
近日,中国科学院院士、华南农业大学教授刘耀光和研究员祝钦泷团队联合清华大学,开发了一个以拟南芥为基础的植物功能基因组学专家问答系统PlantGPT,通过融合检索增强生成技术和大语言模型微调方法,实现了对植物功能基因组学专业问题的精准回答与分析。相关成果在线发表于《先进科学》(Advanced Science),并被选为Editor′s Choice与Frontispiece(扉页论文)高亮推荐。
AI驱动的植物功能基因组学研究。研究团队供图
?
面对全球粮食安全和作物品质提升的挑战,功能基因组学研究在增加作物产量、改善营养品质、提高抗病虫性和逆境适应性等方面发挥了关键作用。然而,现有的计算生物学手段在解析复杂生物系统调控机制及整合多组学数据方面仍存在瓶颈。同时,传统植物数据库如TAIR尽管包含丰富数据资源,但因交互方式局限,常常要求用户掌握精确的性状或基因命名才能有效检索信息。
该研究通过结合检索增强生成技术和大语言模型微调,建立了包含超过60,000篇植物研究文章摘要的向量数据库,使用13,993个拟南芥表型和23,323个基因功能数据构建了101,000个问答对进行模型优化。相比传统的计算生物学方法,PlantGPT能够准确回答植物功能基因组学领域的专业问题,并成功克服了大语言模型在专业领域应用中的“幻觉”问题。
为此,研究人员开发出首个专门用于植物功能基因组学研究的大语言模型AI助手——PlantGPT,为植物科学研究领域提供了全新的人工智能辅助工具。该系统基于拟南芥专业知识和文献构建,具备强大的生物知识泛化框架,能够在三个关键层面发挥重要作用:为公众提供农业知识普及,帮助早期研究者快速适应植物基因组学领域,以及支持资深研究人员进行战略决策。
凭借其开源性、易迁移性和持续更新特性,PlantGPT不仅显著提升了植物科学领域的研究效率和知识传播效果,还为研究人员创建垂直领域专业Agent提供了有力支撑,标志着人工智能在植物功能基因组学研究中的重要突破。PlantGPT目前通过提供免费在线服务,未来计划扩展至合成生物学及更多作物物种的应用。
上述研究得到国家自然科学基金项目、生物育种-国家科技重大专项、广东省未来作物精准育种基础研究卓越中心重大项目和广东省种业振兴项目的资助。
相关论文信息:http://doi.org/10.1002/advs.202503926
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。