|
|
|
全国首个开放式大豆产业大语言模型 |
|
“问豆”发布打通基层农技服务“最后一公里” |
|
|
“大豆产业事关国家粮食安全,种业振兴核心离不开科技赋能。南京农业大学深耕大豆育种领域百余年,搭建的创新服务体系,通过大模型实现了农业历史经验与实时前沿知识的系统化整合。”近日,全国首个开放式大豆产业大语言模型“问豆”(SoyAI)在南京农业大学正式发布。中国工程院院士、国家大豆生物育种产教融合创新平台主任盖钧镒在会上表示,“问豆”大语言模型的核心使命,是将优质专业的大豆产业知识普及到田间地头、送到一线从业者手中,让农业科技真正扎根大地、赋能产业发展。
据悉,这款大语言模型由国家大豆生物育种产教融合创新平台牵头打造,可将海量大豆行业数据转化为优质专业知识,精准服务农户、农技人员、科研工作者和涉农院校师生群体。
海量数据淬炼优质专业知识
近年来,在国家大豆生物育种产教融合创新平台的牵头组织下,“问豆”研发团队系统梳理收录大豆育种、栽培、施肥、病虫害防治、气象灾害应对、品种资源、产业政策与市场行情等全领域的学术文献、学位论文、技术手册、行业报告及政策标准,依托超15亿词元(token)的专业语料,搭建起体量庞大、维度全面的大豆专属专业语料库。
“问豆”发布会现场。南京农业大学供图
“研发‘问豆’大语言模型,96%的工作都集中在数据环节——不仅要保障数据体量充足、品类丰富,更要严控数据质量。”南京农业大学信息管理学院副院长王东波表示,垂直领域大模型的核心竞争力,在于对高质量专业数据的萃取与整合能力。
王东波介绍,为保障模型输出内容专业、精准、可靠,“问豆”创新构建深度贴合领域专家思维的三阶段递进式问答架构。
第一阶段为需求解析,智能提取用户提问中涉及的品种、病害、土壤、肥料、农机、加工、市场等核心关键信息,精准细化、聚焦用户实际需求。
第二阶段为知识融合,整合本地专属知识库、权威搜索引擎、学术数据库等多源信息,对照国家官方品种审定、农药登记、肥料认证等权威标准资料完成初步筛选过滤,为模型筑牢高质量专业知识基础。
第三阶段为高质量数据合成与结果输出,研发团队对专业数据、行业报告、学位论文等各类资料进行精准筛选与规范标注,以专家认证、官方审定数据和行业技术标准为刚性准则,对大语言模型的内容生成能力进行严格约束,确保所有输出内容均有据可依、合规专业。
整合跨学科经验 赋能产业生态升级
田间的实际生产难题,往往关联品种抗性、土壤墒情、气象变化等多重因素,需要多维度综合研判。而“问豆”大语言模型可有效整合分散在各学科领域的行业经验,构建出可计算、可推导、可落地的大豆产业智能决策网络。
南京农业大学国家大豆改良中心主任赵晋铭特别强调:“信息科学为模型提供了海量数据处理的算法与技术框架;种子科学与工程、植物保护、农业资源与环境等涉农学科,则明确了产业问题的研究边界与知识判定标准。多学科知识打通融合、相互印证,才能形成经得起田间实操检验的科学决策依据。”
南京农业大学植物保护学院教授叶文武指出,以往大豆病虫害诊断工作高度依赖基层农技人员个人经验,形成诸多信息闭塞的“经验孤岛”。如今,“问豆”不仅可精准诊断大豆病虫害类型,还能结合大豆生育阶段、气象数据模型等多维信息预判病虫害风险,智能生成包含生物防治、科学用药等内容的绿色防控方案。
从病虫害绿色防控、气象灾害科学应对,到大豆品种甄选、产业政策与市场行情研判,“问豆”大语言模型的落地应用,彻底改变大豆生产“凭经验决策”的传统模式,助力田间生产迈向全产业链知识协同的精准化、科学化决策新阶段。
在产业供给端,“问豆”大语言模型全面汇聚、贯通大豆全产业链科技创新知识与数据资源;在应用服务端,以专业性、低门槛的智能问答形式,面向广大农户、基层农技推广人员、科研工作者和农业院校学生全面开放。
南京农业大学副校长王源超表示,顺应农业数字化转型和国家种业振兴的迫切需求,打通基层农技服务“最后一公里”意义重大。“问豆”大语言模型不仅能推动产学研用深度融合,也为涉农专业学生搭建了实践新平台,学生可在模型使用与反馈优化过程中,探索人工智能与现代农业深度融合的新路径,成长为懂农业、懂科技、懂数字的复合型新农科人才。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。