作者:朱汉斌 来源:中国科学报 发布时间:2025/10/31 19:01:54
选择字号:
港科大(广州)牵头完成语言服务大语言模型

 

近日,由国家语言资源监测与研究中心指导、中国传媒大学和商务印书馆主办的“中国语言生活皮书”编纂二十周年暨第四届中国语言生活学术研讨会在中国传媒大学举行。会上,香港科技大学(广州)[以下简称港科大(广州)]作为牵头单位,正式对外发布了语言服务大语言模型(1.0)。

记者获悉,语言服务大语言模型(1.0)是国家语言文字科研项目的阶段性成果,由港科大(广州)牵头完成,简称“语服通大语言模型”,意指语言服务通。该大语言模型面向国家语言服务体系构建的实际需求,聚焦多源异构语言数据与复杂中文语境,打造了服务可集成、知识可溯源的一体化大模型,为国家语言服务体系的智能化建设提供了应用示范。

在服务层面,该大语言模型集成了国家语言资源服务平台的各类语言资源与知识源,支持跨平台资源访问与服务联动,实现了平台内资源的集成与智能调度。系统能够自动识别不同的服务请求类型,智能路由至相应的数据源和语言服务模块,完成请求解析、资源调用与结果生成全过程,不仅具备语言知识问答能力,更能在语言研究、教育教学、政务传播等垂直领域中提供专业支持。

在知识层面,该大语言模型依托国家语言生活知识库,实现了回答内容的可溯源与可验证。在回答问题时能够基于文献原文进行推理和引用,并在输出中标注具体来源,通过点对点溯源方式,确保生成结果可验证、可引用,以及模型的学术与公共可信度。其中,国家语言生活知识库汇聚了近20年来的国家语言生活报告和政策研究成果,经过专家标注、原始文档数字结构化,形成了可检索的知识单元。

“我们希望‘语服通’大语言模型能够与其他平台和系统顺畅对接,提供无缝的服务体验。”项目带头人、港科大(广州)教授陈雷表示,内测阶段,项目团队邀请了语言学专家、教师、科研人员等多角色参与评测,结果显示该大语言模型在问答准确率、调用准确率与溯源可靠性等方面均表现优异,满意度较高。未来,该大语言模型将持续拓展语言资源接入与应用的边界,推动语言资源服务集成化、智能化、可信化发展,为国家数字中文建设提供有力支撑。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
特殊引力波事件指向“第二代黑洞”存在 高能同步辐射光源通过工艺验收
科学家提出“冷冻表界层分析新方法” 真正有助于缓解便秘的食物是它
>>更多
 
一周新闻排行
 
编辑部推荐博文