|
|
|
|
|
FCS 文章精要 | 哈尔滨工业大学&科大讯飞联合实验室等,RE^2: 通过检索合适解释样例方法提升中文语法纠错 |
|
|
论文标题:RE2: improving Chinese grammatical error correction via retrieving appropriate examples with explanation
期刊:Frontiers of Computer Science
作者:Baoxin WANG, Yumeng LUO, Yixuan WANG, Dayong WU, Wanxiang CHE, Shijin WANG
发表时间:22 Aug 2025
DOI:10.1007/s11704-025-41399-w
微信链接:点击此处阅读微信文章

引用格式:
Baoxin WANG, Yumeng LUO, Yixuan WANG, Dayong WU, Wanxiang CHE, Shijin WANG. RE2: improving Chinese grammatical error correction via retrieving appropriate examples with explanation. Front. Comput. Sci., 2025, 19(12): 1912381
阅读原文:

问题概述
大模型在中文语法纠错(CGEC)任务中取得了重要进展,已有研究通过检索与输入句子相似的参考样例来辅助模型纠错。该方法存在两个主要问题:句子表面结构相似,但语法错误类型可能完全不同,导致参考示例与输入不匹配;基于文本相似度的检索忽视了错误的潜在模式或语言规则,限制了模型学习针对特定错误的纠错策略。因此,只依赖输入文本相似度难以找到具有相似错误模式的样例。

技术步骤
该文首先构建高质量中文语法错误解释数据集,并训练解释生成模型。输入错误句子后,自动生成错误解释,再通过解释来检索相似错误示例。在推理阶段,通过在提示词中拼接相似示例来提升语法纠错效果。

实验结果
实验结果表明,基于错误解释的检索能显著提升大模型的纠错效果,证明了利用解释信息改进样例检索的有效性,并为中文语法纠错提供了新的思路。

期刊简介
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办,南京大学支持,SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华院士,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐B类期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;两次入选“中国科技期刊卓越行动计划”(一期梯队、二期领军)。

中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。