作者:张晴丹 来源:中国科学报 发布时间:2019/11/18 20:13:07
选择字号:
专利文献翻译有了“利器”

 

长期以来,机器翻译一直是一个世界性研究难点和热点。近日,一款翻译质量可媲美人类译员的新一代人工智能产品——科专笑飞人工智能机器翻译系统(以下简称科专笑飞)一亮相就引起了业界关注。其BLEU值(国际上评价机器翻译质量的一种经典方法)已经超越谷歌公司等多家行业巨头。目前有超过1500名专利审查员、10余家知识产权服务机构和企业在使用该系统。

这项技术是由知识产权出版社有限责任公司(以下简称知识产权出版社)历经14年的投入和研发取得的突破性进展,也是落实国家知识产权局党组要求、运用新技术推动审查质量提升的具体举措,为实现我国知识产权强国战略添砖加瓦、贡献力量。

 

克服困难  砥砺前行

自世界专利制度建立以来,专利文献作为国家发明创新成果的载体,涵盖了世界上90%以上的最新科技研发成果。但是,记载各国专利文献的语言种类繁多,跨语言障碍给人们检索、阅读、使用专利文献带来了巨大困难。

2005年,国家知识产权局也面临着同样的难题。在与欧洲专利局谈合作时,对方提出,他们的审查员阅读中文专利文献非常困难,能否提供英文翻译数据?然而,当时的海量专利文献仅靠人工翻译,成本高、效率低。因此,国家知识产权局意识到研发一套专利文献机器翻译系统意义重大,并将此重任交由知识产权出版社负责,开启了自主研发机器翻译核心技术的艰辛发展之路。

然而,在漫长的十多年里,知识产权出版社的机器翻译技术曾长期落后于国际大公司,遭遇了重重困难。但他们始终没有放弃,在各个发展阶段不断调整技术路线、完善技术方案,坚持技术创新。

2011年,机器翻译领域专家——中国科学院计算机语言信息工程研究中心张孝飞的加入,让研究有了转机。他在知识产权出版社科技文献机器翻译研究院(以下简称研究院)担任副院长,带领研究团队砥砺前行,将科专笑飞的准确率稳定在70%左右。

知识产权出版社董事长诸敏刚则对科专笑飞提出了更高的要求。准确率达不到80%,这套翻译系统就没有实用价值;达不到90%,就没有市场竞争力。”担任研究院院长的诸敏刚亲自参与指导机器翻译技术研发,加大对机器翻译的支持力度。多次调整技术方案后,科专笑飞的准确率终于达到90%以上,并于2019年“4·26”世界知识产权日期间正式发布。

 

国际领先  服务市场

科专笑飞机器翻译引擎采用国际先进的人工智能NLP算法和计算模型,对专利文献特定性语言现象和句式规范进行针对化处理和优化,以构建机器翻译大脑;整套系统涉及中、英、日、德等专利领域多个主要语种。

诸敏刚深知,市场反馈是科专笑飞翻译质量好坏的“试金石”。

投入市场的科专笑飞也用实践证明了自身的价值。这款系统不仅10秒钟翻译1万字,而且日汉双向翻译准确率接近98%、英汉双向翻译准确率接近95%、德汉双向翻译准确率接近90%。相关技术已处于国际领先水平,为全社会的知识产权工作者带来了福音。

“翻译得非常准确。”国家知识产权局专利局实用新型审查部审查员张祥表示。自从使用科专笑飞之后,张祥翻译专利申请文件的效率明显提升,翻译完成后,无需看原文,便能快速理解专利申请文件内容。

截止到目前,超过1500名审查员使用该系统,累计翻译次数超过5万人次,以每周超过百人的注册量增长,获得审查员的一致好评。

除了审查员外,科专笑飞还受到了知识产权服务机构和企业的青睐。目前,知识产权出版社已与中国国际贸易促进委员会专利商标事务所(以下简称贸促会专商所)、商汤科技、法国Questel数据服务公司等10余家服务机构及企业签署了合作协议,并与美国高通公司、日本佳能公司等30余家企业达成明确签约意向。

“科专笑飞不仅能把专业性很强的词汇翻译得非常准确,还能将句子翻译得非常流畅,更符合专利文本的表述习惯。使用该系统翻译后的译文基本不需要进行较大幅度的修改,便可直接使用。”贸促会专商所诉讼与咨询处副处长王永刚表示。

诸敏刚表示,未来,知识产权出版社将不断提高机器翻译质量,继续保持世界一流,打造具有国际竞争力的品牌,为助力大专院校、科研人员阅读理解专利文献,为审查员缩短审查周期、提高审查效率做出贡献,为国家知识产权事业发展做出贡献。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
遗传分析追踪潘多森林的进化 团队研制出高性能的蓝光量子点液体激光
宇航员可搭乘小行星前往金星或火星 泡菜等发酵食品真的对肠道有益吗?
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文