■本报记者 彭科峰
日前,中科院自动化所的模式识别国家重点实验室自然语言处理与机器翻译研究团队与人工智能公司出门问问进行了共建揭牌仪式,宣布正式共建“中国科学院自动化研究所——出门问问语言智能与人机交互联合实验室”(以下简称“LIHMI联合实验室”),共同致力于绿色、人文的智能化产业业态,促进科技成果转化。
那么?这个实验室有什么特色呢?主要从事哪些方面的研究呢?近日,《中国科学报》记者就此采访了自然语言处理与机器翻译研究团队的负责人宗成庆研究员。
应用于智能化信息服务系统
宗成庆介绍,团队参与此次合作共建的主要技术包括口语对话理解、对话管理、情感分类和机器翻译等。他表示,在这些合作方向上都是团队的优势所在。1998年宗成庆就加入了模式识别国家重点实验室,开始从事自然语言处理、人机对话系统和口语翻译的研究,后来扩展到文本机器翻译、文本分类及自动文摘等相关研究,并在实验室的统一规划下成立了自然语言处理研究组。2002年,在信息检索和知识工程领域颇有研究的赵军研究员加入了团队。目前团队已有研究人员10余人,博士生和硕士生30多人。
经过近20年的发展,该团队已经具备了相当雄厚的技术积累,不仅在相关技术的基础理论研究方面取得了一批优秀成果,在本领域国际顶级学术会议和权威期刊上发表了大量有影响的学术论文,其中,关于情感分类的学术论文入选ESI高被引论文(前1%),而且在面向国家特定领域的应用系统研发中成绩卓著。
其中,多语言机器翻译系统多次在国际口语翻译评测(IWSLT)和全国机器翻译评测中取得多项评价指标和评测任务第一名的优异成绩,并成功应用于多个国家特定领域,为维护国家和公共安全,发挥了重要作用。
团队2014年荣获中国中文信息学会最高技术奖——“钱伟长中文信息处理科学技术奖”一等奖。与百度公司等多家单位联合完成的“基于大数据的互联网机器翻译核心技术研究及产业化”成果获得2015年度国家科技进步奖二等奖、中国电子学会科技进步奖一等奖。
攻坚语言智能与人机交互等关键技术
这个实验室将着力于自然语言理解、多轮对话管理、问答系统、机器翻译等四方面的研究,为双方合作提供原创技术创新。
宗成庆介绍,在自然语言理解方面,科研人员的研究方向主要探索自然语言语义解析和表达能力,研究语义资源获取和建设方法,研发深层语义理解算法。这将把语言分析或解析到语义层面,准确实现语义表达,让机器真正理解千变万化的语言。
在多轮对话管理方面,他们研究涉及对话任务定义和状态空间表示方法,研发数据驱动的对话管理算法,研发个性化的对话管理算法,将帮助机器模仿如同人与人的对话,通过多个问答回合,确定最终的意图,消除问题中的歧义。
在问答系统方面,他们将研究基于多源数据的知识表示方法,探索基于知识的语义理解、推理方法,开发多种答案类型的问答系统算法。问答系统能够从不同来源的海量数据中找到问题的相关信息,并准确地给出一个明确的答案。由于数据来源不同,问题答案的格式差异很大,需要问答系统具备语义理解、推理等能力,才能很好地回答用户问题。
在机器翻译方面,科研人员致力于研发基于神经网络和深度机器学习方法的机器翻译模型及算法。由于自然语言复杂多变,机器翻译一直是人工智能技术中的一个难点。近年来,随着神经网络和深度机器学习方法的兴起,利用深度神经网络技术进行机器翻译逐渐成为主流并取得了很大进展。神经网络机器翻译方法主要是利用大规模神经网络对源语言句子进行编码,得到源语言句子的一个表示,再利用大规模神经网络对该表示进行展开,并生成目标语言句子。
实现产学研良性循环
宗成庆表示,近期,团队将致力于搭建面向特定应用任务的自然语言处理系统,并在性能上达到学科内领先水平,主要研究内容包括在特定领域搭建完整语义理解和对话管理系统;在特定领域内设计应用场景,研发具有先进技术水准的语义分析和对话管理算法;搭建智能问答系统框架,在性能指标上做到学科内领先水平。随着合作取得进一步进展,之后团队还将在场景构建和算法设计上做出有影响力的创新成果,设计和实验具备演化能力的语义解析算法的自动演化方法,推动合作企业的业务迭代。
“选择出门问问作为共建合作伙伴,一方面是因为出门问问作为一家技术驱动的人工智能领域科技公司,专注于人工智能交互技术的应用,近年来在语音交互、智能推送、手势交互等方面推出了创新产品,其快速增长的市场发展在原创技术方面有迫切需求。另一方面,是缘于与出门问问公司的创始人李志飞多年的相互了解和信任。”宗成庆说。
宗成庆表示,这次合作是面向长远发展的一次尝试,一方面依托团队的自然语言处理与机器翻译研究,为出门问问研发提供语言智能与人机交互等技术的基础研究支持,增强出门问问产品的竞争力和市场领导力;另一方面,出门问问公司也将为团队的科学研究创建良性互动的环境,保证研究需求来源于应用、研究成果服务于应用,面向市场的关键技术难题也将促进和推动理论创新。
宗成庆认为,产学研结合最忌讳两种情况:一是合作双方目标不统一,各打各的小算盘,同床异梦;二是对对方的期望值过高。这两方面都无疑使合作无法持续进行,往往导致“一锤子买卖”,甚至半途而废。此次LIHMI联合实验室的成立,正是在排除上述两种不利因素的基础上双方一拍即合。一方面,作为中科院自动化所的研究团队负责人,宗成庆充分认识到,虽然自然语言处理属于信息科学和技术领域的范畴,但毕竟不是纯基础的科学,而更多的是面向实际需求的应用技术研究,因此,作为应用技术研究必须面向实际需求,研究的科学问题和关键技术要源于实际,用于实际,而出门问问公司恰好能够提供这种具有挑战性的科学问题和技术难题;另一方面,作为出门问问公司创始人和CEO的李志飞博士骨子里有一种科学家的情结。这种知根知底的合作基础,为LIHMI联合实验室的未来发展排除了隐患。
对于LIHMI联合实验室的未来,宗成庆充满了信心。他表示,双方将在互信共融、互惠共赢的基础上,努力推动语言智能与人机交互的关键技术在实用产品的应用中实现跨越式发展,形成产学研紧密配合、良性循环。
《中国科学报》 (2017-06-12 第6版 院所)