近日,国家医学考试中心正式发布了“2017年国家执业医师考试临床综合笔试”合格线,一位特殊“考生”的测试成绩也同步揭晓——在本次测试中,科大讯飞和清华大学联合研发的人工智能机器人“智医助理”取得了456分的成绩。科大讯飞董事长刘庆峰在11月9日的“科大讯飞2017年度发布会”上宣布了这一喜讯,表示智医助理是全球第一个通过国家医师资格考试测试的机器人,这是“一个可以载入中国甚至全球人工智能史册的成果”。
通过国家执业医师资格考试是获得医师资格证的必要条件,它分为两级四类。其中,临床执业医师考试是报考人数最多、难度最大的考试,分为实践技能和综合笔试。智医助理所挑战的就是综合笔试。
记者了解到,综合笔试共有600道客观题,考试内容涵盖基础医学、医学人文、临床医学、预防医学综合四大类,涉及11个基础综合课程和13个专业综合与实践综合课程,约2700个知识点。同时,综合笔试的题型从形式上可分为“知识点”型和 “病例” 型,近年来 “病例型”考题的占比为50%以上。
刘庆峰表示,在全程禁止任何人工干预(考试中全程断网、录像、公证)的情况下,要挑战如此专业性的考试难度颇高。对此,“智医助理”的研发团队在多个技术研究上进行了攻关。
海量的医学知识在计算机中如何表示是一大挑战。因为传统上基于搜索或基于构建结构化知识库的方案,在面对纷繁复杂的医学知识时都明显能力不足。为此,研发团队提出了一整套“语义张量”方法,针对医学考试需求,利用“多语义深度学习”方法让“智医助理”通过学习医学本科教材、临床指南和经典病例等资料,获得医学领域张量化的概念表示和关系表示,让机器拥有了庞大的医学知识库。
另一大挑战是机器人如何运用医学知识去分析和解决问题——这是机器人能否答对的关键。研发团队提出了包括“关键点语义推理”“上下文语义推理”“证据链语义推理”在内的多尺度融合推理算法,让机器具备了词汇、句子、段落间的多层次推理能力。答题时,“智医助理”首先对题干和选项进行全面分析,在医学知识库中为每个选项寻找成为正确答案的可能证据,衡量评估题干、选项和证据三者之间的相关性和可信度,最终依靠综合决策得出自己的答案。
刘庆峰说,这两部分组成了“智医助理”系统的核心引擎,使讯飞“智医助理”机器人具备了高效的知识表示能力和深入的运用知识进行推理的能力。
据了解,“智医助理”诞生于科大讯飞与清华大学于2006年共建的联合实验室。今年2月,科大讯飞和清华大学组建医考系统联合研发团队,历时半年研发“智医助理”并接受医考测试。其中,清华大学电子工程系副教授吴及领导实验室承担了“智医助理”核心算法的研究和核心引擎的开发工作。值得一提的是,IBM的“机器人医生”沃森也曾挑战过美国医考(同为客观题),但自2012年挑战至今一直未有突破。