11月20日,有光学字符识别(OCR)领域“奥斯卡”之称的国际文档分析与识别大会(ICDAR)数据集最新结果公布,中国高校及企业包揽排行榜前五。其中,中科院旗下创企云从科技提出的“Pixel-Anchor框架”在两个ICDAR测试子集(ICDAR2015及ICDAR2017 MLT)上均获得第一名,尤其在东亚语言(包括中文)部分表现亮眼。
ICDAR2015数据集前五名及框架名称分别是:云从科技(Pixel-Anchor)、南京大学与南京理工大学(PSENet)、旷视科技(Mask Text)、商汤科技(FOTS)、阿里巴巴(IncepText)。
ICDAR2017 MLT数据集前五名及框架名称分别是云从科技(Pixel-Anchor)、阿里巴巴(ATL-cangjie)、商汤科技(FOTS)、旷视科技(EAST++)、南京大学(PSENet_NJU)。
据了解,国际文档分析与识别大会专注于文本领域的识别与应用,自2003年大会设立“鲁棒文本阅读竞赛”(Robust Reading Competitions)以来,该竞赛就成为评测和检验自然场景、网络图片、复杂视频等文本自动提取与识别最新技术研究进展的国际赛事及标准。截至目前,全球范围内已有89个国家的3500多支队伍参与,谷歌、微软、亚马逊、脸书以及中国的腾讯、搜狗、北京大学、中国科学技术大学等顶级的科研机构及企业都参加过这项测试。
“高技术难度、强大实际应用性等是这项赛事受到全球关注的重要原因,竞赛中的诸多方法对OCR技术的发展具有强大推动力。”云从科技联合创始人姚志强表示, 中国团队在榜单中取得良好成绩,表明中国正在引领OCR领域的相关研究。