|
刷新世界纪录 开展国际科技合作 |
中科院产业化发展令人振奋 |
|
电影《速度与激情7》的“天眼”系统,可以整合(调取)全球所有的视频监控、手机音频等数据,再使用大数据和人脸识别等技术迅速分析和处理,在极短的时间内(分钟)找到目标人和目标车辆进行追踪,让目标人或物无所遁形。
影片中的“天眼”系统无疑极大满足了观众对智能“黑”科技的想象。
其实,“天眼”光靠人脸识别是无法获取所有信息的,因为有的角落或低头的角度使得摄像机无法获取完整的人脸。那么万一可疑人员低着头溜了怎么办?这就需要靠下面这项技术了:
日前,孵化于中国科学院的云从科技在跨镜追踪(Person Re-Identification,简称 ReID)技术上取得重大突破。
云从科技研究人员从悉尼科技大学、南洋理工、中科院自动化所、清华大学等多家知名高校、企业与研究机构脱颖而出,在数据集DukeMTMC-reID上刷新了世界纪录,人工智能即将从“刷脸”跨到“识人”的新纪元。
也许有人不理解何为“跨镜追踪技术”,简单来说,这项技术可以让人工智能即使不看脸,也能通过衣物、发型、体态等信息,跨摄像头跨场景准确追踪你的位置。
计算机视觉热门分支
跨镜追踪技术是现在计算机视觉研究的热门方向,主要解决跨摄像头跨场景下行人的识别与检索,其利用计算机视觉技术在人脸被遮挡、距离过远时依旧可以从不同摄像机镜头中追踪行人。
该技术作为人脸识别技术的重要补充,可以对无法获取清晰拍摄人脸的行人进行跨摄像头连续跟踪,增强数据的时空连续性,广泛应用于视频监控、智能安保、智能商业等领域。
Market-1501、DukeMTMC-reID、CUHK0
3是当前衡量ReID技术的权威主流的数据集。首位命中率(Rank-1 Accuracy)、平均精度均值(Mean Average Precision,mAP)是衡量ReID技术水平的核心指标。
云从科技在Market-1501、DukeMTMC-
reID、CUHK03都取得了较好的成绩,其中在DukeMTMC-reID数据集的Rank-1 Accuracy达到惊人的88.7%,刷新了业内最好水平。mAP是能够更加全面衡量ReID算法效果的指标,它反映检索的人在底库中的所有图片排在结果队列前面的程度,而不只首位命中。云从科技此次将DukeMTMC-reID的mAP指标在现在最好的水平基础上提高了超过5%,达到78.4%。能够获得如此大幅度的突破,充分说明云从科技ReID的研究成果的价值,该成果必然能够推动ReID技术的大幅进步,也使得ReID加速实际商用。
除此之外,云从科技近日不断放出“大招”,一方面云从科技宣布苹果软件工程总监TOM(中文名:谭涛)加盟云从科技任副总裁。原Facebook信息和用户画像(Signals + Identity)团队技术带头人何洪路加盟云从科技,担任AI大数据部技术总监。
另一方面,云从科技携手英国华威大学(The University of Warwick)与华南理工大学对跨媒体大数据智能计算关键技术及应用平台进行研发。人工智能进入2.0时代,跨媒体大数据理解与智能决策将成为重要技术趋势。
三方计划在国际科技合作项目中建立一套跨媒体视频场景下的视频人脸属性与行为分析、跨时空的视频语义信息关联与检索和视频信息超大规模结构化与可视化的跨媒体智能安防系统,以及研究构建一个跨媒体汽车交互的语音识别、跨媒体汽车交互的人脸识别、跨媒体汽车交互的互联网应用等智能服务功能的跨媒体综合智能交互平台。
“此次国际科技合作项目涉及人脸识别、大数据、边缘计算、跨境追踪(行人再识别)等人工智能细分技术。”云从科技创始人周曦表示,“主要应用在安防与人机交互领域。”
跨媒体大数据平台将解决哪些关键技术问题?
跨媒体大数据平台实施涉及以下3个方面的关键技术问题:
1.跨媒体智能计算的共性关键技术问题。包括跨媒体多模态大数据异构的共性计算问题和跨媒体大数据的知识共享与跨领域辅助计算问题。
2.跨媒体智能安防涉及的关键技术问题。一方面是视觉噪声的分离:跨媒体数据具有极强相关性,将视觉噪声分离作为独立的对象显示问题;另一方面是视觉大数据感知。数据可视化不单单受限于设备的长度比及分辨率,也受限于现实世界的感受。
3.跨媒体汽车智能交互关键技术问题。基于海量无监督数据的自动化模型训练流程和自动化语言内容及声纹识别流程。
针对上述项目研究内容和关键问题,本项目给出的技术路线如下图所示:
项目将首先以跨媒体智能为核心,研发视觉、语音、自然语言大数据机器学习算法和云计算大数据支撑技术,构建面向跨媒体大数据核心软件模块,为安防、汽车的人工智能产业化提供技术支撑。
在此基础上,利用研究的跨媒体大数据智能计算共性技术,设计和实现一套跨媒体视频场景下的视频人脸属性与行为分析、跨时空的视频语义信息关联与检索和视频信息超大规模结构化与可视化的跨媒体智能安防系统,并在应用中验证和完善项目所提出的跨媒体大数据智能计算关键技术。
同时,项目将构建一个集跨媒体汽车交互的语音识别、跨媒体汽车交互的人脸识别、跨媒体汽车交互的互联网应用等智能服务功能的跨媒体综合智能汽车交互平台,进一步深入跨媒体大数据智能计算关键技术的应用。未来将在安防和汽车等行业进行跨媒体大数据智能计算关键技术的产业化应用。
人工智能进入2.0时代,跨媒体大数据理解与智能决策将成为主流技术
2017年12月,国际知名数据公司IDC发布《2017人工智能行业白皮书》。在这份报告中,IDC首次提出人工智能进入2.0时代:以信息流技术为代表的新技术,将成为重新定义人工智能2.0时代的引领者。
白皮书认为,以人工智能技术为支撑的信息流,已经发展成为数字时代人们获取信息的重要形态。
同时,随着万物数字化的普及,社会和经济更是需要新的技术帮助人们更高效地连接人与信息。应用信息流技术的“今日头条”近几年的迅猛发展就是一个很好的例子。
同时,跨媒体大数据理解与智能决策将成为人工智能2.0的核心内容。
人工智能技术发展瓶颈主要集中在如何融合智能感知所获得各种不同模态知识进行跨媒体智能决策。部分国内人工智能标志性企业已经紧紧把握人工智能技术发展脉搏,调整战略,逐步从不同信息源的智能感知与识别等基础人工智能技术的研究,转向跨媒体大数据理解与智能决策等高级人工智能技术的研究。
国家战略引导产业发展
成立于2015年的云从科技孵化于中科院重庆研究院,是一家专注计算机视觉与人工智能的高科技企业。不仅参与制定国家人工智能标准及人脸识别行业标准,技术在金融、安防、交通等重点行业市场占有率也较为领先。
云从科技是中国银行业人脸识别第一大供应商。包括农行、建行、中行总行等全国100多家银行已采用该公司产品,为全国银行提供对比服务日均1.1亿次。在安防领域,公司产品已在24个省级行政区上线实战,截至2018年3月份已协助各地警方抓获2605名嫌疑人,获得公安部高度认可;在民航领域,已有54家机场选择云从科技产品,覆盖75%的枢纽机场。
除此之外,云从科技还支持了国家战略:
2018年3月,云从科技与津巴布韦政府签订框架协议,在安防、交通、教育、金融、国民数据库上输出中国人工智能技术,支持“一带一路”建设。
云从科技将通过 “一个平台、三个中心”,在技术创新、服务平台、云+端服务、城市大脑等多个方面支持国家战略推进,推动我国的计算机视觉及人工智能技术应用位居国际一流水平。
其中包括建立技术层的人工智能基础资源公共服务平台、应用层的人工智能应用技术服务平台、集中科学家智力资源的科学研究中心、集中行业定制化研发资源的技术创新中心、集中专业化众创孵化空间、投资基金与人工智能大学的产业转化中心。(姚志强)
《中国科学报》 (2018-05-28 第2版 国际)