科大讯飞人工智能展示厅里的伴侣机器人
随着人工智能(AI)应用的逐渐深入,AI发展的技术路径也日益多元。特别是当新的应用不断涌现,激发出更多的计算需求,目前在人工智能领域一家独大的深度学习算法的实现也突破了此前GPGPU(通用计算图形处理器)独霸一方的局面,形成以英特尔至强融合处理器KN系列为代表的CPU(中央处理器)、FPGA(现场可编程门阵列)、ASIC(专用集成电路)等诸多路线“百花争艳”的局面。而这一切,都在驱动着人工智能更加民主化、普及化。
不同的应用场景决定不同的计算组合
5月底的合肥,凉爽宜人。《中国科学报》记者和参加英特尔人工智能体验之旅的媒体同行一起走进了科大讯飞总部的人工智能展示厅。
“你好!”当讯飞的工作人员对着小巧的讯飞翻译机说出这句中文后,轻轻点击了一下遥控器按钮,很快,机器就按照要求将其翻译成了英语和维吾尔语。“同声传译真的要失业了。”同行的记者感叹道。
这家成立于1999年的人工智能公司,凭借着其拥有自主知识产权的智能语音及语言识别和翻译技术,已在政府、教育、金融、智能家居、智能车载等多个领域拓展应用。“我们的总应用数达到近30万,已嵌入到10亿个终端中,每天会产生35亿次交互。”科大讯飞的工作人员介绍说。
随着业务量的不断攀升,数据的计算量也持续暴增。“当计算量增长到一定程度的时候,就不简单是一个加机器的过程了,而是重新计算的问题,这就需要一种新的解决方案。”科大讯飞研究院深度学习平台研发总监张致江告诉《中国科学报》记者。基于此,讯飞和英特尔几年来有了紧密的合作,因为“讯飞懂AI,英特尔懂计算架构。”
据介绍,应讯飞邀请,英特尔在讯飞内部进行了大量关于CPU架构以及程序优化方面的相关培训。讯飞使用英特尔KNL芯片进行讯飞的专有模型训练探索,目前性能和效果良好,将训练时间由以前的多个小时甚至很多天变成几分钟。同时,讯飞认为KNL芯片还有更广泛的应用场景。下一步,双方还准备联合进行即将发布的KNM芯片深度合作优化,共同构建基于KNM的深度学习训练平台。
此外,张致江还多次表达了对FPGA的浓厚兴趣。他告诉记者,他们使用英特尔A10 FPGA芯片将E5双路CPU服务器的语音识别并发路数提升了一倍。接下来,双方准备联合研究基于英特尔S10 FPGA的加速解决方案,将语音识别的单服务器并发路数也提升一倍,并联合研究至强+FPGA的CPU解决方案,降低FPGA的实施难度。
谈及时下比较流行的实现深度学习的GPU方案时,张致江认为,不同的应用场景决定了不同的计算组合。“GPU有GPU的应用场景,CPU+FPGA有CPU+FPGA的应用场景,可能在某些应用上两者有一些重合,但是从目前来看,我们更倾向于CPU+FPGA的路线去做。”
做AI的普及者
作为英特尔亚太研发有限公司总经理兼英特尔软件与服务事业部中国区总经理,何京翔亲眼见证了AI由热到冷再到热的过程。“30年前,我上大学的时候,人工智能就已经很热了。为什么后来又冷了呢?是因为那时候一些算法不够先进,计算能力不够。”
发展到现在,他认为人工智能的春天确实来了。“到2020年,AI计算力的需求将会增长12倍。”他告诉《中国科学报》记者。而对英特尔而言,“我们的战略其实很简单,就是要推动AI的发展,做AI的实践者和倡导者,使得其应用能够落地,不再仅仅是空中楼阁,不再仅仅是某几个科学家口中讲的科幻。”
另外,何京翔强调,英特尔的另一个使命就是要做AI的普及者,使之“民主化”。作为英特尔AI“朋友圈”的一分子,浙江德尚韵兴图像科技有限公司将AI“民主化”的受益者普惠到了广大的甲状腺结节患者。该公司总经理胡海蓉告诉《中国科学报》记者,现在医生在做甲状腺结节筛查的时候,通常会保留几张图片,根据这几张图片上的结节特征来判断其到底是良性还是恶性。但是,目前三甲医院医生的人工诊断准确率平均只有60%~70%,基层医院的准确率还会更低一些。而他们公司基于人工智能开发的智能诊断辅助系统,目前准确率已达到了85%以上。
在拥挤、忙碌的浙江大学第一附属医院超声医学科的一间诊室里,赵齐羽医生接受了《中国科学报》记者的采访。他告诉记者,他们与德尚韵兴合作一年多了,对这套智能系统的态度由刚开始的半信半疑变为刮目相看。“非常厉害,很不错。”赵齐羽评价说。他认为,该产品对于初级医生和基层医院的医生会有更大的帮助,推广到基层医院后能迅速帮助其提高诊断的水平,有利于我国分级诊疗政策的推行。
浙江德尚韵兴图像科技有限公司首席科学家、浙江大学特聘教授孔德兴告诉《中国科学报》记者,公司的技术核心主要是把现在的人工智能技术和现代数学的前沿理论结合了起来。“英特尔公司把他们的至强融核处理器提供给我们,我们在这一平台上训练数据,训练完之后就可以把这套系统部署到网上,还可以形成单机版,医院就可以试用了。“未来我们还会一起探讨用英特尔最新的FPGA芯片实现我们的应用。” 孔德兴说。
让公民数据科学家大量涌现
要想切实推动AI的发展,除了芯片底层的硬件架构外,软硬件结合在一起的生态也是很多深度学习用户非常关心的问题。“今天真正在使用大数据的用户很多还不是深度学习的专家,为了让他们能够实现使用人工智能技术的意愿,我们正在针对现有的包括Neon、TensorFlow和caffe等在内的主流的深度学习框架,做大量的优化工作,极大地提高计算性能,同时降低其使用门槛。”英特尔大数据首席架构师戴金权告诉《中国科学报》记者。
以英特尔开发并开源的BigDL软件框架为例。它是基于目前在大数据分析和处理中使用最广泛的计算引擎Spark开发的分布式深度学习框架,能够为大数据分析和深度学习提供统一的体验。戴金权就是其背后的主要推动者和“操盘手”。
“BigDL是我们推动AI普及化、民主化的一个重要举措。”戴金权说。他告诉记者,在没有这样的统一大数据平台之前,数据科学家是非常难以训练的。因为他们不仅要有丰富的统计学、数学知识,还要有一定的机器学习编程能力。而BigDL这样的平台则能够提供丰富易用的各种功能,使得一些普通用户也可以到大数据平台上写些程序、分析数据,这就使得大量不需要经过专业训练的用户也可以实现人工智能的一些应用。
对这一轮AI的民主化,英特尔抱有非常大的信心。何京翔希望,未来想用AI的人、需要用AI的行业、需要用AI技术的设备都能够享受到AI带来的福祉。