刘昕(右)与山世光(左)
■本报记者 赵广立
“90后”的刘昕2017年在中国科学院计算技术研究所获得博士学位,师从山世光研究员。在学术上,他曾2次获计算机视觉领域竞赛冠军,1次亚军,还曾参与创办“深度学习大讲堂”。如今的刘昕有了一个新的身份——人工智能(AI)创业企业中科视拓首席执行官(CEO)。
中科视拓脱胎于中科院计算所智能信息处理重点实验室和视觉信息处理与学习(VIPL)研究组,该研究组由国家万人计划领军人才山世光和自然科学基金委杰出青年基金获得者陈熙霖共同领导。集顶尖智慧创办的科创企业,为何要让一位“90后”在前面冲锋陷阵?在市场竞争中摸爬滚打的刘昕,自己又有哪些感悟?
不同意“人脸识别已成红海”
凭借通用计算机视觉技术起家的中科视拓发现,其目前所在的人脸识别和视觉感知赛道有些拥挤。一方面,人脸识别越来越热门,依靠提供AI算法给行业用户的供应商越来越多;另一方面,此前做硬件的设备商也开始涌入,视觉识别有从蓝海变成红海的趋势。
“现在的‘红海’可能是公司多、概念多,但真正能规模化落地的却很少。在垂直行业把规模化落地推下去,也是企业生存发展的机会所在。”近日,刘昕在接受《中国科学报》专访时表示,无论做技术还是做产品,落地的应用才是重点,“所以我们现在的核心打法是服务垂直行业”。
正如刘昕所言,在计算机视觉领域,人脸识别仍然是落地最好的。现在圈内知名的几家AI视觉创业公司,仍然都在深耕人脸识别。自动驾驶好像很热闹,但L3、L4级别的产品短期内还不能落地,或者很难看到能够规模化可盈利的应用。
“在很多垂直领域,计算机视觉还远未达到红海的地步。AI技术从2015年发展到现在也只有4年多时间,还没有充分饱和——就跟下雨一样,土地还没有湿透。”刘昕举例说,自动驾驶这个场景成立,但直到现在市场还没有最终爆发;再如工业领域的缺陷检测,它现在已经有比较好的应用了,但缺陷检测还没有达到真正意义上的普及,“我们理解,在某个行业的竞争,就是要在一个垂直行业真正扎透”。
“扎透”,中科视拓在新零售行业正在尝试做到这一点。刘昕向《中国科学报》介绍说,传统的贩卖机有个明显的缺点:只能卖硬包装的饮料,而水果、软包装的牛奶等有着更多市场需求的产品根本没法卖。“我们利用开放式的货柜——跟商用冰柜一个样,但在上面装了摄像头,通过视觉识别技术来做——把它们串联起来,能做成一个移动的无人店。”
刘昕透露,中科视拓目前已经技术投资一家名为“智盈科技”的公司,以落地“视觉冰柜”的场景。“同星星冰柜合作、同新零售运营商合作,都是我们通过技术赋能传统行业、然后再找到落地应用场景的案例。”刘昕向记者再三表示,“谈计算机视觉是红海,我觉得这个观点要谨慎一点,因为许多场景远远没有被挖掘出来。”
不惧怕市场和产品竞争
“山世光和你都是科研出身,中科视拓也以科研人员为主,在产品化能力上,跟市场上的对手包括一些巨头竞争,你们会惧怕吗?”
刘昕没有回避记者这个稍显尖锐的问题,“产品化能力或者工程化能力确实不是科研团队擅长的,这就是为什么我们要开公司。”他接着说:“我们一直强调专业的人做专业的事。于我们而言,中科院计算所相当于公司的研究院,从事算法开发等基础研究;公司的工程团队负责产品的优化,比如提高能效以使其能在更低成本的硬件上运行。”
山世光曾这样评价:将计算机视觉技术落地,研究所只走完了五十步,但是应用需要走完一百步,公司是走完另外五十步的地方。
刘昕举了个例子。“我们过去做人脸识别,要拖一台服务器。但现在我们用瑞芯微一款低成本的通用芯片就能‘跑’人脸识别——如果不靠工程团队,研究团队可能永远不会去做这件事。”
记者了解到,8年以上工程经验,是中科视拓工程师的门槛。中科视拓的工程师团队成员大多有系统集成、软件开发等成熟经验,多来自BAT、海康威视等。同时,中科院计算所作为中科视拓的股东,会承担科研成果转化的一些工作,形成了一种高效的产学研合作模式。
布局AI时代的云计算
刘昕花了很长时间向记者讲述中科视拓推出的“云智中心”。
在拓展计算机视觉应用的过程中,中科视拓发现在教育、电力、新零售等行业背后有一些通用的需求,比如对算力的需求,对计算机视觉的检测、识别、跟踪等算法的需求等。“我们想到,如果把这些应用的能力抽象为服务,让更多行业用户更快速、更低成本地跟我们合作,是一个很好的模式。”刘昕说,这就是云智中心的思路——免却行业用户部署AI应用所需硬件、人力等投入的高成本,让他们像使用云计算一样使用AI。
这其实也是中科视拓的长远谋划。“过去那种企业找到我们这种技术服务公司帮他们做外包的模式有点落后,通用化程度低,一个个地做项目很不划算,因为收入根本养不活这么多人。要把研究所的成果在具体行业场景落地,一定需要这样的技术平台去支持。”刘昕告诉记者。
让AI技术变成像水电煤一样,方便用户的同时,也降低中科视拓的获客成本,同时还能实现对算力的按需调用。比如针对视觉冰柜,中科视拓形成了一套标准化的算法,“任何一家做视觉冰柜的企业只要按照我们的流程去操作,就可以做出精度几乎一模一样的柜子,这样AI在行业落地的成本就会大为降低”。
“你们不担心市场被抢走吗?”记者问。
“不会,我们提供的是服务。通过接触更多的行业用户,我们遇到的问题和场景越来越多,反而帮助我们把核心算法做得更好。除了算法之外,AI更多的还是应用场景以及在应用场景下不断迭代产生的数据,才有核心价值。”刘昕说。
对于云智中心,刘昕心里有自己的一把尺子。
“有在云智中心上面跑出来的典型行业场景最重要,因为场景最有说服力。”刘昕说,教育、零售甚至军工、政府行业,都可以通过这一“AI云”提供的解决方案在其上实现应用场景,这是云智中心最核心的目标。
“我们要用一个个有说服力的行业场景让我们的合作伙伴扎扎实实赚到钱。”刘昕说,未来想把云智中心变成一个像App Store一样的开放市场,为此他们推出了一个名为Algo Store的开发者计划。
“我们提出一个口号‘开源赋能共发展’,核心是开源赋能。中科视拓现在的路线就是在一些与我们公司属性比较契合的行业仍然自己做。其他行业交给行业,就安安心心当赋能者。”
快问快答
《中国科学报》:从博士到管理者,角色的变化之间你是否经历了一个略显艰难的适应期?
刘昕:谈不上艰难适应,而是一直都在适应。因为角色是在不停地变化的。最早我们的目标是把中科院的成果产品化,完成产品化之后,我们发现从0到1似乎也没有那么难,然而接下来要从1到100,这个时候考验的就不只是产品能力了,还有渠道能力、商业化能力,让越来越多的合作伙伴一起卖产品。
所以挑战其实是伴随着公司发展的每个阶段的。不同的阶段,投资人、员工、自己的要求都在变化,所以一直在适应。
《中国科学报》:博士毕业后变成了一家创业公司的CEO,有没有觉得人生有很多惊喜?
刘昕:我觉得创业本身就是很大的惊喜。在与客户的接触中,会发现有很多神奇的想法,行业会有很多奇妙的场景,这是之前在科研院所里接触不到的。
比如我们做过奶牛的花纹识别,最近还做了一个应用是帮银行去数猪栏里面的猪有多少头——这些猪是养殖场抵押给银行的,银行得知道到底有多少头猪。银行本打算在猪身上贴标签,但猪天天在泥里打滚,标签很容易损坏,于是想到靠视觉识别去完成。之前根本不知道这些奇妙的场景我们的产品都可以支持。
《中国科学报》:是不是没有想到,原来做公司比做博士有趣多了?
刘昕:我们的计算机视觉核心能力比如目标检测和跟踪技术是通用的,可以去做“猪脸识别”也可以做“牛纹识别”,当把产品做出来的时候,就像PS工具一样,很多神奇的图片是PS作者都不会想到的,我觉得这是做产品最大的魅力所在。既然我们选择为行业赋能,那么行业用户奇妙的场景和想法,就是我们最大的兴奋点。这就是惊喜——原来永远不会想到要去做这件事情。
《中国科学报》:在实验室做科研和在市场做产品,哪个让你更着迷?
刘昕:其实科学研究是一种乐趣,把科研成果落地也是一种乐趣。相比较而言,我更喜欢后一种。
《中国科学报》:你们的创始团队是国内顶尖的技术团队,融资也很顺利,你有没有感觉到身上有很大压力?
刘昕:一个人的能力始终是有限的,这也是为什么公司成立之后要不断地招揽人才,包括商务方面、运营方面等等。这些人其实是帮助我一起把中科视拓做得更好。这些帮我分担压力的同事和小伙伴,我觉得是我的动力,我不是一个人在战斗。
《中国科学报》:你有没有因为自己太年轻而被投资人质疑过?
刘昕:你看我现在长得这么沧桑,应该不会有这个问题(笑)。
《中国科学报》 (2019-08-01 第6版 转移转化)