作者:张军平 来源: 中国科学报 发布时间:2020-8-13
选择字号:
从杭州失踪案谈人工智能的短板

 

张军平

最近杭州的失踪案在经过十几天网民各种“福尔摩斯式”的推测后,终于被侦破了。毋庸置疑,大数据对案件的侦破起到了关键性的作用。通过对小区和邻近路段的监控视频的分析,最终推断出来某某没有出过小区,然后将嫌疑人锁定。

遗憾的是,从公开的报道来看,人工智能似乎并没有发挥其应有的能力。公安人员在分析视频时,是通过人工检查,24小时的视频要看一天甚至更长时间,以免漏掉潜在的目标。一如在世界人工智能大会上,复旦大学附属华山医院感染科主任张宏文讲的“新冠疫情在中国得到成功的控制,也不是得益于人工智能,而是传统医疗和有效的城市管理”。

为什么人工智能在此次案件的侦破中没有发挥应有的作用呢?按道理来说,利用人工智能的快速检索能力,通过对视频监控数据进行摘要提取,可以很快地把嫌疑犯找出来。更何况,人工智能在海量搜索和计算速度这两方面都有人无法比拟的优势。

然而,事实并非如此。

其中的原因可以从判断人工智能算法优劣的两个指标说起,即误检率和漏检率(常称为召回率)。误检率是指本来没有发生的,如未发生的交通违法、没有感染新冠病毒的人被误判为新冠肺炎患者。而漏检率是指发生了却未被检出的,就是说明明有嫌疑人出现了却未检出、有新冠肺炎症状却没被检出。

误检率相对来说损失小一些,但仍然会浪费时间和增加成本。比如在交通违法上,疑似违法者需要花时间去与交通部门进行交涉后方能取消。在刑事案件中,可能导致公安部门不必要的出警,极端情况会产生“狼来了”的不利影响。而在医疗诊断中,对于心理素质不强的人来说,误诊为癌症对身心的打击会很强烈。所以,基于人工智能的模型应该尽量避免这个指标过高。

而漏检率的危害就大多了。举例来说,在监控视频的快速检索中,如果把出现嫌疑人的视频漏掉了,那么有可能会让整个案件无法形成闭环的证据链。而新冠患者如果漏检,则会导致病毒快速扩散,对疫情的防控、相关地区各行业的正常运营都产生巨大的影响。

那么,人工智能有没有可能把误检率做到零,同时也把漏检率降到零呢?

很不幸,答案是否定的。如果在文献中看到有这种情况出现,一种可能是数据集本身的规模太小,并没有涵盖更多未知样本的情况。

单个指标或两个指标达不到零的原因有不少,一是有可能数据本身是有噪的,如不可约简掉的噪声;二是数据的分布,如果对数据做了某种分布假设,那就无法保证不满足该假设的样本能被正确分类或预测。

除此以外,当数据缺乏明显的标签时,就更难保证了。比如这起失踪案,如果连嫌疑犯是谁都未知,人工智能就无法建成有效的预测模型。

另外,有信息表示本次失踪案的监控视频中,有一帧是只有半个下半身影子的图像。依赖现有的人工智能算法,这种图像很容易被忽略掉,因为它可能达不到能形成响应的阈值。其后果却严重地影响对案件的分析。此时,快的搜索就不如人类慢的、缜密的思维模式有效了。

尽管我们看到人工智能在众多刑事案件侦破中起到了重要作用,但也要认识到,仍然有一些情况是不能完全依赖人工智能的,尤其是需要用到人强大的因果推断和直觉思维能力的场合。

未来也许需要人和机器实现混合智能增强,才能把各自的优势有效结合,形成更强大的智能计算。

http://blog.sciencenet.cn/u/heruspex

《中国科学报》 (2020-08-13 第8版 博客)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
缓解肠易激综合征  饮食比服药更有效 银河系发现巨大黑洞
史上最亮伽马射线暴来自一颗坍缩的恒星 导师:年年审毕业论文,总有这些问题!
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文