作者: 贡晓丽 来源:中国科学报 发布时间:2018/4/26 9:32:37
选择字号:
视频审核,人工智能依赖“人工”

 

■本报记者 贡晓丽

火热的短视频市场最近遇冷。

在度过最初的高速成长期后,抖音、快手等互联网内容平台接连遇到了监管这道坎。罚款、约谈、下架、永久关停等字眼在最近一两个月内频频出现,而这一切都指向了平台的人工智能(AI)算法和审核机制。

为何这些宣称“以技术驱动”的互联网公司仍然存在如此大的审核漏洞,仍然需要不断加大人工审核的力度?一位业内人士指出,今日头条等致力于利用AI算法将基于个性化推荐的内容消费做到极致,但要反过来让算法起到整治和导向的作用,显然还需要技术与管理的完善。

技术的进步能不能解决内容审核难题?“机器审核与人工审核协作是当下最好的内容把关方式。”中国科学院某研究所人工智能专家徐天(化名)认为,“人工智能现处于弱人工智能状态,单个固定AI审核模型无法满足日益壮大的短视频内容的冲击。完全依赖机器审核信息量巨大的视频内容,在技术上有难度!”

AI“退后”,人工“向前”

今年3月底,快手平台上存在大量“未成年妈妈”等低俗短视频被央视陆续曝光,今日头条也因广告问题被推到舆论的风口浪尖,两家公司的CEO宿华和张一鸣相继发布了致歉信。

张一鸣在4月11日宣布永久关停内涵段子APP并加强今日头条的审核,“全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍扩大到10000人。”快手不久前也启动了内容审核员的大规模招聘,需要增加3000名审核编辑,招聘条件是团员和党员优先。

逐渐扩大的审核风波,最后也波及到抖音。抖音先是关停所有评论、关闭直播系统,之后还因涉嫌发布售假视频一事查删视频805个,封禁账号677个,并被北京市市工商局约谈。事后抖音CEO张楠透露,目前审核团队的规模已经有几千人,而且“团队人员每天都在增长”。

新招募的这些人员除了在运营层面给公司增加开支外,也意味着快手、今日头条、抖音等社区型产品在UGC(用户原创)内容审核上还不能完全依赖它们所擅长的AI算法,“人工审核”仍然占据非常重要的地位。

这项审核的任务有多重呢?今日头条内容质量中心负责人、副总编辑李彤此前接受采访时说,一个人一天能处理的文章大概是1000篇,机器一秒钟能处理100篇,今日头条每天新增发布内容是50万条,全部由人工来做,要一个人工作500天才能看完。

与视频相比,文字审核相对容易。“网络直播审核通常包含对直播音视频进行低俗、暴力、血腥、有害问题节目等检测和过滤。”徐天表示,人工结合机器审核是目前常用的审核方法,每条短视频先经过机器审核,将可疑的视频交给人工进行二次审核。

对于这些月活跃用户超1亿甚至2亿的短视频平台,视频审核的压力可想而知。

全依赖机器?技术不可行

“以前,音视频审核主要依靠人力,监管人员需要花费大量时间浏览音视频,将违反有关法律法规的音视频进行审核剔除。”徐天表示,近年来,日益增长的海量互联网音视频内容(包括单个主流直播或短视频平台每天数百万的原创视频),难以完全靠人力来监管。

目前人工智能(特别是计算机视觉、语音内容理解和自然语言处理等技术)已经较为成功地应用于网络直播机器审核。“人工智能是审核短视频的有力工具,但要完全依赖机器审核短视频,技术上还不可行。”徐天说。

机器检测违规视频的准确率还达不到百分百。据徐天介绍,机器学习应用于机器审核的前提是有大量多样化标注的训练样本,并且用于实际监管的数据与训练样本有一定的相似性,然而被监管的视频内容场景多样、内容多样,机器学习目前的技术水平达不到百分百的敏感内容审核准确率和召回率。

“机器审核短视频主要是在达到对敏感内容接近百分百召回率时,大幅降低敏感视频的误报率。”徐天表示,在机器去除大量明显非敏感视频后,由人工进行二次审核, 机器审核降低人工审核的工作量,人工审核进一步提高审核准确率。

机器对大量新模式的违规视频标注存在困难。被监管的视频内容不断快速演进,尽管有一些对新模式违规视频发现的工作,但机器如何对大量新模式违规视频自动标注仍是技术难题。

另一方面,方言和风俗类视频内容也增加了被监管的音视频内容场景的多样性,无论人工审核还是机器审核都加大了审核难度。“如果有足够的相关标注样本,机器就有希望进行方言和风俗等内容模型适配,提高审核这类内容的能力。”徐天坦言。

审核标准同样重要

弱人工智能时代,AI在视频敏感目标检测、文字识别、动作识别、语音内容理解等技术领域,仍有待提高。

AI在视频内容识别、过滤方面有没有完全摆脱人工的可能?对此,徐天表示,他更倾向于人工智能与人协作这种模式,“主流的人工智能技术仍依赖‘人工’标注大量的训练样本数据,因此,人工智能依赖于‘人工’”。

他表示,机器的优势在于计算速度快、存储量大、不会疲倦;人的优势在于推理和知识发现的能力更强。“在拥有足量、多样化的训练样本,并且测试数据与训练集分布相似,拥有合适机器学习算法等的前提下,机器在视频内容识别、过滤等任务的完成速度可能更快,但是机器识别结果很难超过训练数据标注人员群体给出的结果。”

而且,上述前提往往难以满足,这也是视频内容无法完全交付机器审核的原因。“但随着数据的积累,机器的内容识别、过滤能力会逐步加强。”徐天说。

作为短视频平台本身,对视频内容的审核有多严格?今日头条算法架构师曹欢欢曾表示:“目前头条的分享内容识别技术模型分为鉴黄模型、低俗模型、谩骂模型等,主要都是通过大量的样本库进行比对分析。”以谩骂模型为例,样本库超过百万级别,准确率80%以上,召回率95%以上,“这部分模型更注重召回率,甚至可以牺牲一些准确率,也要提高安全性。”

“内容审核标准会作为机器审核的重要参考。”徐天表示,“标准的制定与机器算法能力的提升同样重要。”

《中国科学报》 (2018-04-26 第6版 前沿)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 

目前已有0条评论
相关新闻 相关论文

图片新闻
“雪龙”号离开中山站返航回国 美飞行器两次对嫦娥四号探测器成像
“协助迁徙”能否拯救帝王蝶 你的朋友“出卖”了你
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐