天下网吧 >> 网吧系统 >> 系统动态 >> 正文

有一种工作,叫直播里的鉴黄师

2016-12-14不详佚名
一个最直接的宣泄口——有需求就有表演,有表演就有看客。看客数量增多,催生出更多的打擦边球主播。

然而,满足看客欲望只是直播平台频频涉黄的表面原因。拆穿涉黄的西洋镜,无非是巨大的利益驱动。

今年11月28日,女主播“雪梨枪”因传播色情视频内容被判有期徒刑4年。事实上,雪梨枪并不是个例,利用直播平台传播色情内容,牟取利益的大有人在。

依靠着性感裸露的标签,主播王瑞儿的新浪微博粉丝已达641105人,这让她可以顺利地开设自己的店铺、在微博、微信售卖性感内衣,同时,她坚持积极到夜场走穴演出,身家倍涨。

以直播平台YY为例,去年一年,观众在这个平台上送给主播的“棒棒糖”多达100亿个。棒棒糖是虚拟货币,每支可折现0.1元人民不,100亿个,总值10亿元。YY总经理周剑接受媒体访问时说,这10亿元打赏,平台拿掉一半,剩下的由主播和工会按比例分成。

有一种工作,叫直播里的鉴黄师

图片来源:端传媒

而某些小型直播平台,更是专门以提供色情内容为主业。直播裹挟着资本、年轻人的发财渴望和躁动的荷尔蒙,形成一种流量巨大的希望与荒谬。

除了缺乏原则的利益牟取,直播涉黄也带来了难以把控的社会影响。

大麦是个文青,她平时喜欢看音乐节,到不了现场的时候,也喜欢看乐队的现场直播,这让她能感受到现场的热烈。可谈及“直播造人”,她却嗤之以鼻。

“那不是人性,那是兽性,就他妈像动物园一样,里面的人是禽兽,外面的人也是禽兽。”

是人性是兽性,尚未有定论,一个国家的男女关系开放程度,通常跟经济、法治等社会发展程度有关系。

但问题在于,看直播的人没有门槛——成年和未成年,只要有智能手机、直播账号,就相当于拥有了直播的入场券。

无门槛的入场,会诱发人性当中许多潜在的恶。

鉴黄:从鉴黄师到人工智能

魔高一尺,道高一丈。随着各种管控日渐严格,越来越多的平台意识到要“洗白”,一种宅男福利职业诞生了——鉴黄师。

据悉,一个鉴黄师平均一天要看2万张图,为防止漏网之鱼,经常要三班倒,面对大量黄图鉴定分类,常常身心俱疲。

关于直播鉴黄,传统的处理方法是用户举报配以平台的人工抽检巡逻,效率低下且具有诸多盲点。许多别有用心的人士利用人工的弱点,专挑敏感的时间点(凌晨时分)等进行播放,让鉴黄工作难免有疏漏。

另一方面,直播平台聘请大量鉴黄师是一笔不菲的成本,高峰时期尤其备受考验和压力。映客的相关负责人曾表示,

“为了对主播监管,我们成立了800人的审核队伍。实际上,当直播高峰期,成千上万的主播在线,可以说鉴黄队伍真是寡不敌众。”

由此,人工智能鉴黄正式入场。

有一种工作,叫直播里的鉴黄师

相比之下,人工智能鉴黄优势凸显,能够24小时不间断网络巡航,大大降低鉴黄成本。

据VentureBeat报道,12月1日,Facebook应用机器学习部门主管Joaquin Candela表示,Facebook正在开发一项新的系统工具,可以在直播视频中对令人反感的违规内容进行自动标记。目前,这一自动标记系统工具已开始在Facebook视频直播产品Facebook Live上进行测试,以求营造良好的网络社区环境。

近日,雅虎对外开源了一套深度学习神经网络,它专门用于自动检测图片是否含有色情内容。神经网络使用了CaffeOnSpark系统,基于Hadoop/Spark的分布式深度学习框架,能有效鉴别图片是否含有色情成分。

国内也有多家公司开始布局。阿里的绿网、腾讯的万象优图等巨头纷纷下水,创业公司也积极参与鉴黄业务,在这场鉴黄的战局上各展所长,百家争鸣。

例如,国内的图普科技有限公司便将基于大数据的深度学习技术应用于视频直播鉴黄领域。

图普的鉴黄师们每天面对着海量的数据进行判断分类,根据肤色裸露程度、姿势、肢体轮廓判断是否涉及色情元素。海量数据标注之后便是对机器的训练。其通常逻辑是:鉴黄师输入海量数据,将各类数据进行标签化训练,告诉机器,ABC是色情,DEF非色情,机器通过监督学习,提取ABCDEF的特征来判断G是不是色情。

图像识别需要大量的数据进行支撑。数据匮乏,或样本对应用场景覆盖不全会严重影响准确率,只有达十万量级的数据支撑才能起跑。图普的鉴黄师马赛克对Xtecher说:“在前期数据不足的时候,要经常去找岛国的动作片,找番号下载种子,获取数据。”

据图普科技公司介绍,人工智能鉴黄有效节省了超过90%的人工复审工作,节省了大量成本。

在提高鉴黄的准确度上,极限元采用的路径是深度卷积神经网络CNNs的多GPU并行框架,通过小样本目标的学习,快速准确地理解图像内容,并从图像中自动识别指定目标。网络直播平台可以进行内容自定义,对视频中静态和动态的物体、人物信息进行实时分析识别,最终综合处理视频中采集到的敏感信息,对视频中的场景进行事件分析,鉴定其涉黄与否。

除此图像之外,鉴黄还可语音、文字等方面进行鉴定。因为直播的形式不仅仅有丰富的画面,看客可以利用实时弹幕等与主播进行交流互动,主播更是以直接语言交流等方式与粉丝进行实时的互动。

对此极限元对Xtecher说:“为了更好地提高鉴黄的准确度,极限元加入了智能语音处理方面,采用的是CTC+LSTM组合的深度学习技术,识别和分析出语音中的信息内容,从而判断出语音内容中是否含有敏感信息。使得鉴黄除了图像以外有了多一个观察维度。”

国内的另一家公司达观数据是通过提取文字信息进行鉴黄的。

达观数据CEO陈运文对Xtecher介绍,

和图像原理一样,文字也是通过机器学习的原理训练模型,通过弹幕、点播、打赏等行为挖掘数据,进行特征提取,辅之以相应的算法训练,能够有效地识别有无涉及色情信息,从而监督直播房间有无涉黄直播。

如今,大量直播平台都会从图像、语音、文字等多个维度监察直播过程中有无涉及色情信息,期待以技术有效过滤不良信息,还直播一个清白之名,斩断劣币驱逐良币的可能。

难题与前路

人工智能鉴黄虽然在不断发展,但还是存在很多犯错和脱离不了人力的地方。

网络本身的深度、参数的设置、训练的方式、数据样本的齐全性都影响着鉴黄的精准度。此外,鉴黄过程中很多流程都依赖人的参与,例如数据的分类标注、数据的查看、模型的训练、模型的测试、原因的排查等每个环节都需要人来启动运转,对于人力还是未能完全解放。

此前,人工鉴黄也存在着截图频次不高、准确度不够,查全率不足、审核无法识别等问题,导致有害信息在监控漏洞下被迅速传播,造成严重不良社会影响。

因此,难题依旧在,技术需要不断突破,使得人工智能鉴黄达到更精准的程度,进一步解放更多的人力,守卫网络的边界。

一个著名的直播网站的漫画广告上,160年前的画家梵高说:“人生如果再有一次选择,我会愿意在镜头前描绘我的专注,而不是让我的作品在时间中争吵。”

80年前的战地记者罗伯特.卡帕说:“人生如果再有一次选择,我会实时向世界播放战争的真相,而不是在事件过后再选择曝光。”

400多年前的旅行家徐霞客说:“人生如果再有一次选择,我会邀请你们一起看这世界的美好,而不是在文字中

本文来源:不详 作者:佚名

相关文章
没有相关文章
声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。若文章侵犯了您的相关权益,请及时与我们联系,我们会及时处理,感谢您对本站的支持!联系Email:support@txwb.com,系统开号,技术支持,服务联系QQ:1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下