有一种工作 叫直播里的鉴黄师 如今人工智能也登场
图像识别需要大量的数据进行支撑。数据匮乏,或样本对应用场景覆盖不全会严重影响准确率,只有达十万量级的数据支撑才能起跑。图普的鉴黄师马赛克对Xtecher说:“在前期数据不足的时候,要经常去找岛国的动作片,找番号下载种子,获取数据。” 据图普科技公司介绍,人工智能鉴黄有效节省了超过90%的人工复审工作,节省了大量成本。 在提高鉴黄的准确度上,极限元采用的路径是深度卷积神经网络CNNs的多GPU并行框架,通过小样本目标的学习,快速准确地理解图像内容,并从图像中自动识别指定目标。网络直播平台可以进行内容自定义,对视频中静态和动态的物体、人物信息进行实时分析识别,最终综合处理视频中采集到的敏感信息,对视频中的场景进行事件分析,鉴定其涉黄与否。 除此图像之外,鉴黄还可语音、文字等方面进行鉴定。因为直播的形式不仅仅有丰富的画面,看客可以利用实时弹幕等与主播进行交流互动,主播更是以直接语言交流等方式与粉丝进行实时的互动。 对此极限元对Xtecher说:“为了更好地提高鉴黄的准确度,极限元加入了智能语音处理方面,采用的是CTC+LSTM组合的深度学习技术,识别和分析出语音中的信息内容,从而判断出语音内容中是否含有敏感信息。使得鉴黄除了图像以外有了多一个观察维度。” 国内的另一家公司达观数据是通过提取文字信息进行鉴黄的。 达观数据CEO陈运文对Xtecher介绍, 和图像原理一样,文字也是通过机器学习的原理训练模型,通过弹幕、点播、打赏等行为挖掘数据,进行特征提取,辅之以相应的算法训练,能够有效地识别有无涉及色情信息,从而监督直播房间有无涉黄直播。 如今,大量直播平台都会从图像、语音、文字等多个维度监察直播过程中有无涉及色情信息,期待以技术有效过滤不良信息,还直播一个清白之名,斩断劣币驱逐良币的可能。 难题与前路 人工智能鉴黄虽然在不断发展,但还是存在很多犯错和脱离不了人力的地方。 网络本身的深度、参数的设置、训练的方式、数据样本的齐全性都影响着鉴黄的精准度。此外,鉴黄过程中很多流程都依赖人的参与,例如数据的分类标注、数据的查看、模型的训练、模型的测试、原因的排查等每个环节都需要人来启动运转,对于人力还是未能完全解放。 此前,人工鉴黄也存在着截图频次不高、准确度不够,查全率不足、审核无法识别等问题,导致有害信息在监控漏洞下被迅速传播,造成严重不良社会影响。 因此,难题依旧在,技术需要不断突破,使得人工智能鉴黄达到更精准的程度,进一步解放更多的人力,守卫网络的边界。 一个著名的直播网站的漫画广告上,160年前的画家梵高说:“人生如果再有一次选择,我会愿意在镜头前描绘我的专注,而不是让我的作品在时间中争吵。” 80年前的战地记者罗伯特.卡帕说:“人生如果再有一次选择,我会实时向世界播放战争的真相,而不是在事件过后再选择曝光。” 400多年前的旅行家徐霞客说:“人生如果再有一次选择,我会邀请你们一起看这世界的美好,而不是在文字中踽踽独行。” 直播的伟大在于它让每个个体都有可能成为中心,让每个个人都能够有机会发光,不需要经历如梵高一样漫长时间差的遗憾。
良好的平台,应该发挥正面作用,而不是明珠蒙尘。直播的潮流无法逆转,技术却可以更好地守护网络的边界,我们希望有朝一日,任何擦边球最终无法逃离人工智能的天眼,让直播更够以更纯净、健康的方式走进生活,让我们共享一个由善意连结的直播世界,使美好、知识、善意、感动更好地通过直播流动起来。 (编辑:云计算网_泰州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |