阿里巴巴发布人工智能鉴黄师-月光博客

　　近日，阿里AI鉴黄语音反垃圾服务上线公测，能识别语音中存在的涉黄、广告等违规信息。这意味着，除识别色情图片、色情视频和色情文字外，涉黄语音也能通过AI鉴别了。

　　以往，传统的人工鉴黄师通过一双肉眼鉴别色情图片和视频。听起来像是"福利"，但实际上并不轻松。如今，伴随着互联网上社交媒体、直播、短视频的发展，每天光上传的图片超过10亿张，发文数量超过5亿条，不少色情、暴力等内容充斥其中。人工鉴黄师一天一人审核1万张图片的工作量，远远满足不了这一需求。

　　2015年10月，阿里巴巴"绿网"上线，用人工智能识别网络上包括色情、暴力在内的违规信息，阿里AI鉴黄师应运而生。通过人工智能、深度学习和大数据样本等技术，阿里巴巴的AI鉴黄师训练识别千万张正常图片与色情图片，最终生成一个智能鉴黄模型。

　　"我们要做的就是拿图片去'喂养'它，让它不断学习，变得越来越聪明。" 阿里巴巴安全部高级算法工程师威视介绍："最初在获取样本时，我们筛选了近2000网站、6000多万色情图片，经过去重，标注1300多万张高质量的色情图片，可以说这是AI鉴黄最重要的一块基石。"

　　阿里安全，一向致力于解决社会问题，可以说，高效率、低成本的阿里AI鉴黄技术，正将人工鉴黄师逐渐解放出来。威视表示：AI鉴黄师每天可审核数亿张图片，识别准确率高于99。5％。举个例子，一天要审核4亿张图片的话，单纯由人工来审，一人一天审1万张，需要4万人，而AI鉴黄只需将其中20万张可疑的图片筛出来，由人工再审一道，这需要20人即可。

　　更厉害的是，阿里AI鉴黄师不仅能鉴别黄片黄图，连带有情色信息的语音内容都能识别。近期上线公测的AI语音鉴黄反垃圾服务，可支持中文、日文、英文等多国语言，还支持东北、四川、广东等地方言。无语义的呻吟声也能识别出来。8月21日在北京召开的2018年网络安全生态峰会上，这些成果将集中展示。

　　当然，AI鉴黄并不能完全取代人工鉴黄，相比人工审核，机器还很难理解内容背后的深意。"最佳的审核方式是智能为主，人工为辅。人工鉴黄师群体数量少了，目前主要做打标和审查可疑图片的工作。"阿里安全部产品专家念夏说。

　　稿源：环球网

　　原文链接：《阿里巴巴发布人工智能鉴黄师》

2018年8月21日星期二

阿里巴巴发布人工智能鉴黄师