今日头条升级灵犬反低俗助手,新增图片识别功能

来源:www.xjctc.net   时间: 2020-04-10

DoNews 7月30日消息(记者费倩雯)7月30日,今天的标题宣布正式推出新版反流氓助手(以下简称“灵狗”),同时支持图像和文字识别,根据字节击败人工智能实验室主任王长虎透露,“灰狗”将支持语音识别和视频识别。

用户现在可以在头条新闻中搜索“灵魂狗”,只需在“灵狗”中输入一段文字或文章链接,“灵狗”就可以帮助它检测内容健康指数,返回识别结果。对于用户输入的内容,“灰狗”将首先提取,分段和语义识别,然后根据相关规则输出相应的分数,等级和结论。这一切都在几秒钟内完成。图片和图片链接检测相同,用户可以通过上传“灰狗”中的图片或图片链接快速获取识别结果。截至2019年6月,反流氓助手的使用已超过300万。

据报道,“灰狗”诞生于今天的标题反庸俗模式。它是用于检测内容健康状况的辅助小工具。它致力于打击低质量和低质量的内容。自2012年以来,今天的头条新闻已经建立了反色情,反俗,反倒。数百个模型,如标题派对,反假信息,反低质量,并投资近10,000个专业审核团队。

在过去的一年中,“灰狗”已经完成了两次迭代。在2018年3月28日,今天的头条新闻首次在“灰狗”上发布,支持测试文本和文章的链接。 2018年5月16日,“灰狗”完成了服务容量升级,增加了反色情短文型和谣言模式,准确率从73%提高到82%。 2019年2月20日,“Greyhound 2.0”正式上线。除了反色情粗俗模式外,还增加了反暴力和反标题党模式,以涵盖主要的粗俗和低质量内容类型,整体识别准确率接近85%。

这是半年后“灰狗”的另一次重要升级。据王长虎介绍,新版“灰狗”的重点是扩大反俗识别类型和模型能力,现已涵盖图像识别(反色情粗俗,反血腥暴力)和文字识别(反.色情粗俗,反暴力,反头衔党派)后续行动还将支持语音识别和视频识别。

根据王长虎的说法,在文本识别层面,“灰狗”已经历了三次迭代。与旧版本相比,每个新版本的技术和数据集级别都有显着提升。这一代“灵缇犬”同时应用。采用“Bert”和半监督技术,总训练数据集为1.2T,相当于百度百科全书的20倍或维基百科总数据的100倍,其中包括920万个样本,准确率提高到91%。

在图像识别层面,“灰狗”使用深度学习作为解决方案,并在数据,模型和计算能力方面进行了有针对性的优化。在数据层面,“灰狗”已经积累了数千万的训练数据。

在模型层面,“灰狗”优化了许多困难样本的模型结构,并试图解决复杂问题,如多尺寸,多尺度和小目标。在计算层面,“灰狗”使用分布式训练算法和GPU训练集群来加速模型的训练和调试。

王长虎说,粗俗判断问题的复杂性和不同判断方法的局限性,一方面需要技术模型的不断演变,另一方面需要技术与人工判断的有效结合。目前,“灰狗”已经建立了一个比较完整的模型迭代系统。通过“数据采集 - 数据注释 - 数据清理 - 模型培训 - 模型评估 - 案例分析”的全过程,不断优化。 (完)

  • 友情链接:
  • 版权所有© 新疆计算机培训中心 | 新ICP备10201303号-1 | www.xjctc.net . All Rights Reserved | 网站地图