最新壁纸 | 网站合作 快收录网(www.kuaisl.com)找网站,找资源就上快收录!
当前位置:网站首页 > 好文分享 > 正文

苹果开发全新AI框架,让用户亲身参与数据标记自动化

却尘思 2019-09-24 123 浏览 0 评论

苹果Siri这样的个人助理通过自然语言命令来完成任务。然而,它们的底层组件通常依赖于监督机器学习算法,这些算法需要大量手工注释的训练数据。为了减少收集这些数据的时间和精力,苹果的研究人员开发了一个框架,利用用户参与下的信号,来自动创建增强数据的标签。他们的报告中表示,当使用诸如多任务学习和外部知识库验证等策略时,带注释的数据显著提高了生产深度学习系统的准确性。

苹果开发全新AI框架,让用户亲身参与数据标记自动化 第1张

“我们认为,这是首次使用用户参与信号来帮助大规模生成序列标记任务的训练数据,并可应用于实际设置中,在几乎没有人工注释数据的情况下加快新功能的部署,”研究人员在一篇待出版的论文中写道。“此外,用户参与信号可以帮助我们从数字助理自身的错误中吸取教训,从而确定其需要改进的地方。”


研究人员使用了一系列启发式方法来识别,可以表明积极参与或消极参与的行为。其中一些包括点击内容来进一步参与(积极的回应),长时间听一首歌(另一个积极的回应),或者打断智能助手提供的内容,手动选择不同的内容(消极的回应)。这些信号被选择性地以“隐私保护方式”获取,以自动生成基本的具有真实性的注释,随后它们与人类注释者提供的粗粒度标签相结合。


为了将粗粒度标签和推断出的细粒度标签合并到人工智能模型中,论文的合作者设计了一个多任务学习框架,将粗粒度和细粒度实体标签作为两个任务处理。此外,它们还合并了一个由实体及其关系组成的外部知识库验证器。假设预测“something”作为一个音乐标题,“the Beatles”作为一个音乐艺术家,我们可以查询“Play something by the Beatles”,验证器将展开对一级标签的备选方案的查找,并将它们发送到一个组件,该组件将对预测重新排序,并返回最佳备选方案。


研究人员利用两个独立的测试集来评估多任务模型所执行的任务,他们从生产系统中随机抽取样本,并对基础的真实标签手工标注。他们表示,在21次模型运行中,添加的26万个训练示例,与所有数量的人工注释数据的基线相比,“一致地”降低了预测任务中的粗粒度实体错误率。此外,他们还报告说,当有相对少量的人工注释数据(5000个示例)时,添加弱监督的细粒度数据会产生更大的影响。最后,他们报告说,对于任何顶级模型假设通过知识库验证器的例子,细粒度实体错误率下降了大约50%。


在另一个实验中,团队试图确定用户意图的更细微标注,是否会增加系统选择正确操作的可能性。他们采集了大约5000个“播放音乐”命令,其中包含对多个乐队、艺术家和歌曲的引用,并通过一个包含其框架的系统将其发送出去,之后,他们要求注释者将系统返回的响应分为“满意”或“不满意”。研究人员报告说,增强后的系统产生的结果相对任务错误率降低了24.64%。


他们将继续探索如何利用个人用户的参与行为来提升个性化。


“我们观察到,我们的模型改进了用户最终接收的结果,特别是对于包含困难或不寻常语言模式的请求,”论文合作者写道。“例如,增强后的系统可以正确处理诸如‘你能播放Miley Cyrus新专辑中的Malibu吗’和‘播放Kendrick Lamar的Humble’之类的查询。此外,增强后的模型还能识别出用户在遇到真正的语言歧义时更有可能引用的实体。例如,在Play one by Metallica中,one可以是一个非实体标记(意为播放Metallica的任何歌曲),也可以特指Metallica一首名为One的歌。由于大多数用户在说‘Play One by Metallica’时都会听Metallica乐队的‘One’这首歌,所以我们的模型会根据用户参与注释的数据来预测‘One’到底指什么,从而更好地捕捉用户群体的趋势和偏好。”


此前,有一篇论文描述了苹果的人工智能开发工具Overton,该工具的模型处理了“数十亿”个查询。另外,苹果最近研究了用户是否更喜欢与“健谈”的人工智能助手交谈。


相关推荐

2020年全国高考作文题出炉,你会选择哪个?
2020年全国高考作文题出炉,你会选择哪个?

全国卷I阅读下面的材料,根据要求写作。春秋时期,齐国的公子纠与公子小白争夺君位,管仲和鲍叔分别辅佐他们。管仲带兵阻击小白,用箭射中他的衣带钩,小白装死逃脱。后...

2天前 却尘思

《观测号》observation 游戏剧情解析,它到底讲了什么
《观测号》observation 游戏剧情解析,它到底讲了什么

首先,人类发明了SAM这个AI来帮助人类管理空间站,处理观测数据,渐渐地,SAM在海量的观测数据中发现了三种模式:第一种,在众多恒星种找到了23对完全相同的光变...

3周前 (06-16) 却尘思

快手发布一段可被视为快手版《后浪》的演讲视频《看见》,演讲人为冬泳怪鸽奥利给大叔。
快手发布一段可被视为快手版《后浪》的演讲视频《看见》,演讲人为冬泳怪鸽奥利给大叔。

今日快手发布一段可被视为快手版《后浪》的演讲视频《看见》,演讲人为冬泳怪鸽奥利给大叔。快手此次推出的视频聚焦的是普通人及生活中的参态。官方称:“我们虽是世间的尘...

1个月前 (06-07) 却尘思

微信已正式支持修改微信号,内附修改教程!(仅限安卓最新版)
微信已正式支持修改微信号,内附修改教程!(仅限安卓最新版)

今天中午,微信官方团队宣布,安卓版微信已支持修改微信号,只需要下载最新版本即可,而iOS用户还需要再等等。具体操作办法如下:安卓版最新微信(v7.0.15)...

1个月前 (06-05) 却尘思

各大互联网公司对“地摊经济”的扶持计划,摆地摊变得火热起来
各大互联网公司对“地摊经济”的扶持计划,摆地摊变得火热起来

1.阿里1688推“地摊经济”扶持计划新批发帮3000万“摊主”免息赊购进货5月29日,阿里1688发布“地摊经济”帮扶计划,将提供超过7...

1个月前 (06-05) 却尘思

抖音早知惊鸿一场何必情深一往是什么歌
抖音早知惊鸿一场何必情深一往是什么歌

抖音早知惊鸿一场是什么歌?很多小伙伴是不是已经被这首歌洗脑?现在抖音上全部是用这个BGM当背景音乐,那么这句早知惊鸿一场是什么歌?接下来小编为大家带来抖音早知惊...

1个月前 (06-04) 却尘思

教你如何让火绒安全软件禁止开机自启
  • 教你如何让火绒安全软件禁止开机自启
  • 教你如何让火绒安全软件禁止开机自启
  • 教你如何让火绒安全软件禁止开机自启
  • 教你如何让火绒安全软件禁止开机自启
网站SEO 网站优化过度的几个表现
网站SEO 网站优化过度的几个表现

网站优化是一个长久的进程,不该该脚踏两船,然而过分优化会使你的网站拔苗助长,不单不能提高网站的排名和权重,然而容易遭到百度算法的冲击和处罚。其实许多优化人员技术...

1个月前 (05-27) 却尘思

喜加一!Epic商城即将开启限时免费领取《侍魂NEOGZEO合集》
喜加一!Epic商城即将开启限时免费领取《侍魂NEOGZEO合集》

今天SNK正式公开了《侍魂NEOGEO合集》宣传片,本合集收录了经典刀剑格斗游戏《侍魂》系列的共计7款游戏作品,并添加了“在线对战功能”。SNK官推表示《侍...

1个月前 (05-27) 却尘思

免费接码平台 国内外免费临时手机号码短信接收网站
免费接码平台 国内外免费临时手机号码短信接收网站

收短信提供的短信验证码接收服务永久免费,短信内容所有人都查看请不要用本站提供的手机号码接收银行、证券等重要内容本文转载于网络国内免费临时手机号: 1、...

1个月前 (05-25) 却尘思

王者荣耀防沉迷新规定,未成年人夜间无法玩游戏
王者荣耀防沉迷新规定,未成年人夜间无法玩游戏

王者荣耀最新防沉迷规定接入公告,未成年用户夜间禁止游戏。为了防止未成年用户玩游戏,腾讯也是煞费苦心,最终制定好了最新的规定!首先就是限制游戏时间,每天晚上22点...

2个月前 (05-18) 却尘思

喜加一!Steam商店限时免费领取《乐高旋风忍者大电影》《四王一战》
喜加一!Steam商店限时免费领取《乐高旋风忍者大电影》《四王一战》

1、《乐高旋风忍者大电影》(TheLEGO®NINJAGO®MovieVideoGame)Steam商店限时免费领取乐高系列的动作冒险游戏《乐高旋风忍...

2个月前 (05-16) 却尘思

喜加一!限时白嫖《GTA5》《侠盗猎车手5》免费领取永久入库
喜加一!限时白嫖《GTA5》《侠盗猎车手5》免费领取永久入库

不买免费送!本周Epic限免游戏确认为《GTA5》EpicGamesStore官推宣布,本周Epic商城限时免费游戏是《侠盗猎车手5》,一经领取永久入库。领...

2个月前 (05-14) 却尘思

取消回复欢迎 发表评论:

请填写验证码