AI更懂人话:谷歌发布全新对话数据集,模仿智能助理

我想在3天前分享新智慧

新智慧报告

[新智元导读] Google发布了Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1对话数据集,这些数据集独特地模仿了当今基于语音的数字助理设计,保留了自动化系统环境中口语对话的特征。

今天的助手可以执行各种任务,并返回多个主题的个性化结果,例如电影列表,餐厅预订和旅行计划。

然而,尽管近年来取得了巨大进步,但尚未达到人类理解的水平。部分原因是缺乏高质量的培训数据,准确反映了人们如何向智能助理表达他们的需求和偏好。

这是因为这些系统的局限性误解了我们所说的内容,以及我们想要理解的关系,我们必须容纳助手,他们能够理解的词汇。换句话说,我们今天看到的智能助理理解远离人类复杂程度的对话。

为了解决这个问题,Google发布了Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1对话框数据集。

这两个系列都使用了一个绿野仙踪平台,它将两个参与口语对话的人配对,就像那些想要拥有真正有效助手的人一样。

对于这两个数据集,内部的绿野仙踪设计旨在独特地模仿当今的基于语音的助手,在自动化系统的环境中保留口语对话的特征。

由于人类的“助手”可以准确地理解用户的要求,我们可以捕捉用户如何向“完美的”助手表达自己,以便我们可以继续改进这样的系统。

ccpe数据集的全部细节在google发表的一篇研究论文中进行了描述,该论文将在2019年的话语与对话特别兴趣小组特别会议上发表,taskmaster-1数据集论文将在2019年进行处理。实证研究方法已经出现。

偏好灵感

在面向电影的ccpe数据集中,冒充用户的人对着麦克风讲话,音频直接播放给冒充助手的人。

助手输出他们的回答,然后通过文本到语音的方式播放给用户。这两个人的对话自然包括自发的流畅性和双方之间自发发生的错误,这些错误很难用合成对话来复制。这就创造了一系列关于人们电影偏好的自然而有组织的对话。

在对这个数据集的深入研究中,谷歌发现人们有非常丰富的方式来描述他们的偏好。这个数据集是第一个大规模描述这种丰富性的数据集。

谷歌还发现,偏好并不总是与助手的方式相匹配,也不总是与推荐网站的方式相匹配,这是该选项的特点。

换句话说,你最喜欢的电影网站或服务上的过滤器可能与你在寻求个人推荐时用来描述各种电影的语言不匹配。

面向任务的对话框

taskmaster-1数据集使用上述方法和单人书写技术来增加语料库的大小和说话人的多样性,使用了大约7700个“自言自语”条目和大约5500个双人对话。

对于书面对话,google允许人们根据每个任务中概述的场景创建完整的对话,从而充当用户和助手。

因此,虽然口语对话更接近于会话语言,但书面对话既丰富又复杂,但更便宜,更容易收集。

该数据集基于六个任务之一:订购披萨,创建汽车维修预约,设置汽车租赁,订购电影票,订购咖啡饮料和预订餐馆。

此数据集还使用简单的注释模式为数据提供充分的基础,同时允许员工随时轻松地将标签应用于对话框。

与传统的详细策略相比,Google仅关注每种会话类型的API参数,而不仅仅是执行事务所需的变量。

例如,在关于安排乘车共享的对话框中,Google将“到”和“从”位置标记为汽车类型(经济,豪华,游泳池等)。

对于电影票,谷歌标记电影标题,剧院,时间,投票,有时标记屏幕类型(如3D或标准)。语料库版本包含完整的标签列表。

Google希望这些数据集对于对话系统和会话建议中的研究社区的实验和分析非常有用。

收集报告投诉

新智慧报告

[新智元导读] Google发布了Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1对话数据集,这些数据集独特地模仿了当今基于语音的数字助理设计,保留了自动化系统环境中口语对话的特征。

今天的助手可以执行各种任务,并返回多个主题的个性化结果,例如电影列表,餐厅预订和旅行计划。

然而,尽管近年来取得了巨大的进步,但它还没有达到人类的理解水平。部分原因是缺乏高质量的培训数据,无法准确反映人们如何向智能助理表达自己的需求和偏好。

0x251D

这是因为这些系统的局限性误解了我们所说的,以及我们想要被理解的关系,我们必须容纳助手,他们能理解的话。换言之,我们今天看到的聪明助手们对对话的理解远远超出了人类的复杂程度。

为了解决这个问题,google发布了coachedconversationalpreferenceelicitation(ccpe)和taskmaster-1对话框数据集。

这两个系列都使用了一个oz向导平台,将两个参与口语对话的人配对,就像那些想拥有真正有效助手的人一样。

对于这两个数据集,oz设计的内部向导被设计成独特地模仿当今基于语音的助手,在自动化系统的上下文中保留语音对话的特征。

由于人类的“助手”可以准确地理解用户的要求,我们可以捕捉用户如何向“完美的”助手表达自己,以便我们可以继续改进这样的系统。

ccpe数据集的全部细节在google发表的一篇研究论文中进行了描述,该论文将在2019年的话语与对话特别兴趣小组特别会议上发表,taskmaster-1数据集论文将在2019年进行处理。实证研究方法已经出现。

偏好灵感

在面向电影的ccpe数据集中,冒充用户的人对着麦克风讲话,音频直接播放给冒充助手的人。

助手输出他们的回答,然后通过文本到语音播放给用户。这些双人对话自然包括自发流畅性和在使用合成对话难以复制的各方之间自发发生的错误。这创造了一系列关于人们电影喜好的自然而有组织的对话。

通过对此数据集的深入了解,Google发现人们可以通过非常丰富的方式来描述他们的偏好。该数据集是第一个大规模表征这种丰富性的数据集。

Google还发现首选项并不总是与助理的方式相匹配,或者与推荐网站的方式相匹配,这是该选项的功能。

换句话说,您最喜爱的电影网站或服务上的过滤器可能与您在寻求个人推荐时用于描述各种电影的语言不匹配。

面向任务的对话框

Taskmaster-1数据集使用上述方法和单人书面技术来增加语料库大小和说话者多样性,使用大约7,700次“自我对话”条目和大约5,500次双人对话。

对于书面对话,Google可让人们根据每项任务中列出的方案创建完整的对话,从而充当用户和助理。

因此,虽然口语对话更接近于会话语言,但书面对话既丰富又复杂,但更便宜,更容易收集。

该数据集基于六个任务之一:订购披萨,创建汽车维修预约,设置汽车租赁,订购电影票,订购咖啡饮料和预订餐馆。

此数据集还使用简单的注释模式为数据提供充分的基础,同时允许员工随时轻松地将标签应用于对话框。

与传统的详细策略相比,Google仅关注每种会话类型的API参数,而不仅仅是执行事务所需的变量。

例如,在关于安排乘车共享的对话框中,Google将“到”和“从”位置标记为汽车类型(经济,豪华,游泳池等)。

对于电影票,谷歌标记电影标题,剧院,时间,投票,有时标记屏幕类型(如3D或标准)。语料库版本包含完整的标签列表。

Google希望这些数据集对于对话系统和会话建议中的研究社区的实验和分析非常有用。

澳门永利平台