谷歌发布大规模对话语料库,涉及17个领域含1.8万个注释

作者: 图灵联邦 2019-10-30 08:55:33

 在不需要额外数据和再训练的情况下,谷歌Assistant等人工智能助手如何更好地支持新服务?

这是谷歌的研究人员在最近的一项研究中试图回答的问题,该研究引入了一种方法,在没有领域特定参数的情况下跨服务使用模型。

作为它的一部分,该团队发布了一个语料库——模式指导的对话(SGD)语料库——他们声称这是最大的面向任务的对话语料的公开汇编。

软件工程师Abhinav Rastogi 和谷歌研究工程负责人Pranav Khaitan在博客中写道:“如今的虚拟助手帮助用户完成各种各样的任务,包括查找航班、搜索附近的活动和电影、预订、从网上获取信息等等。”

“尽管取得了巨大的进步……适应性挑战在最先进的模型中常常被忽视。这部分是由于缺乏合适的数据集来匹配虚拟助理所面临的规模和复杂性。”

为此,SGD包含18000多个人与虚拟助理之间的带注释的对话,涉及与17个领域服务的交互:从银行、大事件到媒体、日历、旅行和天气等。

对于大多数领域,数据集包含几个不同的api,其中许多api具有重叠的功能,但是不同的接口反映了典型的真实场景。评估集包含了训练集中没有的服务,主要用于量化模型对api变化或新api添加的鲁棒性。

至于前面提到的模式指导方法,它利用每个服务或API及其相关属性的自然语言描述来学习分布式语义表示,该语义表示作为对话系统的额外输入,随后作为单个模型实现。

该团队表示,统一模型是谷歌开源对话状态跟踪模型的核心,它促进了不同服务中相似概念之间的公共知识表示,使得对训练数据中没有的新服务进行操作成为可能。

“我们相信,这个数据集将成为建立大规模对话模型的良好基准,”Rastogi和Khaitan写道。“我们很兴奋,并期待着研究界将以各种创新的方式利用它来推进对话技术。”

新数据集和模型的发布是在谷歌Coached Conversational Preference Elicitation (CCPE)和Taskmaster-1(两个人之间的一对对话数据集)的开源之后进行的。(前者包括与人们就他们的电影喜好进行的500次对话,总计1万次,总计1.2万次对话。)

谷歌将其描述为:向能够实现人类级别的性能的自然语言系统建模迈出了一步。

谷歌 人工智能 技术
上一篇:AI软件如何帮助教育领域发展? 下一篇:刷脸支付入场:能否成为下一个“支付大战”的酣战点?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

干货!从0到1教你打造一个令人上瘾的聊天机器人?

几千年来,我们一直都是直接通过对话来解决问题的。聊天机器人(Chatbots)的出现实际上是回归到了最简单的岁月。

火火酱 ·  1天前
治愈大脑,人机共生,马斯克为“脑机接口”辩护

随着今年年初特斯拉中国工厂正式开始交付特斯拉 model3 型号电动汽车,特斯拉的股值不断飙升,与此同时特斯拉和马斯克也在新闻媒体上赚足了眼球。

学术君 ·  1天前
CNNIC报告:我国网民已达8.29亿 短视频用户6.48亿

针对疫情特殊状况,基于前期研究试验,具有微纳滤膜清新空气微正压输入与呼出气体在线消毒排放功能的“新风正气”新冠病毒防护面罩研制已经取得初步成功,并有望批量化生产。

佚名 ·  1天前
突破迁移学习局限!谷歌提出“T5”新NLP模型,多基准测试达SOTA

迁移学习在2018年出现的GPT、ULMFiT、ELMo以及 BERT等成果上初露锋芒,之后又在2019年大显身手,推动了领域内多种新方法的发展,其中就包括XLNet、RoBERTa、ALBERT、Reformer 和 MT-DNN 等等。

丛末、蒋宝尚 ·  1天前
英伟达将展示6款机器人:真人大小,力举千斤……

除了显卡之外,老黄近几年也越来越关注AI与机器人,在下月举行的GTC 2020上,英伟达宣布将至少展示6款机器人,它们高矮胖瘦各不同,具备不同的功能。

佚名 ·  1天前
戴口罩难以刷脸支付 刷手行不行?

人工智能技术日益深入生活的同时,公众的隐私担忧也越来越甚。人脸作为生物识别特征数据的一种,与其他识别方式相比具有更容易暴露、难以更改的特性,公众对相关的收集使用活动就更为敏感。那么,有没有其他支付方式?

佚名 ·  1天前
从TensorFlow到Theano:横向对比七大深度学习框架

最近,来自数据科学公司 Silicon Valley Data Science 的数据工程师 Matt Rubashkin(UC Berkeley 博士)为我们带来了深度学习 7 种流行框架的深度横向对比,希望本文能对你带来帮助。

AI小师弟 ·  1天前
AI驱动的网络安全团队致力于人类强化

在很多其他行业,流程自动化和AI预示着工作机会的减少,但与之不同的是,威胁情报的未来是强化人类,而不是取代人类。在这方面,我们的研究发现以下三个主要原因。

邹铮 ·  1天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载