Uber 开源研究对话系统 Plato,用于开发和训练会话 AI

作者: xplanet 2019-07-17 16:30:35

 “在过去的几十年中,智能会话代理已经发生了显著的变化,从关键字定位交互式语音应答(IVR)系统到正在成为日常生活中不可或缺的一部分的跨平台智能个人助理。随着这种增长,需要直观、灵活和全面的研究和开发平台,可以作为开放的测试平台,帮助评估新算法,快速创建原型,并可靠地部署会话代理。 ”

在这种背景下,Uber AI(Uber 的人工智能研究部门)开发并且开源了柏拉图( Plato )研究对话系统。Plato 旨在构建、训练和部署会话 AI 代理,使数据科学家和业余爱好者能够从原型和演示系统中收集数据。它提供干净且易于理解的设计,并与现有的深度学习和贝叶斯优化框架(用于调整模型)集成,可减少编写代码的需要。

目前,Plato 支持通过语音、文本或结构化信息(换句话说,对话行为)进行交互,并且每个会话代理可以与人类用户、其他会话代理(在多代理设置中)或数据进行交互。最重要的是,Plato 可以为会话代理的每个组件包裹现有的预训练模型,并且每个组件都可以在线(在交互期间)或离线(从数据)进行训练。

Plato 通过模块化设计实现了这一目标,将数据处理分为七个步骤:

  • 语音识别(将语音转录为文本)
  • 语言理解(从该文本中提取意义)
  • 状态跟踪(到目前为止已经说过和完成的内容的汇总信息)
  • API 调用(搜索数据库,查询 API 等)
  • 对话策略(生成代理人回应的抽象含义)
  • 语言生成(将抽象意义转换为文本)
  • 语音合成(将文本转换为语音)

每个单独的组件都可以使用任何机器学习库(例如,Ludwig、TensorFlow 或 PyTorch)进行在线或离线训练,因为 Plato 是一个通用框架。

▲Plato 的架构允许对多个代理进行并发训练

为了证明其可扩展性,Plato 用户可以通过提供该类模块的 Python 类名和包路径以及模型的初始化参数来定义自己的体系结构或插入自己的组件。只要模块按照它们应该执行的顺序列出,Plato 就会处理其余部分,包括包装输入和输出,链接和执行模块(串行或并行),以及促进对话。

在数据记录方面,Plato 会在名为 Dialogue Episode Recorder 的结构中跟踪事件,该结构包含有关先前对话状态、所采取的操作、当前对话状态等信息。还包括一个自定义字段可用于跟踪不属于定义类别的任何内容。

Uber AI 的研究人员在***表示:“我们相信,Plato 能够在和其他开源的深度学习框架中更加无缝地训练会话代理,从而改善学术和行业应用中的对话 AI 技术,随着时间的推移,他们的谈话会变得越来越自然。”

博客原文:https://eng.uber.com/plato-research-dialogue-system/

AI 数据 开源
上一篇:不用再求老板涨工资了!下次如何加薪将由AI和算法说了算 下一篇:95后达摩院实习生击败微软,打破NLP最难任务世界纪录
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

大数据与AI如何助力食品饮料行业发展?

数字化几乎颠覆了每一个行业,从金融服务到医疗保健,而食品和饮料行业也不例外。从历史上看,风味特点、潮流和新的食品主要归功于厨师和产品开发人员。而在将一个创意转化成产品并推向市场之前,可能需要花费几个月甚至是几年的时间。

至顶网 ·  9h前
研究公司统计了9大AI领域,分析了世界各国AI法律举措

世界各国政府正在迅速采取行动,以确保现有的法律、法规以及框架,能够在人工智能技术变革中继续起效,应对由新浪潮带来的种种新挑战。

佚名 ·  9h前
单张图像就可以训练GAN!Adobe改良图像生成方法 | 已开源

数据集太小了,无法训练GAN?试试从单个图像入手吧。去年谷歌就提出了SinGAN,是第一个拿GAN在单幅自然图像学习的非条件生成模型(ICCV 2019最佳论文)。

十三 ·  12h前
华为全场景 AI 计算框架MindSpore开源!

华为Mindspore AI计算框架正式开源,标志着华为向自己的AI梦想,迈出了新的一步,而深度学习开源领域,又迎来了一位重量级的玩家。

佚名 ·  17h前
人工智能会扮演好医生的角色吗?

人工智能技术的发展日新月异。它不仅在娱乐和通信领域发挥作用,而且在未来的健康和生活领域做出重要贡献。在一些国家,人工智能技术已经融入强大的分析工具,以帮助医院的医生诊断癌症和其他疾病。但是人工智能会取代医生的角色吗?

风车云马 ·  20h前
人工智能辅助下社交媒体营销人员的十大戒律

如果我告诉你,在社交媒体中使用人工智能工具(并正确地使用)能够增强每名用户的消费者旅程,从而留下更多的用户,且留存时间更长,会怎么样呢?

读芯术 ·  1天前
2020~2030:人工智能将占据主导地位的十年

AntWorks预测,在未来十年中,很难找到一个没有利用AI来智能地自动化业务流程的行业。在所有行业中都有无数的AI用例,这是我们对2020年及以后的预测。

CDA数据分析师 ·  1天前
用机器学习备忘单解决艰巨问题,你行吗?

在本文中,我们将介绍如何使用备忘单简化机器学习方法,你可以使用该备忘单选择适合解决问题的正确算法。

读芯术 ·  2天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载