2019自然语言处理前沿论坛:聚焦机器“读、写、说、译”,探寻NLP未来之路

作者: 佚名 2019-05-28 14:26:04

 人工智能的本质是让机器像人一样感知世界、认知世界。以语言和知识为研究对象的自然语言处理(NLP)技术是人工智能的核心问题之一。5月26日,百度、中国计算机学会中文信息技术专委会和中国中文信息学会青工委联合举办“2019自然语言处理前沿论坛”。

百度高级副总裁、ACL Fellow王海峰博士为论坛做开场致辞。他表示,“语言是人类思维和交流的载体,同时也是人类知识凝练和传承的载体。自然语言处理技术不仅仅需要算法、算力和数据,同时也需要不断地凝练知识,需要语言处理跟我们认识世界、改造世界的过程相结合,所以仍然有很多创新突破的空间。”他希望通过本次论坛,青年学者们能够增进交流,碰撞新的火花,一起推动自然语言处理的发展及产业化的进程,在人工智能时代帮助我们的生活变得更加美好。

本届论坛主题为“机器之‘读、写、说、译’—— 探寻NLP未来之路”,包含语义计算、自动问答、语言生成、人机对话和机器翻译5场专题报告,以及围绕上述专题的嘉宾对话环节。本论坛汇集学术界和工业界的青年专家学者,共同探讨NLP领域的***技术进展、产业应用及发展趋势,旨在促进产学研深度融合,推动自然语言处理技术进步。

“语义计算”研究如何利用计算机对自然语言的语义进行表示、分析和计算,使机器具备语义理解能力。哈工大车万翔教授介绍了动态词向量的技术进展,该技术可以根据上下文更好地处理一词多义现象,大幅提高自然语言处理多个任务的准确率;复旦大学邱锡鹏副教授介绍了表示学习的***进展,分析和对比了当前主流模型的基本原理和优缺点,探讨了如何更好地融合局部和非局部的语义关系,如何更好地加入先验知识,以及针对目前复杂网络模型的简化和加速。北京大学孙栩研究员开展了关于稀疏化深度学习的研究,提出简单有效的算法来简化神经网络,仅用全梯度的子集来更新模型参数,大幅降低了训练和解码复杂度。百度主任架构师孙宇介绍了百度最近提出的知识增强语义表示模型ERNIE,基于实体、短语等知识进行建模,在语言推断、语义相似度等多个任务上取得了大幅提升。

“自动问答”专题探讨机器的“阅读”能力,让机器阅读文本,然后回答和阅读内容相关的问题。机器阅读理解可以使机器具备从文本数据中获取知识并运用知识的能力,是问答领域的关键技术之一。中科院自动化所副研究员刘康介绍了文本阅读理解的基本框架和方法。他表示,构建合理的数据集对于阅读理解任务非常重要,而如何更好的融合知识是未来的重要研究方向。百度资深研发工程师刘?介绍了深度融合文本表示与知识表示的模型KT-NET,以及百度发布的面向真实应用的中文阅读理解数据集DuReader 2.0。基于此数据集,百度、中国计算机学会和中文信息学会连续两年举办了机器阅读理解评测,共同推动中文阅读理解技术的进步。

“语言生成”专题聚焦如何让计算机像人一样使用自然语言进行表达和创作。北京大学万小军教授介绍了自然语言生成(NLG)技术和应用的***进展,指出自然语言生成目前面临两大挑战,首先是对生成文本的质量评估,其次是平行数据的缺失。如果这些问题解决了,将极大地推动自然语言生成的发展。他同时也表示,目前的文本生成与人类还有较大差距,尤其是在综合利用知识的方面。百度主任架构师肖欣延介绍了百度在语言生成技术方面的创新和应用,提出了基于规划、基于信息选择、端到端等多种模型,在文章生成、摘要生成、诗歌生成等任务上取得良好效果。此外,百度还推出了智能写作平台,通过提供自动写作和辅助写作能力,提升内容创作的效率和质量,为智能创作领域提供更多可能。

“人机对话”专题探讨如何让计算机和人类进行对话交流。清华大学副教授黄民烈回顾了人机对话的发展历程,经典的对话系统大多采用强语义方法,而现代神经网络方法则发展了弱语义方法,基于数据驱动和概率统计。语义理解始终是人机对话中需要攻克的难题,如何更好的结合数据和知识,是该领域需要共同努力的方向。百度主任研发架构师孙珂介绍了百度***发布的智能对话系统训练与服务平台UNIT 3.0,从搭建技能、构建知识、整合技能与知识三方面着眼,发布了多个核心技术和工具,大幅降低了对话系统的定制成本。

“机器翻译”是指利用计算机进行不同语言之间的转换和生成,是自然语言处理领域中填补语言鸿沟的重要技术。清华大学副教授刘洋首先介绍了神经网络机器翻译的基本原理,并指出,尽管该方法取得了较大进步,但是仍然面临许多挑战。刘洋介绍了他们在知识驱动、可解释性、鲁棒性神经网络机器翻译方面的***进展。百度人工智能技术委员会主席何中军介绍了机器同传的主要挑战和***进展,指出目前机器同传面临技术、数据、评价三个方面的挑战。结合百度的研究成果,在现场使用了***研发的百度翻译AI同传。现场听众使用手机扫描会议二维码,可以实时收听译文。

5大专题探讨结束后,车万翔、邱锡鹏、黄民烈、刘洋以及百度高级科学家吕雅娟、百度PaddlePaddle总架构师于佃海就“NLP的未来之路”展开高端对话。围绕“最近5年NLP的突破进展”、“NLP的发展趋势及未来5-10年的突破方向”等内容进行了精彩的分享。他们认为5年来,NLP在数据、模型、算法等多方面取得了突破性进展。中国NLP在学术界的研究及工业化应用处于国际前沿,近年来入选领域国际***会议的论文数量急剧增加,论文质量也在不断上升。同时,我们也需要进一步加强前瞻性和原创性的工作,中国NLP的发展潜力不可小觑。谈及未来发展趋势,嘉宾们表示未来进一步融合知识、多模态、探索更类人的学习机制等会带来NLP领域的进一步提升。

自然语言处理被誉为人工智能皇冠上的明珠。随着自然语言处理能力的不断发展,人工智能也在不断的进步。自然语言处理技术被广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为广大用户提供更智能的体验,满足用户对信息和服务的需求,同时也越来越多地在金融、服务、零售、制造业等行业中应用,促进产业智能化发展。NLP的未来之路是什么?或许没有标准答案。但是我们一直相信技术的力量。探索未来***的可能,正如王海峰所言,随着技术发展,人们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。

自然语言 机器 语言
上一篇:2020年将是人工智能相关业务发展的重要一年 下一篇:速看!十大免费机器学习课程已经给你备好了
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

扎克伯格45分钟深度采访:透露下个十年VR和脑机接口野心

Facebook 创始人兼 CEO 扎克伯格在最新接受的专访中,贡献了他迄今为止有关 AR/VR 最深入的策略分析、行业洞察和见解。

李水青 ·  2021-03-10 09:21:05
2021年影响企业的自然语言处理趋势

如今自然语言技术越来越多地在企业中得到应用。很多公司推出了大量文本分析解决方案、语音识别系统、聊天机器人以及所有可以令人想象的语言处理用例。

李睿 ·  2021-03-03 09:00:00
什么是“自然语言处理”? 它到底在“处理”些什么?

“自然语言处理” (Natural Language Processing,简称NLP) 是近年来科技界最热门的词语之一,也是当下人工智能研究最热门的领域之一。

潘蓉 ·  2021-01-21 10:28:16
四两拨千斤,如何做到自然语言预训练加速十倍

随着自然语言处理中的预训练成为研究领域的热点,预训练的成本与计算代价也成为了大家在研究过程中必须考虑的现实问题。本文将会介绍多种在训练模型过程中提高效率,降低成本的方法,希望能对大家的研究有所帮助。

柯国霖 贺笛 ·  2021-01-20 15:41:05
很遗憾,自然语言理解是AI尚未攻克的领域

短短几年之内,深度学习算法得到了长足发展,不仅在棋类游戏中击败了全球很优秀的选手,也能够以等同于、甚至超越人类的准确率识别人脸。但事实证明,人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。

科技行者 ·  2021-01-19 22:38:59
美国科学家用冰造了辆机器车,自己的轮子自己修,要上火星赴南极!

在去年 10 月召开的机器人与智能系统领域国际旗舰会议 2020 年 IEEE/RSJ 智能机器人与系统国际会议(IROS 2020)上,与上述研究相关的论文被收录,这一论文题为 Robots Made From Ice: An Analysis of Manufacturing Techniques(冰制机器人:制造技术分析)。

付静 ·  2021-01-13 10:19:19
首个双手控制脑机接口:开颅手术10小时植入6个电极,瘫痪人士用意念吃蛋糕

Buz Chmielewski 借助科技的力量,用意识同时控制了两条机械臂,这在医学上还是首次。

付静 ·  2021-01-06 09:19:52
想和医生“抢生意”?人工智能须攻破这三大难关

十多年过去,深度学习给了人工智能发展的契机,再加上并行计算(parallel computing)的快速处理能力,以及海量数据的训练,人工智能在很多场景中得以应用,包括语音、图像识别、人脸识别,以及语言翻译和自动驾驶等。

健康界国际 ·  2021-01-05 16:33:22
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载