金山 AI Lab 首次公布落地计划,它选择了 AI 最难啃的一块“骨头”

作者: 苏建勋 2019-01-10 15:16:20

 

“2014 年的时候我曾经说过,成立 30 年的金山 WPS 是被雷军一脚’踢’到移动互联网上的;现在来看,人工智能将成为金山后 30 年一块最重要的敲门砖。”

12 月末,金山办公 CEO 葛珂在北京的一场媒体发布会中表示。在该活动中,成立满一年的金山 AI Lab 首次公布了其落地计划。

金山办公 CEO 葛珂

自 2018 年 7 月金山办公推出 WPS AI 助手,通过可模拟人的智能语音助手协助用户进行智能协作起,金山办公的 AI 战略开始逐步实施,未来计划实现“AI 知识图谱技术”在金山 WPS Office 等产品的落地。

其具体的功能点包括:

“成语知识卡片”将从文档中识别成语实体,提供成语的读音、释义和出处;
“成语读音填充”将为含有生僻字的成语注音;
“成语知识问答”将针对用户对成语的提问,进行推荐常用成语;
“成语写作”可在用户比较各个成语时,展开成语对应的知识卡片。

人工智能正成为金山集团当下的核心战略。上个月,金山软件集团召开了成立 30 周年庆典,金山董事长雷军也在公开演讲与全员邮件中多次谈到人工智能的战略地位。

“未来 30 年,金山将全力投入国际化和 AI。” 雷军强调。

整个 2018 年,AI 成了互联网巨头业务板块中的“香饽饽”,这从阿里、腾讯、百度等大公司在去年的组织架构调整中可见一斑。对于他们来说,人工智能的落地既需要与现有的数据、业务积累实现联动,也需要与未来的战略发展相互映衬(诸如百度自动驾驶的 Apollo、阿里天猫精灵的语音交互)。

而在以 WPS 等办公软件发家的金山软件,其多年积累的语义处理、机器翻译等场景则成为 AI 落地的首选方向。目前,金山 WPS 全线产品月活跃用户数超 3 亿,产品已覆盖全球超过 220 个国家和地区。每天用户使用 WPS Office 来编辑的文件数量达到 5 亿左右。

2017 年 5 月,金山集团成立 AI Lab ,由金山办公副总裁姚冬直接分管,目前团队涵盖图像、文本、语音三大方向,计划将机器翻译与图文转换、知识图谱、智能协作等技术深度融合。

金山办公副总裁姚冬

相比商汤、旷视、云从等 AI 公司在视觉识别领域扎堆进场,金山选择了主攻人工智能中的 NLP(自然语言处理)方向,这样的选择有些特例独行。

一般来说,人工智能可以被简单分为自然语言处理、计算机视觉、人机交互三类模块,而在其中,自然语言处理的起源时间最早,后期落地难度也最大。

1956 年,“人工智能”概念在达特茅斯会议提出后,科学家们开始寄希望于用计算机模拟大脑理解语言学的过程,1962 年,一个名为“机器翻译与计算语言学学会”(后更名为国际计算机语言学委员会,简称“ACL”)的机构在美国成立,学界开始对包含机器翻译、语义理解等技术在内的人工智能模块进行深入研究。

“机器翻译遇到了很多难以克服的语义障碍,甚至一度进入低迷状态。”中科院研究院博士生导师宗成庆对钛媒体介绍道,2013 年,宗成庆成为国内至今唯一一位加入 ACL 的华人科学家,在他看来,在语音语义理解的机器翻译操作中,需要面临诸如“口音、标点识别不准导致语句翻译出错”、“政治经济等专业术语机器无法胜任”等诸多挑战。

不过,金山仍愿意在 NLP 领域进行尝试。在金山办公副总裁姚冬看来,这与集团在该赛道上的积累息息相关。

1997 年毕业即加入金山的姚冬,曾参与金山早期的两款产品——金山词霸与金山快译的开发工作。他认为,起初受限于当时 CPU 计算能力、存储、数据量三个问题,机器翻译只是基于规则的模型。而随着算力的升级与算法的迭代,姚冬一方面目睹了机器翻译逐步大规模地应用,另一方面,他也见证了金山集团旗下云、WPS、稻壳网等产品的延伸,这也为金山的 AI 落地提供了更为丰富的场景。

在阐释金山的人工智能战略时,“务实”是姚冬多次谈到的形容词。他告诉钛媒体:“金山做技术的风格是一定要落地,一定要把 AI 变成一个产品或服务直接面向用户。这是金山 30 年来的一贯风格。”

以金山此次宣布的 AI 落地计划中的功能点为例:当用户写作时突然忘记应该使用什么成语,只需通过对 WPS 文档中内置的智能助手提问,比如“形容勤奋的成语是什么?”,即可获得一系列描述勤奋的常用成语,同时每个成员还包含一份相对应的知识卡片,以帮助用户做出选择,并在用户选定合适的成语时实现自动插入。

金山 WPS 推出的“成语智能问答”功能可以帮助用户联想合适的成语。

“公文辅助写作”,是金山选择用 AI 进行革新的另一大主场景。这项在今年年中推出的功能包括关键词句自动校对,比如对“全面建成小康社会”这类的常用语句进行定向识别;以及对《全国人大学习方案》这类长文件进行智能要点汇总与目录检索。

根据金山办公 CEO 葛珂介绍,目前全国政务系统中,金山 WPS 的覆盖率已经超过了 50%,这就让金山在 TO G 的垂直类别里获取到足够多的训练场景;另一方面,由于政务领域对文本要求比较高,相关的格式、字体、字号都有所限定,再加上政府信息公开化的趋势,有助于为金山形成高质量的语料。

除了功能点上的革新以外,金山办公也十分注重人工智能的技术研究与实际业务的结合效率,在葛珂看来,当 AI 对用户的价值通过金山办公的产品不断放大后,当中的商业化能力也会被自然而然地释放出来。

“现在的用户习惯已经变成是他们愿意为成果付费,而不愿意为一个工具付费。”葛珂对钛媒体举例谈到。目前金山 WPS 的付费应用主要以模板素材、会员服务等增值功能为主,而 AI 助手可以做得,就是可以将 PPT 模板之类的素材与用户需求更智能地匹配在一起,以撬动用户的付费购买意愿。

AI 数据 科技
上一篇:芯片巨头们的 CES:自动驾驶“明争”、5G“暗斗” 下一篇:小度蓝牙联盟峰会:开创对话式AI技术+蓝牙设备的智慧未来
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

中文自动转SQL,准确率高达92%,这位Kaggle大师刷新世界纪录

首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

郭一璞 ·  1天前
图灵奖得主Yoshua Bengio:深度学习当务之急,是理解因果关系

深度学习擅长在大量数据中发现模式,但无法解释它们之间的联系,而图灵奖获得者Yoshua Bengio想要改变这一点。

佚名 ·  1天前
全球十大AI训练芯片大盘点

AI芯片哪家强?现在,有直接的对比与参考了。英国一名资深芯片工程师James W. Hanlon,盘点了当前十大AI训练芯片。

乾明 ·  1天前
模型仅1MB,更轻量的人脸检测模型开源,效果不弱于主流算法

AI模型越来越小,需要的算力也也来越弱,但精度依旧有保障。最新代表,是一个刚在GitHub上开源的中文项目:一款超轻量级通用人脸检测模型。

乾明 ·  1天前
人工智能遇冷,自动驾驶受阻?

2016到2019,人工智能经历了梦幻般的三年,但人工智能的历史规律告诉我们:高潮过后可能会引来新的一波沉寂,人工智能助推下的自动驾驶也会受到波及。

佚名 ·  2天前
机器学习转化为生产力,警惕这4个常见陷阱!

几乎每个人都想在他们的业务中引入机器学习,但是这些人也遇到了一个大问题:让模型可持续发展十分困难,尤其是在云架构的基础上。medium上一位博主也指出了这个问题,并提出了将机器学习模型投入生产的4个常见陷阱。

大数据文摘 ·  2天前
对于人工智能的恐惧及其5个解决方法

实施人工智能技术的IT领导人可能会感到一些恐惧,这有着充分的理由。人工智能在拥有数十年发展和应用历史的同时却有着奇怪的定位,但对于许多人来说,人工智能仍然是一种未来主义的感觉。

Kevin Casey ·  3天前
用AI实现动画角色的姿势迁移,Adobe等提出新型「木偶动画」

近日,Adobe 和康奈尔大学的研究人员提出一种基于学习的动画制作方法——基于卡通角色的少量图像样本就可生成新动画。

机器之心 ·  4天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载