金山 AI Lab 首次公布落地计划,它选择了 AI 最难啃的一块“骨头”

作者: 苏建勋 2019-01-10 15:16:20

 

“2014 年的时候我曾经说过,成立 30 年的金山 WPS 是被雷军一脚’踢’到移动互联网上的;现在来看,人工智能将成为金山后 30 年一块最重要的敲门砖。”

12 月末,金山办公 CEO 葛珂在北京的一场媒体发布会中表示。在该活动中,成立满一年的金山 AI Lab ***公布了其落地计划。

金山办公 CEO 葛珂

自 2018 年 7 月金山办公推出 WPS AI 助手,通过可模拟人的智能语音助手协助用户进行智能协作起,金山办公的 AI 战略开始逐步实施,未来计划实现“AI 知识图谱技术”在金山 WPS Office 等产品的落地。

其具体的功能点包括:

“成语知识卡片”将从文档中识别成语实体,提供成语的读音、释义和出处;
“成语读音填充”将为含有生僻字的成语注音;
“成语知识问答”将针对用户对成语的提问,进行推荐常用成语;
“成语写作”可在用户比较各个成语时,展开成语对应的知识卡片。

人工智能正成为金山集团当下的核心战略。上个月,金山软件集团召开了成立 30 周年庆典,金山董事长雷军也在公开演讲与全员邮件中多次谈到人工智能的战略地位。

“未来 30 年,金山将全力投入国际化和 AI。” 雷军强调。

整个 2018 年,AI 成了互联网巨头业务板块中的“香饽饽”,这从阿里、腾讯、百度等大公司在去年的组织架构调整中可见一斑。对于他们来说,人工智能的落地既需要与现有的数据、业务积累实现联动,也需要与未来的战略发展相互映衬(诸如百度自动驾驶的 Apollo、阿里天猫精灵的语音交互)。

而在以 WPS 等办公软件发家的金山软件,其多年积累的语义处理、机器翻译等场景则成为 AI 落地的***方向。目前,金山 WPS 全线产品月活跃用户数超 3 亿,产品已覆盖全球超过 220 个国家和地区。每天用户使用 WPS Office 来编辑的文件数量达到 5 亿左右。

2017 年 5 月,金山集团成立 AI Lab ,由金山办公副总裁姚冬直接分管,目前团队涵盖图像、文本、语音三大方向,计划将机器翻译与图文转换、知识图谱、智能协作等技术深度融合。

金山办公副总裁姚冬

相比商汤、旷视、云从等 AI 公司在视觉识别领域扎堆进场,金山选择了主攻人工智能中的 NLP(自然语言处理)方向,这样的选择有些特例独行。

一般来说,人工智能可以被简单分为自然语言处理、计算机视觉、人机交互三类模块,而在其中,自然语言处理的起源时间最早,后期落地难度也***。

1956 年,“人工智能”概念在达特茅斯会议提出后,科学家们开始寄希望于用计算机模拟大脑理解语言学的过程,1962 年,一个名为“机器翻译与计算语言学学会”(后更名为国际计算机语言学委员会,简称“ACL”)的机构在美国成立,学界开始对包含机器翻译、语义理解等技术在内的人工智能模块进行深入研究。

“机器翻译遇到了很多难以克服的语义障碍,甚至一度进入低迷状态。”中科院研究院博士生导师宗成庆对钛媒体介绍道,2013 年,宗成庆成为国内至今唯一一位加入 ACL 的华人科学家,在他看来,在语音语义理解的机器翻译操作中,需要面临诸如“口音、标点识别不准导致语句翻译出错”、“政治经济等专业术语机器无法胜任”等诸多挑战。

不过,金山仍愿意在 NLP 领域进行尝试。在金山办公副总裁姚冬看来,这与集团在该赛道上的积累息息相关。

1997 年毕业即加入金山的姚冬,曾参与金山早期的两款产品——金山词霸与金山快译的开发工作。他认为,起初受限于当时 CPU 计算能力、存储、数据量三个问题,机器翻译只是基于规则的模型。而随着算力的升级与算法的迭代,姚冬一方面目睹了机器翻译逐步大规模地应用,另一方面,他也见证了金山集团旗下云、WPS、稻壳网等产品的延伸,这也为金山的 AI 落地提供了更为丰富的场景。

在阐释金山的人工智能战略时,“务实”是姚冬多次谈到的形容词。他告诉钛媒体:“金山做技术的风格是一定要落地,一定要把 AI 变成一个产品或服务直接面向用户。这是金山 30 年来的一贯风格。”

以金山此次宣布的 AI 落地计划中的功能点为例:当用户写作时突然忘记应该使用什么成语,只需通过对 WPS 文档中内置的智能助手提问,比如“形容勤奋的成语是什么?”,即可获得一系列描述勤奋的常用成语,同时每个成员还包含一份相对应的知识卡片,以帮助用户做出选择,并在用户选定合适的成语时实现自动插入。

金山 WPS 推出的“成语智能问答”功能可以帮助用户联想合适的成语。

“公文辅助写作”,是金山选择用 AI 进行革新的另一大主场景。这项在今年年中推出的功能包括关键词句自动校对,比如对“全面建成小康社会”这类的常用语句进行定向识别;以及对《全国人大学习方案》这类长文件进行智能要点汇总与目录检索。

根据金山办公 CEO 葛珂介绍,目前全国政务系统中,金山 WPS 的覆盖率已经超过了 50%,这就让金山在 TO G 的垂直类别里获取到足够多的训练场景;另一方面,由于政务领域对文本要求比较高,相关的格式、字体、字号都有所限定,再加上政府信息公开化的趋势,有助于为金山形成高质量的语料。

除了功能点上的革新以外,金山办公也十分注重人工智能的技术研究与实际业务的结合效率,在葛珂看来,当 AI 对用户的价值通过金山办公的产品不断放大后,当中的商业化能力也会被自然而然地释放出来。

“现在的用户习惯已经变成是他们愿意为成果付费,而不愿意为一个工具付费。”葛珂对钛媒体举例谈到。目前金山 WPS 的付费应用主要以模板素材、会员服务等增值功能为主,而 AI 助手可以做得,就是可以将 PPT 模板之类的素材与用户需求更智能地匹配在一起,以撬动用户的付费购买意愿。

AI 数据 科技
上一篇:芯片巨头们的 CES:自动驾驶“明争”、5G“暗斗” 下一篇:企业如何释放大数据的潜力
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

从演电影到开车,细数人工智能的五大落地方向

越来越多的企业希望通过利用人工智能的功能来提高其ROI。这篇文章就将带你了解如今人工智能的五大落地方向。

读芯术 ·  8h前
AI又一次打败了人类:仅凭一张自拍照片辨别个人性格

一项新研究表明,人工智能(AI)可在“仅凭一张自拍照片辨别个人性格”这件事上再次打败人类。与人类相比,机器能够更好地识别一种特征,通过分析人物面孔来确定物种不同的性格特质。

佚名 ·  20h前
下一站AI:实时服务

随着实时解决方案的增长与人工智能技术的发展,工作负载的日益提升以及非结构化数据的爆炸式增长,数据中心的发展方向正朝着加速计算、存储与网络适应性前进。

佚名 ·  1天前
教你轻松选择合适的机器学习算法!

机器学习方面没有免费午餐。因此,确定使用哪种算法取决于许多因素:面临的问题类型和预期的输出类型等。本文介绍了为数据集探究合适的机器学习方法时要考虑的几个因素。

布加迪 ·  1天前
领创智信首推数据标注业务,打造AI商业化闭环

亚洲大数据和人工智能公司领创智信首次推出经典保留业务--数据标注与采集。该业务由人工智能(AI)团队根据国内人工智能公司出海的数据需求,利用行业领先的技术精心打造数据标注与采集一体化服务,其中包括图片、语音、对话、文本和视频数据的标注及采集。

佚名 ·  1天前
人工智能将“吞噬”数据

显然,更多数据将成为人工智能辅助解决方案的标志。对数据的渴求可能来自于更具挑战性的问题、对高级人工智能/分析的更好利用或者是端到端价值链的增长。

佚名 ·  2天前
腾讯AI又创新纪录:ACL 2020入选27篇论文

近日,国际计算语言学协会年会(ACL,The Association for Computational Linguistics)在官网公布了ACL 2020的论文收录名单,共计收录779篇论文。据不完全统计,此次腾讯共有27篇论文入选,投中论文总数刷新国内记录,领跑国内业界AI研究第一梯队。

佚名 ·  2020-05-22 23:33:11
Σco时间 | 把握新趋势,湖南智慧校园转型加速时

日前,在#Σco时间#直播平台上举办了以“把握新趋势,湖南智慧校园转型加速时”为主题的线上研讨会,华为湖南政企业务教育行业技术总监谢传亮、苏迪科技产品与解决方案总监刘传先等嘉宾出席会议,通过主题演讲全方位展示了华为以“5G+AI”方案为高校数字化转型之路筑基的战略愿景以及新趋势下一网通办的解决方案。

张洁 ·  2020-05-22 11:41:40
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载