深度剖析Amazon AI技术应用和战略布局: Alexa篇

作者: Henry 2019-01-16 21:00:44

Amazon超过微软成为全球市值最高的公司,市值7900万美元。Jeff Bezos一直有个非常著名的“Day 1”哲学,就是让公司永远保持在一个"Day 1"的状态,他认为一旦到了“Day 2”,就意味着进入停滞期。那如何保持“Day 1”?Jeff在2017年给股东的公开信中提到了4个策略:用户至上(Amazon内部神一般的教条),抵制形式主义,关注外部趋势和快速决策。

Jeff早在1997年Amazon还刚起步的时候提到”Day1”,当时的vision:But this is Day 1 for the Internet and,if we execute well for Amazon.com. Today, online commerce saves customers moneyand precious time. Tomorrow,through personalization online commerce well accelerate the very process ofdiscovery。从网上书店起步的Amazon,Jeff已经很早预测到技术对驱动业务发展的重要性——1998年推出的协同过滤推荐引擎充分体验了这一点。

这就是Amazon为什么在“Day1”就对机器学习和人工智能非常的重视,从面向消费者的语音助手Alexa,showcase的无人商店Amazon Go,到藏在电商王国背后的AI技术,从inside到outside,从topdown到bottomup,AI渗透进Amazon内部每一个细胞。

相对其他巨头,Amazon在AI领域的收购稍显保守,但Amazon Alexa基金就非常aggressive,后面会作介绍。2013年,收购英国公司Evi Technology,该公司当时开发了一款跟Siri类似的语音助手Evi。据了解,Amazon Echo的语音技术来自于Evi。2016年,收购做图像识别的华人初创公司Orbeus,这是目前AWS上提供计算视觉服务Rekognition的前身。同年9月,收购聊天机器人平台Angel.ai,显然是为Alexa布局。2017年,收购AI云服务安全公司Harvest.ai,就是目前AWS推出的支持ML技术的安全服务Macie。

Amazon的AI应用可分为三大类,一类是能“看得见、摸得着”的前沿技术moonshot产品,像Alexa, Amazon Go和无人机Prime Air;一类是“不可见、藏在后台”的AI技术,如推荐引擎、仓库机器人和fulfillment中心的“最后一公里”;另外就是企业级应用AWS云平台,提供AI工具和服务,让企业构建自己的AI应用。

下面会分为3篇文章,全面、深入地剖析Amazon的AI技术应用和战略布局。

Amazon在2004年成立Lab126, 专注于硬件产品的研发。实验室曾有4个神秘的项目,代号为”ABCD”。拥有3000多名研发人员的Lab126以2007年发布的Kindle一战成名。但后来却因重压赌注的智能手机Fire Phone的失败而大规模重组,项目C(据说是AR产品)也随之流产。但万万想不到,一直不受重视的项目D,竟然打了一场漂亮的翻身仗,成为Amazon历史上第二个成功的硬件产品。

2014年Echo从Lab126孵化出来,先定位Prime会员做市场试水,直到2015年在美国地区开放给全部用户,接着就一发不可收拾,高歌猛进。凭着快速的语音响应,多场景的语音交互能力,亲民的价格,瞬间秒杀市场上的音箱产品。Echo从“点”到“面”的铺开战略,从音箱到家电,从家庭到汽车,全面占据消费者的生活场景。Amazon最新对外公布,Alexa的设备超过1亿。虽然一直处于亏损状态,但这并不阻挡“Alexa Everywhere”的战略。靠硬件盈利并不是Amazon的目的,布局才是大棋。这跟当年AWS“低价切进,闪电式占领市场”的策略如出一辙。AWS开始target中小型企业,财务上一直亏损,但市场渗透极深,等竞争对手开始醒觉的时候,已被AWS抛离到很远。另外,Alexa最杀手的大招是开放,允许第三方的技能集成,吸引了大量的开发者进入生态。2018年,Alexa技能个数已超7万。

这是一个典型的Alexa驱动开灯的场景。当用户发起语音指令,传给云端的Alexa解析和处理。Alexa如果发现使用的不是它内带技能,就会去调用外部第三方开发者的技能,最后发出“开灯”的指令。

Alexa主要通过2个核心服务连接开发者和消费者构建生态: AVS (Alexa Voice Service) 和 ASK (Alexa Skill Kit)。AVS让设备厂商把Alexa的“智能大脑”内嵌进自己开发的设备里,让Alexa“无处不在”。而ASK提供工具和接口给第三方开发者添加定制化的Alexa技能,让Alexa“无所不能”。另外,Amazon近期还推出连接工具箱 ACK (Alexa Connect Kit) ,允许设备制造商不联网、不走云端、不需开发技能,通过本地连接就可实现设备“智能化”。很明显,Amazon这些布局极具前瞻性,不但笼络了消费者和开发者,还降低技术门槛让传统的硬件制造商进入生态。它的最终目标是让Alexa无处不在,无所不能,统治从家居家电,消费级可穿戴设备到汽车的一切平台。

我们从技术层面drill down,对Alexa的处理流程进行拆解。AVS主要负责两个转化:语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)。这两个转化的背后是由两个深度学习引擎所支撑:Amazon Lex和Amazon Polly。

1. Amazon Lex:语音转文字服务,包含自动语音识别ASR和自然语言理解NLU的功能,可以独立于Alexa使用,是Amazon AWS对外提供的chatbot服务

2. Amazon Polly:文字转语音服务,利用的是语音合成技术(speech synthesis)

首先,AVS解析用户发起的语音请求,识别技能的名称,转成结构化的信息。如果技能已经部署在AWS,ASK就直接运行AWS Lambda服务。AWS Lambda是云计算Serverless的计算架构,函数即服务(Function-as-a-Service, FaaS)。简单的来说,就是开发人员直接编写运行在云端上的函数,后面AWS章节会详细描述。如果技能不在AWS,ASK就通过REST API调用外部服务。返回的结果通过AVS转成语音信息传给Echo,或者图像形式发送到手机App。

Alexa的成功主要在产品、市场先机和开放策略。先从Echo单点爆发,迅速占领市场,形成第一道“护城河”。然后,利用开放的策略,吸引更多的开发者研发第三方的Alexa设备,满足消费者各种场景需求,用户体验不断提升,然后带来更多的流量,吸引更多的开发者进入,打造一个自给自足的生态循环,形成第二道“护城河”。另外,生态的增长,持续产生大量有价值的用户偏好数据,数据的反哺帮助ML算法优化,分析更加精确,个性化程度更高,客户的体验更好,形成第三道“护城河”。从用户流量,到开发生态,到数据反哺,持续优化模型,层层递进,形成一个让竞争对手难以复制的巨大壁垒,最终垄断市场。

Amazon在2015年成立1亿美元的Alexa Fund,2017年再加注1亿美元,target全球更多地区(美国、加拿大、澳新、印度等)。基金目的主要是围绕Alexa打造智能助手的生态,让Alexa植入到更多的外部第三方产品,开发更多技能,引入先进的语音交互,NLP等AI技术。基金除了关注ToC应用,还会进入ToB领域,这跟逐渐从消费级转型到企业级的微软Cortana正面交锋。

除了基金,Alexa跟知名加速器Techstars合作,孵化以语音技术驱动的创业公司。据了解,Amazon与Techstars向每家加速器创业公司投资12万美元,换取6%的普通股。另外,基金还与大学,如卡内基梅隆CMU,Johns Hopkins,南加州大学,以及加拿大的Waterloo等,合作创办fellowship项目,争取从更早期阶段孵化语音AI技术。

基金的portfolio有3家来自加拿大,7家来自欧洲,1家来自以色列和1家来自印度,其他均是美国地区。领域覆盖了智能家居,汽车出行、教育、医疗护理、企业应用等领域。很明显,智能家居仍然是Alexa的重心,从智能冰箱贴,宠物喂食器到安防摄像头,共投了14家。其中智能门锁Garageio,智能门铃Ring,安全路由器Luma,智能洒水系统Rachio均被收购。儿童教育也是Alexa的关注领域,结合语音技术和IoT,赋能儿童STEM教育。核心技术和平台方面,KiTT.ai 专注语音唤醒和自然语音交互技术,尤其定制化的热词检测和支持多回合、多平台的语音会话技术,2017年被百度收购。DefinedCrowd针对的是语音识别,NLP和计算视觉方面的数据打标签和训练服务。还有明星公司Ctrl-Labs,同时获得GV,Matrix Partners,Peter Thiel的Founders Fund等知名风投的投资,结合计算神经科学,机器学习,生物物理,人机交互等技术,打造新一代的“脑机接口”。另外,Alexa也进入ToB领域,包括销售场景的Tact.ai、零售场景的Blutag、餐饮场景的SeverRooms。

80到90年代,微软的Windows一直稳坐PC操作系统的王者地位。从2000年开始,移动互联网开始崛起。2007年是一个关键里程碑,Google推出免费操作系统Android和Apple发布iPhone,标志着正式进入移动互联网时代。虽然两家走的路线不一样,一个开放操作系统以应用生态为主,一个封闭走中高端路线,提供极致的用户体验,但并不阻挡iOS和Android的发展势头,完全占据了用户手机使用的半壁江山。2015年,Echo横空出世,以极快地进入智能家居市场,从点到面地爆发。通过精准的产品定位,

闪电式的市场策略,开放的生态,以及投资布局,建立极高的竞争壁垒。得用户者得天下,Amazon目标只有一个,就是打造下一代基于语音交互的操作系统。

根据“The Alchemy of Growth”理论(中文: 增长的炼金术),企业有三个层次的增长。第一个层次是Operator,维持当前业务的核心竞争力。第二个层次是Business Builder,开拓新的业务增长模式和解决方案,扩展核心竞争力。第三层次是最高级别Visionary,也是离公司的comfort zone最远的区域,创造独有的解决方案,开拓全新市场,实现业务爆炸性的增长。我们可以看出,Echo一系列智能产品利用语音技术,让Amazon从电商业务拓展到智能家居,实现了新的业务模式,进入到Horizon II。盈利不是首要目标,速度才是关键。这让我想到了“The Lean Startup”里面的原则: learning and iterating as quickly as you can to build a viable business。而Alexa最大的潜力在于开放API给第三方的开发者,打造生态系统,让Alexa的设备达到1亿多台,一年之内翻了5倍,把Amazon带进了Horizon III,实现transformative的增长。是否能实现Amazon最终的目标?我们拭目以待。

Amazon AI Alexa
上一篇:国内首款真正意义的AI输入法上线 面向未来革新输入方式 下一篇:旷视科技发布机器人协调网络大脑“河图” 投入20亿元完善生态
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI艺术日渐繁荣,未来何去何从?

利用人工智能创作而成的画作近年来越来越受瞩目,有的作品甚至能在知名拍卖行拍得高价。但这类作品仍有不少问题需要解答,比如它的作者是开发出算法的程序员还是计算机呢?AI艺术的市场未来将走向何方呢?

网易智能 ·  20h前
人工智能进入大学校园带来了哪些变化

在一个人的教育生涯中,大学如何成为最好的学习体验?高等教育的目的就是发展技能,探索新理论,并将其应用于现实生活中。在整个学习期间,鼓励学生完成学习任务,熟练掌握技能,同时培养一个健康的、积极的、和谐的生活态度。

风车云马 ·  1天前
图灵奖得主Yoshua Bengio:深度学习当务之急,是理解因果关系

深度学习擅长在大量数据中发现模式,但无法解释它们之间的联系,而图灵奖获得者Yoshua Bengio想要改变这一点。

佚名 ·  2天前
人工智能遇冷,自动驾驶受阻?

2016到2019,人工智能经历了梦幻般的三年,但人工智能的历史规律告诉我们:高潮过后可能会引来新的一波沉寂,人工智能助推下的自动驾驶也会受到波及。

佚名 ·  3天前
AI核心难点之一:情感分析的常见类型与挑战

情感分析或情感人工智能,在商业应用中通常被称为意见挖掘,是自然语言处理(NLP)的一个非常流行的应用。文本处理是该技术最大的分支,但并不是唯一的分支。情绪AI有三种类型及其组合。

Veronika Vartanova ·  2019-10-12 10:14:41
机器学习帮你预测电池寿命:精确了解电池还能充几次 精选

电池寿命的确定,是移动硬件发展的重要一环,但是由于电池电化学反应的不确定性以及不同的使用环境和习惯,电池寿命变成了一门玄学。不过柏林的三位小伙伴,利用Tensorflow,在原有的预测体系基础上。更近一步,完成了电池的全寿命预测。

靓科技解读 ·  2019-10-11 13:00:40
专家认为对“人工智能+教育”应持审慎态度

随着人工智能不断发展,人脸识别技术被越来越多地应用于校园中。据了解,一所知名大学2019级新生“刷脸”就能瞬间完成报到程序,系统是这所学校的学生研发的,学生对着摄像头,人脸识别系统就开始进行比对,眨眼间就能完成扫描,整个报到注册手续几乎不到一秒钟。

新华网客户端 ·  2019-10-11 09:37:43
人脸识别有风险,美国全面禁止,可为什么中国却全面推广?

对于大多数人而言,最先接触的就是指纹识别,对指纹识别的了解程度也相对比较深一些,然而随着科技的不断发展,人脸识别也越来越普及,所谓的人脸识别就是基于人的脸部特征信息进行身份识别的一种生物识别技术,用摄像头或摄像机采集含有人脸的图像或视频,并自动在图像中检测和跟踪人脸,对其进行一系列的相关技术,最后进行辨别完成自己想要完成的项目。

测评前线说 ·  2019-10-10 13:36:49
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载