人工智能技术是基于大数据吃饭的?

作者: 佚名 2017-04-08 17:08:10

自从 Google 的人工智能 AlphaGO 成为围棋界的百胜将军开始,AI(Artificial Intelligence,人工智能)这两个英文字,刹那间成为科技业最热门的关键字之一。而就在2017年初,早在 AI 领域打下深厚底子的 IBM Watson,除了打进一些数据服务公司、科技公司外,甚至进军医疗领域,能够依照病患资料判定青光眼,准确率高达95%。

人工智能技术是基于大数据吃饭的?

我们现在已经迈入了AI与机器人逐渐取代人类工作的年代,在不知不觉间,AI的相关技术已经开始渗透每个人生活的角落,从Google与Facebook依照兴趣投放的广告、可以帮你找资料设定日历的语音助理Siri,背后都含有AI的概念与技术。未来的生活无论是投资、交通、医疗、学习、生产,将无处不是AI的踪影,这个技术也将彻底改变人们的生活模式。

是什么让AI从“科幻”变“科技”?

AI其实是个庞大而复杂的概念,但大都奠基于一项基础的关键技术,这个技术叫做“机器学习 Machine Learning”。

机器学习技术,就是让机械拥有自主学习的能力,说起来很简单,但在1950年代技术萌芽期间,演算法和硬体条件都不够成熟,是直到近年来日益优异的演算法,与强劲的硬体运算能力,才让机器学习的能力有突破性进展,而其中带进展最为快速的一项关键技术,就是大家最耳熟能详的──“深度学习”。

我们来看看这个数据:2015年机器学习的周边市场规模约3.6亿美元,至2020年预估将突破29亿美元,并在AI整体市场的50亿美元中占了约六成比重,可以说机器学习的技术突破,就是AI市场发展的原动力。

既然机器学习重要,那么它究竟是什么?为何能进展神速?

“大数据”提高了深度学习精准度

演算法及硬件条件的大幅跃进提供了机器学习发展的优良条件,再加上数字化联网的蓬勃下带来的“大数据”,便引爆了科技大厂争相投入深度学习技术的浪潮。目前不管是NVIDIA这类的芯片商,或擅长演算法的Google、Facebook等软件商,最常提到从事的机器学习的主流技术,就是深度学习。

举个例子描述深度学习如何进行。想像一下,要让一台搭载深度学习能力的车辆进行自动驾驶,面对陌生的路线、随时有行人冲出马路的危险路况,机器怎么判断?透过深度学习,你可先一次提供机器海量的数据资讯,包含路标、号志、路树、行人、等,让它学会辨识环境中的物体为何,学会了,便有助于它在行进过程中快速而精准地避开障碍、找出最佳路径,并顺利抵达目的地。只要数据越丰富完整,机器就越能够提高一切辨识的精准度,以加强判断能力。

这么说来,要能让AI靠“深度学习”发展思考能力,很大程度是依赖大数据所赐,不过,这时候我们就会面临一个问题:没有大数据,深度学习就毫无用武之地了吗?

“小数据”的机器学习方案也蓄势待发

大数据带给深度学习强而有力的判断能力,但其实机器若要做到“学习”这件事,深度学习并不是唯一方法。

回到自动驾驶的例子,倘若这次我们先不将海量的数据提供给机器,而是只告诉他“目的地”、“禁止碰撞”两项指令,然后任凭他不断的Trial & Error,在失败中汲取“经验”以达到学习的效果,最终也能抵达目的地(前提当然是没有遭遇严重车祸影响行进能力)。这样在初始阶段不仰赖大数据的学习方式,可以归类为“强化学习”。

强化学习的方法能补足机器在突发状况下的应变能力,AlphaGO 的开发商 DeepMind 也深谙这项方法的优点,因此让 AlphaGO 也借着深度学习与强化学习的组合,在对手下出意料之外的棋步时,随即建立新的经验,以做为未来在相同局势下能克敌制胜的判断依据。

为什么我们需要“小数据”的 AI 培养方案?

事实上,“获取足够大量的数据”就是极耗成本的一件事,此外,有些数据如罕见疾病的病历、症状等本身就具稀有性,因此像是强化学习等低数据依赖度机器学习方案逐渐开始受到青睐,许多公司与研究机构也以此作为研发的努力方向。日前就有一间名为 Gamalon 的新创公司发表新技术,表示其 AI 系统可仅用很少量的数据训练机器学习,就达到媲美进行深度学习后的精准辨识能力,成功吸引市场关注。

除了一般仰赖大数据的深度学习外,其他可降低数据量依赖度的机器学习方案正不断酝酿中。在不远的未来,我们开车出门只要安稳的在后座休息,不须担心安全与塞车问题,AI 自然会帮我们找到最佳路径;弹指轻点,手机便会帮我们挑选出最适合的购物选择;还可能有贴身的虚拟健康顾问可咨询,并随时告知我们每天的饮食是否均衡、甚至帮我们设计健康菜单。

AI 深入生活的程度,说不定会比我们想像中来得更快。

人工智能 大数据 AI
上一篇:深度学习在自然语言处理中的应用 下一篇:有望取代Spark的实时机器学习框架Ray
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI行业寒潮下,智能物流机器人产业迎来“风口”

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  18h前
人工智能应用在智慧社区五大场景

物联网、云计算、大数据、人工智能正逐步从概念走向应用。越来越多的传统产业也开始探索和创新,积极拥抱互联网和新技术。未来,人工智能技术可能会颠覆社区管理。

有熊 ·  18h前
基于PyTorch的CV模型框架,北大学生出品TorchCV

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。

张倩、泽南 ·  20h前
高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  1天前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  1天前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  1天前
为什么我的CV模型不好用?没想到原因竟如此简单……

机器学习专家 Adam Geitgey 近日发布了一篇文章探讨了这一简单却又让很多人头痛的问题,并分享了他为解决这一问题编写的自动图像旋转程序。

机器之心 ·  1天前
中文自动转SQL,准确率高达92%,这位Kaggle大师刷新世界纪录

首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

郭一璞 ·  1天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载