企业界迟迟未采用深度学习的四大原因

编译作者: 布加迪 2018-07-11 09:00:00

【51CTO.com快译】在过去的几年里,许多公司获得了采用数据驱动型方法带来的好处。数据2.0战略将由新的人工智能技术驱动,比如深度学习、强化学习和贝叶斯机器学习。

深度学习是最先进的人工智能方法,涉及机器翻译、计算机视觉和自然语言处理。不使用这些技术会影响收入,并限制最终用户的体验。

使用深度学习的方法可全面解决问题。换句话说,我们让算法而不是人类来决定什么是解决问题的要点。这种方法简化了系统,并让数据可以做决策。更重要的是,它最大限度地减小了人类带来自身偏见的可能性。

1. 深度学习很深奥,要招聘合适的人员。 

企业界迟迟未采用深度学习的四大原因

深度学习是人工智能这个更广泛的领域的分支。

深度学习是个庞大的研究领域。如今许多公司使用的机器学习大多可能基于广为人知、较为悠久的算法,这些算法可使用scikit-learn之类的开源工具轻松构建。然而,深度学习还没有达到那么成熟的地步。谷歌员工François Chollet开发的Keras、Facebook的PyTorch和谷歌开发的Tensorflow,诸如此类的工具已让深度学习更普及开来。

虽然让简单的深度学习例子切实有用比较容易,但改变行业规则的重大结果却需要我们所说的“魔法”。深度学习的秘诀在于,最先进的结果需要大量的计算资源、深入了解训练技巧以及特别熟悉某种特定的方法。

解决办法:招聘构建过深度学习系统,而不是只会复制粘贴的研究人员。这些人不需要都有博士学位,一些顶尖的机器学习研究人员连大学学位都没有。

2. 可解释性重要吗?

深度学习中的可解释性是指明白为什么系统做出某个决策。这是人工智能界的一个热门话题,具体归结为企业的使用场景和风险容忍度。对于制药公司来说,明白算法为什么做出可影响我们生活的决策是个好想法。对于客户流失预测来说,如果系统能大大降低流失率,可解释性可能不是很重要。

正如Facebook的人工智能研究主任Yann LeCun在《人工智能大辩论》中所说:“如果你向一家公司展示两个系统,一个是表现还行的可解释的简单系统,另一个是表现更好的较复杂系统,公司每次都会选择后者,每次都是如此。”

我在自己的工作和研究中经常听到的就是所谓的“黑盒子谬误”(black box fallacy)。数据科学家常常将神经网络称为无法理解的黑盒子。虽然解释结果不如更传统的方法那么清楚,但是我们开发出了许多方法来探究这些网络的内部。这应该不会阻止公司采用深度学习。

解决办法:确定可解释性在贵公司带来的实际影响。另外构建简单的模型,以便有一个基准。如果你的深度学习方法好得多,它可能会提供更引人入胜的商业理由。

3. 你需要更多的数据和GPU。

数据和计算能力是当今深度学习切实可行的两大原因。GPU将计算时间从几星期缩短到几小时。TPU的速度更快。要是没有这些GPU,你不可能足够快地训练这些模型、获得显著成效。贵公司可以自行购买GPU,也可以向亚马逊网络服务(AWS)或谷歌云等提供商租用。

深度学习方法需要大量数据才能发现不太明显的模式。如果没有足够的数据,这些系统注定会失败,或者给人以一种性能良好的假象(即:过度拟合)。

解决办法:收集你所有产品的原始信号。别害怕在GPU上花钱。

4. 人工智能战略的目标不够远大

企业界迟迟未采用深度学习的四大原因

为什么深度学习因大数据而变得更有意义?

手动特征工程是指人类选择对算法来说很重要的东西。由于这个环节牵涉人类,这些系统的性能受制于人类的创造力。一种更好的方法是,使用来自贝叶斯机器学习的技术将人类的直觉添加到系统中。

数据科学团队认为深度学习对于大多数问题而言大材小用。虽然神经网络无法解决所有问题,但它们是最先进的方法,涉及计算机视觉、音频和自然语言处理。这种思维人为地限制了系统的性能。如果你知道汽车比马快,为什么还要继续骑马?

解决办法:使用较悠久的机器学习方法构建强大的基准。如果深度学习能超过这个基准,就使用深度学习。这让你得以量化这些技术相对于更简单的方法所提供的价值。

结束语

深度学习已离开了学术界,准备改变公司企业。别害怕负责任地使用深度学习。不正确的采用会导致数据出现偏差,因而会损害贵公司和最终用户。深度学习有助于将人类从机器学习这条环中解放出来,最大限度地减小系统出现偏差的可能性。构建任何机器学习系统时,始终恪守伦理道德很重要。

原文标题:4 Reasons Why Companies Struggle To Adopt Deep Learning,作者:William Falcon 

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

人工智能 深度学习 机器学习
上一篇:腾讯云音视频AI技术,极速高清世界杯直播的“幕后功臣” 下一篇:三个常见的机器学习错误要避免
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI行业寒潮下,智能物流机器人产业迎来“风口”

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  19h前
人工智能应用在智慧社区五大场景

物联网、云计算、大数据、人工智能正逐步从概念走向应用。越来越多的传统产业也开始探索和创新,积极拥抱互联网和新技术。未来,人工智能技术可能会颠覆社区管理。

有熊 ·  19h前
基于PyTorch的CV模型框架,北大学生出品TorchCV

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。

张倩、泽南 ·  21h前
高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  1天前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  1天前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  1天前
为什么我的CV模型不好用?没想到原因竟如此简单……

机器学习专家 Adam Geitgey 近日发布了一篇文章探讨了这一简单却又让很多人头痛的问题,并分享了他为解决这一问题编写的自动图像旋转程序。

机器之心 ·  1天前
中文自动转SQL,准确率高达92%,这位Kaggle大师刷新世界纪录

首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

郭一璞 ·  1天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载