三个常见的机器学习错误要避免

作者: David Linthicum 2018-07-11 05:24:05

企业不断犯这三个错误:浪费资金,降低应用程序性能,还有成效不佳。

我非常喜欢基于云的机器学习和深度学习,以及一般意义上的人工智能。毕竟,如果你无法想象这样的场景——与能回答问题且执行命令的具有人工智能的实体展开对话,你就不能成为一名极客!

话虽这么说,我也发现,基于云的机器学习和深度学习一再被误用。这多半都可以轻松解决,当然,基于云的机器学已得到了广泛的使用。但你要用得巧妙,用得恰当。

以下是我看到的三个反复出现的错误。

1. 没有足够的数据来为知识模型提供训练

没有经历过任何学习的机器学习是毫无价值的。机器学习的真实用例是将算法应用于大量的数据,并且使某些模式显现出来,这些模式成了用于基于机器学习的应用程序的培训。

所以,没有数据就谈不上学习。虽然机器学习应用程序最终会收集数据并变得更加智能,但它需要一个出发点,在这个出发点,数据多得足以教会系统如何思考。

例如,有一些机器学习系统运行在医院中,这些系统用魔法般的手段向员工透露你住院期间死亡的可能性。如果连100,000个数据点都没有,你可以指望该可能性为0或100%——这毫无帮助。

2. 在不需要机器学习的地方使用机器学习

这是我见过的最常见的失败事项——因在应用程序中使用机器学习而导致公司在开发成本上增加两倍或三倍——完全平白无故地。机器学习系统在很多用例中根本没有发挥真正的优势。

程序逻辑在大多数情况下都管用,因此为会计系统或调度系统构建知识库就太过分了。更糟糕的是,由此产生的应用程序效率要低得多。

3. 不了解性能影响

在应用程序中嵌入机器学习系统有时可以使它们对业务更有价值。但这也可能会使应用程序的性能大打折扣。

试想一下:嵌入式机器学习服务在跨数据运行算法时可能会有几秒的延迟。如果该应用程序要近乎实时地提供响应,由于延迟响应导致的生产力损失,机器学习的一切价值都会迅速地消失。

机器学习 人工智能 数据
上一篇:企业界迟迟未采用深度学习的四大原因 下一篇:构建深度神经网络,我有20条「不成熟」的小建议
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI行业寒潮下,智能物流机器人产业迎来“风口”

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  14h前
人工智能应用在智慧社区五大场景

物联网、云计算、大数据、人工智能正逐步从概念走向应用。越来越多的传统产业也开始探索和创新,积极拥抱互联网和新技术。未来,人工智能技术可能会颠覆社区管理。

有熊 ·  14h前
基于PyTorch的CV模型框架,北大学生出品TorchCV

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。

张倩、泽南 ·  16h前
高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  20h前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  20h前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  20h前
为什么我的CV模型不好用?没想到原因竟如此简单……

机器学习专家 Adam Geitgey 近日发布了一篇文章探讨了这一简单却又让很多人头痛的问题,并分享了他为解决这一问题编写的自动图像旋转程序。

机器之心 ·  20h前
中文自动转SQL,准确率高达92%,这位Kaggle大师刷新世界纪录

首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

郭一璞 ·  21h前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载