五分钟向长辈解释机器学习,这样特别通俗!

作者: 读芯术 2019-07-22 05:12:28

什么是机器学习呢?如果是对此一窍不通的长辈来问你这个问题,你该如何回答?本文将用最简单的词汇来尝试解释这一话题,包括每个人都应该知道的最主要也是最重要的部分。

机器学习是一个旨在让计算机在没有被明确编程的前提下掌握学习能力的研究领域。这是一个正在迅速成长的领域,可以让计算机进一步模仿人类。

机器学习不同于传统计算机科学。在传统中,计算机需要程序员准确地告诉它去做什么以及要怎么做,可以说是非常笨拙了。然而有了机器学习,我们只需要在计算机中输入大量数据,就可以进行分析,并输出结果了。

比如说,你知道怎么在Facebook上发布照片吧。当你发布照片时,Facebook会提醒你标记一些可能在照片中出现了的人。如果你不了解Facebook,那么再举一个更常见的例子,你在浏览Netflix时,网页会推荐一些可能喜欢的剧集或电影。其实,这就有点机器学习的意味了。

再比如说,机器学习在自动驾驶汽车上发挥着重要作用。汽车会收集大量的数据来学习怎样开得更好更安全。显而易见的是,机器学习将在未来的生活中扮演重要的角色。

机器学习不是什么

首先,机器学习并不是像你在电影中看到的那样,机器人想要摧毁人类。当人们听到人工智能时,往往首先会想到“终结者”。其实,机器学习并不是人工智能,它只是人工智能的一个子领域。机器学习已经经过了相当长一段时间的发展。其起源可以追溯到上世纪50年代晚期。当时,IBM的亚瑟·塞缪尔(Arthur L. Samuel)设计了第一款会下西洋棋的机器学习应用。

机器学习

解释邪恶人工智能时“必备”的终结者图片

深度学习可能是你经常听到的另一个时髦词汇。深度学习的发展历史和机器学习一样长,但是直到上世纪80年代深度学习才得到广泛重视。最终,世界科技巨头如Facebook、谷歌和微软纷纷大力投资深度学习的发展,继而引发了人工智能革命。谷歌翻译、苹果智能助手Siri等等,都是深度学习的产物。

请放心,在可以预见的未来,即使机器学习或人工智能的发展失去控制,也不会对人类社会造成威胁。

怎样让机器学习

机器学习

看到这里,你可能在想,那么到底是怎样让机器学习的呢?计算机是怎样收集并理解信息的呢?其实,在这一过程中,我们会利用很多数学算法来帮助得到想要的结果。

1. 机器学习中的数学

线性代数是数学的一个研究领域,被公认为是深入了解机器学习的前提。线性代数的内容非常广泛,包含很多晦涩难懂的理论和发现。但是其基本方法和符号对机器学习研究者来说是非常有用的。所以,需要有坚实的线性代数知识作为基础。

数学对学习机器学习来说是极其重要的,因为我们需要在选择算法时考虑其准确性、训练时间以及其他性能。数学可以帮助我们找到一种让机器学习的最佳方法。除了线性代数,机器学习科学家/工程师也需要掌握微积分、算法、概率论和统计学等数学概念。在机器学习中,Python是最常用的一种编程语言。

2. 联想到大脑

大脑会将世界上各种各样的信息收集起来形成我们对现实的看法。计算机也需要做到这一点。神经网络就承担了这一职责。

神经网络是让计算机模拟人类大脑最常用的方法。人类大脑由将近10亿个神经细胞,也就是神经元构成。人类大脑非常擅长解决问题。在解决问题时,每个神经元都会负责解决其中的一小部分。这些神经元可以收集和传递信号,就像一个电网。

3. 人类大脑神经元

在知道了计算机神经网络是受到人类大脑结构启发设计的之后,你可能想知道这些神经元是怎么连接在一起的。每个神经元都会接收输入,然后产生输出。输入节点(输入层)为神经网络提供来自外界的信息,就好比是你的眼睛看到并收集信息后传递给大脑。

输出节点(输出层)则负责将信息反馈给外界。假设下图中的网络将被训练用来识别数字。一个数字从输入层输入,经过隐藏层,然后在输出层以被识别出的数字输出。隐藏层的神经元会互相交流各自获取的信息。它们利用这些信息来识别输入的数字是什么。每一层都会影响到下一层。

当训练计算机神经网络做其他事情,比如说音频识别时,则更为神奇。计算机可以学习对演讲进行文法分析、分段音频以及筛选出不同的声音。这些声音被组合起来,构成特定的音节、单词、词组等。在构建网络时,你需要知道:

  • 卷积网络往往用来做图像识别
  • 长短时记忆网络往往用来做演讲识别

机器学习还有多种方法,比如监督学习、非监督学习和强化学习,是经常使用的三种方法。本文不再详述。简单来说,神经网络使得计算机能够接收信息,将信息分成易于理解的部分,最后输出它能得出的最接近的结果。

挑战与局限性

虽然机器学习非常强大,但仍有很多局限性,克服这些局限性将帮助机器学习技术更上一层楼。

首先,机器学习算法需要大量的存储数据用于训练,而给这些数据做标记是一个非常繁琐的过程。输入机器的数据必须是被标记过的,否则机器将无法变得智能。算法仅能开发机器的决策能力,并与其按要求操纵的环境保持行为一致。

另一个问题就是机器无法解释它自己。这就使得你很难知道它为什么做出某个决定。

最后一个也是最重要的一个局限性就是很难避免偏差。透明性至关重要,公正的决策可以帮助建立信任。比如说,面部识别在社交媒体和执法中发挥着重要的作用。但是面部识别提供的数据集中的偏差会使得结果不准确。如果说算法有偏差,并且数据集和训练数据是不平衡的,那么最终输出的结果将会放大数据集中的区别和偏差。

未来是机器的

机器学习是人工智能发展的基础,它的未来是不可阻挡的。机器学习已经成为了现代生活的一部分。

如果你使用Spotify听音乐,你会发现它会根据你听的歌曲给你做每日推荐。亚马逊也会根据客户的购物习惯,学习如何给客户推荐他们可能感兴趣的商品。类似于亚马逊的Alexa,苹果的Siri以及微软的Cortona这样的虚拟助理,都是基于机器学习来理解人们说的话并和他们交互的。

机器学习在商业中也得到了广泛应用。它可以自动化一些通常需要人类操作的工作。很多公司会在客户服务部门使用聊天机器人和服务机器人。这些机器人会学习如何回复客户,为客户提供智能化的、有用的帮助。

还有机器学习在自动驾驶汽车和卡车上的应用。车辆需要学会识别路上的障碍物,如停车标志、暴风雪、路中间的球、其他车辆等,并做出相应的反应。收集的信息越多,它们就表现得越像人类。比如说,它们可以识别出一个被雪覆盖的停车标志。

机器学习可以让我们的生活变得更加便利。人们不断地提出各种利用机器学习的方法,一场工业革命正在悄然发生。至于当机器学习逐渐引导我们走向真正的人工智能技术时,人类的生活会变成什么样,只能靠想象了。

机器学习 深度学习 人工智能
上一篇:图像识别AI遇上对抗性图像变“瞎子”,准确率猛降90% 下一篇:Dialogflow、Lex、Watson、Wit和Azure机器人大比拼
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

机器学习转化为生产力,警惕这4个常见陷阱!

几乎每个人都想在他们的业务中引入机器学习,但是这些人也遇到了一个大问题:让模型可持续发展十分困难,尤其是在云架构的基础上。medium上一位博主也指出了这个问题,并提出了将机器学习模型投入生产的4个常见陷阱。

大数据文摘 ·  1天前
500亿参数,支持103种语言:谷歌推出「全球文字翻译」模型

由于缺乏平行数据,小语种的翻译一直是一大难题。来自谷歌的研究者提出了一种能够翻译 103 种语言的大规模多语言神经机器翻译模型,在数据丰富和匮乏的语种翻译中都实现了显著的性能提升。

机器之心 ·  2天前
对于人工智能的恐惧及其5个解决方法

实施人工智能技术的IT领导人可能会感到一些恐惧,这有着充分的理由。人工智能在拥有数十年发展和应用历史的同时却有着奇怪的定位,但对于许多人来说,人工智能仍然是一种未来主义的感觉。

Kevin Casey ·  2天前
机器学习免费跑分神器:集成各大数据集,连接GitHub就能用

搞机器学习的小伙伴们,免不了要在各种数据集上,给AI模型跑分。现在,Papers with Code (那个以论文搜代码的神器) 团队,推出了自动跑分服务,名叫sotabench,以跑遍所有开源模型为己任。

栗子 鱼羊 ·  2天前
用AI实现动画角色的姿势迁移,Adobe等提出新型「木偶动画」

近日,Adobe 和康奈尔大学的研究人员提出一种基于学习的动画制作方法——基于卡通角色的少量图像样本就可生成新动画。

机器之心 ·  2天前
AI新贵登上胡润百富榜:“CV四小龙”三家创始人上榜

AI造福人类,也造富了一些创业者。最近公布的2019胡润百富榜就是窥探老板们身价的好机会。

郭一璞 ·  2天前
大数据为什么不够聪明?机器要如何走向强人工智能

大数据为什么不够聪明?比概率语言更强大的思考工具是什么?科幻电影中的强人工智能到底怎样实现?如何让智能机器像人一样思考?搞清楚因果关系才能拨云见日。

明日情报 ·  2天前
2019机器学习框架之争:与Tensorflow竞争白热化,进击的PyTorch赢在哪里?

2019年,机器学习框架之争进入了新阶段:PyTorch与TensorFlow成为最后两大玩家,PyTorch占据学术界领军地位,TensorFlow在工业界力量依然强大,两个框架都在向对方借鉴,但是都不太理想。

大数据文摘 ·  2天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载