机器学习可以解决哪些类型的任务?

作者: 佚名 2017-12-26 10:54:22

机器学习可以让我们解决一些人为设计和实现固定程序很难解决的问题。从科学和哲学的角度来看,机器学习受到关注是因为发展我们对机器学习的认识需要发展我们对智能背后原理的理解。

如果考虑“任务”比较正式的定义,那么学习的过程并不是任务。学习是我们所谓的获取完成任务的能力。例如,我们的目标是会行走的机器人,那么行走便是任务。我们可以编程让机器人学会如何行走,或者可以编写特定的指令,人工指导机器人如何行走。

通常机器学习任务定义为机器学习系统该如何处理样本(example)。样本是指我们从某些希望机器学习系统处理的对象或事件中收集到的已经量化的特征(feature)的集合。我们通常会将样本表示成一个向量x∈Rn其中向量的每一个元素xi 是一个特征。例如,一张图片的特征通常是指这张图片的像素。

机器学习可以解决很多类型的任务。一些非常常见的机器学习任务列举如下:

分类:在这类任务中,计算机程序需要指定某些输入属于K类中的哪一类。为了完成这个任务,学习算法通常会返回一个函数。当y = f(x) 时,模型为向量x 所代表的输入指定数字码y 所代表的类别。还有一些其他的分类问题,例如,f 输出的是不同类别的概率分布。分类任务中有一类是对象识别,输入是图片(通常用一组像素亮度值表示),输出是表示图片物体的数字码。例如Willow Garage PR2 机器人像服务员一样识别不同饮料,并送给点餐的顾客。目前,最好的对象识别工作正是基于深度学习。对象识别同时也是计算机识别人脸的基本技术,可用于标记相片集中的人脸,有助于计算机更自然地和用户交互。

输入缺失分类:当输入向量的每个度量不被保证的时候,分类问题将会更有挑战。为了解决分类任务,学习算法只需要定义一个从输入向量映射到输出类别的函数。当一些输入可能丢失时,学习算法必须学习一组函数,而不是单个分类函数。每个函数对应着分类具有不同缺失输入子集的x。这种情况在医疗诊断中经常出现,因为很多类型的医学测试是昂贵的,对身体有害的。有效地定义这样一个大集合函数的方法是学习所有相关变量的概率分布,然后通过边缘化缺失变量来解决分类任务。使用n 个输入变量,我们现在可以获得每个可能的缺失输入集合所需的所有2n 个不同的分类函数,但是计算机程序仅需要学习一个描述联合概率分布的函数。了解以这种方式将深度概率模型应用于这样任务的示例。本节中描述的许多其他任务也可以推广到缺失输入的情况; 缺失输入分类只是机器学习能够解决的问题的一个示例。

回归:这类任务中,计算机程序会给定输入预测数值。为了解决这个问题,学习算法会输出函数。除了返回结果的形式不一样外,这类问题和分类问题是很像的。这类任务的一个示例是预测投保人的索赔金额(用于设置保险费),或者预测证券未来的价格。这类预测也用在算法交易中。

转录:这类任务中,机器学习系统观测一些相对非结构化表示的数据,并转录信息为离散的文本形式。例如,光学字符识别要求计算机程序根据文本图片返回文字序列(ASCII 码或者Unicode 码)。谷歌街景以这种方式使用深度学习处理街道编号。另一个例子是语音识别,计算机程序输入一段音频波形,输出一序列音频记录中所说的字符或单词ID 的编码。深度学习是现代语音识别系统的重要组成部分,广泛用于各大公司,包括微软,IBM 和谷歌。

机器翻译:在机器翻译任务中,输入是一种语言的符号序列,计算机程序必须将其转化成另一种语言的符号序列。这通常适用于自然语言,如将英语译成法语。最近,深度学习已经开始在这个任务上产生重要影响。

结构化输出:结构化输出任务涉及到输出是不同元素之间重要关系的向量(或者是含多个值的其他数据结构)的任务。这是一个很大的范畴,包括上面转录任务和翻译任务在内的很多其他任务。例如语法分析——映射自然语言句子到语法结构树,并标记树的节点为动词,名词,副词等等。参考应用深度学习到语法分析。另一个例子是图像的像素级分割,将每一个像素分配到特定类别。例如,深度学习可用于标注航拍照片中的道路位置。在这些标注型的任务中,输出的结构形式不需要和输入尽可能相似。例如,在图片标题中,计算机程序观察到一幅图,输出描述这幅图的自然语言句子。这类任务被称为结构化输出任务是因为输出值之间内部紧密相关。例如,图片标题程序输出的单词必须组合成一个通顺的句子。

异常检测:这类任务中,计算机程序在一组事件或对象中筛选,并标记不正常或非典型的个体。异常检测任务的一个例子是信用卡欺诈检测。通过对你的购买习惯建模,信用卡公司可以检测到你的卡是否被滥用。如果窃贼窃取你的信用卡或信用卡信息,窃贼采购物品的分布通常和你的不同。当该卡发生了不正常的购买行为时,信用卡公司可以尽快冻结该卡以防欺诈。了解欺诈检测方法。

合成和采样:这类任务中,机器学习程序生成一些和训练数据相似的新样本。通过机器学习,合成和采样可能在媒体应用中非常有用,可以避免艺术家大量昂贵或者乏味费时的手动工作。例如,视频游戏可以自动生成大型物体或风景的纹理,而不是让艺术家手动标记每个像素。在某些情况下,我们希望采样或合成过程可以根据给定的输入生成一些特定类型的输出。例如,在语音合成任务中,我们提供书写的句子,要求程序输出这个句子语音的音频波形。这是一类结构化输出任务,但是多了每个输入并非只有一个正确输出的条件,我们明确希望输出有很大的偏差,使结果看上去更加自然和真实。

缺失值填补:这类任务中,机器学习算法给定一个新样本x∈Rn,x 中某些元素xi 缺失。算法必须填补这些缺失值。

去噪:这类任务中,机器学习算法的输入是,由未知破坏过程从干净样本x∈Rn得到的污染样本。算法根据污染后的样本x 预测干净的样本x,或者更一般地预测条件概率分布P(x |~x)。

密度估计或概率分布律函数估计:在密度估计问题中,机器学习算法学习函数可以解释成样本采样空间的概率密度函数(如果x 是连续的)或者概率分布律函数(如果x 是离散的)。要做好这样的任务当我们讨论性能度量P 时,我们会明确定义任务是什么),算法需要学习观测到的数据的结构。算法必须知道什么情况下样本聚堆出现,什么情况下不太可能出现。以上描述的大多数任务都要求学习算法至少能隐式地抓住概率分布的结构。密度分布可以让我们显式地抓住该分布。原则上,我们可以在该分布上计算以便解决其他任务。例如,如果我们通过密度估计得到了概率分布p(x),我们可以用该分布解决缺失值填补任务。如果xi 的值是缺失的,但是其他的变量值x??i 已知,那么我们可以得到条件概率分布。现实中,密度估计并非能够解决所有这类问题,因为在很多情况下p(x) 是难以计算的。

当然,还有很多其他或其他类型的任务。这里我们列举的任务类型只是用来介绍机器学习可以做哪些任务,并非严格地定义机器学习任务分类。

机器学习 类型 任务
上一篇:深度学习,如何用去噪自编码器预测原始数据? 下一篇:透视 CES 2018:四大趋势科技千万别错过
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

机器学习转化为生产力,警惕这4个常见陷阱!

几乎每个人都想在他们的业务中引入机器学习,但是这些人也遇到了一个大问题:让模型可持续发展十分困难,尤其是在云架构的基础上。medium上一位博主也指出了这个问题,并提出了将机器学习模型投入生产的4个常见陷阱。

大数据文摘 ·  13h前
500亿参数,支持103种语言:谷歌推出「全球文字翻译」模型

由于缺乏平行数据,小语种的翻译一直是一大难题。来自谷歌的研究者提出了一种能够翻译 103 种语言的大规模多语言神经机器翻译模型,在数据丰富和匮乏的语种翻译中都实现了显著的性能提升。

机器之心 ·  1天前
机器学习免费跑分神器:集成各大数据集,连接GitHub就能用

搞机器学习的小伙伴们,免不了要在各种数据集上,给AI模型跑分。现在,Papers with Code (那个以论文搜代码的神器) 团队,推出了自动跑分服务,名叫sotabench,以跑遍所有开源模型为己任。

栗子 鱼羊 ·  1天前
大数据为什么不够聪明?机器要如何走向强人工智能

大数据为什么不够聪明?比概率语言更强大的思考工具是什么?科幻电影中的强人工智能到底怎样实现?如何让智能机器像人一样思考?搞清楚因果关系才能拨云见日。

明日情报 ·  1天前
2019机器学习框架之争:与Tensorflow竞争白热化,进击的PyTorch赢在哪里?

2019年,机器学习框架之争进入了新阶段:PyTorch与TensorFlow成为最后两大玩家,PyTorch占据学术界领军地位,TensorFlow在工业界力量依然强大,两个框架都在向对方借鉴,但是都不太理想。

大数据文摘 ·  2天前
机器学习帮你预测电池寿命:精确了解电池还能充几次

电池寿命的确定,是移动硬件发展的重要一环,但是由于电池电化学反应的不确定性以及不同的使用环境和习惯,电池寿命变成了一门玄学。不过柏林的三位小伙伴,利用Tensorflow,在原有的预测体系基础上。更近一步,完成了电池的全寿命预测。

靓科技解读 ·  2天前
PyTorch横扫顶会,TensorFlow退守业界:机器学习框架一年变天

机器学习框架的世界,局势变化过于迅猛,稍不注意就会被抢了地盘。一年前,TensorFlow还是各大顶会论文选择的主流框架,如今顶会几乎成了PyTorch的天下。

鱼羊 栗子 ·  2天前
Nature发文:深度学习系统为什么这么好骗?

今天的人工智能系统经常会出现莫名其妙的 bug。最新一期《自然》杂志上的这篇文章向我们介绍了深度学习为什么如此容易出错,以及解决这些问题的研究方向。

机器之心 ·  3天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载