近代数字重要奠基人之一的德国数学家高斯曾说:“数学是科学的‘皇后’。”
在“大数据”和“人工智能”的浪潮中,算法是核心,而数学、统计学、概率论与算法息息相关。

线性代数:如何将研究对象形式化?

事实上,线性代数不仅仅是人工智能的基础,更是现代数学和以现代数学作为主要分析方法的众多学科的基础。
从量子力学到图像处理都离不开向量和矩阵的使用。
而在向量和矩阵背后,线性代数的核心意义在于提供了⼀种看待世界的抽象视角:万事万物都可以被抽象成某些特征的组合,并在由预置规则定义的框架之下以静态和动态的方式加以观察。
着重于抽象概念的解释而非具体的数学公式来看,线性代数要点如下:
线性代数的本质在于将具体事物抽象为数学对象,并描述其静态和动态的特性;
向量的实质是 n 维线性空间中的静止点;
线性变换描述了向量或者作为参考系的坐标系的变化,可以用矩阵表示;
矩阵的特征值和特征向量描述了变化的速度与方向。
总之,线性代数之于人工智能如同加法之于高等数学,是一个基础的工具集。

概率论:如何描述统计规律?

除了线性代数之外,概率论也是人工智能研究中必备的数学基础。
随着连接主义学派的兴起,概率统计已经取代了数理逻辑,成为人工智能研究的主流工具。在数据爆炸式增长和计算力指数化增强的今天,概率论已经在机器学习中扮演了核心角色。
同线性代数一样,概率论也代表了一种看待世界的方式,其关注的焦点是无处不在的可能性。
频率学派认为先验分布是固定的,模型参数要靠最大似然估计计算;贝叶斯学派认为先验分布是随机的,模型参数要靠后验概率最大化计算;正态分布是最重要的一种随机变量的分布。

高等数理统计:如何以小见大?

在人工智能的研究中,数理统计同样不可或缺。
基础的统计理论有助于对机器学习的算法和数据挖掘的结果做出解释,只有做出合理的解读,数据的价值才能够体现。
数理统计根据观察或实验得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。
虽然数理统计以概率论为理论基础,但两者之间存在方法上的本质区别。
概率论作用的前提是随机变量的分布已知,根据已知的分布来分析随机变量的特征与规律;
数理统计的研究对象则是未知分布的随机变量,研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断。
用一句不严谨但直观的话讲:数理统计可以看成是逆向的概率论。
数理统计的任务是根据可观察的样本反过来推断总体的性质;
推断的工具是统计量,统计量是样本的函数,是个随机变量;
参数估计通过随机抽取的样本来估计总体分布的未知参数,包括点估计和区间估计;
假设检验通过随机抽取的样本来接受或拒绝关于总体的某个判断,常用于估计机器学习模型的泛化错误率。

最优化理论:如何找到最优解?

本质上讲,人工智能的目标就是最优化:在复杂环境与多体交互中做出最优决策。
几乎所有的人工智能问题最后都会归结为一个优化问题的求解,因而最优化理论同样是人工智能必备的基础知识。
最优化理论研究的问题是判定给定目标函数的最大值(最小值)是否存在,并找到令目标函数取到最大值 (最小值) 的数值。
如果把给定的目标函数看成一座山脉,最优化的过程就是判断顶峰的位置并找到到达顶峰路径的过程。
通常情况下,最优化问题是在无约束情况下求解给定目标函数的最小值;
在线性搜索中,确定寻找最小值时的搜索方向需要使用目标函数的一阶导数和二阶导数;
置信域算法的思想是先确定搜索步长,再确定搜索方向;
以人工神经网络为代表的启发式算法是另外一类重要的优化方法。

信息论:如何定量度量不确定性?

近年来的科学研究不断证实,不确定性就是客观世界的本质属性。
换句话说,上帝还真就掷骰子。
不确定性的世界只能使用概率模型来描述,这促成了信息论的诞生。
信息论使用“信息熵”的概念,对单个信源的信息量和通信中传递信息的数量与效率等问题做出了解释,并在世界的不确定性和信息的可测量性之间搭建起一座桥梁。
总之,信息论处理的是客观世界中的不确定性;条件熵和信息增益是分类问题中的重要参数;KL 散度用于描述两个不同概率分布之间的差异;最大熵原理是分类问题汇总的常用准则。

形式逻辑:如何实现抽象推理?

1956 年召开的达特茅斯会议宣告了人工智能的诞生。
在人工智能的襁褓期,各位奠基者们,包括约翰·麦卡锡、赫伯特·西蒙、马文·闵斯基等未来的图灵奖得主,他们的愿景是让“具备抽象思考能力的程序解释合成的物质如何能够拥有人类的心智。”
通俗地说,理想的人工智能应该具有抽象意义上的学习、推理与归纳能力,其通用性将远远强于解决国际象棋或是围棋等具体问题的算法。
如果将认知过程定义为对符号的逻辑运算,人工智能的基础就是形式逻辑;
谓词逻辑是知识表示的主要方法;
基于谓词逻辑系统可以实现具有自动推理能力的人工智能;
不完备性定理向“认知的本质是计算”这一人工智能的基本理念提出挑战。

支持向量机:如何在特征空间分类?

支持向量机是人工智能的主要分类方法之一,其数学基础为核函数。
可计算理论是人工智能的重要理论基础和工具,为了回答是否存在不可判定的问题,数理逻辑学家提出了关于算法的定义(把一般数学推理形式化为逻辑演绎)。
可以被计算,就是要找到一个解决问题的算法。
在不可计算性以外,如果解决一个问题需要的计算时间随着实例规模呈指数级增长,则该问题被称为不可操作的,对这个问题的研究产生了计算复杂性。
可计算性和计算复杂性为人工智能判断问题求解可能性奠定了数学基础。

贝叶斯统计与决策:如何解决不确定问题?

人工智能学科诞生的时候,在概率论的基础上,出现了条件概率及贝叶斯定理,奠定了大多数人工智能系统中不确定推理的现代方法基础。
贝叶斯网络起源于条件概率,是一种描述变量间不确定因果关系的图形网络模型,是目前人工智能,典型用于各种推理的数学工具。
传递算法为贝叶斯网提供了一个有效算法,为其进入实用领域奠定了数学基础。
后来,面向对象的思想引入贝叶斯网,用于解决大型复杂系统的建模问题。将时间量引入贝叶斯网则形成了动态贝叶斯网,动态贝叶斯网提供了随时间变化的建模和推理工具。
贝叶斯网络节点兼容离散变量和连续数字变量则形成了混合贝叶斯网,混合贝叶斯网在海量数据的挖掘和推理上有较大优势。
贝叶斯在人工智能领域的应用主要包括故障诊断,系统可靠性分析,航空交通管理,车辆类型分类等。
数据是人工智能的关键“养料”,而数学是人工智能的核心基础。
机器学习学者张志华教授曾经说过:搞好机器学习,关键是数学。
所以想从事人工智能,学好数学才能C位出道!
加V 、X:hcgx0904(备注:“AI”)获取更多人工智能相关的资料。
点击AI,打开人工智能的大门!!!