零、什么是机器学习

利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策

  1. 解决的问题:
    未来不确定场景的决策
  2. 怎么解决问题
    利用计算机从历史数据中挖出的规律来解决问题
  3. 机器学习要素
    • 主体
      主体是计算机
    • 数据
      数据量越大,找出的规律越精准
    • 规律
      通过算法,找到规律,机器学习系统利用规律自动生成落地方案

一、机器学习的源动力

  1. 从历史数据中找出规律,把这些规律用到对未来场景的预测与决定;
  2. 用数据替代专家
  3. 经济驱动,数据变现

二、机器学习算法分类

  1. 分类方法一

    1. 有监督学习
      • 分类算法
      • 回归算法
    2. 无监督学习
      • 聚类算法
    3. 半监督学习(强化学习)
  2. 算法分类方法二

    1. 分类与回归
    2. 聚类
    3. 标注
  3. 算法分类方法三
    1. 生成模型
    2. 判别模型

三、机器学习常见算法

序号 挖掘主题 算法
1 分类 C4.5
2 聚类 K-Means
3 统计学习 SVM
4 关联分析 Apriori
5 统计学习 EM
6 链接挖掘 PageRank
7 集装与推进 AdaBoost
8 分类 kNN
9 分类 Naiive Bayes
10 分类 CART
  • 其他常见算法
    • FP-Growth
    • 逻辑回归
    • RF、GBDT
    • 推荐算法
    • LDA
    • Word2Vector
    • HMM、CRF
    • 深度学习

机器学习解决问题步骤

  1. 确定目标
    • 业务需求
    • 数据
    • 特征工程
  2. 训练模型
    • 定义模型
    • 定义损失函数
    • 优化算法
  3. 模型评估
    • 交叉验证
    • 效果评估