[老汤-人工智能]机器学习八之Spark项目实战二

课程目标:掌握决策树相关算法解决实际问题

24小时内答疑 课时永久观看 15分钟内无条件退款
1. 仅限付费视频课程适用
2. 购买后15分钟内可以找到客服进行沟通退款
3. 退款将返还至51CTO学院账户,不支持提现
4. 下载资料后不再享有退款特权
5. 客服(Tel:400-101-1651)
6. 最终解释权归51CTO所有
共31课时,共3小时53分钟
现价¥99.00
购买
  1. 课程介绍
  2. 课程大纲
课程目标

掌握决策树相关算法解决实际问题

适用人群

了解决策树相关算法原理

课程简介

这个课程以一个项目来讲解Spark中怎么使用决策树、提升树以及随机深林等算法模型的使用方法。


项目主要是对运动数据的分类,项目是按照如下的流程来讲解:

图片.png在数据转换中,也详细讲解了在机器学习中缺失值的探索与正确处理。


在模型的评估中,详细讲解了在多分类任务中,混淆矩阵的概念以及准确率、召唤率等指标的计算



【老汤人工智能】机器学习课程体系分为三部分:

机器学习一之数学基础(https://edu.51cto.com/sd/80200 ):从微积分和线性代数两个方面讲解机器学习需要的数学知识

机器学习二之线性回归(https://edu.51cto.com/sd/7feec  ):讲解机器学习中最简单也是最常用的线性回归算法(包括一元线性回归和多元线性回归算法)

机器学习三之逻辑回归(https://edu.51cto.com/sd/52d18  ):讲解机器学习中分类算法(也就是逻辑回归算法),还讲解了解决机器学习的过拟合问题

机器学习四之模型调试(https://edu.51cto.com/sd/89e23  ):讲解机器学习中怎么来评估模型、测试模型以及怎样定位模型问题等

机器学习五之SVM算法(https://edu.51cto.com/sd/0dda5  ):讲解机器学习中应用很广泛的支持向量机算法(即SVM算法)

机器学习六Spark机器学习实战一(https://edu.51cto.com/sd/8aeee  ):航班延迟预测

机器学习七之决策树算法(https://edu.51cto.com/sd/8ebe9 ):讲解机器学习中决策树算法,以及基于决策树的回归树算法、提升树算法以及梯度提升算法等算法

机器学习八Spark机器学习实战二(https://edu.51cto.com/sd/2194b ):运动数据分类

机器学习九之非监督类型算法(https://edu.51cto.com/sd/24a14 ):讲解机器学习中非监督类型的算法,包括:聚类算法(K-Means算法)以及PCA降维算法

机器学习十Spark机器学习实战三(https://edu.51cto.com/sd/198f3  ):uber载客位置聚类分析

机器学习十一Spark推荐系统实战(https://edu.51cto.com/sd/63444 ):讲解怎样使用Spark实现推荐系


Scala、Spark Core、Spark SQL以及Spark Streaming的学习,请在51CTO学院搜索"老汤"



第一章Spark中决策树相关算法
11节1小时14分钟
1-1回顾决策树 [免费试看]
06:11
1-2信息增益的计算
08:11
1-3参数maxBins含义
05:40
1-4其他重要参数讲解
07:22
1-5类别值转换处理
11:31
1-6构建决策树分类模型
09:15
1-7模型训练以及debug
06:16
1-8构建决策树回归模型
06:12
1-9Spark中的梯度提升树
04:01
1-10性能提升参数
03:51
1-11Spark中的随机森林模型实现
05:45
第二章运动数据分类
20节2小时39分钟
2-1业务场景定义
13:43
2-2加载数据
11:34
2-3探索每一种活动类型数据分布情况
08:42
2-4计算每一行的NAN个数
08:36
2-5计算NAN的占比
05:44
2-6找出NAN值太多的无效行
06:52
2-7每一列缺失值的探索
09:17
2-8心率缺失值的处理
03:24
2-9其他字段缺失值的处理
07:12
讲师介绍
老汤
讲师评分4.9分
51CTO微职位大数据教学总监; 多年大数据技术架构师,10年软件技术设计开发经验,在爱奇艺、北京国双科技(大数据上市公司)、快钱支付、华为等大型企业设计和开发大数据相关项目,大型的项目包含爱奇艺直播业务大数据中心的建设、2016奥运会CNTV网站流量分析、金融支付反欺诈项目以及电信计费数据清洗分析等数十个大数据相关项目。服务的行业有视频、电子营销、金融、电信等行业。国内首批Spark实践者之一,也是国内首个推出按照”软件即现实世界” 的原则来讲解Spark等大数据技术,丰富的大型企业内部培训大数据技术的经验。
X
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载