黄美灵的Spark ML机器学习实战(第三期) 黄美灵的Spark ML机器学习实战(第三期)
所属分类:数据分析
  课程名 : 黄美灵的Spark ML机器学习实战(第三期)【开课中】 总学费/人 : ¥400 (固定学费:¥100, 逆向学费:¥300) 开课时间 : 2018-05-30 09:00:00 
开课老师 : sunbow


课程简介:

本课程主要讲解基于Spark 2.xMLML是相比MLlib更高级的机器学习库,相比MLlib更加高效、快捷;ML实现了常用的机器学习,如:聚类、分类、回归等算法。本课拒绝枯燥的讲述,将循序渐进从Spark2.x的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark ML分布式机器学习。

通过该课程的学习,同学们可以全面掌握Spark ML机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。且该课程优异毕业生均可获得老师内推机会,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。掌握技术,高薪就业,课程等待你的加入!

课程大纲:

第一课 Spark ML基础入门

1、Spark介绍

2、Spark ML介绍

3、课程的基础环境

4、Spark SparkSession

5、Spark Datasets操作

6、Datasets操作的代码实操


第二课 Spark ML PipelinesML管道)

1、Pipelines的主要概念

2、Pipelines实例讲解

3、ML操作的代码实操

4、使用 ML Pipeline 构建机器学习工作流案例展示

5、实例的代码实操


第三课 Spark ML数学基础

1、ML矩阵向量计算

2、分类效果评估指标及ML实现详解

3、交叉-验证方法及ML实现详解

4、实例的代码实操


第四课 Spark ML特征的提取、转换和选择

1、特征的提取及ML实现详解

2、特征的转换及ML实现详解

3、特征的选择及ML实现详解

4、实例的代码实操


第五课 Spark ML线性回归/逻辑回归算法
1、线性回归算法

2、逻辑回归算法
3、ML回归算法参数详解
4、ML实例
5、实例的代码实操


第六课 Spark ML决策树/随机森林/GBDT算法
1、决策树算法

2、随机森林算法

3、GDBT算法

4、ML树模型参数详解
5、ML实例
6、实例的代码实操

第七课 Spark ML KMeans聚类算法
1、KMeans聚类算法
2、ML KMeans模型参数详解
3、ML实例
4、实例的代码实操


八课 Spark ML LDA主题聚类算法
1、LDA主题聚类算法
2
ML LDA主题聚类模型参数详解
3
ML实例
4
、实例的代码实操

第九课 Spark ML协同过滤推荐算法
1、协同过滤推荐算法
2
ML协同过滤分布式实现逻辑

3、ML协同过滤源码开发
4、实现实例
5、实例的代码实操

第十课 大型案例:基于Spark的推荐模型开发
1、案例背景

2、架构设计
3、数据准备

4、模型训练
5、模型预测
6、脚本封装


开课时间:

课程基础:
学习者需要有一些Spark/Scala/线性代数基础知识。

授课对象:
spark有兴趣,有志从事数据分析,数据挖掘工作方向的朋友

课程环境:
Spark2.0, Spark2.1, Spark2.2

预期收获:
通过该课程的学习,同学们可以全面掌握Spark2.0 ML机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。该课程优异毕业生均可获得老师内推机会,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。 

讲师简介:
黄美灵,Spark爱好者,现从事移动互联网的计算广告和数据变现工作,专注Spark机器学习在计算广告中的研究和实践。现著有:《Spark MLlib机器学习:算法、源码及实战详解》
CSDN
博客专家:http://blog.csdn.net/sunbow0



 

GMT+8, 2018-7-19 15:59 , Processed in 0.116339 second(s), 29 queries .