课程购买咨询和资料获取请加老师QQ 2020363447
本课程讲解大规模数据处理的统一分析引擎—Spark。在本课程中基于大量案例实战,深度剖析和讲解Spark2.4原理和新特性,且会包含完全从企业真实业务需求中抽取出的案例实战。除Spark全体系外还包含机器学习、算法、推荐系统等。
本套大型Spark架构师系列教程共计13季,本套为第十二季。
课程目录:
第十二季
01.userCF的推荐列表实现
02.userCF的推荐列表实现-数据验证
03.itemCF的原理说明
04.itemCF的itemUsers计算
05.itemCF的item相似度矩阵算法-排序
06.itemCF下计算用户对商品的偏好值
07.itemCF下实现用户商品推荐
08.itemCF下实现用户商品推荐-验证结果
09.john breese相似度对流行商品进行惩罚
10.机器学习-中文垃圾邮件分类
11.推荐系统-scala实现itemCF算法
12.推荐系统-scala实现商品相似度矩阵求解
13.推荐系统-userCF-itemCF的比较
14.推荐系统-f1score物理意义计算
15.推荐系统-处理观影数据用于itemCF测试
16.推荐系统-处理观影数据用于itemCF测试scala修剪1
17.推荐系统-精确率和召回率结果验证
13季全部掌握可以达到如下效果:
1.代码和原理驱动讲解Spark的各个技术点(全部手敲代码),全程图文解读
2.能够对常见的Spark性能问题,使用各种技术进行性能调优
3.熟练掌握Spark全体系的知识和操作,可以开发各种复杂的大数据离线批处理程序
4.透彻理解Spark新特性和原理,可以对Spark企业级案例,进行调优和故障排查
5.能熟练对Spark、Sclala、Kafka、机器学习、朴素贝叶斯算法等技术融汇贯通