用非常广泛的、且专为大规模数据处理而且设计的优秀计算引擎,能够非常好的地适用于数据挖掘与机器学习等迭代算法之中。这套课程就为同学们介绍了高级别的Spark应用与集群优化技术,当然课程没有涉及非常基础的Spark技术,如果基础比较薄弱的同学可以参考其他Spark零基础课程先进行学习。另外Spark的学习不建议进行单科目的研修,而且对整体的Hadoop生态圈都至少有一定理解才是最好的。

===============课程目录===============

├─第10课:实时计算平台(设计与实战).ts
├─第11课:spark图计算讲解及mlib.ts
├─第12课推荐系统实战.ts
├─第1课:大数据入门概述.TS
├─第2课:spark技术栈发展概.TS
├─第3课:spark应用开发与API介绍.TS
├─第4课:spark运行模式及原理.TS
├─第5课:spark集群应用与优化分析.TS
├─第6课:sparkcore核心讲解.TS
├─第7课:spark性能调优.TS
├─第8课:sparksql讲解.TS
├─第9课:流式计算简介及sparkstreaming.TS
(1)资料;目录中文件数:2个
├─Spark大数实战班群问和资料收集.docx
├─大数据Hadoop+HBase+Spark+Hive集群搭建教程.pdf
(2)资料第一课资料;目录中文件数:3个
├─google三篇论文.zip
├─大数据入门概述.pdf
├─第1课复习导图.png
(3)资料第七课资料;目录中文件数:4个
├─pom.xml
├─Spark调优(1).pdf
├─test.scala
├─train.tsv
(4)资料第三课资料;目录中文件数:3个
├─sparkAPI讲解.pdf
├─SparkAPI.zip
├─第三课复习导图.png
(5)资料第九课资料;目录中文件数:2个
├─SparkStreaming.pdf
├─SparkStreaming.zip
(6)资料第二课资料;目录中文件数:4个
├─pom.xml
├─Spark发展介绍.pdf
├─第二课内容复习导图.pdf
├─第二课文件配置补充.pdf
(7)资料第五课资料;目录中文件数:3个
├─5.Spark集群应用与监控.pdf
├─Pi.scala
├─Spark集群应用与监控.png
(8)资料第八课资料;目录中文件数:2个
├─8.spark-sql讲解.pdf
├─第八节课数据.zip
(9)资料第六课资料;目录中文件数:6个
├─6.sparkcore数据与存储讲解.pdf
├─BabyCount.scala
├─spark集群实战练习20190403.pdf
├─spark集群实战练习题.zip
├─WordCount.scala
├─WordCount2.scala
(10)资料第十一课资料;目录中文件数:1个
├─spark图计算与机器学习.zip
(11)资料第十二课资料;目录中文件数:3个
├─recommendMF.scala
├─recommendSystem.pdf
├─Word2Vec.scala
(12)资料第十课资料;目录中文件数:2个
├─SparkStreaming.pdf
├─SparkStreaming.zip
(13)资料第四课资料;目录中文件数:5个
├─code.scala
├─pom.xml
├─Spark运行模式与原理.pptx
├─Spark运行模式和原理.png
├─train.tsv

独家号:蚂蚁编程

本站视频教程资源支持会员下载专享,普通注册会员只能原价购买资源或者限制免费下载次数,付费会员所有资源可无限下载。

学习方式:百度网盘下载