大数据学习指南,从零开始学习大数据开发,包含大数据学习各个阶段资汇总
学习路线中的视频、文档资料可以关注公众号:旧时光大数据,回复相应关键字获取云盘链接
完全分布式集群搭建
关于VM、远程登录工具的安装暂时可以参考我的博客,找到相应步骤进行操作即可
集群搭建
1.Hadoop——分布式文件管理系统HDFS
2.Hadoop——HDFS的Shell操作
3.Hadoop——HDFS的Java API操作
4.Hadoop——分布式计算框架MapReduce
5.Hadoop——MapReduce案例
6.Hadoop——资源调度器YARN
7.Hadoop——Hadoop数据压缩
1.Hive——Hive概述
2.Hive——Hive数据类型
1.Flume——Flume概述
2.Flume——Flume实践操作
3.Flume——Flume案例
1.Kafka——Kafka概述
2.Kafka——Kafka深入解析
3.Kafka——Kafka API操作实践
3.Kafka——Kafka对接Flume实践
1.HBase——HBase概述
2.HBase——HBase数据结构
3.HBase——HBase Shell操作
4.HBase——HBase API实践操作
1.Spark基础——Spark的诞生
2.Spark基础——Spark概述
3.Spark基础——Spark运行模式
4.Spark基础——案例实践
1.Hadoop面试题总结(一)
2.Hadoop面试题总结(二)——HDFS
3.Hadoop面试题总结(三)——MapReduce
4.Hadoop面试题总结(四)——YARN
5.Hadoop面试题总结(五)——优化问题
1.Kafka面试题总结(一)
2.Kafka面试题总结(二)
1.Spark面试题总结(一)
2.Spark面试题总结(二)
3.Spark面试题总结(三)
4.Spark面试题总结(四)
Spark性能优化:
5.Spark面试题总结(五)——几种常见的数据倾斜情况及调优方式
6.Spark面试题总结(六)——Shuffle配置调优
7.Spark面试题总结(七)——程序开发调优
8.Spark面试题总结(八)——运行资源调优
如果大家想要关注我分享的更多大数据干货的话,可以关注我的公众号:旧时光大数据
“大数据学习路线”中我自己看过的视频、文档资料可以直接在公众号获取相关云盘链接
交流群建好了,进群的小伙伴可以加我微信:MoRan1607,备注:GitHub