Skip to content

主要汇集了较新版的各类大数据组件的使用教程,包含但不限定MapReduce、HBase、Spark等相关主流技术。后续还将持续更进Flink等当前流行的实时计算框架。

Notifications You must be signed in to change notification settings

OrvilleX/BigData

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

大数据技术学习

本教程将根据当下的主流技术与版本进行相关教程的编写,考虑到当前往上主要以老旧版本的教程居多,对于较新版的教程明显比较 匮乏。考虑到新版诸多API存在破坏性更新,致使新人在使用新版本的SDK上进行开发学习时往往会被劝退。为此本系列将围绕新版进 行编写并辅以实际项目代码以及博客内容。

相关技术版本选型如下:

  • Hadoop:3.1.1
  • HBase:2.4.0
  • Spark:2.4.0
  • JDK:1.8

围绕本源码项目的对应的教程文档可以通过我的知乎专栏


基础教程

对于HDFS相信大家都耳熟能详了,为了快速的巩固对于其中mapreduce的理解,用户可以结合本教程 进行学习,其中相关源码均在mapreducedemo文件夹下。

HBase教程

本教程需要集合实际的项目目录进行学习,本项目的主要目录组成如下(hbasedemo)。

  • normaldemo:包含各类常用操作以及Phoenix使用方式
  • mapreducedemo:包含MapReduce操作HBase的支持
  • obsererdemo:包含协处理器相关使用方式

Spark教程

本教程当前主要以Java为基础进行Demo编写,主要由以下几个文件组成,有关Spark的其他更 详细的可查阅本教程

  • AggregateSpark:包含聚合操作
  • JavaSparkPi:基础入门
  • JoinSpark:连接操作相关
  • RDDWithSpark:RDD操作相关
  • SparkWithHBase:与HBase操作相关

About

主要汇集了较新版的各类大数据组件的使用教程,包含但不限定MapReduce、HBase、Spark等相关主流技术。后续还将持续更进Flink等当前流行的实时计算框架。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages