大数据学习笔记
介绍
第一章 概念
第二章 云计算技术
1 结构化数据与非结构化数据
第三章 Hadoop是什么
1.基本概念
2.原理漫画
3.技术选型
第四章 Hadoop的安装
1.Hadoop 2.6.2伪分布式
2.Hadoop 2.6.2完全分布式
3 Hadoop 2.7.2完全分布式
4.Hadoop的组件
5.SSH免密钥登录
第五章 Ambari集群管理
1.Ambari集群安装
第六章 Hive
1.Hive 1.1.1的安装
2.Hive 2.1.0的安装
3.Hive的基本使用与导入导出
4.Hive数据类型与文件格式
5 Hive的存储架构与HQL语法
6 Hive的模式设计与事务性
7 Hive综合案例实战
8 Hive开发
9 Hive安全
10 FAQ
第七章 Sqoop
1.Sqoop2的安装
2.Sqoop1的安装
3.Sqooq1综合案例
4.Sqooq2综合案例
5.DataX性能对比
第八章 HBASE
1.HBASE的伪分布安装与分布式安装
2.HBASE常用的Shell命令
3.基于HBASE的Java开发
4.基于HBASE的Python开发
5.HBASE与传统数据库的区别
6.HBASE安装疑难杂症
7.Hive与Hbase的区别
第九章 HBASE实战
1.HBASE基于Java开发
2.整合SQL引擎层
3.基本数据迁移
4.基于Bulk load的数据迁移
5.使用管理工具
6 Hbase 数据备份及恢复
7 监控与诊断
副录-HBase资源收集
第十章 Spark
1. 基YARN安装
2.基于Mesos安装
3.Hadoop与Spark的区别
第十一章 CDH的发行版本
1.基于Centos的安装
2.基于Ubuntu的安装
第十二章 TDH发行版本
1.安装
2.Inceptor-SQL使用
3.使用JDBC、ODBC工具连接Inceptor
4 Sqoop的使用
5 使用JDBC、ODBC工具连接Inceptor
6 SQL兼容测试
7 SQL语法知识
附录 POC前的准备工作
第十三章 HUE安装与配置
第十四章 数据采集与爬虫
第十五章 Hadoop相关资源
1 github相关资源收集
第十五章 Hadoop100问
第十六章 大数据框架合集
1.电商网站架构案例
第十七章 运维
1.运维常用工具
第十八章 机器学习入门
第十九章 Centos下的Oracle安装
第二十章 基于JFinal的大数据框架快速开发
1 基于Gradle的项目构建
第二十一章 ELK
附录 Hadoop运维技能要求
Powered by
GitBook
2.原理漫画
2.原理漫画
HDFS存储原理
1.发送写数据请求
2.文件切分
3.DN分配
4.数据写入
5.完成写入
6.用户读文件
7.下载数据
8.HDFS容错机制
9.节点监测机制
10.写容错
11.读容错
12.DN失效
13.备份规则
results matching "
"
No results matching "
"