李小萌资源网 大数据云计算 小象学院Hadoop高级进阶视频教程Hadoop大数据处理精华视频教程


小象学院Hadoop高级进阶视频教程Hadoop大数据处理精华视频教程

2019-08-22 1075
咿呀决定于法国
资源介绍

小象学院Hadoop高级进阶视频教程Hadoop大数据处理精华视频教程
课程名称及简介

《Hadoop进阶》:本课程面向Hadoop高阶学习者,具有一定Hadoop系统使用经验,结合大规模使用Hadoop的实践经验,了解和掌握HDFS构建、Hadoop工具使用、调试优化,问题分析,通过分析示例掌握大量实际使用的经验,很多实战内容的示例是很少在网络上找到文档支持。

时间:共六周
培训方式:视频学习 + 在线答疑 + 每周作业 + 结业考试

课程大纲:

授课对象:Hadoop高级、具有一定Hadoop系统使用经验
适用Hadoop版本:兼顾所有Hadoop版本,包括Apache、Hortonworks和CDH发行版

第一部分. MapReduce
Mapreduce工作流程及基本架构回顾
运维相关
参数调优
benchmark
reuse jvm
错误感知及speculative执行
task日志分析
可容忍错误百分比设置及跳过坏记录
选择fairescheduler等其他调度器优化性能
开发相关

数据类型选择
实现自定义wrITable数据类型、自定义key
一个mapper中输出不同类型value
InputFormat/OutputFormat,原理及定制
Mapper/Reducer/Combiner,Combiner的使用及其对mapreduce框架优化的作用
Partitioner定制
排序策略GroupingComparator/SortComparator
任务调度原理及修改方法(案例,map/reduce共享slot,按标识精准map/reduce调度)
Streaming
DistributedCache
mapreduce任务间依赖
counter
JobChild参数设置
性能优化

第二部分. hdfs
HDFS API
fuse(C API)
压缩
HDFS benchmark
Datanode添加及删除
多盘支持,磁盘错误感知
hdfs raid
HDFS block size设置相关问题
文件备份数设置
HDFS中合并文件
第三部分. Hadoop工具
dfsadmin/mradmin/balancer/distcp/fsck/fs/job
监控及报警
hadoop配置管理
第四部分. Hadoop调试
Lo
本地模式调试map/reduce任务
远程调试
第五部分. 问题分析
Java GC介绍及java进程常用的分析工具jstat、jhat、jmap
top/iostat/netstat/lsof等
Jstack/kill -3
Strace
nload/tcpdump

第六部分.分析示例
MapReduce简单分析
用MapReduce实现Group-by
用MapReduce实现倒排索引
MpReduce实现直方图
MapReduce实现Join





百度网盘可以用手机平板电脑在线播放,也可以下载之后播放

本帖资源评论
最新大数据Spark实时流统计实战
数据结构与算法_C语言
[项目实战] 2017最新某团购网站大型离线电商数据分析平台实战演练视频教程配套软件文档齐全 138课
零基础自学云计算分析hadoop storm spark
数据结构视频教程
[视频教程] 今天大更新,第一个标题:人工智能,数据挖掘
【586M】华为HCNA-Cloud-BCCP构建云计算平台培训视频教程
最新大数据开发项目实战视频
大数据建模分析实战 Matlab基础课程10天 数据分析数学建模基础入门MATLAB视频教程
Storm入门到项目实战
初阶量化工程师的最佳实践-量化思想实战系统搭建课程 量化专家亲授竞赛级量化金融课程
小牛学堂大数据全套视频+实战
数据可视化tableau精品课程零基础到精通(全套)
[Hadoop] 分布式开源数据库- Hbase完全入门专题视频教程 大数据云计算培训
北风网数据结构视频教程 共20课
Spark2全方位深入分析(从源码到项目实践)
大数据:hadoop7天完整版
Spark2全方位深入分析(从源码到项目实践)
[数据挖掘] 炼数成金大数据课程 大数据快速数据挖掘平台RapidMiner数据分析 数据挖掘视频教程
Hadoop完美实战系列视频课程1-7天
没有账号? 注册