李小萌资源网 大数据云计算 炼数成金 深入BI - Kettle 篇 视频教程 教学视频


炼数成金 深入BI - Kettle 篇 视频教程 教学视频

2019-08-22 1385
吴小小
资源介绍

炼数成金 深入BI - Kettle 篇 视频教程 教学视频
课程简介:  

有人统计过,在整个数据分析过程里,收集、整理数据的工作大致占全部工作量的90%,建模过程不足10%,可见ETL是数据处理流程中一个非常重要的环节。ETL工程师,在数据仓库类职位中占有很大比例,而且薪水都不差。IT人一下子转型数据分析师可能跳跃度比较大难度高,先转型数据仓库/ETL工程师再择机往更高处走是合理选择之一。在ETL软件中,使用最多的是开源的Kettle,完全免费,功能和性能不弱于datastage这类商业ETL软件,使用Kettle和其它开源数据平台软件,例如Mysql集群,Hadoop集群等组合在一起,是性价比极高的架构选择。本课程系统讲解Kettle及其秘密。 

课程介绍: 

ETL (Extract,Transformation,Load)工具是构建数据仓库、进行数据整合工作所必须使用的工具。目前市面有多种商业 ETL 工具,如Informatica,Datastage等。目前市场上开源且实用的 ETL 工具比较少,Kettle 就是这不多的开源 ETL 工具之一。 本课程将主要讲解开源 ETL 工具 Kettle 的基本使用和二次开发方法,并结合实际项目案例,讲解 Kettle 如何在实际中应用,以及应用中可能会出现的问题。针对目前大数据的应用情况,本课程也将结合大数据,讲述 Kettle 如何支持 Hadoop、HBase、MongoDB、MapReduce 等大数据技术。除了Kettle 的使用,在本课程的后几个课时,将讲述 Kettle 的二次开发: 包括 Kettle 代码阅读指导, Kettle API 的说明以及使用方法, Kettle 插件的开发方法。 

课程内容: 

第一周:ETL 的概念,Kettle 的概念、功能、操作 
第二周:Kettle 资源库、日志、运行方式 
第三周:输入步骤(表输入、文本文件输入、XML 文件输入...) 
第四周:输出步骤(表输出、更新、删除、文本文件输出、XML文件输出...) 
第五周:转换步骤(过滤、字符串处理、拆分字段、计算器...) 
第六周:转换步骤(字段选择、排序、增加校验列、去除重复记录...) 
第七周:应用步骤、流程步骤(处理文件、执行程序、发送邮件、空操作、阻塞步骤、中止等...) 
第八周:查询步骤、连接步骤(数据库查询、流查询、合并记录、记录集连接、笛卡尔...)
第九周:脚本步骤(JAVAscript,Java Class、正则表达式...) 
第十周:作业项(拷贝、移动、ftp、sftp…) 
第十一周:Kettle 的参数和变量、Kettle 集群 
第十二周:Kettle 代码编译、代码结构、应用集成、各种配置文件 
第十三周:插件开发 - 步骤、作业项 
第十四周:作业设计技巧、错误处理、调试转换、循环和分支 
第十五周:大数据插件(Hadoop 文件输入/输出,HBase输入/输出,MapReduce输入/输出,MongoDB输入/输出) 

目标人群: 

1. ETL 工程师,Java 开发工程师, 
2. 经常要做数据处理的 DBA 
3. 有一定数据库基础 和 Java 基础的学生。 

课程预期目标: 

1. 理解 Kettle 软件的基本功能。 
2. 能使用 Kettle 完成基本的数据处理工作。 
3. 了解 Kettle 软件的一些高级功能 
4. 对有Java 开发经验的同学,对 Kettle 代码结构有一定了解,能开发一些 Java 的基本插件





百度网盘可以用手机平板电脑在线播放,也可以下载之后播放

本帖资源评论
[视频教程] 尚硅谷大数据
黑马hadoop初中高加项目培训视频教程
小牛学堂大数据全套视频+实战
从实战出发学习数据结构与算法 2017年全新数据结构与算法精华新课程 视频+代码
大数据开发协作框架及工具:Sqoop+Flume+Oozie+Hue完美实战 大数据开发必备技术
零基础学习Spark 1.x应用开发系列课程
[分布式服务框架/Dubbo/ZooKeeper] Dubbo项目高级篇 Dubbo分布式系统架构视频教程-ZooKeeper-第三方支付项目精华课程
数据分析全栈工程师
图灵系列丛书(交互设计、编程、大数据、人工智能等)
[大数据] 专业数据分析师的内功心法-真实数据分析师实战课程 打造专业大数据分析师视频教程
[数据仓库/商业智能] 小象学院云计算 HIVE数据仓库完美实战课程 HIVE八周精讲课程 快速掌握HIVE视频教程
广发证券量化交易策略合集 PDF版
[Hadoop] 大型电商分布式系统实践 分布式系统架构高阶培训视频教程 炼数成金-电商大型网站架构
推荐系统算法工程师-从入门到就业【价值1899元】
学思维!升技能!做项目!数据分析架构师就业课程 升职加薪+跳槽必备 100G最新课程
[Spark/Scala] Scala从入门到精通 大数据专题-Scala编程语言轻松入门视频教程 Scala完美视频教程
【2.5G】最详细的一套Spark框架实战讲解视频教程Spark从入门到高级应用及优化课程
2016北风网大数据全套课程
老男孩 徐培成_大数据课程大数据高薪就业视频(全套)
数据挖掘Matlab精品课程零基础到精通(全套)
没有账号? 注册