原创

kettle(一)

1.初识kettle
Kettle 来自百度百科;
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle(现也称为Pentaho Data Integration,简称PDI)是一款非常受欢迎的开源ETL工具软件,主要用于数据整合、转换和迁移。Kettle除了支持各种关系型数据库,HBase MongoDB这样的NoSQL数据源外,它还支持Excel、Access这类小型的数据源。并且通过这些插件扩展,kettle可以支持各类数据源。
2.为什么使用kettle

免费开源
基于java的免费开源的软件,对商业用户也没有限制

易配置
可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定

不同数据库
ETL工具集,它允许你管理来自不同数据库的数据

两种脚本文件
transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制

图形界面设计
通过图形界面设计实现做什么业务,无需写代码去实现

定时功能
在Job下的start模块,有一个定时功能,可以每日,每周等方式进行定时
3.前辈经验
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我介绍一个我在工作中使用了3年左右的ETL工具Kettle,本着好东西不独享的想法,跟大家分享碰撞交流一下!在使用中我感觉这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率

正文到此结束
本文目录