Kattle

1.kattle介绍

​ kattle是用于数据迁移的ETL开源工具,是以Java开发,支持跨平台运行,其特性包括:支持100%无编码、拖拽方式开发ETL数据管道;可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源;支持ETL数据管道加入机器学习算法。


2.kattle安装

​ kattle是基于Java的,因此需要在有jdk的环境下运行,建议下载JDK1.8以上的版本,7.0以后版本的Kattle不支持低版本JDK。

​ Kattle是无需进行安装的,直接在官网或以下提供的链接下载,解压后即可使用。

​ 链接:https://pan.baidu.com/s/1bfZwguh3P3eq_5_bOpQa1w

​ 提取码:TQK3


3.Kattle的使用

3.1kattle的启动

解压文件后打开以下文件

在这里插入图片描述

启动后页面

在这里插入图片描述


3.2 建立DB连接

主对象树->转换->DB连接,双击打开

在这里插入图片描述

填写数据库连接信息(此处是连接Oracle)

在这里插入图片描述

点击测试,弹出成功的页面

在这里插入图片描述

注意:若测试连接报错,则可能是没有Oracle驱动的原因,将Oracle6.jar放在kattle文件的lib下即可,重启连接

在这里插入图片描述



3.3 kattle的简单使用

建立数据库连接后,就可以对该数据库进行操作了。

3.3.1 复制表数据到另一张表

1)点击文件->新建->转换

在这里插入图片描述

2)找到核心对象->输入->表输入,将其拖入到右边

在这里插入图片描述


3)双击表输入,填入相关信息

在这里插入图片描述

1.布置名称:自定义(可默认)。

2.数据库连接:选择连接,没有连接需要点击新建,然后按之前步骤进行连接。

3.写入sql,查询表数据。

4.预览:浏览表数据,选择预览的行数,预览后关闭。

5.确定:确认配置。


4)拖入插入/更新,进行连接

在这里插入图片描述


5)配置插入/更新,对应要插入的表字段,点击确定

在这里插入图片描述


5)运行

在这里插入图片描述

在这里插入图片描述


6)运行结果

在这里插入图片描述



3.3.2 csv数据导入

1)新建转换:文件->新建->转换

在这里插入图片描述

2)转换结构

​ csv文件输入:核心对象->输入->csv文件输入

​ 表输出: 核心对象->输出->表输出

在这里插入图片描述


3)配置csv文件输入

在这里插入图片描述


4)配置表输入

在这里插入图片描述

注意:选择的表字段要和文件字段进行对应,如果表中没有相应的字段也可点击下面的SQL对表结构进行更改,执行完成后点击确定就可以了。

在这里插入图片描述


5)配置完后点击确定,并保存转换,点击运行

在这里插入图片描述



3.3.3 excel 数据导入

1)新建转换:文件->新建->转换

在这里插入图片描述


2)转换结构:

excel输入:核心对象->输入->excel输入

表输出:核心对象->输出->表输出

在这里插入图片描述

3)配置Excel输入

  • 选择文件

在这里插入图片描述

  • 选择sheet

在这里插入图片描述

  • 获取字段

    在这里插入图片描述


4)设置表输出

在这里插入图片描述


5)启动转换

在这里插入图片描述


6)转换结果

在这里插入图片描述


3.3.4 excel导出

1)新建转换:文件->新建->转换

在这里插入图片描述

2)转换结构:

表输入:核心对象->输入->表输入

excel输出:核心对象->输出->excel输出

在这里插入图片描述


3)表输入配置

在这里插入图片描述


4)输出excel

在这里插入图片描述

在这里插入图片描述


5)运行

在这里插入图片描述


6)导出结果

导出的文件默认在pdi-ce-8.3.0.0-371\data-integration下

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐