首页 > 专利技术

oracle到mysql,oracle到oraclel的多表批量数据迁移,定期任务抽取数据。。。

oracle到mysql,oracle到oraclel的多表批量数据迁移，定期任务抽

取数据。。。

⼀、背景

上⼀篇⽂章（单表数据迁移）⽤kettle实现了⼀张表的数据迁移。但实际情况中，数据库会有⼏百，⼏千张表，⽽kettle的表输⼊和表输出只能选择⼀张表，我们不可能⼀个个地填写表名。这时候，我们要考虑通过循环实现多表的数据迁移。

⼆、前期准备

与单表数据迁移类似

高压变频柜准备好Oracle和MySQL的库，Oracle到Oracle也可以，转移，只是必须提前在kettle⽂件夹的lib⽬录下放⼊各个数据库的依赖。

电脑可以连接Oracle和MySQL。

下载好kettle，并把Oracle和MySQL的驱动包放在kettle⽂件夹的lib⽬录下。

如果第⼀次使⽤kettle，建议先看上⼀篇⽂章《单表数据迁移》，上⼀篇很详细地介绍了新建转换、新建节点、新建数据库连接等问题。

三、批量数据迁移

1.读取需要迁移的表（转换）

⽅法⼀：从数据库读取所有表光固化打印

// mysql查询该数据库的所有表

select table_name from information_schema.tables where table_schema=当前数据库名 and table_type='base table';

点击⽂件——新建——转换，在左侧的核⼼对象标签下选择输⼊下的表输⼊，双击添加到右侧的转换⾯板，再选择作业下的复制记录到结果，双击添加到右侧的转换⾯板。

接下来配置表输⼊，双击表输⼊的图标，橙⾊区域为必填项。如果是两个库表结构⼀致，导⼊所有表，可⽤语句

select table_name from user_tables //

且千万不要在语句后⾯加分号，会报错。如果只有部分表结构⼀致且要导⼊，可⽤语句来过滤掉源数据库没有的表，否则就会报错。

select table_name from user_tables where table_name!='T_XZQH'and table_name !='BASE_BUSINESS_INFO'

新建mysql的数据库连接，数据库连接的配置参考上⼀篇⽂章（注意是mysql的连接），新建好连接，记得测试⼀下是否连接成功。

SQL语句填写的就是mysql查询所有表的语句，table_schema 为你的mysql数据库名。

配置好点击下⽅的预览，看⼀下查出来的表名对不对。

现在已经把mysql中的表名都查出来，最后会根据这些表名查询oracle的数据库。

复制记录到结果不需要配置。

保存这个转为“tables in mysql.ktr”。

⽅法⼆：从Excel读取所需的表

上路床

电子防盗门还有⼀种⽅法，是把需要迁移数据的表名写到Excel中，从Excel中读取表名。

如果mysql库和oralce库的表不⼀⼀对应，⽐如mysql中有的表但oracle中没有，那⽤第⼀种⽅法查出的表名，⽤于转换会报错（因为oracle 不到表）。这时候，筛选出两个库都有的表并写到Excel中，从Excel读取表更合适。

Excel写成下⾯的格式，读取时会把第⼀⾏的内容作为查询出来的字段名。

点击⽂件——新建——转换，在左侧的核⼼对象标签下选择输⼊下的 Excel输⼊，双击添加到右侧的转换⾯板，再选择作业下的复制记录到结果，双击添加到右侧的转换⾯板。

接下来配置Excel输⼊，双击 Excel输⼊的图标，按以下步骤配置。

⾸先是⽂件标签。在⽂件或⽬录那⼀⾏点击浏览，选择上⾯整理好的Excel表格。再点击增加，选中的⽂件⼀栏就会出现路径。

接下来是⼯作表标签。点击下⽅的获取⼯作表名称，双击选择记录表名的sheet1，点击确定。sheet1就出现在要读取的⼯作表列表中。

最后是字段标签。点击下⾯的获取来⾃头部数据的字段，开始前，允许清空列的列表。把Excel中的第⼀⾏读取为字段名。

最后点击最下⽅的预览记录，查看是否正确读取了表名。

把这个转换保存为“aa.ktr”。

2.把这些表名设置成变量（转换）

图像型火焰探测器新建转换，在左侧的核⼼对象标签下选择作业下的从结果获取记录，双击添加到右侧的转换⾯板，再选择作业下的设置变量，双击添加到右侧的转换⾯板。

接下来配置这两个节点。

双击从结果获取记录，填写字段名称和类型（获取表名时，两种⽅法的字段都写成了table_name，就是为了这⾥读取字段时可以统⼀）。双击设置变量，字段名称仍然是table_name，为取到的字段取⼀个变量名，⽐如“vtable”，变量活动类型如下。

把这个转换保存成set table name.ktr。

3.根据变量设置表输⼊和表输出（转换）

这个步骤和单表迁移的步骤相同，新建⼀个转换，添加表输⼊和表输出节点。

表输⼊的配置仍然是新建oracle的数据库连接，填写sql查询语句。与单表迁移不同，查询语句from后不填表名，填写上⼀步设置的变量名vtable，这个变量保存了所有的表名。因为还没有把这些步骤关联起来，所以现在不能预览数据。

表输出的配置仍然是新建mysql的数据库连接，但⽬标表需要填写与表输⼊⼀致的变量名 vtable，提交记录数量是指每插⼊1000条记录commit⼀次。如果定时循环同步数据，可以勾选裁剪表或者忽略插⼊错误两种⽅式，第⼀种⽅式裁剪表即 truncate table ，即更新时先删除所有表中所有数据，然后再把源数据库数据重新提交，可以实现真正意义上的同步，只是最好在夜⾥定时更新，以免项⽬数据出问题。第⼆种，忽略插⼊错误，因为这整个流程是根据主键id同步的，如果有主键重复的就会报错，⽆法插⼊。所以忽略这个错误，只插⼊新增的数据，之前那些已有的数据，因为主键重复会报错停⽌，忽略插⼊错误后，可以继续执⾏。指定数据库字段这个选项需要注意，如果源数据库表与⽬标数据库表数据结构，字段等完全⼀致，可以不⽤勾选。如果源数据库表⽐⽬标数据库表新增了字段，那么执⾏会停⽌报错(源数据库表字段⽐⽬标数据库表字段多会报错，反过来则没事)。勾选此项后，就会忽略源数据库多余字段，只把源数据库与⽬标数据库相同的表字段数据更新。

。

注意：kettle中变量的写法是 ${变量名}。

把这个转换保存成insert data into mysql.ktr。

4.把以上的三个转换连接（作业）

到此为⽌，我们新建了是三个转换，分别是：

从Excel表读取表名并复制到结果（aa.ktr）

或者直接查询表名，复制到结果

从结果获取记录并设置成变量（set table name.ktr）

根据变量进⾏表输⼊和表输出（insert data into mysql.ktr）

接下来把这些转换连接成作业（JOB）。

第⼀个作业

⾸先把第2、3个转换结合起来。点击⽂件——新建——作业，在左侧的核⼼对象标签下选择通⽤，双击添加⼀个 start ，两个转换和⼀个成功到右侧的作业⾯板，这些作业项都可以改名字。把这个作业保存为insert into mysql.kjb。

点击两个转换可以修改作业项名称，点击浏览选择对应的转换。第⼀个转换对应 set table name.ktr，第⼆个转换对应 insert data into mysql.ktr。

第⼆个作业

接下来把第⼀个转换与第⼀个作业结合。点击⽂件——新建——作业，在左侧的核⼼对象标签下选择通⽤，双击添加⼀个 start ，⼀个转换，⼀个作业和⼀个成功到右侧的作业⾯板，这些作业项都可以改名字。

配置转换和作业，把转换对应到 tables in mysql.ktr 或者 aa.ktr。把作业对应到 insert into mysql.kjb，同时在execution那⾥选择执⾏每⼀个输⼊⾏⽤于循环。

这个作业就是最终需要的作业。

5.开始导数

点击作业⾯板左上⾓的三⾓形，运⾏这个作业。

点击执⾏即可。

执⾏过程如下，⽇志记录了迁移的过程。

成功会有提⽰，过程中出错会终⽌，执⾏完作业可以去navicat查看mysql的表。

四、步骤总结

在mysql⾥查当前库下有哪些表格，或者从整理好的Excel读取，输出到结果记录

从结果记录⾥⾯每次取⼀⾏，设置成变量vtable

针对每次使⽤的变量值，去oracle数据源⾥⽣成对应的表输⼊（通过变量⽣成）

把变量赋给表输出的表名，其他配置不变，因为表名和字段都和源端oracle是⼀样的

针对每个“输出到结果记录”做循环，插⼊每个oracle表的数据到mysql

>路缘石滑模

本文发布于:2024-09-21 14:50:44，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/3/190705.html

上一篇：史上最大实体关系抽取数据集清华发布

下一篇：知识图谱学习与实践（6）——从结构化数据进行知识抽取（D2RQ介绍）

标签：数据库数据转换迁移表名作业新建

留言与评论（共有 0 条评论）