datastage 入门示例

1. 环境

OS: win xp

ETL工具:data stage 版本 7.5.1

数据库:db2 版本 9 其驱动版本 2.8.46

--------------------------------------------------------------------------------

2. 安装

两个主要的部分安装都比较简单,要说明的是:

-- 安装完data stage后,顺便就创建了一个新的project,所有的job, metadata, schedule等都属于它。需要一个用户名和密码来登录此project。

-- 安装Db2的时候,有一个默认的用户db2admin,设置密码,安装成功后,有一个样例数据库sample,自己可以添加新的数据库。另外会创建一个OS用户db2admin,它具有管理者权限,启动安全服务,以db2admin登录,就能使用了。

有几个地方要注意:db2的Schema,即模式。还不确定此处的schema与oracle的schema的不同,表面上是oracle的Schema似乎是使用数据库的用户名。而这里是要另外创建的,每个表都需要指定其schema,只有在当前的Schema符合表定义的Schema时才能顺利对表进行操作。没有指定的情况下是db2admin,注意这个地方,后面有一些问题也是由它引起的。详见:http://bytes.com/topic/db2/answers/185391-db2-sql-error-sqlcode-204-sqlstate-42704-a

引用: If the userid you are using is db2admin, and you don't supply a high level
qualifier on the table name, the DB2 assumes that DB2ADMIN is the qualifier
(schema) name. You can use the SET SCHEMA statement before hand, use an
alias, or use the a userid with the same name as your schema.

--------------------------------------------------------------------------------

3. 开始用data stage

3.1 建一个数据库 mydb,建Schema schema_ytao,建表AA,schema为schema_ytao,只有一列 ID(int),插入数据1,2,3..

3.2 在数据库sample和mydb中分别建表BB,schema分别为 db2admin 和 schema_ytao

3.3 新建一个server job (猜测:因为server job,所以后面的Db 组件都不需要指定server ip 或 server name,这个字面真的让我犯困了)

3.4 拖两个 Db2 api 组件,一个用作输入dc in,一个用作输出 dc out

3.5 拖一个 transfer 组件

3.6 连接。点击link,左击 dc in,靠中间一点,不要放掉鼠标,向右拉开到 transfer 组件,这样才能出来一条线,这个地方试了很久。同样的方法连接 transfer 和 dc out

3.7 设置 dc in,如下图:


 
3.8 设置dc out,如下图:

另外还有输出到sample库的bb表,可以用默认的sql语句了,只要view data有数据应该就是OK的了

3.9 点击编译,打到datastage director工具,点击run按钮,运行成功就是finished,出错就是aborted,可以到日志表里查看原因。

猜你喜欢

转载自sito.iteye.com/blog/758179