kettle6.0 hadoop hbase交互记录 - 代码天地

kettle6.0 hadoop hbase交互记录

其他 2019-03-29 14:47:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/fzuzhanghao1993/article/details/78784877

摘要:在kettle6.0中连接读写hadoop和hbase与之前版本方法不同，故记录一下使用方法。

环境准备:

windows kettle6.0
jdk1.7
hadoop 2.6.5
hbase 1.2.6

配置

首先配置hadoop的连接插件
打开

工具->hadoop distribute

原生hadoop选择CDH5.4
这里写图片描述

接下来新建一个hadoop连接配置，username和password可以忽略，我们只需要连接到hdfs即可。配置完后进行test，如图几个关键项通过即可。
new
config
test

读写操作

hdfs Hadoop file input

在左侧transform树中，找到big data(大数据）一栏，将输入“hadoop file
input”拖入操作板中，再设置一个输出目的，这里我选择输出到本地txt文件中。

result

双击点开hadoop file input，配置输入文件，这边我随意选择了一个配置文件

这里写图片描述

接下来配置数据处理方式，
这边需要配置输出字段这个sheet，不然你啥也别想得到╮(╯▽╰)╭

这里写图片描述

这里写图片描述

输出

这里写图片描述

Hadoop file output(mysql读取)

mysql的配置以及读入读出前面《kettle6.0基础功能实战》中都有介绍，配置mysql连接，再使用表输入即可这里就不多说了。

file

这里写图片描述

这里写图片描述

写入hdfs要注意一下目录权限问题

这里写图片描述

配置完成后执行

这里写图片描述

这里写图片描述

Hbase读入

这里写图片描述

1、选择cluster以及hbase文件
2、配置mapping
选择一张表，并为其命名一个mapping，然后配置相关字段
3、选择mapping

这里写图片描述

Hbase output

配置同input

Tips:
1、上一步骤输入的数据必须要出现在写入mapping里，否则会报Cant find incoming错误，如果不需要写入上一步骤全部字段，可以用过滤。
2、famliy必须先创建，columns可以不用

这里写图片描述

这里写图片描述

总览

这里写图片描述

猜你喜欢

转载自blog.csdn.net/fzuzhanghao1993/article/details/78784877

kettle6.0 hadoop hbase交互记录

kettle6.0基础功能实战

PDI KETTLE6.0打包注意事项

hadoop/hbase补充记录

HBase与Hadoop版本匹配记录

Kettle 整合大数据平台（Hadoop、Hive、HBase）

kettle 6.0安装并连接ORACLE,HADOOP CDH5.3.0以及hadoop客户端配置

hadoop -- Hbase

hadoop+hbase+hive日常异常记录

hadoop，hbase，hive安装全记录

hadoop-hbase几个错误记录

Windows环境下搭建Hadoop(2.6.0）+Hive(2.2.0)环境并连接Kettle(6.0)

kettle配置hadoop cluster

Kettle连接Hadoop与Hive

hadoop记录

kettle6.1读写hive on hbase记录

hadoop hbase 集群的安装(未整理,先记录在这)

Hadoop记录-Ganglia监控HDFS和HBase指标说明

hadoop记录-Hadoop参数汇总

PDI(Kettle)5.1配置hadoop

Kettle 7.1 连接Hadoop集群

kettle写入hadoop中——AccessControlException

安装Hadoop, Hbase, Phoenix

HBase 全称Hadoop Database

hadoop、hbase源码编译

hadoop、hbase节点下线

hadoop hbase lzo 安装

Hadoop HBase入门学习

hadoop hbase的datanode分离

hadoop+hbase

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)