【转】使用logstash-input-jdbc插件将 mysql 数据导入 elasticsearch

转载出处:https://blog.csdn.net/u014315200/article/details/78630618

注:logstash-input-jdbc的版本必须要和ElasticSearch版本一致

首先 logstash-input-jdbc 是 logstash的插件,需要先安装logstash

wget https://artifacts.elastic.co/downloads/logstash/logstash-6.0.0.zip

解压

unzip logstash-6.0.0.zip
logstash-2.3.4/bin 下执行
./logstash -e "" 

输入hello 输出如下 表示 安装成功:

这里写图片描述

安装 logstash-input-jdbc 插件

logstash-input-jdbc插件是logstash 的一个插件

使用ruby语言开发。下载插件过程中最大的坑是下载插件相关的依赖的时候下不动,因为国内网络的原因,访问不到亚马逊的服务器。解决办法,改成国内的ruby仓库镜像。此镜像托管于淘宝的阿里云服务器上 :

如果没有安装 gem 的话 安装gem

sudo yum install gem
gem sources --add https://ruby.taobao.org/ --remove https://rubygems.org/
gem sources -l
*** CURRENT SOURCES ***

https://ruby.taobao.org
# 请确保只有 ruby.taobao.org
如果 还是显示 https://rubygems.org/ 进入 home的 .gemrc 文件
sudo vim ~/.gemrc 
手动删除 https://rubygems.org/

修改Gemfile的数据源地址。步骤:

whereis logstash # 查看logstash安装的位置, 我的在 /opt/logstash/ 目录
sudo vi Gemfile # 
修改 source 的值 为: "https://ruby.taobao.org"
sudo vi Gemfile.jruby-1.9.lock # 找到 remote 修改它的值为: https://ruby.taobao.org 

或者直接替换源这样你不用改你的 Gemfile 的 source。

sudo gem install bundler
$ bundle config mirror.https://rubygems.org https://ruby.taobao.org

安装logstash-input-jdbc

cd /opt/logstash/
sudo bin/logstash-plugin install logstash-input-jdbc 
#这边是logstash-plugin很多教程都是写plugin

以上之后 logstash 和 logstash -input -jdbc 插件安装完成(安装过程会比较慢,我大概等了十几分钟)

准备 执行脚本: 本人在 logstash-6.0.0下新建conf 文件夹 其中保存了执行的sql脚本和 input的执行脚本文件

分别是 jdbc.sql 和 jdbc.conf文件

jdbc.sql:

SELECT id AS _id,
    id,title,intro,autherid,logo,background,view,fans,sort,score,dynamic,
    recommend_flag AS recommendFlag,recommend_sort AS recommendSort,status,
    unix_timestamp(create_date) AS createDate ,unix_timestamp(update_date) AS updateDate
    FROM motor_short_topic

jdbc.conf:

input {
    stdin {
    }
    jdbc {
      jdbc_connection_string => "jdbc:mysql://10.33.96.213:3306/motor"
      jdbc_user => "root"
      jdbc_password => "123456"
      jdbc_driver_library => "/usr/logstash-6.0.0/lib/mysql-connector-java-5.1.38.jar"
      jdbc_driver_class => "com.mysql.jdbc.Driver"
      jdbc_paging_enabled => "true"
      jdbc_page_size => "50000"
      statement_filepath => "/usr/logstash-6.0.0/config/jdbc.sql"
      schedule => "* * * * *"
      type => "motor_fans_short_topic"
    }
}

filter {
    json {
        source => "message"
        remove_field => ["message"]
    }
}

output {
    elasticsearch {
        hosts => "192.168.136.128:9200"
       # port => "9300"
       # protocol => "http"
        index => "motor_fans_short_topic"
        document_id => "%{id}"
       # cluster => "motor-application"
    }
    stdout {
        codec => json_lines
    }
}

需要注意的是 你需要根据你的数据库类型 将对应的数据库驱动上传到相应位置,然后配置数据库的信息

另外 elasticsearch 的在网上低版本的配置都是 host 和 port 在高版本中修改为了 hosts 了 和ElasticSearch版本配置是同步的,其他注意端口号是 9200 不是 http端口号 9300,根据你的Elasticsearch配置修改

以上工作做完之后 就可以 准备导入数据了

./bin/logstash -f config/jdbc.conf 

执行之后,会将数据库中的数据导入到Elasticsearch中

猜你喜欢

转载自blog.csdn.net/hundan_520520/article/details/81667902
今日推荐