Spark之读取Hbase数据库表并写入文件 - 代码天地

Spark之读取Hbase数据库表并写入文件

其他 2018-08-02 05:22:24 阅读次数: 0

import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.{HBaseAdmin, Result}
import org.apache.hadoop.hbase.io.ImmutableBytesWritable
import org.apache.hadoop.hbase.mapreduce.TableInputFormat
import org.apache.hadoop.hbase.util.Bytes
import org.apache.spark.{SparkConf, SparkContext}

object HbaseUtils {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("HbaseTest").setMaster("local")
    val sc = new SparkContext(conf)
    val tableName = "mkd_sdata:u_user_info"
    val hbaseConfig = HBaseConfiguration.create()
    hbaseConfig.set(TableInputFormat.INPUT_TABLE, tableName)
    val admin = new HBaseAdmin(hbaseConfig)

    val hbaseRDD = sc.newAPIHadoopRDD(hbaseConfig,
      classOf[TableInputFormat],
      classOf[ImmutableBytesWritable],
      classOf[Result])

    val count = hbaseRDD.count()

    println("------------------:"+count)

    val resultRDD = hbaseRDD.map { result => {
        val key = Bytes.toString(result._2.getRow)
        val userId = Bytes.toString(result._2.getValue("base".getBytes, "user_id".getBytes))
        val mobile = Bytes.toString(result._2.getValue("base".getBytes, "mobile".getBytes))
        println("key:" + key + "\t userId:" + userId + "\t mobile:" + mobile)
        (userId, mobile)
      }
    }
    resultRDD.saveAsTextFile("file:///e:/outs")
    sc.stop()
    admin.close()

  }
}

猜你喜欢

转载自blog.csdn.net/niuchenliang524/article/details/80737585

Spark之读取Hbase数据库表并写入文件

spark从hbase读取写入数据

Spark读取HBase数据库

Spark Core (TopN、mysql写入、读取文件通过RDD结合数据库中的表)练习3套

Spark_读取小文件数据写入MySQL并读取_spark-HadoopAPI SequenceFile对象文件数据写入hbase并读取

数据库把数据写入文件及读取文件并插入表中

spark将数据写入hbase以及从hbase读取数据

python读取数据库表数据并写入excel

spark -- RDD数据源（读取小文件数据写入MySQL并读取 spark-HadoopAPI SequenceFile 对象文件数据写入hbase并读取）

读取数据库并写入excel表中发送邮件

ajax读取文件数据并写入数据库

Python从数据库读取大量数据批量写入文件

Spark学习之使用Spark SQL读取数据库

nodejs读取json文件，写入mongodb数据库

【JAVA】读取和写入数据库生成的dbf文件

读取FTP上的excel文件，并写入数据库

读取.bcp文件写入postgre数据库

node读取docx文件并写入数据库

读取csv文件写入mysql数据库

读取HDFS文件，写入到HBase表当中去

spark 数据写入与读取

六十三、Spark-读取数据并写入数据库

python语法-MySQL数据库（综合案例：读取文件，写入MySQL数据库中）

spark-RDD写入数据库

spark读取hbase数据

Spark 读取 HBase 数据

dataframe to sqlite写入读取数据库

读取文本写入数据库

Excel 读取写入数据库

spark 数据写入到 hbase

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)