使用 python 批量插入 hive - 代码天地

使用 python 批量插入 hive

其他 2020-05-22 19:21:32 阅读次数: 0

1.环境准备.

需要 python3.6 最好是安装anaconda

用anaconda navigator 安装这个 , 当然 , 纯 python环境下也能安装这个包

2. 插入hive 换个思路 , 直接插入到hive的表的仓库中 , 也就是hdfs上存储hive文件的地方

from hdfs.client import Client
import time
t1=time.time()
client = Client("http://192.168.1.102:50070")

s="100,1094,baumax,58"
filepath="/user/hive/warehouse/hadoop.db/kk/t.txt"
t1 = time.time()
client.write(filepath, s,overwrite=False,append=True)
print('OK')

t2=time.time()
print(t2-t1)

这里我使用的是追加 ,append , 我直接定位到了文件 , 可以添加到里面 , 当然 ,

这个HDFS client也是能建文件夹 , 建文件 , 不追加新建文件等等 ,

这只是一种了思路.

最后我去HDFS上看了下 t.txt 确实增加了一行 .

并且在hive的 select * from 表名 ,也能查到新加的

可以这样理解 , hive的表结构存储在mysql中 ,但是表数据存储在hdfs上 , 且定位是文件夹 ,只要把数据放进去

结论: 通过 LOAD DATA INPATH '' INTO TABLE

等同于手动追加 hive的表文件所在的文件夹

使用注意: 理论上追加的大小是不做限制的 , 读取文件 ,追加就行 .

猜你喜欢

转载自www.cnblogs.com/alpha-cat/p/12939020.html

使用 python 批量插入 hive

python 使用 mysqldb 批量插入数据

Hive/Impala批量插入数据

mysql空间型数据使用python executemany批量插入报错

Python 中 sqlite3 使用 executemany 批量插入数据

使用mybatis 批量插入

Hive查询结果批量插入分区操作

Python使用JDBC连接Hive

使用Python编写Hive UDF

Python 3 使用Hive 总结

python批量从sqlserver导表到hive

hive使用动态分区插入数据详解

使用shell脚本批量删除hive表

【python】爬虫篇：python使用psycopg2批量插入数据（三）

用python批量插入clickhouse

【python】mysql批量插入/更新

使用JDBC批量插入数据

Elasticsearch使用BulkProcessor批量插入

springboot使用RestHighLevelClient批量插入

MyBatis 使用 foreach 批量插入

使用mybatis批量插入数据

【Hive】hive插入数据

hive（3）——在hive中使用自己写的函数（python实现）

使用Python-elasticsearch-bulk批量快速向elasticsearch插入数据

使用python往数据库的表中批量插入数据

基于PyHive库使用python访问Hive

使用python在Windows上连接hive

Hive | hive使用压缩

Python批量跑Hive数据到本地目录

关于Hive使用动态分区插入数据详解

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)