Python读写HDFS上的文本文件 - 代码天地

Python读写HDFS上的文本文件

其他 2018-07-09 21:55:35 阅读次数: 0

1. 目标

通过hadoop hive或spark等数据计算框架完成数据清洗后的数据在HDFS上
爬虫和机器学习在Python中容易实现
在Linux环境下编写Python没有pyCharm便利
需要建立Python与HDFS的读写通道

2. 实现

安装Python模块pyhdfs
版本:Python3.6, hadoop 2.9

读文件代码如下

from pyhdfs import HdfsClient
client=HdfsClient(hosts='ghym:50070')#hdfs地址
res=client.open('/sy.txt')#hdfs文件路径,根目录/
for r in res:
    line=str(r,encoding='utf8')#open后是二进制,str()转换为字符串并转码
    print(line)

写文件代码如下

from pyhdfs import HdfsClient
client=HdfsClient(hosts='ghym:50070',user_name='hadoop')#只有hadoop用户拥有写权限
str='hello world'
client.create('/py.txt',str)#创建新文件并写入字符串

上传本地文件到HDFS

from pyhdfs import HdfsClient
client = HdfsClient(hosts='ghym:50070', user_name='hadoop')
client.copy_from_local('d:/pydemo.txt', '/pydemo')#本地文件绝对路径,HDFS目录必须不存在

猜你喜欢

转载自blog.csdn.net/wxfghy/article/details/80941088

Python读写HDFS上的文本文件

python读写文本文件

python 读写文本文件

Python读写txt文本文件

Python文本文件读写

读写文本文件

【Python】对文本文件操作小结（一）：读写文本文件

Python基本语法之文本文件读写

Python中文本文件读写操作的编码问题

Python连载笔记（七）——————文本文件的读写

问题20：如何读写文本文件问题20：如何读写文本文件 Python：文件操作

python——文本文件

FSO 读写文本文件

QtQFile读写文本文件

C# 读写文本文件

MFC TXT 文本文件的读写

Java读写文本文件

java读写文本文件大全

Qt之文本文件读写

c++ 读写文本文件

Qt 文本文件的读写操作

实例042读写文本文件

nodejs文本文件的读写

QFile读写文本文件示例

FileStream文本文件读写操作

Flutter：如何读写文本文件

Java 读写文本文件

c++文件操作-文本文件-读写文件

Python读写文本文件和二进制文件的方法及注意事项

Python操作txt文本文件

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)