spark 中删除HDFS文件 - 代码天地

spark 中删除HDFS文件

其他 2018-06-20 14:14:15 阅读次数: 2

在写spark代码的时候，经常会遇到文件夹路径存在的情况，一般有以下的解决方式

1.在shell脚本中直接调用hadoop fs -rm path

2.通过设置可直接覆盖文件路径，此方法我没有测试

[html]view plain copy
yourSparkConf.set("spark.hadoop.validateOutputSpecs", "false")  
val sc = SparkContext(yourSparkConf)  

可参考：http://stackoverflow.com/questions/27033823/how-to-overwrite-the-output-directory-in-spark

3.通过Hadoop方式删除已存在的文件目录

[html]view plain copy
val path = new Path("hdfs://xxx");    
val hdfs = org.apache.hadoop.fs.FileSystem.get(    
      new java.net.URI("hdfs://x"), new org.apache.hadoop.conf.Configuration())      
if (hdfs.exists(path)) hdfs.delete(path, false)    

4.通过spark自带的hadoopconf方式删除

[html]view plain copy
 val hadoopConf = sparkContext.hadoopConfiguration  
   val hdfs = org.apache.hadoop.fs.FileSystem.get(hadoopConf)  
if(hdfs.exists(path)){  
     //为防止误删，禁止递归删除  
     hdfs.delete(path,false)  
   }  

猜你喜欢

转载自blog.csdn.net/kwame211/article/details/80696497

spark 中删除HDFS文件

Spark读取HDFS中的Zip文件

在spark udf中读取hdfs上的文件

HDFS上传文件与Spark执行

Spark HadoopRDD读取HDFS文件

Spark读取与保存hdfs文件

Spark读取HDFS路径文件

【Spark】Spark中的Partitioner

Spark读取本地文件和HDFS文件

Spark之本地文件上传至HDFS

spark streaming监控HDFS文件目录

Spark/HDFS上传文件错误：Permission denied

spark读取HDFS多个文件配置

spark读取hdfs上文件打包运行

python spark中parquet文件写到hdfs，同时避免太多的小文件（block小文件合并）

Spark读取HDFS某个路径下的子文件夹中的所有文件

Spark Mysql to hdfs

Spark：hadoop HDFS

Spark保持HDFS示例

Spark中的Spark Shuffle详解

Spark中的BlockManager及Spark HA

在Spark shell中基于HDFS文件系统进行wordcount交互式分析

恢复HDFS中删除的文件

Spark读取HDFS或者AFS等文件系统文件

spark上传文件和追加文件到hdfs

Spark中shuffle的文件寻址

spark插件删除步骤

spark-env.sh增加HADOOP_CONF_DIR使得spark运行文件是hdfs文件

spark运行时加载hive，hdfs配置文件

小文件有什么危害？（hive、spark到hdfs）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)