spark 读取的parquet文件schema改变了如何处理 - 代码天地

spark 读取的parquet文件schema改变了如何处理

其他 2018-07-16 10:35:25 阅读次数: 0

当用spark.read.parquet("filepath").as[MyClass]时候，如果被读取的文件schema变了，比如增加了两列，这个时候直接读取会报错，那么有一种变通的方法就是spark.read.parquet("filepath").map(e=> val field =

if (e.isNullAt(e.fieldIndex("field"))) null else e.getAs[String]("

field")

MyClass

})这种形式，也就是通过判断字段存在不存在做处理，否则会直接报异常

org.apache.spark.sql.AnalysisException: No such struct field

更简便的方法是加上option.通过schema合并即可

spark.read.option("mergeSchema", "true").parquet(xxx).as[MyClass]

ref:http://spark.apache.org/docs/latest/sql-programming-guide.html#schema-merging

猜你喜欢

转载自blog.csdn.net/zhouyan8603/article/details/80451471

spark 读取的parquet文件schema改变了如何处理

spark 读取parquet

spark-shell读取parquet文件

Spark读取parquet文件的切分逻辑

【Spark系列】：如何处理数据倾斜

Spark如何读取csv文件

Spark读取Parquet格式的数据为Dataframe

spark读取sequenceFile文件

Spark读取本地文件

spark 读写 parquet

【Spark五十五】Spark读取csv文件

Spark使用parquet文件存储格式

Spark Filter算子在Parquet文件上的下推

Spark SQL数据源：Parquet文件

Spark Streaming 整合 Flume（Spark读取Flume）

Spark Streaming 整合 Kafka（Spark读取Kafka）

利用spark读取phoenix(phoenix-spark)

Spark HadoopRDD读取HDFS文件

Spark 读取文件系统的数据

Spark读取与保存hdfs文件

Java Spark读取JSON文件

Spark的RDD 文件读取与保存

Spark读取HDFS路径文件

Spark parquet merge metadata问题

Spark 系列（十三）—— Spark Streaming 与流处理

spark读取hbase数据

Spark Streaming 读取RabbitMQ

Spark 读取excel csv

Spark数据读取

spark读取es数据

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)