spark不同版本读取csv文件出现的编码问题

其他 2020-01-27 13:54:48 阅读次数: 0

昨天在跑的时候发现一个问题，因为在本地的spark版本号为spark 2.4，集群上的为spark 2.1，代码在spark2.4跑挺好，在spark2.1跑不起来。

用sparkSession读完csv文件，对列进行过滤，在spark2.4，可见"is_claim"已经被过滤掉。
spark2.4 运行

然鹅，在spark2.1中，此列并无法过滤，赫然在列！
spark2.1运行

究其原因，碰巧无奈在一次打印feature_cols的时候，发现此列较其他列多了一位空格，并不是真的空格，是BOM字节流标记----- \uFEFF。

这并不是ide设置或者是excel编译转译出问题，是spark读取csv的时候出问题。

解决方案1，

coolljp21

发布了10 篇原创文章 · 获赞 0 · 访问量 3885

私信关注

猜你喜欢

转载自blog.csdn.net/coolljp21/article/details/86737344

spark不同版本读取csv文件出现的编码问题

Python中pandas读取*.csv文件出现编码问题

Spark如何读取csv文件

pandas读取csv编码问题

python读取csv编码问题

CSV文件读取（问题）

【Spark五十五】Spark读取csv文件

spark读取csv文件，中文乱码，同一单元格同时出现引号逗号（"，）串列问题，动态构建原有csv首行schema信息

解决pandas读取csv文件出现乱码问题

用pandas读取csv文件出现问题

pandas读取列数不同的CSV文件

读取csv文件的字符编码错误

[Spark] DataFram读取JSON文件异常出现 Since Spark 2.3, the queries from raw JSON/CSV files are disallowed...

Python读取csv文件pdf版本下载

python读取csv文件出错:显示utf-8编码问题该怎么解决

【R】【编码】R读取csv文件时中文显示为乱码的问题

Spark 读取excel csv

Spark读取CSV数据

读取并且解析csv文件的问题？kPzUX

解决pandas读取csv文件出错的问题

PHP 读取或生成Unicode csv文件（PHP读取淘宝CSV文件出现乱码解决方案）

通过Spark程序读取CSV文件存储到ES

Spark读取文本或CSV文件中文乱码的解决方案

使用python对不同版本csv文件的数据进行分析

Jmeter读取csv文件首行变量出现？

读取with open as ：读取文件的时候出现的问题

spark保存读取csv SequenceFile

【spark】Spark Session 读取csv文件、修改无列名文件名

spark读写csv文件

读取不同编码格式文本文件

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)