Spark SQL 入门 创建DataFrame报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://local

Spark SQL 入门

创建DataFrame

执行以下语句时

val df = spark.read.json("../examples/src/main/resources/people.json")

报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://localhost:9000/user/examples/src/main/resources/people.json

如下图所示:

问题原因:spark-shell 与 Hadoop集群管理器YARN集成,访问的是HDFS中的文件,需要把文件上传到HDFS中。

解决办法:

将/usr/spark/spark-3.0.0/examples/src/main/resources/people.json文件,复制到/usr/hadoop/hadoop-3.2.1/examples/src/main/resources文件夹下面。
使用以下命令上传到HDSF中:

// 创建文件夹
$ hadoop fs -mkdir /user/examples
$ hadoop fs -mkdir /user/examples/src
$ hadoop fs -mkdir /user/examples/src/main
$ hadoop fs -mkdir /user/examples/src/main/resources
// 上传文件
$ hadoop fs -moveFromLocal ../examples/src/main/resources/people.json /user/examples/src/main/resources/people.json
发布了377 篇原创文章 · 获赞 127 · 访问量 64万+

猜你喜欢

转载自blog.csdn.net/daqiang012/article/details/104180928