pyspark读取Mysql数据 - 代码天地

pyspark读取Mysql数据

业界资讯 2023-09-08 20:46:43 阅读次数: 0

pyspark读取Mysql数据：

样例code 1：

from pyspark.sqlimportSQLContext

sqlContext = SQLContext(sc)
dataframe_mysql = sqlContext.read.format("jdbc").options(url="jdbc:mysql://127.0.0.1:3306/spark_db", driver="com.mysql.jdbc.Driver", dbtable="spark_table", user="root", password="root").load()
dataframe_mysql.show()

样例code 2：

from pyspark import SparkContext,SQLContext
from pyspark.sql import SQLContext

sc = SparkContext("spark://train01:7077","LDASample")
sqlContext=SQLContext(sc)
jdbcDf=sqlContext.read.format("jdbc").options(url="jdbc:mysql://10.10.10.10:3306/adl",driver="com.mysql.jdbc.Driver",dbtable="(SELECT code,title,description FROM project) tmp",user="mouren",password="mouren").load()
print(jdbcDf.select('description').show(2))

前提：配置文件/etc/spark/conf/spark-env.sh

+export SPARK_CLASSPATH=$SPARK_CLASSPATH:/opt/mysql-connector-java/mysql-connector-java-5.1.40-bin.jar

这样的配置有时报错：

WARN spark.SparkConf: Setting 'spark.executor.extraClassPath' to ':/opt/mysql-connector-java/mysql-connector-java-5.1.40-bin.jar' as a work-around.

解决方案：

去掉上面的配置，编辑spark-defaults.conf

+spark.executor.extraClassPath /opt/mysql-connector-java/mysql-connector-java-5.1.40-bin.jar

猜你喜欢

转载自blog.csdn.net/victory0508/article/details/68067716

pyspark读取Mysql数据

pyspark 数据的读取与保存；pyspark的dataframe转化与展示

pyspark 读取mysql 数据库，返回类型是true和false

pyspark读取tidb数据库

Pyspark和MySQL建立连接，并插入数据

利用pyspark 读取 S3上数据

windows下用pyspark连接mysql数据库

pyspark将本地数据转化为方便在hdfs上读取的分布式数据

PHP MySQL 读取数据

python 读取mysql数据

Spark读取MySQL数据

pyspark进行操作mysql

pyspark学习系列（二）读取CSV文件为RDD或者DataFrame进行数据处理

CDH 集群机器上部署 Jupyter notebook 使用 Pyspark 读取 Hive 数据库

python中，用pyspark读取Hbase数据，并转换为dataframe格式

pyspark程序从hdfs上读取数据求其TopN，并将结果存回hdfs

pyspark数据准备

pySpark加载数据

使用PySpark处理数据

PySpark 数据操作

Presto查询数据，通过pyspark把数据存入mysql数据库

java mysql 读取blob 数据

java - mysql 读取blob 数据

mysql 读取不是最新的数据

从mysql读取数据写入mongo

pandas读取mysql中的数据

redis读取数据,写入mysql

读取HDFS数据写入MySQL

DataX之读取MySQL数据

powerbi如何读取mysql的数据

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)