spark学习笔记4 - 代码天地

spark学习笔记4

其他 2018-05-30 11:27:23 阅读次数: 1

一、

spark2.0+ 版本只用spark.sql的SparkSession就可以代替之前的SparkContext、SQLContext等。

SparkSession的建立：

spark = SparkSession.builder \
    .master("local") \
    .appName("Word Count") \
    .config("mysqlusername", "alarm") \
    .getOrCreate()

用SparkSession的read.jdbc读取mysql数据

df = spark.read.jdbc(url='jdbc:mysql://192.168.88.60:3306/alarm',table='test',
                     properties={'user':'alarm','password':'123456'})

注意：在这里本来开始遇到了报错，“java.sql.SQLException: No suitable driver”

原因是java没有连接mysql的驱动

解决办法是：到mysql的官网，下载驱动mysql-connector-java-****-bin.jar，放到JAVA_HOME目录下的jre\lib\ext文件下

下载地址https://dev.mysql.com/downloads/connector/j/，点download会提示登录或注册，不用管点下面的No thanks下载即可。

另外SparkSession的read里面包含读取各种dataset的方法，如json、csv等等

二、

今天也学习了python的图论库NetWorkx

顺便就想看看spark的Graphx，但发现Graphx根本没有python接口，后来查看spark项目开发记录，原来Graphx的python接口项目中途关闭了，因为在不太好做。但好在有GraphFrames，有java，scala，python接口，而且接口统一。GraphFrames一个基于spark同样做图论的，只不过是基于dataframe。

看来dataframe这种结构真是很有优势啊，spark ml就是基于dataframe。

猜你喜欢

转载自blog.csdn.net/rona1/article/details/79917745

spark学习笔记4

spark 2.2.0学习笔记4之SparkSQLDemo

4-spark学习笔记-spark运行模式与原理

Spark学习笔记(4)作业执行源码分析

Spark学习（4）----ScalaTest

spark学习笔记：Spark Streaming

Spark学习笔记： Spark Streaming

Spark学习笔记：Spark SQL

Spark2.x学习笔记：4、Spark程序架构与运行模式

spark学习笔记__chap4_spark基础原理__4.2_SparkContext编程入口

spark学习笔记__chap4_spark基础原理__1_模块介绍

Spark SQL 笔记(4)——Spark SQL 介绍

spark学习笔记01

Spark 学习笔记

spark学习笔记二

Spark学习笔记

spark学习笔记1

spark学习笔记2

spark学习笔记3

spark学习笔记6

spark学习笔记5

Spark学习笔记（一）

Spark RDD学习笔记

spark学习笔记_1

学习笔记-Spark

Spark学习笔记（1）——

spark 学习笔记6

spark 学习笔记3

spark 学习笔记2

Spark Core 学习笔记

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)