解决ValueError: Cannot run multiple SparkContexts at once； existing SparkContext

企业开发 2022-04-27 15:38:07 阅读次数: 0

一、问题描述

创建sparkcontext和SparkSession，连接spark集群时报错，如题ValueError: Cannot run multiple SparkContexts at once; existing SparkContext。

from pyspark.sql import SparkSession
from pyspark.sql import functions as F
from pyspark.sql.functions import min, max
from pyspark.sql.functions import monotonically_increasing_id, lit, col, struct
from pyspark.ml.evaluation import RegressionEvaluator
from pyspark.ml.recommendation import ALS
from pyspark.sql.functions import udf
from pyspark import SparkContext, SparkConf
from pyspark.sql.types import StructType, StructField, IntegerType, StringType, ArrayType, DoubleType, FloatType
from pyspark.ml.feature import Word2Vec
import os
import pandas as pd
import numpy as np
from tqdm import tqdm 
import heapq

# 创建 sparkcontext
# sc.stop()
# local[*]时最大线程数
conf = SparkConf().setAppName("data_process_first").setMaster("local[*]")
sc = SparkContext(conf=conf)

# 创建SparkSession，连接spark集群
spark = SparkSession.builder.appName('mypyspark_test1') \
        .master("local")\
        .config("spark.driver.memory","30G")\
        .config("spark.executor.memory","30G")\
        .getOrCreate()

二、解决方法

因为之前已经启动了sparkContext，不能重复启动，所以在SparkConf()上一句运行sc.stop()即可，即关闭spark集群。
在这里插入图片描述
sparkContext即完成了一个spark集群的连接，可以在该集群上创建RDD和广播变量。创建时至少传入master（上面栗子local[*]是使用当前所有的线程运行）和appname两个参数。

Reference

[1] Spark启动时的master参数以及Spark的部署方式

猜你喜欢

转载自blog.csdn.net/qq_35812205/article/details/124395130

解决ValueError: Cannot run multiple SparkContexts at once； existing SparkContext

Cannot run multiple SparkContexts at once; existing SparkContext错误

spark：ValueError: Cannot run multiple SparkContexts at once解决方法

RUN ONCE

cannot simultaneously fetch multiple bags异常的解决

compile once，run anywhere

write once , run anywhere

Existing lock /var/run/yum.pid: another copy is running as pid 解决办法?

已解决ValueError: document with multiple roots

ORA-00824: cannot set sga_target due to existing 问题解决

react项目中报“Cannot update during an existing state transition“问题解决

Hibernate: cannot simultaneously fetch multiple bags 问题的解决办法

SparkContext

MyBatisBatchItemWriter Cannot change the ExecutorType when there is an existing transaction

CentOS 7使用yum install命令报Existing lock /var/run/yum/pig:another copy is running as pid 1715的解决方式

Run Multiple Webpack Configs Sequentially

解决ERROR spark.SparkContext: Error initializing SparkContext

Run Code Once on First Load (Concurrency Safe)

用pyinstaller打包python程序，解决打包时的错误：Cannot find existing PyQt5 plugin directories

cannot mount volume over existing file, file exists /var/lib/docker/overlay2/.../merged/usr/share/zoneinfo/UTC 解决

adbd cannot run as root in production builds 的解决方法

Sorry, this application cannot run under a Virtual Machine的解决

解决adbd cannot run as root in production builds问题

the selection cannot be run on any server错误解决方法

解决运行qmake：Project ERROR: Cannot run compiler ‘cl‘. Output:

docker启动报错解决及分析(Cannot create container for service *******: cannot mount volume over existing file, file exists /var/lib/docker/overlay2/)

解决通过Eclipse启动Tomcat-Run On Server出现The selection cannot be run on any server

PyTricks-Differebt ways to test multiple flags at once in

Cannot import a package more than once

搭建Fabric 2.3解决问题“ERRO 001 Cannot run peer because cannot init crypto”

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)