ubuntu Hadoop及Spark环境搭建 - 代码天地

ubuntu Hadoop及Spark环境搭建

其他 2020-02-10 10:40:05 阅读次数: 0

关于平台选择的问题
目前分布式计算框架主要是在linux系统下开发，因此选择ubuntu或者centos都没有问题。
spark发展到现在，很多方面都已经十分完善，其速度与性能等也比hadoop好不止一个数量级，因此，主要使用spark进行分布式计算框架的学习。但是hadoop中的HDFS文件系统应用广泛，spark默认也采用hadoop的HDFS文件系统，因此安装时，首先安装配置hadoop，然后再安装spark。
主要流程
安装系统
最好是首先配置一个username为hadoop的用户名，方便之后的操作。
安装hadoop
jdk配置：因为在这里需要配置jdk，尽量选择jdk8，不要选择9或者以上的版本，否则之后spark中的scala(scala2.12.4以及之前版本都是这样)无法使用
在安装hadoop的过程中，主要是需要配置一些免密登录等的东西，方便之后的操作，同时需要设置hadoop文件夹可以被hadoop用户直接读写，否则始终用sudo操作很麻烦。
安装hadoop的参考链接
https://www.cnblogs.com/87hbteo/p/7606012.html
http://blog.csdn.net/monkeys2012/article/details/51972622
scala安装
其实不需要单独安装这个，因为之后安装spark的时候也会安装scala，但是为了平时练习，也可以安装一下，安装教程参考链接和spark的放在一起
spark安装
安装与测试的参考链接：http://dblab.xmu.edu.cn/blog/spark-quick-start-guide/
注意：如果遇到spark-shell Failed to initialize compiler: object java.lang.Object in compiler mirror not found.等问题，可能就是java版本太高的问题，换成8或者一下就没有问题了

Archger

发布了123 篇原创文章 · 获赞 62 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/Archger/article/details/102160915

ubuntu Hadoop及Spark环境搭建

Ubuntu 18.04下搭建单机Hadoop和Spark集群环境

在Ubuntu里搭建spark环境

Ubuntu18.04环境下Hadoop、Spark的环境的搭建

在Ubuntu环境下搭建Hadoop

Ubuntu中Hadoop环境搭建

ubuntu下Hadoop与Spark开发环境安装

Ubuntu下Spark开发环境搭建

在ubuntu上搭建hadoop开发环境

Ubuntu 18.04.1 LTS 搭建Hadoop环境

大数据A环境搭建--HADOOP--Ubuntu

Spark Hadoop 环境搭建

pc上ubuntu环境下搭建hadoop开发环境

Ubuntu 16.04下Spark安装与开发环境搭建

Ubuntu 搭建hadoop平台

ubuntu Hadoop 单点搭建

Ubuntu部署Hadoop环境

Ubuntu安装Hadoop Ubuntu16.04+hadoop2.7.3环境搭建 Ubuntu16.04下Hadoop的本地安装与配置

ubuntu14.04的hadoop环境搭建（全分布模式）

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）

Ubuntu下搭建单节点Hadoop环境及WordCount示例的运行

ubuntu9.04+hadoop0.20.2+eclipse环境搭建

Ubuntu 14.04.4 下 Hadoop环境搭建安装

ubuntu14.04搭建hadoop伪集群环境

Ubuntu13.04下搭建Hadoop+Eclipse开发环境

ubuntu系统的mysql+hadoop+hive环境搭建

Ubuntu16.04搭建hadoop伪分布式环境

Ubuntu16.04 搭建伪分布式Hadoop环境

Ubuntu上搭建Hadoop环境(单机模式+伪分布模式)

hadoop spark ubuntu16

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)