hadoop学习笔记之hadoop集群搭建详细步骤
本次集群的搭建是在之前的伪分布集群的基础上实现的,如果没有搭建好伪分布集群,可参看之前的详细教程:
hadoop学习笔记之hadoop伪分布集群搭建(一)
hadoop学习笔记之hadoop伪分布集群搭建(二)
hadoop学习笔记之hadoop伪分布集群搭建(三)
hadoop学习笔记之hadoop伪分布集群搭建(四)
hadoop学习笔记之hadoop伪分布集群搭建(
Linux系统环境下安装IntelliJ IDEA
Linux系统安装 IntelliJ IDEA
1、下载IDEA镜像安装文件
(1)打开IDEA官网,点击 DOWNLOAD
(2)选择Linux 对应的版本下载(Community是免费的)
2、安装
(1) 在/opt目录下新建一个idea目录
mkdir
关于Linux系统下软件安装路径的一点建议
关于Linux系统下软件安装路径的一点建议
我们都知道,在Windows下安装软件时尽量不要安装到C盘(系统盘),这是因为如果所有软件都安装到C盘(虽然软件安装时默认是都C盘 ),即管理不方便,也会影响系统性能。
同样,Linux系统下的软件安装目录的选择也是很重要的,这对以后的系统管理也是有帮助的。
下面的表格是将Linux系统下的某些目录和Windows系统下的某些目
利用IDEA的Maven创建第一个java程序(helloworld)
利用IDEA的Maven创建第一个java程序
1、如果刚安装完IDEA,打开之后出现以下界面,点击Create New Project
2、出现New Project对话框,在左侧选择Maven,然后直接点击Next(如果想快速创建,可以勾线Create from archetype,然后选择一个模板即可。在此我们不勾选)。
3、接着填写GroupI
StringUtils工具包中的isBlank函数
StringUtils工具包中的isBlank函数
isBlank( )函数位于
org.apache.commons.lang.StringUtils工具包中,该函数的功能是判断传入的变量是否为空(通常为String类型)
在判断一个String变量是否为空时,通常分为以下三种情况:
(1)变量是否为null
(2)变量是否为“”
(3)变量是否为空字符串“
利用Hadoop MapReduce实现单词统计——Wordcount
Hadoop MapReduce实现单词统计——Wordcount环境:Centos 7系统+IDEA本程序是利用IDEA中的Maven来实现的,主要是因为Maven省去了在本地搭建Hadoop环境的麻烦,只需要在配置文件中进行相应的配置即可。如果你还没有安装IDEA,可以参考Linux下如何安装IntelliJ IDEA本(1)新建java Project ,并命名为WordCount。如果不知...
String中的split(",")和split(",",-1)的区别
String中的split(",")和split(",",-1)的却别
1、当字符串最后一位有值时,两者没有区别
2、当字符串最后一位或者N位是分隔符时,前者不会继续切分,而后者继续切分。即前者不保留null值,后者保留。
举例:
package stringsplit;
public class stringSplit {
public static v
Java中Array与ArrayList之间的转换
Java中Array与ArrayList之间的转换
ArrayList是一个数组队列,可以理解为是一个动态数组,即它的容量能动态增加。
Array也是一个数组队列,是一个静态数组,长度是固定的,不能更改。
很多情况下,我们需要在两者之间进行转换,转换方法如下:
package
arrayListToArray;
import
java.util.Arr
UNIX系统下diff的三种格式
UNIX系统下diff的三种格式
diff命令是UNIX系统中常用的一个命令,其功能是比较两个文本文件之间的差异。
目前diff的输出有三种格式,分别是:正常格式(normal diff)、上下文格式(context diff)、合并格式(unified diff)
1、正常格式
命令格式 :
diff
diff
举例:
创建
Centos 7(linux)系统下如何创建软件桌面快捷方式
刚接触Linux系统,通过解压安装的应用程序每次启动的时候都是cd到相应的bin目录下,然后执行相应的.sh文件,相当的麻烦,如何才能像Windows一样创建桌面快捷方式呢?下面就让我们开始吧!1、创建系统自带的应用程序快捷方式对于系统自带的应用程序,其桌面快捷方式存储的位置为以下三个目录中的其中一个:/usr/share/applications~/.local/share/applicatio...
Hash(散列表)算法实现原理
散列表
散列表,又叫做“哈希表”,它是基于高速存取的角度设计的,也是一种典型的“空间换时间”的做法。
散列表是依据关键码值(key)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中的一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组就叫做散列表。
哈希的思路很简单,如果所有的键都是整数,那么就可以使用一个简单的无序数组来实现:将键作为数组索引
MapReduce读写ORC文件
MapReduce读写ORC文件ORC的全称是Optimized Row Columnar。ORC文件格式是hadoop生态圈中的一种列式存储格式,最早来自于Apache Hive, 有着非常高的压缩比和读取效率,成为Hive中常用的一种文件格式。1、读ORC文件OrcFileReadMapper.java
---------------------------------------
impor...
StreamSets 下载安装教程
本教程以 StreamSet 3.4.0 为例
StreamSet有多种安装方式,最简单的一种就是下载压缩包,直接解压即可使用
1、下载StringSet压缩包
StringSet下载地址:https://streamsets.com/opensource/
执行以下语句
$ tar xvzf streamsets-datacollector-core-3.4.0...
Mac 环境变量介绍
1、Mac系统环境变量加载顺序:
1. /etc/profile
2. /etc/paths
3. ~/.bash_profile
4. ~/.bash_login
5. ~/.profile
6. ~/.bashrc
注:
优先级:1>2>3>4>5>6
1和2是系统级别的,在系统启动的时候就会加载;3、4、5和6是用户级别的。
3、...
(超详细)读取mnist数据集并保存成图片
mnist数据集介绍、读取、保存成图片
1、mnist数据集介绍:
MNIST数据集是一个手写体数据集,简单说就是一堆这样东西
MNIST的官网地址是 MNIST; 通过阅读官网我们可以知道,这个数据集由四部分组成,分别是
;也就是一个训练图片集,一个训练标签集,一个测试图片集,一个测试标签集;我们可以看出这个其实并不是普通的文本文件或是图片文件,而是一个压缩文件,
Linux下Docker容器使用systemctl命令出现"Failed to get D-Bus connection: Operation not permitted"错误
编者在使用Docker容器部署服务的时候,用的是CentOS的的的镜像,所以在这里就以CentOS的的的为例。
刚开始,编者在制作的Apache服务多克尔容器时,发现在使用systemctl命令启动服务时,就会出现错误。
[-> ~ Scong ] docker exec -it s1k3b3jwj4 bash
[-> ~ Scong ] yum -y install ht...
Wordpress博客部署,产生“建立数据库连接时失败出错”、“抱歉,我不能写入wp-config.php文件”、“未能找到WordPress内容目录(wp-content)”等问题的解决方法
Wordpress博客部署,产生“建立数据库连接时失败出错”、“抱歉,我不能写入wp-config.php文件”、“未能找到WordPress内容目录(wp-content)”等问题的解决方法
今日推荐
周排行