Cree un entorno pseudodistribuido independiente de Hadoop

 Cree un entorno pseudodistribuido independiente de Hadoop

Esta versión de prueba es ubuntu 16.04 como entorno del sistema

Uso de VMware Workstation 12 como máquina virtual

Esta vez no presentaremos CentOS y RedHat para construir un entorno pseudodistribuido independiente de Hadoop

hadoop 2.6.4 utilizado por hadoop

¡Bien, ahora comenzamos nuestro viaje de configuración del entorno Hadoop ! ! !

El primer paso:

Abra el terminal ubuntu . Si no hay un usuario hadoop, creamos un usuario hadoop

       Use el comando sudo useradd -m hadoop-s / bin / bash

Aquí hay una breve reseña:

Usuarios y grupos

Usuario: multiusuario

Elementos centrales para la asignación de recursos por usuarios y grupos   

Un grupo es un grupo de contenedores donde    puede agregar usuarios o agregar permisos

Tipo de usuario:

Administrador 0 

Usuarios del sistema: 1--499 

Ejecute el programa en segundo plano (daemon )

Usuarios ordinarios: más de 500

Inicio de sesión: acceso interactivo

Categoría de grupo:

Grupo de administradores: 0

Grupo de sistema: 1-499

Grupo de usuarios: más de 500

Linux:

/ etc / passwd : información de la cuenta de usuario

/ etc / shadow : contraseña del usuario y configuración de cuenta relacionada

/ etc / group: información de la cuenta del grupo

/ etc / gshaow: información de contraseña de grupo

Use sudo cat / etc / group después de crear el usuario

Utilice sudo passwd hadoop para establecer la contraseña para hadoop

Sudo adduser hadoop sudo agrega permisos de administrador para usuarios de hadoop

Finalmente, use el comando de reinicio para reiniciar ubuntu e inicie sesión como usuario hadoop

El segundo paso:

Los usuarios de Hadoop actualizan la actualización después de iniciar sesión o algún software no funcionará

Utilizo la fuente espejo de nosotros , a veces la actualización es lenta o su hash es problemático, lo que indica que la fuente del software no puede encontrar recursos, puede cambiar la fuente del software. Se recomienda usar 163.

No diré nada sobre cambiar la fuente del software, y lo resolveré yo solo.

Luego instale el editor de texto de vim . Hay muchos tipos de nano vi vim (versión mejorada de vi) gedit (interfaz gráfica, se recomienda usarlo no muy familiar para vi o vim, pero aún tiene que aprender vi o vim en el futuro. Todos entienden). Para el gedit que acabo de contactar con Linux esta vez, porque es conveniente modificar el archivo de configuración xml y el archivo de script .sh modificado más adelante, acelerar la eficiencia y evitar errores.

Para el sistema con nano vi   instalar vim es 

Debido a que lo instalé, aparece la pantalla anterior. Si no está instalado, debería tener la opción de y / n . Ingrese y directamente.

El tercer paso:

Instale ssh para lograr el control remoto 

Ubuntu instala el cliente ssh por   defecto y luego podemos instalar el servidor directamente

El comando es:

La mía ha sido instalada y aparece la pantalla de arriba

Hay muchas herramientas de control remoto en Xshell secureCRT

Escribo ifconfig para ver ip

Yo uso Xshell5 para conectarme a ubuntu

El cuarto paso:

Instalar java jdk jre

Después de instalar OpenJDK , debe encontrar la ruta de instalación correspondiente, que se utiliza para configurar la variable de entorno JAVA_HOME.

Use sudo gedit ~ / .bashrc para editar y crear variables de entorno.

export JAVA_HOME = Ruta de instalación de JDK

Entre ellos, debe usar el comando source ~ / .bashrc   para que la variable surta efecto.

Finalmente use el comando anterior para verificar que las variables de entorno java que instalamos son válidas. Si funciona, continuamos con el siguiente paso. De lo contrario, configure el entorno java. De lo contrario, el siguiente paso no es posible.

El quinto paso:

Instalar hadoop

Estoy usando hadoop-2.6.4.tar.gz

Lo puse en el escritorio. Lo obtuve de la ventana y lo arrastré a ubuntu. Para realizar esta función, debe iniciar y reinstalar las herramientas de vmware para usarlo (puede crear una carpeta compartida y usar la transferencia de archivos ftp y muchos otros métodos)

Sugiero descargar directamente en Internet en ubuntu y luego buscar el archivo en la descarga. Para probar si puede conectarse a Internet, use ping  www.baidu.com y otros métodos. 

Luego, instale hadoop a continuación. Mi paquete de instalación se coloca en el escritorio. Se recomienda instalarlo en el mismo entorno que Java.

Modificar permisos

Sudo chown -R hadoop ./hadoop

Use el siguiente comando para verificar la versión de hadoop

Déjame escribir un poco sobre los permisos:

Chown : solo el administrador tiene permiso para cambiar el propietario del archivo  

Chown USERNAMEfile, ... -R   modifica recursivamente el propietario de los archivos internos del directorio y sus subfiles

- referencia = / ruta / a / archivo de archivo, ...

#chgrp GRPNAMEfile ... -R --reference = / path / to / somefile file, ...

Nombre de usuario de Chown: archivo GROUP ....

Chown USERANME.GROUP file ...

Chmod: modificar permisos de usuario

Modificar los permisos de tres tipos de usuarios.

Chmod más archivo ...

-R

- referencia = / ruta / a / archivo de archivo, ...

Rwxr-x ---

Modificar los permisos de ciertos usuarios o ciertos tipos de usuarios

U g o a

Tipo de usuario de Chmod = MÁS archivo ...

Modificar los permisos de ciertos usuarios o ciertos usuarios

U g o a

Tipo de usuario de Chmod + (-) MÁS archivo ...

El sexto paso:

Hadoop no está distribuido de forma predeterminada, es decir, un solo proceso de Java . A continuación, realizamos una configuración pseudodistribuida

Hadoop archivo de configuración se encuentra en / usr / local / hadoop / etc   / hadoop / Luego de entrar en el fichero de configuración, los cambios de maquillaje, tenemos que modificar un núcleo site.xml y hdfs-site.xml   uso sudo gedit./etc/hadoop/core -site.xml

El archivo core-site.xml modificado es la siguiente captura de pantalla:

 

Del mismo modo: la captura de pantalla de la modificación de hdfs-site.xml es la siguiente:

 

Paso 7: iniciar hadoop

./bin/hdfs -format NameNode formato NameNode recuerde que debe instalar hadoop bajo el contenedor en uso

 

 

El 0 en el camino indica que ha tenido mucho éxito para continuar nuestra operación a continuación. Estamos a punto de tener éxito, ¡vamos! ! ! Si algo sale mal, entonces verifique qué está mal.

./sbin/start-dfs.sh abierta NameNode y DataNode demonio. La primera vez, aparecerá una advertencia, .

Jps para ver si se abre con éxito.

Si puede fallar, elimine log tmp    usando el formato de archivo rm -r ./deleted

Paso 8: después de un inicio exitoso, puede acceder a la interfaz web para ver información relacionada

 

Use su dirección IP en rojo y el número de puerto es 50070 para ver la información

Esto ha sido exitoso. Jaja, jaja, genial! ! !

Paso 9:

Añadir ruta :

Debido a que las operaciones anteriores deben realizarse bajo el hadoop instalado , es más problemático. Utilizamos la variable de entorno de ruta para permitirnos abrir nuestro servicio en cualquier directorio.

Modificar el archivo ~ / .bashrc es similar a modificar la configuración JAVA_HOME

, Pro, finalmente recuerde operar source ~ / .bashrc para que la configuración surta efecto.

Escanee el código y siga la cuenta pública para obtener más información.

                                                             

 

Publicado 24 artículos originales · elogiado 36 · 20,000+ visitas

Supongo que te gusta

Origin blog.csdn.net/tanjunchen/article/details/79733866
Recomendado
Clasificación