Tutorial de instalação local do Hive

Três modos de instalação da seção:

  • Modo incorporado: use o banco de dados Derby incorporado para armazenar metadados. Os metadados não podem ser compartilhados. É o método de instalação padrão do hive, mas apenas um cliente pode ser conectado por vez. É adequado para teste e não é adequado para ambientes de produção.
  • Modo local: o banco de dados externo é usado para armazenar metadados.Este modo não precisa iniciar o serviço de metastore separadamente, porque o modo local usa o serviço de metastore no mesmo processo que a seção.
  • Modo remoto: os metadados são armazenados em um banco de dados externo.Neste modo, o serviço de metastore precisa ser iniciado separadamente e cada cliente é configurado para conectar-se ao serviço de metastore no arquivo de configuração. No modo remoto, o serviço e a seção do Metastore são executados em diferentes processos.

Nota:
Modo local e remoto: Essencialmente, o meio de armazenamento de metadados padrão da seção é substituído pelo banco de dados Derby interno pelo banco de dados MySQL, para que, independentemente de qualquer diretório, a seção seja iniciada de qualquer maneira, desde que o serviço de seção seja conectado no mesmo dia. Em seguida, as informações de metadados acessadas por todos os nós são consistentes, de modo a obter o compartilhamento de metadados.

Instalação incorporada da instalação do Hive:

  • Baixe o pacote de instalação do Hivea
  • Digite o comando: bin / hive para entrar na seção

Instalação local do Hive

1. Instale o serviço mysql

Baixe e instale o mysql
Insira a descrição da imagem aqui
iniciar o serviço mysql
Insira a descrição da imagem aqui
para baixar e instalar MariaDB
Insira a descrição da imagem aqui
iniciar serviços MariaDB;
serviços permanentes início MariaDB;
serviço mysql login;
usar o MySQL;
senha;
privilégios de root concessão, pode ser usado para login remoto;
sair mysql;
password mysql login;
Insira a descrição da imagem aqui

2. Instale a seção

Importe o pacote compactado do hive (você também pode usar rz para fazer upload).
Insira a descrição da imagem aqui
Descompacte-o no servidor
Insira a descrição da imagem aqui
. Altere o nome simples do arquivo que você acabou de descompactar
Insira a descrição da imagem aqui
para o hive; digite o hive;
localize o diretório conf;
você pode ver que não há hive-env.sh, portanto, faça uma cópia
Insira a descrição da imagem aqui
Abra o arquivo de configuração
Insira a descrição da imagem aqui
Modifique o arquivo de configuração
Insira a descrição da imagem aqui
Crie um novo arquivo hive-site.xml
Insira a descrição da imagem aqui
Adicione o seguinte conteúdo
Insira a descrição da imagem aqui

<configuration>
    <property>
          <name>javax.jdo.option.ConnectionURL</name>
          <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
    </property>
    <property>
          <name>javax.jdo.option.ConnectionDriverName</name>
          <value>com.mysql.jdbc.Driver</value>
    </property>
     <property>
          <name>javax.jdo.option.ConnectionUserName</name>
          <value>root</value>
    </property>
     <property>
          <name>javax.jdo.option.ConnectionPassword</name>
          <value>123456</value>
    </property>
</configuration>

Um arquivo de driver de banco de dados é usado no arquivo hive-site.xml, portanto, abaixo, temos que importá-lo para o hive / lib (você também pode usar o rz, desde que seja necessário primeiro o pacote)
Insira a descrição da imagem aqui
para copiar a configuração do hive em hadoop01 para hadoop02 e hadoop03 Em
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui

3. Gerenciamento de colméia:

Antes de tudo, é necessário iniciar o cluster primeiro. Após abrir o
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
hive, o
Insira a descrição da imagem aqui
processo a seguir será exibido com êxito
Insira a descrição da imagem aqui
. Digite o beeline no hadoop02 (você também pode operar em outros nós). Após
Insira a descrição da imagem aqui
conectar-se ao hadoop01
, digite o nome do usuário e a senha. Você pode ver que a conexão foi bem-sucedida (entrada bem-sucedida)
Insira a descrição da imagem aqui
. A operação é semelhante à instrução
Insira a descrição da imagem aqui
mysql.Verifique o banco de dados.Depois de abrir o hive, use o sqlyog para conectar-se ao banco de dados mysql do hadoop01. Após a atualização, você verá que um banco de dados do hive aparece e todas as tabelas de metadados são armazenadas nele.
Insira a descrição da imagem aqui
Criar banco de dados
Insira a descrição da imagem aqui
Alternar banco de dados, exibir tabela
Insira a descrição da imagem aqui

4. Operação da tabela interna da seção

Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
Crie uma tabela interna, a segunda linha usa uma vírgula como delimitador e importe-a para a tabela.
Insira a descrição da imagem aqui
Você pode ver que a tabela foi criada com sucesso, mas não há dados.
Insira a descrição da imagem aqui
Coloque os dados na tabela t_user no banco de dados itcast.
Insira a descrição da imagem aqui
Em seguida, consulte a tabela e os dados serão
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
excluídos. Vejamos o segundo método para importar dados.
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui
Use load data inpath local para especificar a localização dos dados e, em seguida, carregue os dados na tabela especificada. Para
Insira a descrição da imagem aqui
visualizar o número total de dados, podemos ver que o mapa e a redução são usados ​​aqui. Não use nenhuma linha de dados como chave, o valor é 1, a redução é adicionada e as estatísticas.
Insira a descrição da imagem aqui
O caminho da tabela DBS na seção para colocar o banco de dados
Insira a descrição da imagem aqui
aqui é a tabela que criamos
Insira a descrição da imagem aqui

5. Operação da tabela externa do Hive

Primeiro, crie alguns dados
Insira a descrição da imagem aqui
novos.Insira os dados no sistema de arquivos distribuído em / stu para
Insira a descrição da imagem aqui
criar uma tabela externa, adicione a palavra-chave external e também use a vírgula como delimitador.O arquivo vem do stu no diretório raiz do sistema de arquivos local. Dados.
Insira a descrição da imagem aqui
Toda vez que executarmos um comando, haverá uma exibição aqui e, finalmente, você pode usar ctrl + c para sair.Você
Insira a descrição da imagem aqui
também pode usar ctrl + c para sair
Insira a descrição da imagem aqui
Pensando: Como escolher usar tabela interna ou tabela externa?
  Se todo o processamento for feito com o hive, use tabelas internas;
  se você precisar usar o hive e outras ferramentas externas para processar o mesmo conjunto de conjuntos de dados, use tabelas externas; use tabelas externas
  quando os dados forem grandes.

Publicado 72 artigos originais · Gosto 3 · Visitas 3527

Acho que você gosta

Origin blog.csdn.net/id__39/article/details/105628118
Recomendado
Clasificación