Créer une ruche de tables et des opérations sur la table de données

Une ruche en deux tables

  1, la table interne (tableau de gestion):

      Supprimer pour supprimer les données sur la table quand HDFS.

  2, la table externe

      Supprimer la table lorsqu'ils ne sont pas des données de suppression sur HDFS.

      table externe ne peut pas être inséré à l'aide insérer les données, toutes les sources de données sont fournies par des personnes extérieures, cette ruche pensent qu'ils ne disposent pas de données exclusives, supprimer la table ruche, la table ne supprime pas l'intérieur de données

En second lieu, le fonctionnement de la table de données ruche;

  1, insérer en général fortement recommandé de ne pas insérer les données de cette façon, car il produira de petits fichiers dans HDFS ci-dessus, l'impact de la gestion des métadonnées HDFS

  2, ruche lors de la construction de la table si vous ne pas utiliser un séparateur, il par défaut \ 001. code Asc est une valeur, un des caractères non-impression.

  3, spécifiez le délimiteur lors de la création de tables

    Créer une table interne

    créer la table si existe pas stu2 (id int, chaîne de nom) format de ligne délimité fileds terminés par '\ t' stockés comme emplacement de fichier texte '/ user / ruche / entrepôt / myhive / stu2';

    Créer une table externe

    créer la table externe si elle existe pas format de lignes étudiant (string, S_ID chaîne de s_name) champs délimités terminés par '\ t' stockés comme emplacement de fichier texte '/ user / ruche / entrepôt / myhive / étudiant';

  4, créez une table en fonction des résultats de la requête et les résultats des données dans la nouvelle table pour aller à l'intérieur

      create table stu3 comme select * from stu2, de cette manière l'utilisation de plus

      Selon la table existante la structure pour créer une table, il suffit de copier la structure de la table de cette façon:

      create table stu4 comme stu2;

  5, type de table de correspondance:

    desc stu2 formaté;

  6, comment charger des données dans des tables externes à l'intérieur?

   1, les données sont chargéespartir du système de fichiers local à une table

     les données de charge de INPATH locale « de /export/servers/hivedatas/student.csv » en étudiant de table;

     Charger des données et remplacer les données existantes

     les données de charge de INPATH locale « /export/servers/hivedatas/student.csv » Ecraser dans étudiant de table;

   2, hdfs chargés à partir du système de fichiers pour les données de table (nécessaire à l' avance pour télécharger des données vers le système de fichiers de hdfs, en fait, un fichier d'exploitation mobile)

    les données de charge INPATH '/hivedatas/techer.csv' dans la table techer;

 

  

Je suppose que tu aimes

Origine www.cnblogs.com/nacyswiss/p/12606983.html
conseillé
Classement