Introducción a la colmena (1)

1.1 Introducción

El software de almacenamiento de datos Apache Hive facilita la lectura, escritura y administración de grandes conjuntos de datos que residen en almacenamiento distribuido utilizando SQL.  La estructura se puede proyectar en datos que ya están almacenados. Se proporciona una herramienta de línea de comandos y un controlador JDBC para conectar a los usuarios a Hive.

El software de depósito de datos Apache Hive puede usar SQL para leer, escribir y administrar fácilmente grandes conjuntos de datos que residen en almacenamiento distribuido. La estructura se puede proyectar sobre los datos almacenados. Se proporciona una herramienta de línea de comandos y un controlador JDBC para conectar a los usuarios a Hive.

1.2 Función

Convierta SQL al programa MapReduce, envíe el programa al clúster YARN y lea el procesamiento de datos en HDFS.

Consulta S ql: similar a sql en la base de datos mysql

1.3 Concepto

SQL en hadoop

Facción: un marco de análisis basado en SQL construido en Hadoop

H i ve marco de este tipo es el bastidor de base del bastidor

M ysql el DDL y DML

 

M ap: dividir, convertir

(Hadoop, 1), colmena, 1), chispa, 1) .....

R educe: agregar

 

DML DDL DCL diferencia

DML (lenguaje de manipulación de datos):

Son SELECT, UPDATE, INSERT, DELETE, al igual que su nombre, estos 4 comandos se utilizan para operar los datos en la base de datos 
DDL (lenguaje de definición de datos): 
DDL es más que DML, los comandos principales son CREATE, ALTER, DROP, etc., DDL se usa principalmente para definir o cambiar la estructura de la tabla (TABLE), los tipos de datos, los enlaces y las restricciones entre tablas y otros trabajos de inicialización, la mayoría de ellos usan
DCL (Data Control Language) al crear tablas  : Es 
una función de control de base de datos. Declaraciones utilizadas para establecer o cambiar los permisos de usuario o rol de la base de datos, incluidas las declaraciones (otorgar, denegar, revocar, etc.). De manera predeterminada, solo el personal como sysadmin, dbcreator, db_owner o db_securityadmin tienen la autoridad para ejecutar DCL 

1, DDL

      1-1 Descripción general de
               DDL DDL (Lenguaje de definición de datos) se utiliza para manipular objetos y atributos de objeto, tales objetos incluyen la base de datos en sí, así como objetos de base de datos, como tablas, vistas, etc. DDL trata estos objetos y atributos La gestión y definición del rendimiento específico en Crear, Soltar y Alterar. Atención especial: el concepto de "objeto" en la operación DDL, "objeto" incluye el objeto y los atributos del objeto, y el objeto es al menos un nivel más grande que el registro. Tome la tabla como ejemplo: Crear crea una tabla de datos, Alter puede cambiar los campos de la tabla, Drop puede eliminar la tabla, desde aquí podemos ver que la altura de la estación DDL, no operará en los datos específicos.

      1-2. Declaración principal de DDL (operación)
               Crear declaración: puede crear una base de datos y algunos objetos en la base de datos.
               Declaración de caída: puede eliminar tablas de datos, índices, disparadores, restricciones condicionales y permisos de tablas de datos.
               Alterar declaración: Modificar la definición de la tabla de datos y los atributos.
      1-3, objetos de operación DDL (tablas)
               1-3-1, el concepto de
                           creación de tablas se utiliza para almacenar datos, porque los datos que almacenamos no están disponibles, por lo que debemos definir algunos tipos de datos para facilitar la gestión .
               1-3-2. Atributos de la tabla    
                           Atributos de la clave primaria: la clave primaria es la restricción de la clave primaria, pero el nombre es diferente, el nombre de la clave primaria está sesgado a lo virtual (es decir, para describir este asunto), el nombre de la restricción de la clave primaria está sesgado a lo real (es decir, para describir la implementación de la operación), todo descrito Es lo mismo. La restricción de clave primaria es un atributo en la tabla; puede haber como máximo una clave primaria en una tabla; una clave primaria se puede definir en uno o más campos; la clave primaria hace que el valor de uno o más campos debe ser único y no vacío De esta manera, el valor en este campo o el grupo de campos se puede usar para representar un registro de forma exclusiva.
                           Atributo único: solo puede haber un atributo de clave principal en una tabla. Para los usuarios de la tabla cuadrada, se propone una restricción única; una restricción única se puede definir en uno o más campos; una restricción única hace que el valor en el campo o grupo de campos sea único, puede ser Vacío, pero no se puede repetir.
                           Atributo de clave externa: también llamada clave externa, también llamada restricción de clave externa, y la relación entre la clave primaria y la restricción de clave primaria es la misma; las dos tablas seleccionadas por la restricción de clave externa, si la clave primaria de la tabla A es un campo en la tabla B, entonces Este campo se llama la clave externa de la tabla B, la tabla A se llama la tabla maestra y la tabla B se llama la tabla esclava, pero debe tenerse en cuenta que la computadora debe saber que usted está en esta relación.

               Verificación, nulo y atributos predeterminados: los atributos de verificación también se denominan restricciones de verificación, los atributos nulos también se denominan restricciones nulas y los atributos predeterminados también se denominan restricciones predeterminadas; estos nombres describen una cosa, describen una situación, esto o esto Por supuesto, podemos hacerlo intencionalmente artificialmente (los datos de entrada son para prestar atención), pero su intención original es lograr la automatización, es decir, dejar que la computadora haga esto.
            (¿Sabe por qué la clave primaria y las restricciones únicas se crean automáticamente, el índice se creará automáticamente? Y es un índice único, piense que el índice se usa principalmente en esos campos, y el papel del índice lo sabrá. Al igual que las restricciones de clave primaria, restricciones únicas , Las restricciones no nulas, las restricciones de clave externa, las restricciones de verificación y las restricciones predeterminadas son todas operaciones que hacen que la tabla tenga ciertas características, por lo que aquí creo que todos son atributos de la tabla).

2. DML

      2-1 Descripción general de
               DML DML (Lenguaje de manipulación de datos) se utiliza para manipular los datos contenidos en los objetos de la base de datos, es decir, la unidad de operación son los registros.
      2-2. Declaración principal de DML (operación)
               Insertar declaración: inserte un registro en la hoja de datos.
               Declaración de eliminación: elimine uno o más registros en la tabla de datos, también puede eliminar todos los registros en la tabla de datos, pero su objeto de operación sigue siendo un registro.
               Declaración de actualización: se utiliza para modificar el contenido de los registros que ya existen en la tabla.
      2-3. Objetos de operación del registro DML
               2-3-1. Nota
                           Cuando realizamos operaciones de Insertar, Eliminar y Actualizar en el registro, debemos prestarle atención, y debemos tener claras algunas operaciones de DDL en él.

3. DCL

       3-1. Descripción general de
                DCL La operación de DCL (Lenguaje de control de datos) es la autoridad de los objetos de la base de datos. La determinación de estas operaciones hace que los datos sean más seguros.
       3-2. Declaración principal de DCL (operación)
                Declaración de concesión: permite al creador de un objeto otorgar ciertos permisos a un usuario o un grupo o todos los usuarios (PÚBLICO).
                Declaración de revocación: puede revocar los derechos de acceso de un usuario o un grupo o todos los usuarios
       3 a 3. El objeto de operación (usuario) de DCL se
                refiere al usuario de la base de datos. 

105 artículos originales publicados · Me gusta 536 · Visitas 70,000+

Supongo que te gusta

Origin blog.csdn.net/qq_41934990/article/details/81901556
Recomendado
Clasificación