Selección de tipo de datos de almacén_datos_colmena

 

Hive tiene muchos tipos de datos básicos. ¿Cómo elegimos entre tantos tipos de datos que realmente construyen almacenes de datos?

 

Si su empresa es lo suficientemente grande, se recomienda consultar las siguientes sugerencias:

 

Recomendaciones de punto flotante:

 

1) El tipo doble en la colmena debe usarse con precaución, hay distorsión en el tipo doble en la colmena.

Por ejemplo: los datos originales son 10000, 10000 en Hive pueden ser 10000,0001


 
2) Para evitar números de coma flotante fuera de límites o distorsión, se recomienda que los datos originales se almacenen como decimales, independientemente de si los datos originales son flotantes, dobles o decimales.
 

 

Recomendaciones de tipo de valor: 
    


 Se recomienda que todos los tipos numéricos se almacenen como BIGINT. El propósito es evitar que el rango de tipos numéricos se agrande, lo que lleva al problema del cruce de valores numéricos.  
   

 

 

Carácter, tipo de cadena:

 

CHAR, VARCHAR se definen como STRING. Aunque CHAR y VARCHAR ya son compatibles con la versión superior de Hive, se recomienda almacenarlo como tipo STRING para evitar que los datos estén fuera de límites y sean complicados.

 

 

Recomendaciones de tipo de fecha:

 

     Se recomienda que DATE se defina uniformemente como el tipo STRNG (al menos en ods esto se almacena) 

519 artículos originales publicados · elogiados 1146 · 2,83 millones de visitas

Supongo que te gusta

Origin blog.csdn.net/u010003835/article/details/105233864
Recomendado
Clasificación