Bloques de datos: OLTP y OLAP híbrido de almacenamiento comprimido utilizando tanto vectorización y compilación

El propósito principal de este trabajo es introducir DataBlocks, la base de datos híbrido de resolución de problemas

 

 

 

 sistema híbrido dificultad radica en AP y TP en muchos sentidos, la idea de optimización es contradictoria

Tales como la compresión, para una p puede mejorar la consulta de rendimiento debido al uso del ancho de banda menor, pero para TP pero reduce el rendimiento de las consultas debido a la descompresión del tiempo de consulta requiere, sino que también afectan el índice

 

 

Así que la mayoría de los sistema de estrategia híbrida, están proporcionando optimizada de lectura y escritura optimizada dos piezas

Pero esto no es, obviamente, muy elegante, y el proceso de fusión es una operación muy pesada

Así que aquí se propone es que

La mesa se corta en trozos de tamaño fijo con ligera comprimido, bloques de datos inmutables

 

 

 

Y con el fin de mejorar la velocidad de consulta de la introducción del índice de PSAM ligero,

 

 

 

Finalmente la vista, si se utiliza la capacidad de cuantificar y JIT para mejorar la consulta híbrido,

Descrito anteriormente, la diferencia entre el JIT cuantificado y, la CPU reduce número de instrucciones aunque ambos son proceso tupla, pero por el JIT registro de datos de transferencia, a través de la memoria principal vectorizado

Y vectorizado para TP poco efecto, ya que el TP no tienden a datos de exploración, cuando los datos de contacto pequeños para cuantificar el efecto va a ser sin

 

 

Por lo tanto, este trabajo ha sido, formas de fusibles para cuantificar y optimizar el JIT,

Con tubería de ejecución tupla-en-un-tiempo basado en la exploración secundaria cuantificadas, alimenta los datos al intérprete del compilador JIT

 

 

 

 

 

DataBlocks

Hyper es una base de datos de la memoria, la memoria es limitada, por lo que puede ahorrar memoria comprimiendo

Pero después de la compresión puede afectar al rendimiento de TP y AP, se propone DataBlocks aquí, en el caso de la compresión, también se puede asegurar que el rendimiento no disminuye TP y AP

Para los primeros datos calientes no está comprimido, no existe un índice de SMA, garantizando así que el rendimiento de escritura TP no se verá afectada,

Cuando los datos se convierte en frío cuando, será el fragmento de datos en un bloque de datos, a continuación, cómo en el caso de la compresión, puede recuperar rápidamente

Podemos ver DataBlocks incluye principalmente las siguientes varias características,

1. Los métodos de compresión Optimizar para garantizar una mejor relación de compresión

2. Uso sólo es compatible con el método de compresión de bytes direccionables, la única manera de saltar rápidamente bloque, recuperación rápida

3. Apoyo sargable escanear, la afección es una simple filtración, puede ser directamente en el partido de datos comprimidos, no descompresión

4. El índice contiene SMA y PSMA

Aquí que el PSMA SMA y sólo se utilizan para los datos de frío, para no afectar el TP de escritura

 

 

Los bloques de datos de la disposición, tal como se muestra a la derecha,

El primero es el recuento de tuplas,

A continuación, los atributos asociados compensaciones de cada columna

Seguido por datos reales,

depósito de la columna, por lo que es una columna, una columna, fila pasado

Cada columna contiene, SMA, índice de PSMA, diccionario, datos, cuerda

Un depósito y, a continuación depositar la siguiente columna

 

 

 

 

posicional SMA

SMA, Pequeño materializadas agregados, de hecho, la mayor registrada en cada bloque, mínimo

 

 

PSMA, grabación máximo, mínimo puede podar a predicar, pero si cae máximo, mínimo, si no hay otros índices necesitan ayuda, sólo se puede escanear

Así que aquí incorporada PSMA, usando una tabla de consulta para registrar el rango de exploración,

 

 

Búsqueda en una tabla de la siguiente manera,

Tal como el algoritmo de derecho,

Debido a una precisión relativamente alta de pequeño valor, hacerlo con un índice de delta,

El principio es que ver con el índice no es cero byte más alto del índice, porque el algoritmo más r * 256 byte de bajo orden de modo de todos modos, por lo que el valor más alto no cero será el mismo lugar a la misma entrada en el índice

Así que para el de 4 bytes, 8-ésima potencia requiere una entrada de tabla de consulta 4 * 2, ya que cada valor de cada byte que requieren una entrada

Así que si estamos todos de valor relativamente grande, se concentra en un determinado período de entrada, por lo que el uso de delta

 

 

árbol de índice basado en PSMA por lo que es más pequeña que la convencional, ya que no es índice preciso, acaba de dar un rango

Pero si el mismo rango de valores de puntos es muy informal, así que PSMA no es tan eficaz, la mejor situación es el mismo valor de clúster

 

 

 

compresión atributo

método de compresión Aquí el ejemplo principal, y qué se puede hacer de bytes direccionables

 

MOTORES VECTORIZADO SCANS en la compilación de QUERY

Si elige el algoritmo de compresión en el nivel de bloque y de la columna, ya que puede mejorar la relación de compresión para diferentes tipos y la distribución de datos, sino que también conducen a la representación física diferente

Esto JIT gran reto, ya que cuando el código generado requiere compatible con todos diseño de almacenamiento, bajo las ramas más, el código compilado dará lugar a una explosión 

 

 Así que aquí se propone es que

El Scan separa y se procesa Pipline

porción Scan con interpretado, mientras que la sección de la tubería con el JIT, que puede realizar los datos obtenidos mediante la interpretación, la tubería de alimentación a la compilado

 

Supongo que te gusta

Origin www.cnblogs.com/fxjwind/p/12576026.html
Recomendado
Clasificación