El propósito principal de este trabajo es introducir DataBlocks, la base de datos híbrido de resolución de problemas
sistema híbrido dificultad radica en AP y TP en muchos sentidos, la idea de optimización es contradictoria
Tales como la compresión, para una p puede mejorar la consulta de rendimiento debido al uso del ancho de banda menor, pero para TP pero reduce el rendimiento de las consultas debido a la descompresión del tiempo de consulta requiere, sino que también afectan el índice
Así que la mayoría de los sistema de estrategia híbrida, están proporcionando optimizada de lectura y escritura optimizada dos piezas
Pero esto no es, obviamente, muy elegante, y el proceso de fusión es una operación muy pesada
Así que aquí se propone es que
La mesa se corta en trozos de tamaño fijo con ligera comprimido, bloques de datos inmutables
Y con el fin de mejorar la velocidad de consulta de la introducción del índice de PSAM ligero,
Finalmente la vista, si se utiliza la capacidad de cuantificar y JIT para mejorar la consulta híbrido,
Descrito anteriormente, la diferencia entre el JIT cuantificado y, la CPU reduce número de instrucciones aunque ambos son proceso tupla, pero por el JIT registro de datos de transferencia, a través de la memoria principal vectorizado
Y vectorizado para TP poco efecto, ya que el TP no tienden a datos de exploración, cuando los datos de contacto pequeños para cuantificar el efecto va a ser sin
Por lo tanto, este trabajo ha sido, formas de fusibles para cuantificar y optimizar el JIT,
Con tubería de ejecución tupla-en-un-tiempo basado en la exploración secundaria cuantificadas, alimenta los datos al intérprete del compilador JIT
DataBlocks
Hyper es una base de datos de la memoria, la memoria es limitada, por lo que puede ahorrar memoria comprimiendo
Pero después de la compresión puede afectar al rendimiento de TP y AP, se propone DataBlocks aquí, en el caso de la compresión, también se puede asegurar que el rendimiento no disminuye TP y AP
Para los primeros datos calientes no está comprimido, no existe un índice de SMA, garantizando así que el rendimiento de escritura TP no se verá afectada,
Cuando los datos se convierte en frío cuando, será el fragmento de datos en un bloque de datos, a continuación, cómo en el caso de la compresión, puede recuperar rápidamente
Podemos ver DataBlocks incluye principalmente las siguientes varias características,
1. Los métodos de compresión Optimizar para garantizar una mejor relación de compresión
2. Uso sólo es compatible con el método de compresión de bytes direccionables, la única manera de saltar rápidamente bloque, recuperación rápida
3. Apoyo sargable escanear, la afección es una simple filtración, puede ser directamente en el partido de datos comprimidos, no descompresión
4. El índice contiene SMA y PSMA
Aquí que el PSMA SMA y sólo se utilizan para los datos de frío, para no afectar el TP de escritura
Los bloques de datos de la disposición, tal como se muestra a la derecha,
El primero es el recuento de tuplas,
A continuación, los atributos asociados compensaciones de cada columna
Seguido por datos reales,
depósito de la columna, por lo que es una columna, una columna, fila pasado
Cada columna contiene, SMA, índice de PSMA, diccionario, datos, cuerda
Un depósito y, a continuación depositar la siguiente columna
posicional SMA
SMA, Pequeño materializadas agregados, de hecho, la mayor registrada en cada bloque, mínimo
PSMA, grabación máximo, mínimo puede podar a predicar, pero si cae máximo, mínimo, si no hay otros índices necesitan ayuda, sólo se puede escanear
Así que aquí incorporada PSMA, usando una tabla de consulta para registrar el rango de exploración,
Búsqueda en una tabla de la siguiente manera,
Tal como el algoritmo de derecho,
Debido a una precisión relativamente alta de pequeño valor, hacerlo con un índice de delta,
El principio es que ver con el índice no es cero byte más alto del índice, porque el algoritmo más r * 256 byte de bajo orden de modo de todos modos, por lo que el valor más alto no cero será el mismo lugar a la misma entrada en el índice
Así que para el de 4 bytes, 8-ésima potencia requiere una entrada de tabla de consulta 4 * 2, ya que cada valor de cada byte que requieren una entrada
Así que si estamos todos de valor relativamente grande, se concentra en un determinado período de entrada, por lo que el uso de delta
árbol de índice basado en PSMA por lo que es más pequeña que la convencional, ya que no es índice preciso, acaba de dar un rango
Pero si el mismo rango de valores de puntos es muy informal, así que PSMA no es tan eficaz, la mejor situación es el mismo valor de clúster
compresión atributo
método de compresión Aquí el ejemplo principal, y qué se puede hacer de bytes direccionables
MOTORES VECTORIZADO SCANS en la compilación de QUERY
Si elige el algoritmo de compresión en el nivel de bloque y de la columna, ya que puede mejorar la relación de compresión para diferentes tipos y la distribución de datos, sino que también conducen a la representación física diferente
Esto JIT gran reto, ya que cuando el código generado requiere compatible con todos diseño de almacenamiento, bajo las ramas más, el código compilado dará lugar a una explosión
Así que aquí se propone es que
El Scan separa y se procesa Pipline
porción Scan con interpretado, mientras que la sección de la tubería con el JIT, que puede realizar los datos obtenidos mediante la interpretación, la tubería de alimentación a la compilado