Sobre cómo utilizar las funciones de tabla SQL para el análisis y la adquisición de datos

¿Qué es una función de tabla?

La función de tabla devuelve una colección de filas de datos para cada fila de entrada, es decir, una tabla bidimensional. 

El conjunto de datos devuelto puede estar vacío y contener una o más filas de datos, cada fila de datos contiene una o más columnas. El valor de retorno de una función escalar ordinaria es un valor escalar.

¿Por qué necesitamos funciones de tabla?

Las funciones de la tabla juegan un papel importante en los dos aspectos siguientes:

Análisis de los datos

Adquisición de datos

Además de las funciones de tabla integradas, los usuarios pueden personalizar las funciones de la tabla según sus necesidades para mejorar la eficiencia del análisis de datos.

Cómo utilizar funciones de tabla en Honghu

En Honghu, las funciones de tabla se pueden utilizar siempre que se requiera una estructura de tabla bidimensional. Las funciones de tabla se dividen en funciones de tabla SQL y funciones de tabla que no son SQL:

funciones de tabla SQL

La función de tabla SQL puede considerarse como una vista parametrizada (Vista parametrizada) y admite funciones definidas por el usuario (Función de tabla definida por el usuario, UDTF).

Crear función de tabla SQL:

  • get_events_from_dataset es el nombre de la función de tabla SQL creada.

  • La tabla @data_set y la cadena @key corresponden al parámetro_nombre en la sintaxis, lo que indica que esta función de tabla tiene dos parámetros, el tipo de parámetro data_set es tabla y el tipo de clave de parámetro es cadena.

  • SELECCIONE * DE @data_set DONDE 

    CONTAINS(@key) es la expresión de consulta correspondiente a la función de la tabla SQL.

Ver funciones de tabla SQL

Usando funciones de tabla SQL

Después de definir la función de tabla SQL anterior llamada get_events_from_dataset, podemos usarla así:

Esta consulta es equivalente a consultar:

Eliminar función de tabla SQL

Al eliminar una definición de función de tabla, debe especificar la firma de la función (firma), es decir, el tipo de parámetro debe coincidir exactamente con el tipo de parámetro definido.

Funciones de tabla que no son SQL

Funciones de tabla integradas que no son SQL

Honghu proporciona una serie de funciones de tabla integradas que no son SQL para enriquecer el contenido de las consultas. Las funciones de tabla integradas que no son SQL se implementan principalmente en C++ y Python.

Escenario: Genere 5 números enteros del 1 al 5, un número entero por línea.

Escenario: analizar campos de tipo json

Para obtener más instrucciones sobre cómo utilizar las funciones de tabla integradas que no son SQL, consulte el manual del usuario.

Funciones de tabla personalizadas que no son SQL

Actualmente, Honghu solo admite funciones de Python definidas por el usuario (función de tabla definida por el usuario de Python, Python UDTF). Para personalizar las funciones de la tabla de Python, consulte Desarrollo de UDTF de Python.

Mejores prácticas para funciones de tabla

En Honghu, el uso de funciones de tabla debe combinarse con los requisitos reales de análisis de datos. Por lo general, cuando encontramos algunos requisitos que no se pueden cumplir mediante consultas SQL generales, podemos seguir los siguientes pasos para considerar si los requisitos se pueden cumplir mediante funciones de tabla:

  • ¿Es posible lograr esto mediante funciones de tabla SQL personalizadas?

  • ¿Existe alguna función de tabla incorporada que pueda usarse directamente?

  • ¿Puedo utilizar el SDK proporcionado por Honghu para implementar funciones de tabla según mis necesidades únicas?

otras referencias

Funciones de tabla 

Supongo que te gusta

Origin blog.csdn.net/Yhpdata888/article/details/130771709#comments_26575822
Recomendado
Clasificación