Un artículo para comprender los requisitos técnicos de la infraestructura de TI cercana al borde

Con la madurez gradual de las tecnologías relacionadas con la informática de punta, los tipos de aplicaciones de punta también se diversifican. La Guía mundial de gastos en el borde 2023 de IDC identifica más de 400 aplicaciones relacionadas con el borde, agregadas de nueve regiones geográficas, 17 mercados tecnológicos, seis dominios tecnológicos y 19 industrias.

La complejidad de la computación de borde y la diversidad de aplicaciones de borde pueden recordar fácilmente a la gente una alusión: "el ciego toca al elefante". En el ecosistema de computación de borde, cada persona, cada industria y la solución de cada empresa solo pueden cubrir una parte del escenario de computación de borde. Es difícil encontrar una tecnología/producto/solución de una empresa/organización que pueda cubrir las necesidades de todos los escenarios de aplicaciones de borde. Si desea crear una solución dedicada para cada caso de uso de borde, sin duda reducirá la velocidad de entrega de las aplicaciones de borde, aumentará el costo y la complejidad y dificultará la garantía de la calidad y la experiencia del usuario; y si desea proporcionar estandarización, Los recursos y las soluciones con procesos altamente integrados requieren una comprensión profunda y un análisis preciso de las características comunes de las aplicaciones de borde y sus requisitos de recursos.

Con base en esto, en este artículo nos centraremos en el nivel de infraestructura y brindaremos a los lectores una referencia de arquitectura adecuada para admitir casos de uso de borde en esta etapa mediante el análisis de los requisitos técnicos de las aplicaciones de borde en la infraestructura de TI.

Análisis de los requisitos técnicos de las aplicaciones de borde en infraestructura.

Características arquitectónicas generales que admiten aplicaciones perimetrales

El análisis de Gartner de la arquitectura técnica de la computación de borde y la nube puede ayudarnos a comprender mejor las tecnologías y clasificaciones relacionadas con las aplicaciones de borde desde la perspectiva de la arquitectura general. La clasificación de la infraestructura de la informática de punta a menudo se resume como "extremo de la nube". En el modelo de infraestructura de Gartner, el "borde del dispositivo" es lo que a menudo llamamos "final", y las capas superiores son el borde de la puerta de enlace, el borde de la computación, el centro de datos local, el centro de datos regional y la nube (como se muestra a continuación).

Referencia de imagen: Infografía: Comprensión de Edge Computing, Gartner (2022)

La clasificación y denominación del nivel de borde por parte de todos no es uniforme: por ejemplo, lo que a menudo llamamos equipo "final", que se divide en "borde del dispositivo" en el diagrama de arquitectura en capas de computación de borde de Gartner, y lo que Gartner llama "borde de computación" Parte, Las soluciones de algunos proveedores lo llaman "borde del campo"...

En comparación con la jerarquía en la figura anterior, el "lado del dispositivo" y el "borde de la puerta de enlace" se pueden denominar colectivamente "borde del extremo lejano" (o "borde del dispositivo"), y la parte desde el "borde de computación" hasta los "datos locales". centro" se puede llamar "borde cercano" (correspondiente a sucursal, centro de datos de sucursal, nube distribuida), la capa superior es "centro de datos" (o "nube central").

Esta clasificación jerárquica se basa principalmente en las siguientes tres dimensiones para medir las aplicaciones de borde y sus sitios:

1. Dimensiones de almacenamiento y procesamiento de datos

El "borde remoto" (o "borde del dispositivo") es el principal responsable de la recopilación de datos, el almacenamiento temporal y el preprocesamiento. Por ejemplo, los datos obtenidos a través de dispositivos de borde, como sensores, cámaras y terminales inteligentes, primero se someten a una capa de filtrado y filtrado antes de transmitirse al "extremo cercano". Varias aplicaciones perimetrales y los dispositivos perimetrales correspondientes realizan en su mayoría tareas similares en la ubicación "remota".
El "borde cercano" es la primera parada para que todos los datos del "borde lejano" se almacenen, se realicen copias de seguridad, se sincronicen, se analicen y se procesen.
Un "centro de datos" (o "nube central") se utiliza a menudo para almacenar, realizar copias de seguridad y gestionar datos de forma centralizada desde todos los extremos.

Por lo tanto, los factores clave son si cada sitio que participa en aplicaciones de borde tiene la función de guardar datos, durante cuánto tiempo se pueden guardar los datos, qué garantías de datos y servicios de datos se pueden proporcionar y qué procesamiento y procesamiento de datos en profundidad se requiere. que distinguen entre "final" y "borde". ": una base importante para la arquitectura a nivel de "nube".

2. Aplicar dimensiones sensibles a la latencia

Las aplicaciones que son altamente sensibles a la latencia, como la conducción autónoma que requiere respuestas de nivel de milisegundos, a menudo deben ejecutarse en el "borde lejano" para mantener la aplicación lo más cerca posible del dispositivo de borde y de las personas que lo utilizan.
Las aplicaciones que no son sensibles al retraso pueden estar en el centro de datos , como la capacitación y el aprendizaje a largo plazo después de desensibilizar los datos recopilados.
Las aplicaciones cuya sensibilidad de latencia se encuentre entre las dos primeras pueden ejecutarse en sitios "near-edge" .

3. Dimensiones de publicación y gestión de aplicaciones

El "borde del extremo cercano" y el "borde del extremo lejano" son los principales responsables de la ejecución de algoritmos/programas. Debido a que el algoritmo/programa de la aplicación perimetral no puede provenir del "borde del extremo lejano", solo se puede distribuir al "borde del extremo cercano" o al "borde del extremo lejano" a través del sitio central para su ejecución.
Los algoritmos/programas en el sistema de aplicaciones perimetrales deben administrarse de manera centralizada y programarse de manera uniforme en un sitio central , generalmente un "centro de datos" o una "nube central". Incluso si es necesario utilizar diferentes algoritmos/programas para escenarios de borde en diferentes regiones, la gestión unificada y la publicación a través del sitio central es la forma más eficiente.

A partir de las tres dimensiones anteriores, podemos delinear claramente las características de los tres sitios involucrados en las aplicaciones de borde. En la práctica, muchas aplicaciones perimetrales no tienen límites claros para los requisitos de "latencia", y el método de "administración y lanzamiento de aplicaciones" aún no ha formado un modelo definido. Actualmente, sólo las "dimensiones de procesamiento y almacenamiento de datos" tienen estándares relativamente ciertos. . Compare el modelo jerárquico de computación de borde de Gartner: "borde de puerta de enlace" y "borde de dispositivo" (borde remoto) son los principales responsables de las tareas de recopilación y transmisión de datos, y no tienen la capacidad de almacenar grandes cantidades de datos durante mucho tiempo; comenzando desde el El "borde informático" y los niveles superiores (cerca del borde y del centro de datos) son responsables de un número cada vez mayor de tareas de almacenamiento, análisis y procesamiento de datos. Esto tiene una importancia rectora directa para el diseño de infraestructura y la implementación de aplicaciones perimetrales.

La relación entre “datos” y “computación” en la informática de punta

Anteriormente, analizamos la arquitectura general de la informática de punta desde la perspectiva de los requisitos de almacenamiento de datos. Hay otra pregunta importante en el diseño de la arquitectura de la computación de borde: ¿deben los datos seguir a la computación para darse cuenta de que "dónde está la potencia de la computación, los datos se moverán allí"? ¿O los cálculos deberían seguir los datos y darse cuenta de que "el cálculo se realiza dondequiera que se almacenen los datos"?

En Innovation Insight: Rethink Your Enterprise Storage and Cloud Data Services Strategies for the Edge Awakening, Gartner explora las necesidades de almacenamiento de datos en la computación de borde, como la gravedad de los datos, la soberanía de los datos, la autonomía de los datos, la recopilación de datos, la distribución de datos, la seguridad de los datos y otros aspectos. .

En las aplicaciones perimetrales, los datos deben guardarse o almacenarse temporalmente en diferentes ubicaciones del sitio para cumplir con los requisitos de diferentes escenarios de aplicación. Dado que el límite superior de la velocidad de transmisión de datos es la velocidad de la luz, el retraso del extremo informático en acceder a la fuente de datos es proporcional a la distancia entre los dos, y el retraso en el procesamiento de los datos está relacionado positivamente con la complejidad del algoritmo de procesamiento. . Estos dos elementos, especialmente el tiempo dedicado a leer y escribir datos a largas distancias, representan una gran proporción del tiempo total requerido para cada respuesta en la informática de punta. Por lo tanto, los datos utilizados para admitir aplicaciones sensibles a la latencia deben analizarse y procesarse en tiempo real más cerca del dispositivo perimetral para minimizar los retrasos en la lectura y escritura de datos; mientras que los datos utilizados para admitir aplicaciones insensibles a la latencia pueden almacenarse centralmente en centros de datos que están más alejados. pero tienen mayor capacidad de almacenamiento y tecnología de almacenamiento más completa para lograr menores costos de almacenamiento y mayor seguridad de almacenamiento.

图片来源：Innovation Insight: reconsidere sus estrategias de servicios de datos en la nube y almacenamiento empresarial para el despertar del borde，Gartner（2022）

Los datos sin procesar obtenidos por el dispositivo perimetral se pueden procesar de diferentes maneras:

Sin procesamiento: después de que los datos se recopilan directamente desde el dispositivo, se guardan tal como están sin ningún procesamiento.
Preprocesamiento: los datos se procesan inicialmente en el lado del dispositivo, como limpieza, conversión de formato, detección de valores atípicos, etc., y luego se guardan los datos procesados.
Procesamiento en tiempo real: los datos se analizan y procesan en tiempo real en el lado del dispositivo, como estadísticas en tiempo real, agregación, etc., y solo se guarda la información resumida procesada.
Procesamiento retrasado: permite el procesamiento de datos en tiempo casi real o asíncrono, como cada minuto, hora, día, etc., y luego guarda los resultados procesados.

Para los datos procesados de las diferentes formas anteriores, puede elegir almacenamiento temporal local (copia única, sin garantía), almacenamiento centralizado en la nube/centro de datos, almacenamiento distribuido o una combinación de estos tres métodos. Para los datos que deben almacenarse durante mucho tiempo, es necesario considerar no solo la frecuencia de uso, la relación de ubicación relativa con el dispositivo perimetral, sino también la capacidad de almacenamiento, la escalabilidad, la disponibilidad, la seguridad, la propiedad, el riesgo de fuga y costo integral. Ésa es la principal conclusión del informe "Almacenamiento de datos en el borde" de Gartner.

Del análisis anterior de los datos y las características de almacenamiento, podemos concluir que "la informática sigue a los datos". Debido a que la elección de la ubicación y la tecnología de almacenamiento de datos involucra la arquitectura de software y hardware del sitio, el ciclo de cambio de la arquitectura del sitio es largo y el costo es alto; y mover datos es una tarea relativamente difícil y la transmisión en diferentes medios físicos. Requiere mucho tiempo y es difícil garantizar que haya suficiente espacio de almacenamiento en cualquier sitio perimetral para almacenar datos movidos desde otros sitios. Los dos aspectos anteriores tienen un impacto directo en la efectividad y el costo de las aplicaciones perimetrales.

"La computación sigue los datos" es solo un dicho popular, que se refiere a la distribución de algoritmos/programas específicos a diferentes ubicaciones de borde para que los datos puedan procesarse localmente de manera rápida y segura, lo que puede reducir el retraso en la transmisión de datos y reducir la velocidad de transmisión de datos El costo del almacenamiento en múltiples ubicaciones. Aquí, "computación" se refiere a algoritmos o programas, porque cada aplicación requiere algoritmos específicos para procesar datos específicos. Lo que se distribuye desde la biblioteca de aplicaciones en el centro de datos al borde puede ser una función o un pequeño programa, este es el "cálculo sigue los datos" antes mencionado. En comparación con los datos de la aplicación, se puede decir que el tamaño del archivo del algoritmo/programa es "ligero como el polvo", lo que es adecuado para distribuirlo rápidamente a varios sitios y utilizar el grupo de recursos informáticos local en forma de virtualización o contenedorización. en el sitio, procese datos almacenados localmente y responda rápidamente a las solicitudes de aplicaciones locales.

Entonces la pregunta es: De esta manera, ¿hay suficientes recursos informáticos en cada ubicación de borde para que los utilicen varios algoritmos/programas? De hecho, a la mayoría de los sitios perimetrales no les faltan recursos informáticos. El fenómeno común observado en la práctica de virtualización en los últimos diez años y en la práctica de contenedorización en los últimos años es que los recursos de CPU de varias nubes, centros de datos y sucursales generalmente son suficientes. Implementar "la computación sigue a los datos" no significa migrar temporalmente la CPU de hardware de un sitio a otros sitios.

Requisitos técnicos para sitios de borde

Con base en el análisis anterior, resumimos los requisitos técnicos de los sitios de borde para computación, almacenamiento, red y otros niveles de infraestructura.

Los tres requisitos técnicos de la izquierda pueden variar en diferentes sitios de borde: debido a que cada sitio enfrenta diferentes grupos de clientes y ubicaciones geográficas, cada aplicación de borde tiene diferentes requisitos informáticos, de almacenamiento y de latencia. Pero también se puede concluir que la elasticidad y la compatibilidad son características esenciales de la infraestructura del sitio de borde, y solo una arquitectura elástica y compatible puede adaptarse de manera flexible a diversas escalas y tipos de aplicaciones.

Los tres elementos de la derecha son requisitos más generales. En cualquier sistema de infraestructura creado para aplicaciones de borde, generalmente se requiere control centralizado, administración centralizada y distribución bajo demanda de cargas de aplicaciones mixtas (algoritmos/programas), y en cada uno se establecen mecanismos de seguridad. en el sitio para garantizar la seguridad de los datos internos y del acceso externo.

Requisitos clave: adaptarse a la implementación híbrida de aplicaciones

Un punto que necesita especial énfasis aquí es la importancia de la implementación híbrida en aplicaciones de borde. La implementación híbrida se refiere al alojamiento de aplicaciones perimetrales en diferentes formas, como virtualización o contenedorización. En el futuro, es posible que haya implementaciones más detalladas que ejecuten diferentes aplicaciones o funciones perimetrales dentro de ellas.

El énfasis en la implementación híbrida de aplicaciones se debe al rápido aumento en el número de aplicaciones de borde, muchas de las cuales se desarrollan específicamente para escenarios de borde y pueden denominarse aplicaciones "nativas de borde". Pero todavía hay muchas aplicaciones perimetrales que se basan en tecnologías y métodos tradicionales, como bases de datos distribuidas, colas de mensajes y programas de middleware que ya funcionan bien en entornos virtualizados o en contenedores. ¿Los desarrolladores de aplicaciones perimetrales necesitan diseñar bases de datos, middleware, colas de mensajes u otros componentes dedicados específicamente para los escenarios más periféricos? Sin duda, esto consumirá la energía de los desarrolladores de aplicaciones perimetrales. Hoy en día, los negocios de vanguardia se están desarrollando muy rápidamente. Deberíamos evitar caer en el tipo de innovación de "reinventar la rueda", sino crear rápidamente nuevas aplicaciones basadas en software/complementos existentes. Sólo así podremos lanzar nuevos productos más rápidamente y aprovechar oportunidades de mercado, obteniendo así mayor valor de negocio.

Por lo tanto, las nuevas aplicaciones/programas "nativos del borde" y las aplicaciones/componentes/complementos tradicionales se mezclarán en el sitio del borde, lo que requiere que el sistema informático del borde pueda proporcionar soporte unificado y capacidades de distribución de programación para estas diferentes formas de aplicación. .

Hiperconvergencia: la arquitectura ideal para soportar aplicaciones perimetrales

Después de analizar las características de las aplicaciones de borde y los requisitos técnicos de los sitios de borde, creemos que la hiperconvergencia (HCI) es una plataforma arquitectónica que es muy adecuada en esta etapa para admitir varias aplicaciones de borde en sitios de borde: la hiperconvergencia puede proporcionar servicios para la mayoría de los sitios de borde. Las aplicaciones (excepto aquellas que deben ejecutarse en sitios de "borde remoto" o "borde de dispositivo") proporcionan un entorno operativo de alto rendimiento, confiable y estable, y simplifican el aprovisionamiento, la operación y la administración, mejorando así la eficiencia de los sitios de borde. entrega de aplicaciones, Reducir el costo total de propiedad (TCO) de la informática de punta.

La madurez de la infraestructura hiperconvergente es la razón principal por la que es adecuada para alojar aplicaciones perimetrales. El Technology Hype Cycle (Hype Cycle) publicado por Gartner en 2022 muestra que la tecnología y los productos hiperconvergentes han entrado en un período de plataforma estable y, después de pruebas suficientes y verificación de casos de producción, la hiperconvergencia puede llevar la ventaja, incluida la ventaja, en el entorno de producción La mayoría de los formularios de solicitud. IDC también declaró en el estudio El uso de infraestructura hiperconvergente continuará creciendo en entornos perimetrales : "Los sistemas de infraestructura hiperconvergente que integran tecnologías de virtualización, computación, almacenamiento y red en un solo sistema se pueden configurar para el personal de TI que se enfrenta a entornos perimetrales. Proporcionan importantes ventajas para las empresas desafiantes. Ayudan a simplificar el aprovisionamiento, las operaciones y la administración, y se ejecutan en hardware estándar de la industria rentable para reducir los costos". Por lo tanto, los usuarios empresariales o los proveedores de aplicaciones perimetrales pueden aprovechar las soluciones de infraestructura. Ahorre mucho tiempo y utilice directamente la arquitectura hiperconvergente para proporcionar rápidamente un entorno operativo que integre varios recursos para diversas aplicaciones de borde.

Fuente de la imagen: Hype Cycle for Infrastructure Strategy, Gartner, 2022

Además, las siguientes características de la arquitectura hiperconvergente también pueden satisfacer plenamente las necesidades de las aplicaciones perimetrales en términos de rendimiento, elasticidad, soporte de aplicaciones híbridas y control centralizado:

Desacoplamiento de software y hardware: la hiperconvergencia se basa en computación, almacenamiento y red "definidos por software", lo que permite un desacoplamiento completo de la infraestructura y los dispositivos de hardware sobre la base de una amplia compatibilidad. La infraestructura hiperconvergente requiere equipos menos especializados que la arquitectura tradicional, lo que puede reducir los costos.
Alto rendimiento: la hiperconvergencia admite la configuración bajo demanda de diferentes especificaciones de CPU, GPU, almacenamiento y componentes de red para cumplir con los requisitos de rendimiento de diferentes aplicaciones y cumplir con los requisitos de alto rendimiento en escenarios de computación de borde.
Escalabilidad: la hiperconvergencia le permite comenzar con algo pequeño, construir rápidamente múltiples sitios de borde a través de "módulos estándar" y expandir la escala de recursos en el sitio en cualquier momento según sea necesario para lograr una fácil expansión de recursos.
Aplicabilidad: la hiperconvergencia proporciona soporte de recursos y funciones de administración para aplicaciones virtualizadas y en contenedores, y es aplicable a varios tipos de escenarios de aplicaciones informáticas de borde cercano.
Facilidad de gestión: la solución hiperconvergente permite la gestión visual de múltiples sitios remotos desde el sitio central, lo que reduce la complejidad de la operación y el mantenimiento y mejora la eficiencia de la gestión.

¿Quiere obtener más información sobre la capacidad de la arquitectura hiperconvergente para admitir escenarios de borde? Escanee el código QR a continuación para obtener "Arquitectura hiperconvergente desde la evaluación hasta la implementación: recopilación de preguntas frecuentes de los usuarios".

Artículo de referencia:

1. Infografía: Comprensión de Edge Computing, Gartner, 2022
https://www.gartner.com/document/4002267

2. Guía mundial de gasto perimetral, IDC, 2022
https://www.idc.com/getdoc.jsp?containerId=IDC_P39947

3. Perspectivas de innovación: reconsidere sus estrategias de servicios de datos en la nube y almacenamiento empresarial para el despertar del borde, Gartner, 2022
https://www.gartner.com/document/4017186

4. El uso de infraestructura hiperconvergente seguirá creciendo en entornos perimetrales, IDC, 2023
https://www.idc.com/getdoc.jsp?containerId=US46034120

5. Ciclo de publicidad para la estrategia de infraestructura, Gartner, 2022
https://www.gartner.com/interactive/hc/4016448