La tecnología de enrutamiento distribuido de alto rendimiento de Tencent apareció en APNet, el seminario web de Asia y el Pacífico

El Seminario de la Red de Asia y el Pacífico (APNet) reúne a los mejores investigadores en el campo de las redes y sistemas informáticos en la región de Asia y el Pacífico para compartir sus últimos resultados de investigación y discutir los temas de investigación de actualidad más candentes. El 3 y 4 de agosto de 2020, se llevó a cabo en línea el cuarto seminario web de Asia Pacífico de dos días (APNet'20). Tencent, Alibaba, Microsoft, Nvidia, Cisco, ByteDance, etc. Entre los últimos logros en el campo, Lu Jianchao, el arquitecto del Departamento de Plataforma de Red de Tencent TEG , pronunció un discurso sobre el servicio de enrutamiento escalable y flexible para la red de acceso a la nube de Tencent .

https://conferences.sigcomm.org/events/apnet2020/index.html

Con la popularización de la computación en la nube, 5G, IA, etc., cada vez más clientes implementan sus servicios en Tencent Cloud, y Tencent Cloud ha marcado el comienzo de un crecimiento explosivo en los últimos años. El rápido crecimiento de las solicitudes de conexión de los clientes y las visitas masivas de usuarios finales plantean nuevos desafíos para la red de acceso de Tencent Cloud.

El 3 de agosto de 2020, en el seminario web de Asia Pacífico APNet, Tencent presentó en detalle la arquitectura y el concepto de diseño del enrutador definido por software (enrutador definido por software) de Tencent, y cómo SDR resuelve la nube en diferentes escenarios de acceso a través de métodos definidos por software. Flexibilidad, escalabilidad y alta disponibilidad a escala de red.

La red de acceso de Tencent tiene principalmente tres escenarios

1. Acceso de línea dedicada: al implementar pasarelas de línea dedicadas en los puntos de acceso, los centros de datos de los clientes de las grandes empresas se pueden conectar a la red de Tencent cercana, proporcionando a los clientes un ancho de banda alto, baja latencia y alta seguridad.

2. Acceso a VPN, las sucursales corporativas acceden a Tencent Cloud a través de Internet y acceden a recursos en la nube de forma económica.

3. Acceso del usuario final: Tencent implementa la infraestructura TIX (Tencent Internet Exchange) en núcleos regionales y POP en todo el mundo para proporcionar canales eficientes para que los usuarios finales globales accedan a los recursos en Tencent Cloud.

En los primeros días, cuando la escala de Tencent Cloud aún era relativamente pequeña, la red de acceso de Tencent realizaba principalmente la interconexión con redes externas mediante la implementación de enrutadores o conmutadores comerciales tradicionales.

Con el rápido desarrollo de Tencent Cloud en los últimos años, continúan surgiendo nuevos desafíos, que incluyen:

1. Diez millones de entradas de la tabla de enrutamiento de nivel, rendimiento de reenvío de nivel 10T, diferentes capacidades dimensionales pueden escalarse horizontalmente según sea necesario

2. Las características de la red deben repetirse rápidamente para cumplir con los requisitos de interoperabilidad y programación de diferentes escenarios de acceso.

3. El Capex y el Opex de la red necesitan una optimización continua

Dado que el equipo de red comercial tradicional no está diseñado para redes en la nube, gradualmente no puede soportarlo frente a los nuevos desafíos bajo la escala de las redes en la nube. Se manifiesta principalmente en:

1. Vinculación de proveedores de software y hardware, alto acoplamiento, ciclo de iteración de funciones largo

2. El rendimiento y las especificaciones no se pueden ampliar de forma flexible bajo demanda

3. Alto costo  

Obviamente, frente a la escala de la red en la nube, necesitamos una nueva arquitectura de sistema. Con este fin, el Departamento de Plataforma de Red rediseñó la arquitectura del servicio de red para la escala de la red en la nube con base en los principios de diseño de alta escalabilidad, ultra flexibilidad, alta confiabilidad y alta operación y mantenimiento .

La nueva arquitectura, la llamamos enrutador definido por software (enrutador definido por software), el concepto central es separar funciones y características de red complejas del hardware de red y transferirlas a un servidor x86 general, frente a los requisitos de la red en la nube, a través de la programación de software. Defina el enrutador de la red en la nube.

Bajo el nuevo sistema de arquitectura, la función de red general se divide en red superpuesta y red subyacente.

La red de superposición se divide además en cuatro componentes funcionales principales, plano de datos, plano de enrutamiento, plano de control y orquestador. Se implementan diferentes componentes funcionales en diferentes clústeres de servidores, y cada componente se puede diseñar, mantener y actualizar de forma independiente de acuerdo con sus propias características y necesidades. Al mismo tiempo, el modelo basado en la programación de software ha mejorado enormemente la flexibilidad de la red, y la velocidad de desarrollo e iteración se ha multiplicado por 10 en comparación con las redes tradicionales, que pueden satisfacer las diversas necesidades de los clientes de forma más rápida y mejor.

La red subyacente utiliza una red de conmutadores de caja de bajo costo. La red subyacente solo necesita proporcionar una función de red troncal IP simple para conectar componentes internos y redes externas. La red subyacente desconoce por completo los servicios de superposición.

Los componentes internos de SDR sincronizan eficientemente el enrutamiento, ARP y la información de configuración estática a través de una cola de mensajes distribuida.Al mismo tiempo, los switches EA se implementan en el borde para la interconexión con redes externas. El conmutador EA funciona en la red L2 y es responsable de proporcionar varios tipos de puertos de interconexión (GE / 10GE / 00GE) a la red externa e implementar el aislamiento de red de capa L2. El plano de datos es responsable del reenvío de datos de alto rendimiento a través de una pila de protocolos de modo de usuario de desarrollo propio. La información de enrutamiento se transfiere entre el plano de enrutamiento y los enrutadores externos y los componentes de enrutamiento internos a través del protocolo BGP. El orquestador y el plano de control son responsables de la sincronización de la configuración global o regional, la administración y la información de operación y mantenimiento en las funciones de controlador global y controlador local, respectivamente. Además, para sincronizar de manera eficiente la información de la tabla de flujo dinámico masivo entre los componentes internos de SDR, el plano de control también proporciona canales de mensajes distribuidos de alto rendimiento y servicios de almacenamiento distribuido.

Como conector para redes internas y externas, el SDR bajo la nueva arquitectura, a través del despliegue de Sitios de Acceso globales, conecta completamente la red tradicional y la red en la nube, y realiza la interconexión eficiente de la red externa y la red interna de Tencent. La integración e interoperabilidad de los servicios de redes inteligentes proporcionan una gran comodidad.

Las características naturales definidas por software de SDR lo convierten en una mejora sustancial en comparación con las redes tradicionales en términos de flexibilidad, escalabilidad, confiabilidad y operación y mantenimiento.

En términos de flexibilidad, el tráfico saliente de la red externa, a través de las reglas Flex de SDR, puede realizar una programación refinada y flexible de acuerdo con las necesidades de diferentes clientes y diferentes servicios. El tráfico de entrada de la red externa puede realizar la programación fina basada en la granularidad IPv4 de 32 bits o IPv6 de 128 bits a través de la tabla de enrutamiento de especificación ultra grande, lo que respalda la migración flexible y la recuperación ante desastres de puertas de enlace o servicios internos.

Los servicios de seguridad como FW / DDoS utilizan Flexrules de SDR para guiar la redirección de ataques o tráfico anormal y el retorno de tráfico limpio bajo demanda. Al implementar VxLAN entre el servicio FW y SDR, admite la implementación local del servicio FW o la implementación remota. En términos de protección DDoS, SDR admite entradas de reenvío de gran formato basadas en software y capacidades de reenvío de ancho de banda ultragrande basadas en hardware.

Para mejorar aún más el rendimiento, SDR introdujo Tencent Smart Switch (TSS) para lograr la aceleración de hardware. TSS es un conmutador programable desarrollado por Tencent, que proporciona capacidades de reenvío de velocidad de cable de nivel T de hardware y baja latencia de nivel sutil. TSS se define como el componente de descarga de Data Plane, que personaliza el comportamiento de procesamiento de mensajes ASIC a través de un lenguaje programable para formar una tubería general basada en flujo y LPM.A través del trabajo colaborativo con Data Plane y Control Plane, brinda servicios para diferentes escenarios comerciales. Capacidad de aceleración de hardware.

Actualmente, SDR ofrece capacidad de reenvío de 10 Tbps, tabla de enrutamiento de 10 millones de niveles y capacidad de actualización de enrutamiento de extremo a extremo de 100k / s.

En términos de confiabilidad, basado en un diseño de arquitectura redundante, el sistema no se ve afectado cuando ocurre un solo punto de falla en cada componente. Al mismo tiempo, debido al desacoplamiento completo entre componentes, el plano de reenvío puede proporcionar la capacidad de reenvío continuo (NSF) para procesar mensajes normalmente cuando fallan otros componentes. En el plano de enrutamiento, el SDR divide aún más la función BGP en una unidad de altavoz BGP y una unidad de cálculo de ruta BGP, que se implementan en diferentes grupos. Entre ellos, la unidad de altavoz BGP se implementa con granularidad de pares, actualizaciones y recuperación rápida de fallas, y proporciona capacidades de enrutamiento sin interrupciones (NSR).

En términos de operación y mantenimiento, SDR implementa la detección en tiempo real y el rápido aislamiento de fallas de diferentes niveles de clúster, servidor y núcleo a través de la vinculación con el sistema de monitoreo y funcionamiento en tiempo real (RMOS). Al mismo tiempo, el estado de salud del SDR se supervisa en tiempo real en función de registros enriquecidos e información de alarmas. Además, SDR proporciona aislamiento con un solo clic, convergencia de ruta rápida y capacidades de recuperación de desastres entre dominios para garantizar servicios al cliente ininterrumpidos desde la perspectiva de toda la red.

En el futuro, SDR proporcionará capacidades de análisis y detección de calidad de red en tiempo real de extremo a extremo para diferentes niveles de redes. Basado en la calidad de la red en tiempo real y en diferentes dimensiones, SDR implementará estrategias de programación de tráfico dinámicas, multidimensionales y detalladas. Al mismo tiempo, SDR integrará plataformas de simulación y verificación de redes para mejorar aún más la confiabilidad y el funcionamiento y mantenimiento de toda la red.

En resumen, para las redes a escala en la nube, SDR utiliza desacoplamiento de software y hardware, desacoplamiento de funciones y definición de software para construir una nueva red de acceso con una flexibilidad, escalabilidad, operación y mantenimiento ultra altos y un bajo costo para Tencent Cloud. .

Supongo que te gusta

Origin blog.csdn.net/Tencent_TEG/article/details/108138253
Recomendado
Clasificación