No es sólo "grande"! El análisis de grandes datos detrás de los detalles técnicos

Todos sabemos que hablar de grandes volúmenes de datos, uno de su característica más notable es el "grande", esto simplemente un "gran" palabra, que hace que el negocio en la cara de los datos comienzo grande tuvo que usar el modo de computación distribuida, hay una serie de métodos para simplificar el cálculo.

 

No es sólo "grande"! El análisis de grandes datos detrás de los detalles técnicos

Cuando se trata de información a gran escala, una gran cantidad de aplicaciones de datos grandes para su consideración para aplicaciones elásticas, es necesario copiar los datos en un número de diferentes posiciones que, por lo que la cantidad de información comenzó a aumentar de tamaño, incluso de forma exponencial crecimiento.

 

El atributo más importante es que los datos grande no es su tamaño, pero gran trabajo es que se divide en muchas capacidades de operaciones pequeñas, su capacidad para manejar los recursos a las tareas a través de múltiples posiciones para el procesamiento en paralelo. Cuando nos enfrentamos a grandes aplicaciones de datos y la arquitectura de aplicaciones distribuidas, ¿qué temas necesitan atención? Este problema nos preocupa que. >>

 

Sabemos que si un conjunto de recursos informáticos distribuidos por qué ser la colusión y la coordinación a través de Internet, la disponibilidad de las aplicaciones se vuelve muy importante, una vez que uno de los aspectos de comunicaciones de red del problema, entonces los datos dará lugar a resultados inimaginables desastre.

 

De hecho, por ahora muchas aplicaciones de datos de gran tamaño, la mayor parte de la seguridad de la infraestructura de red y la estabilidad es muy alto, por supuesto, de la red de datos y recursos entre los fracasos son inevitables, aunque la alta disponibilidad de la red es también muy importante, pero desee diseñar la utilidad perfecta es imposible.

 

Para arquitectos de la empresa, la solución de resistencia de la red es una solución, resistencia de la red muy eficaz y diversidad depende ruta de conmutación por error dos categorías. Además de los métodos tradicionales de tiempo medio entre fallos, muy grandes criterios de diseño de redes de datos deben incluir estas características.

problema de "congestión" de datos grande

Como todos sabemos, se llama una gran tecnología de datos, la enorme cantidad de datos es cierto, sin embargo, para grandes aplicaciones de datos, no sólo a gran escala, los datos para situaciones de emergencia también permite que muchas empresas un dolor de cabeza.

 

En período de tiempo de alto tráfico, la congestión es un problema grave. Sin embargo, la congestión puede conducir a una mayor demora de espera tiempo y tasa de pérdida de paquetes. Además, la congestión también puede desencadenar la transferencia de peso, lo que podría permitirse una red muy cargado no puede permitirse.

 

arquitectura de red debe estar diseñada para reducir los puntos de congestión como sea posible. De acuerdo con los criterios de diseño de la disponibilidad, reducir la congestión de la red ha requerido una diversidad de trayectoria más alta, con el fin de permitir la dispersión de tráfico de red en un número de diferentes caminos. >>

Esta es la opinión de los expertos senior de la industria, señaló, para la mayoría de aplicaciones de grandes volúmenes de datos, el retardo de red no es realmente un gran problema, si el tiempo calculado es del orden de unos pocos segundos o minutos, aunque la red un retraso mayor es insignificante.

 

Sin embargo, las aplicaciones de datos grandes normalmente necesitan tener mayor sincronización de datos, una característica de la experiencia de grandes servicios de datos es muy importante, ya que significa que los trabajos se ejecutan en paralelo, mientras que el más grande entre cada puesto de trabajo las diferencias de rendimiento pueden conducir al fracaso de la aplicación.

Futura escalabilidad día lluvioso, los datos

Echemos un vistazo a un conjunto de números, mucha gente sabe Yahoo se ejecuta más de 42.000 nodos de su entorno de datos grande, pero sobre la base de datos Asistente para Hadoop, el número medio de nodos de clúster de datos de gran tamaño 2013 solamente 100.

 

En otras palabras, aun cuando cada servidor está configurado con doble redundancia, entonces el apoyo de todo el clúster sólo se requiere el modificador de acceso de cuatro, la escalabilidad no es que ahora clúster Cómo de grande es ahora, pero que la forma de equilibrio escala prolongados despliegues futuros de soporte.

 

Si el diseño de la infraestructura es ahora sólo es adecuado para las implementaciones a pequeña escala, a continuación, la forma en que esta arquitectura con el aumento en el número de nodos y en evolución, la escalabilidad no es el tamaño absoluto, sino más preocupado por el camino para lograr soluciones escala suficiente. >>

segmentación de la red es una parte importante compuesta de entornos de datos grandes, simplemente, técnicas de segmentación de red pueden significar que usted necesita una gran cantidad de datos y el tráfico de red con entradas distintas fluir en beneficios de hacerlo es que debe evitarse debido a que surge súbita el normal funcionamiento de algunos servicios clave.

 

Además, los usuarios también tienen que hacer frente a múltiples inquilinos ejecutan múltiples puestos de trabajo, para cumplir con el rendimiento o requisitos de cumplimiento de auditoría. El trabajo necesario para lograr la separación lógica de la carga de la red en algunos casos, también para lograr un número de ocasiones la separación física de los mismos. Quiere aprender el sistema de grandes volúmenes de datos, puede unirse a la gran tecnología de datos de aprendizaje abotonada Junyang: 522 189 307

Todo es inseparable del reconocimiento de aplicaciones

Big Data se ha convertido en una de las palabras icónicas entorno de clúster, a través de las diferentes necesidades de las diferentes aplicaciones, muchos aspectos de los requisitos de sensibilidad de datos de la aplicación para empezar a aumentar, esto significa que una red para soportar múltiples aplicaciones y múltiples usuarios, se debe ser capaz de distinguir su carga de trabajo, y para ser capaz de manejar adecuadamente las cargas de trabajo diferentes, esto es realmente muy difícil.

 

Una buena experiencia de la aplicación está compuesta por una variedad de factores, congestión de la red, la escalabilidad de la red, habilidades de grandes aplicaciones de datos, y de muchas maneras, la demanda del usuario y hacia adelante para estas aplicaciones y capacidades de datos grandes, sino también para mejorar la experiencia de los indicadores importantes lo

Publicados 181 artículos originales · ganado elogios 3 · Vistas a 30000 +

Supongo que te gusta

Origin blog.csdn.net/mnbvxiaoxin/article/details/104909273
Recomendado
Clasificación