(versión 2023 de la ruta de autoaprendizaje) el mapa de ruta de aprendizaje de big data más completo

Con el rápido desarrollo de la industria de la información y la implementación gradual de aplicaciones de big data, la demanda de talentos en la industria se expande año tras año. Big data se ha convertido en una de las industrias mejor pagadas más prometedoras en la actualidad, y los talentos de big data, como los ingenieros de análisis de big data y los ingenieros de desarrollo de big data, también se han convertido en talentos escasos en el mercado, y sus salarios han aumentado una y otra vez. .

Muchas personas quieren unirse a las filas del desarrollo de big data, pero no saben cómo empezar. A continuación, el editor compartirá con usted una ruta completa de aprendizaje de big data para ayudarlo a comenzar rápidamente.

La primera etapa
es JAVASE+MYSQL+JDBC, principalmente aprendiendo algunos conceptos del lenguaje Java, como caracteres, control de procesos, orientado a objetos, subprocesos de proceso, reflexión de enumeración, etc., aprendiendo la instalación y desinstalación de la base de datos MySQL y operaciones relacionadas, aprendiendo el principio de realización de JDBC Además del conocimiento básico de Linux, es la etapa inicial de big data.

Segunda etapa

Es una introducción a la teoría distribuida, explicando principalmente la teoría CAP, el modo de distribución de datos, la consistencia, 2PC y 3PC y la arquitectura de integración de big data. Los puntos de conocimiento involucrados incluyen consistencia, disponibilidad, tolerancia de partición, distribución de volumen de datos, proceso de 2PC, proceso de 3PC, método hash, hash consistente, etc.

la tercera fase

Para almacenamiento de datos y computación (escenarios fuera de línea), explique principalmente el servicio de coordinación ZK (1T), almacenamiento de datos hdfs (2T), almacenamiento de datos alluxio (1T), canal de recopilación de datos, logstash de recopilación de datos, sincronización de datos Sqoop (0.5T), Sincronización de datos datax (0.5T), sincronización de datos mysql-binlog (1T), modelo de cálculo MR y DAG (1T), colmena (5T), Impala (1T), programación de tareas Azkaban, programación de tareas airflow, etc.

La cuarta etapa
es la construcción del almacén de datos, explicando principalmente los antecedentes históricos del almacén de datos, el análisis técnico de la arquitectura del proyecto de almacén de datos fuera de línea-Banwo (5T), el despliegue e instalación del procesamiento de modelos de datos multidimensionales kylin (3.5T ), y el proyecto de almacén de datos fuera de línea-Banwo Después de actualizar el automóvil, se agrega kylin para análisis multidimensional, etc.;

quinta etapa

Es un motor de computación distribuida. Explicar principalmente el motor informático, el lenguaje scala, chispa, almacenamiento de datos hbase, redis, kudu, y realizar la lectura y escritura de fuente de datos múltiples chispa a través de un proyecto de plataforma p2p.

sexta etapa

Para el almacenamiento y el cálculo de datos (escenarios en tiempo real), explica principalmente el canal de datos Kafka, el druida del almacén de datos en tiempo real, el flink de procesamiento de datos de transmisión, SparkStreaming y explica ciertos datos de tráfico para que pueda dominar los puntos de conocimiento.

séptima etapa

Para la búsqueda de datos, explica principalmente la búsqueda elástica, incluida la tecnología de búsqueda de texto completo, la operación de instalación de ES, el índice, la creación de índices, la adición, la eliminación, la modificación, la indexación, el mapeo, el filtrado, etc.

octava etapa

Para el gobierno de datos, explica principalmente los estándares de datos, la clasificación de datos, el modelado de datos, el almacenamiento y la consulta de gráficos, los metadatos, el linaje y la calidad de los datos, Hive Hook, Spark Listener, etc.

novena etapa

Para el sistema BI, explique principalmente las dos tecnologías principales de Superset y Graphna, incluida la introducción básica, la instalación, la creación de fuentes de datos, la operación de tablas y la exploración y análisis de datos.

décima etapa

Para la minería de datos, explica principalmente el sistema matemático en el aprendizaje automático, la biblioteca de algoritmos de aprendizaje automático Spark Mlib, la biblioteca de algoritmos de aprendizaje automático Python scikit-learn y el aprendizaje automático combinado con proyectos de big data.

La era de los grandes datos ha llegado y desencadenará una gran ola. Si desea aprovechar esta ola, debe comenzar lo antes posible.

Digresión

En este primer año de tecnología de rápido crecimiento, la programación es como un boleto a un mundo de infinitas posibilidades para muchas personas. En la alineación estelar de los lenguajes de programación, Python es como la superestrella líder. Con su sintaxis concisa y fácil de entender y sus potentes funciones, se destaca y se convierte en uno de los lenguajes de programación más populares del mundo.


El rápido ascenso de Python es extremadamente beneficioso para toda la industria , pero " 人红是非多" ha provocado que agregue muchas críticas, pero aún no puede detener su gran impulso de desarrollo.

¿Python seguirá siendo relevante e intacto durante el resto de la próxima década? Hoy, vamos a analizar los hechos y disipar algunos conceptos erróneos.

Si está interesado en Python y desea obtener un salario más alto aprendiendo Python, ¡entonces el siguiente conjunto de materiales de aprendizaje de Python debe serle útil!

Los materiales incluyen: paquete de instalación de Python + código de activación, desarrollo web de Python, rastreador de Python, análisis de datos de Python, inteligencia artificial, aprendizaje automático y otros tutoriales de aprendizaje. Incluso los principiantes con 0 conceptos básicos pueden entender y comprender. ¡Siga el tutorial y lo llevará a aprender Python sistemáticamente desde cero conceptos básicos!

1. Rutas de aprendizaje en todas las direcciones de Python

La ruta de todas las direcciones en Python es organizar los puntos técnicos comúnmente utilizados de Python para formar un resumen de los puntos de conocimiento en varios campos. Su utilidad radica en que puede encontrar los recursos de aprendizaje correspondientes de acuerdo con los puntos de conocimiento anteriores para asegurarse de que aprende de manera más integral.
inserte la descripción de la imagen aquí
2. Software de aprendizaje Python

Si un trabajador quiere hacer un buen trabajo, primero debe afilar sus herramientas. ¡El software de desarrollo comúnmente utilizado para aprender Python está aquí!
inserte la descripción de la imagen aquí
3. Video de aprendizaje introductorio de Python

También hay muchos videos de aprendizaje adecuados para comenzar con los conceptos básicos de 0. Con estos videos, puede comenzar fácilmente con Python ~inserte la descripción de la imagen aquí

4. Ejercicios de Python

Después de cada lección de video, hay preguntas de práctica correspondientes, ¡puedes probar los resultados de aprendizaje, jaja!
inserte la descripción de la imagen aquí

Cinco, caso de combate real de Python

La teoría óptica es inútil, tienes que aprender a codificar junto con ella y hacerlo tú mismo, para que puedas aplicar lo aprendido a la práctica, en este momento, puedes aprender de algunos casos prácticos. Esta información también está incluida~inserte la descripción de la imagen aquí

6. Materiales de entrevista de Python

¡Después de haber aprendido Python, podemos salir y encontrar un trabajo con las habilidades! Las siguientes preguntas de la entrevista son todas de compañías de Internet de primer nivel como Alibaba, Tencent y Byte, y hay respuestas autorizadas de los jefes de Ali. Después de leer este conjunto de materiales de entrevista, creo que todos pueden encontrar un trabajo satisfactorio.
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
7. Recopilación de información

La versión completa mencionada anteriormente del conjunto completo de materiales de aprendizaje de Python se cargó en el CSDN oficial, y los pequeños socios que lo necesiten pueden escanear el código QR de la certificación oficial de CSDN a continuación en WeChat para obtenerlo de forma gratuita.

Supongo que te gusta

Origin blog.csdn.net/pythonhy/article/details/132209767
Recomendado
Clasificación