Aprendizaje profundo y transformador de modelo grande

En el "14º Plan Quinquenal" nacional, hay hasta 57 expresiones relacionadas de "inteligencia" y "sabiduría". Se ha convertido en una de las garantías técnicas importantes y fuerzas impulsoras fundamentales del "14º Plan Quinquenal" de mi país. " Período para promover el desarrollo económico de alta calidad y construir un país innovador. En la actualidad, el desarrollo ardiente de ChatGPT, su tecnología básica se deriva del aprendizaje profundo. ChatGPT es un modelo de inteligencia artificial basado en el aprendizaje profundo, y su tecnología central es la red neuronal. ChatGPT utiliza una red neuronal multicapa para aprender y predecir la distribución de probabilidad de secuencias de lenguaje natural para tareas como la generación de diálogos y el procesamiento de lenguaje natural. El aprendizaje profundo es un método de aprendizaje automático de red neuronal multicapa, que puede aprender características y patrones complejos a través del entrenamiento con grandes cantidades de datos y lograr una clasificación y predicción eficientes.

Con el fin de responder activamente a las necesidades del personal de investigación científica e ingeniería, de acuerdo con las "Opiniones del Consejo de Estado sobre la Promoción del Sistema de Capacitación de Habilidades Profesionales de por vida" presentadas "mantenerse al día con el desarrollo y los cambios de nuevas tecnologías y nuevas ocupaciones, establecer un mecanismo de ajuste dinámico para la clasificación ocupacional y acelerar el desarrollo de requisitos de estándares ocupacionales, el Instituto de Investigación de Educación Moderna de la Academia China de Ciencias Administrativas (http://www.zgyxdjy.com) y Beijing Longteng Asia-Pacific Education Consulting Co., Ltd. celebró conjuntamente el " Seminario de aplicación de nuevas tecnologías de redes neuronales gráficas y práctica de tecnología básica de aprendizaje profundo" . Este entrenamiento adopta el modo de entrenamiento de combate completo.

Esta capacitación está a cargo de Beijing Longteng Asia-Pacific Education Consulting Co., Ltd. y se cobran las tarifas relacionadas y se emiten las facturas. El aviso específico es el siguiente:

1. Formación de expertos :

Los expertos principales del Instituto de Tecnología de Automatización de la Academia de Ciencias de China, el Instituto de Tecnología de Beijing y otras instituciones de investigación científica y universidades tienen una gran experiencia en investigación científica y tecnología de ingeniería, y se han dedicado durante mucho tiempo a la enseñanza y la investigación en los campos de la tecnología artificial. inteligencia, aprendizaje automático, aprendizaje profundo y análisis de big data. .

Hora y lugar :

27 de julio de 2023 — 31 de julio de 2023 Shanghái (transferido simultáneamente a transmisión en vivo en línea )

( Inscripción el día 27 y reparto de material de clase , clases del 28 al 31 )

3. Funciones de entrenamiento:

1. Usando un método simple, combinado con ejemplos y una gran cantidad de ejercicios de código, centrándose en explicar el modelo de marco de aprendizaje profundo, los algoritmos científicos y las habilidades del proceso de capacitación.

2. Ser capaz de captar la tendencia de desarrollo tecnológico del aprendizaje profundo, ser capaz de dominar la tecnología central y las habilidades prácticas del aprendizaje profundo y, al mismo tiempo, analizar, explicar y discutir los problemas difíciles en el trabajo, para mejorar de manera efectiva. la capacidad de los estudiantes para resolver problemas complejos;

3. Domine la construcción y configuración de la red de capacitación de Transformer , un gran modelo de aprendizaje profundo , y domine la extracción profunda de valor de datos.

4. Domine el modelo de red neuronal gráfica y el marco Py Torch

5. Practique casos como el reconocimiento de fuentes escritas a mano y la clasificación de hojas, y deje que la IA juegue por sí misma.

6. De acuerdo con los propios proyectos de investigación científica y la investigación de temas, domine los cinco modelos marco de aprendizaje profundo de manera flexible.

Nota: Otros conjuntos de datos públicos de código abierto: ImageNet, MS-COCO, UCF101, HMDB51, PASCAL VOC, Open Images, etc.

4. Participantes:

Todas las provincias, municipios y regiones autónomas se dedican a la inteligencia artificial, el aprendizaje profundo, la visión por computadora, el reconocimiento facial, el procesamiento de imágenes, la detección de peatones, el procesamiento del lenguaje natural y otros campos relacionados. Y los estudiantes de posgrado y otro personal relacionado, así como el aprendizaje profundo, entusiastas de la visión artificial.

5. Tarifa estándar:

Clase A: 5680 yuanes por persona (incluida la tarifa de registro, la tarifa de capacitación, la tarifa de materiales y la tarifa del certificado de clase A), el alojamiento se puede organizar de manera uniforme y los gastos corren por su cuenta.

1. La tasa de formación es recaudada por la institución docente que organiza la clase de formación y proporciona una factura de formación.

2. Podrás disfrutar de un 10% de descuento por remesa una semana antes de la clase, o un 10% de descuento por inscripción de más de 5 personas, no pudiendo disfrutarse los dos descuentos a la vez. Apúntate a más de 8 personas para disfrutar de un 12% de descuento.

3. Los estudiantes que participan en capacitación en línea y fuera de línea pueden disfrutar de los derechos de grabación y reproducción de video, y el derecho a participar en cursos fuera de línea del mismo tema de forma gratuita .

6. Expedición de certificados:

A. Los estudiantes que hayan participado en una capacitación relevante y hayan aprobado la evaluación recibirán una certificación de capacidad profesional de "Ingeniero de aplicación y desarrollo de aprendizaje profundo" (Avanzado) por parte del Instituto de Educación Moderna de la Academia China de Ciencias Administrativas , que se puede consultar a través de sitio web oficial, y el certificado puede ser utilizado por las unidades pertinentes . Es una base importante para el nombramiento, la evaluación del título profesional, la evaluación y evaluación de la capacidad del personal profesional y técnico.

Nota : Se solicita a los estudiantes que envíen fotos electrónicas a color (más de 20 KB , se aceptan fondos rojos y azules ) , copias de tarjetas de identificación y certificados académicos al buzón de registro .

7. Asuntos que requieren atención

1. Dirección de correo electrónico de registro designada: [email protected].

2. Después de que el registro sea exitoso, el grupo de asuntos de la conferencia emitirá un aviso de registro específico y una ruta de manejo una semana antes del registro.

3. Los estudiantes deben traer su propia computadora, equipada con win10, sistema de 64 bits, 8G o más de memoria y reservar 100G de espacio en el disco duro.

Adjunto: horario específico del curso

punto clave

La historia del desarrollo de la inteligencia artificial y el aprendizaje profundo
Transformador de modelo grande de aprendizaje profundo
Método de entrenamiento de redes neuronales
Red neuronal convolucional, núcleo de convolución, agrupación, canal, función de activación
Red neuronal recurrente, memoria a corto plazo LSTM, unidad recurrente cerrada GRU
Método de inicialización de parámetros, función de pérdida Pérdida, sobreajuste
Contra la Red Generativa GAN
transferencia de aprendizaje TL
RF de aprendizaje por refuerzo
Graficar red neuronal GNN

1. Comprensión de fusión de algoritmos y escenas.

1. Datos no estructurados con correlación espacial, algoritmo CNN . Para los datos de imagen típicos, existe una correlación espacial entre los píxeles. Por ejemplo, la clasificación, la segmentación y la detección de imágenes son todos algoritmos CNN.

2. Datos no estructurados dependientes del tiempo , algoritmo RNN . Un fenómeno común en este tipo de escenarios es que existe una correlación de series temporales entre datos, es decir, existe una dependencia secuencial entre datos. Por ejemplo, el procesamiento del lenguaje natural y los algoritmos relacionados con el habla se basan en algoritmos RNN .

3. Estructura de datos no euclidiana , GNN . Tales escenarios normalmente se pueden representar mediante gráficos. Por ejemplo, redes sociales, etc.

Explicación del resumen del caso

Campo médico : detección de enfermedades relacionadas , como enfermedades epidémicas y tumores.

Campo de teledetección : como el reconocimiento de escenas en imágenes de teledetección

Exploración de petróleo : como la detección del tamaño de partículas de petróleo

Tránsito ferroviario : como la detección de multitudes densas en el metro

Campo de detección : como detección de fallas

Campo de la seguridad pública : como el análisis del comportamiento criminal.

Campo de defensa : detección de objetivos, análisis de señales, conciencia situacional...

Campos económicos: como la previsión de existencias

2. Comprensión y procesamiento de datos

Analice datos típicos en escenarios típicos y procese los datos en combinación con algoritmos específicos

1. Datos estructurados, cómo leer y organizar los datos.

2. Datos de imagen, métodos de procesamiento en el proceso de aplicación real, cómo hacer el preprocesamiento de datos, mejora de datos, etc.

3. Señales de temporización, cómo combinar datos de un solo punto en una secuencia y el método básico de procesamiento de datos de secuencia.

3. Diseño de rutas técnicas

Diseñe modelos de redes neuronales específicos para escenarios específicos e introduzca estructuras de red típicas adaptadas a los datos.

1. Principios básicos de la construcción de modelos DNN

2. Estructura de red común y análisis de parámetros en el modelo CNN.

3. Algunos operadores básicos soportados en RNN, cómo organizar datos de secuencia.

4. Validación del modelo y solución de problemas

Los algoritmos o modelos simples verifican rápidamente los escenarios típicos y explican algunos problemas que ocurren con frecuencia.

La convergencia del modelo no es buena
La influencia de la función de activación de la última capa de la tarea de clasificación en el modelo

5. Principios de optimización avanzada de modelos

Diferentes modelos necesitan usar la función de optimización y el método de optimización de parámetros en retropropagación

1. Introducción al algoritmo de optimización de modelos, y la introducción del algoritmo basado en descenso de gradiente estocástico.

2. Introducción de funciones de pérdida adaptadas a diferentes escenarios.

3. El proceso de empuje del gradiente de retropropagación para escenarios típicos.

6. Ideas de personalización avanzada

Combinado con algunos proyectos de alumnos anteriores, introduce brevemente la idea de resolver un problema específico.

En imágenes de teledetección, la identificación de tipos de cultivo en parcelas.

Análisis práctico y formación.

El primer escenario:

神经网络实践

实验：神经网络

1.神经网络中基本概念理解：epoch、batch size、学习率、正则、噪声、激活函数等。

2.不同的数据生成模型、调整网络参数、调整网络规模

3.神经网络分类问题

4.不同数据特征的作用分析、隐含层神经元数目

5.过拟合

高频问题：

1.输入数据与数据特征 2.模型设计的过程中的参数与功能的关系。

关键点：

1.掌握神经网络的基本概念 2.学会搭建简单的神经网络结构

3.理解神经网络参数

实操解析与训练

第二阶段：

深度学习三种编程思想

实验：Keras实践

1.理解Keras基本原理 2.学会Keras编程思想

3.三种不同的深度神经网络构建编程方式

4.给定数据集，采用Keras独立完成实际的工程项目

高频问题：

1.如何编程实现深度神经网络 2.三种开发方式的具体使用

关键点：

1.掌握Keras编程思想 2.采用三种不同方式编写深度神经网络

实操解析与训练

第三阶段：CNN实践

实验：图像分类

1.使用CNN解决图像分类问题 2.搭建AlexNet 3.VGG16/19

4.GoogleNet 5.ResNet

高频问题：

1.CNN更复杂的模型在哪里可以找到代码

关键点：

1.使用卷积神经网络做图像分类 2.常见开源代码以及适用的问题

实验：视频人物行为识别

1.基于C3D的视频行为识别方法 2.基于LSTM的视频行为识别方法

3.基于Attention的视频行为识别方法

高频问题：

1.2D卷积与3D卷积 2.视频的时空特征

关键点：

1.C3D网络的构建 2.Attention机制

实操解析与训练

第四阶段：

R-CNN及YOLO实践

实验：目标检测

1.目标检测发展现状及代表性方法

2.两阶段目标检测方法：R-CNN系列模型

3.一阶段目标检测方法：YOLO系列模型

高频问题：

1.提名与分类 2.BBOX实现策略 3.YOLO Loss函数

关键点：

1.提名方法 2.ROI Pooling 3.SPP Net 4.RPN 5.YOLO

实操解析与训练

第五阶段：

RNN实践

实验：股票预测

1.股票数据分析 2.同步预测 3.异步预测

高频问题：

1.历史数据的使用

关键点：

1.构建RNN 2.采用Keras编程实现

实操解析与训练

第六阶段：

Encoder-Decoder实践

实验：去噪分析

1.自编码器 2.去噪自编码器

高频问题：

1.噪声的引入与去除

关键点：

1.设计去噪自编码器

实验：图像标题生成

结合计算机视觉和机器翻译的最新进展，利用深度神经网络生成真实的图像标题。

1.掌握Encoder-Decoder结构 2.学会Seq2seq结构

3.图像CNN +文本RNN 4.图像标题生成模型

高频问题：

1.如何能够根据图像生成文本？

关键点：

1.提取图像特征CNN，生成文本RNN 2.构建Encoder-Decoder结构

实操解析与训练

第七阶段：

GAN实践

实验：艺术家作品生成

1. 生成对抗网络原理 2.GAN的生成模型、判别模型的设计

高频问题：

1.生成模型与判别模型的博弈过程

关键点：

1.掌握GAN的思想与原理 2.根据需求学会设计生成模型与判别模型

实操解析与训练

第八阶段：

强化学习实践

实验：游戏分析

1.游戏场景分析 2.强化学习的要素分析 3.深度强化学习

高频问题：

1.DNN 与DQN 2.探索与利用

关键点：

1.深度强化学习的原理 2.根据实际需求，设计深度强化学习模型

实操解析与训练

第九阶段：

图卷积神经网络实践

实验：社交网络分析

1.图神经网络的原理 2.图卷积神经网络的思想

3.设计图卷积神经网络进行社交网络分析

高频问题：

1.如何从图神经网络的原理转化到实际编程

关键点：

1. 掌握图神经网络原理 2. 图卷积神经网络编程实现

实操解析与训练

第十阶段：

Transformer实践

实验：基于Transformer的对话生成

1. Transformer原理 2. 基于Transformer的对话生成

3.基于 Transformer 的应用

高频问题：

1.如何应用自注意力机制 2.如何应用于自然语言处理与计算机视觉

关键点：

1.self-Attention机制 2.position

更多资讯请关注微信公众号：人工智能技术与咨询或登录中国人工智能培训网

Aprendizaje profundo y transformador de modelo grande

Supongo que te gusta