Visión artificial: ¿Cuál es el tamaño del parámetro de una capa convolucional?

El enfoque de este artículo

La cantidad de parámetros del kernel de convolución es un concepto importante en la red neuronal convolucional, que determina la complejidad y la cantidad de cálculo de la red. En el aprendizaje profundo, la operación de convolución es una operación de uso común para extraer características en datos como imágenes y voz. La ventaja de la red neuronal convolucional radica en la escasa conexión y el peso compartido, lo que hace que los parámetros del kernel de convolución sean mucho menores que los de la red neuronal tradicional.

ejemplo

Suponiendo que una sola capa convolucional tiene 10 filtros (núcleos de convolución) y la dimensión del filtro es 3*3*3, ¿cuántos parámetros tiene esta capa?

Los filtros son 3×3×3, por lo que cada filtro tiene 27 parámetros. Luego agregue una desviación, representada por el parámetro b, y ahora el número de parámetros ha aumentado a 28. Y ahora tenemos 10 filtros, que suman 28×10, o 280 parámetros.

Los parámetros de la red neuronal totalmente conectada están determinados por la capa superior y la capa actual, mientras que los parámetros de peso de la red neuronal convolucional están determinados por el ancho, la altura, el canal y la cantidad de filtros del filtro.

Tenga en cuenta que no importa cuán grande sea la imagen de entrada, ya sea 1000 × 1000 o 5000 × 5000, los parámetros de la capa convolucional siempre son 280. Utilice estos 10 filtros para extraer características como bordes verticales, bordes horizontales y otras características. Aunque estas imágenes son grandes, hay pocos parámetros, lo cual es una característica de las redes neuronales convolucionales llamada "evitar el sobreajuste".

resumen formulaico

Tomando un núcleo de convolución bidimensional como ejemplo, suponiendo que el tamaño del núcleo de convolución es K×K, la profundidad es D y el número de canales de los datos de entrada es C, entonces la cantidad de parámetros del núcleo de convolución puede calcularse como:

<

Supongo que te gusta

Origin blog.csdn.net/huanfeng_AI/article/details/132032273
Recomendado
Clasificación