Norma (norma): Una breve introducción a las normas LP, L0, L1, L2

¿Qué es una norma?

Sabemos que la definición de distancia es un concepto amplio, siempre que satisfaga desigualdades no negativas, reflexivas y triangulares, se le puede llamar distancia. Norma es un concepto reforzado de distancia, que tiene un algoritmo más de multiplicación que distancia en definición. A veces, para facilitar la comprensión, podemos entender la norma como una distancia.

En matemáticas, las normas incluyen normas vectoriales y normas matriciales. La norma vectorial caracteriza el tamaño del vector en el espacio vectorial, y la norma matricial caracteriza el tamaño del cambio causado por la matriz. Una explicación no rigurosa es que, correspondiente a la norma vectorial, los vectores en el espacio vectorial tienen un tamaño. Cómo medir este tamaño se mide por la norma. Se pueden usar diferentes normas para medir este tamaño, al igual que ambos metros y los pies se pueden usar para medir la distancia; para la norma matricial, después de aprender álgebra lineal, sabemos que al calcular AX=B , el vector X se puede cambiar a B, y la norma matricial se usa para medir el tamaño de este cambio.

Aquí hay una breve introducción a las definiciones y significados de las siguientes normas vectoriales 


1. norma LP 

Al igual que la definición de distancia de Minkowski, la norma LP no es una norma, sino un conjunto de normas, que se definen de la siguiente manera: 

Según el cambio de P, la norma también tiene diferentes cambios.Un diagrama de cambio clásico de la norma P es el siguiente: 
  

Escriba la descripción de la imagen aquí


La figura anterior muestra el cambio de la gráfica formada por los puntos con una distancia (norma) de 1 desde el origen en el espacio tridimensional cuando p cambia de infinito a 0. Tomemos como ejemplo la norma común L-2 (p=2), la norma en este momento es también la distancia euclidiana, los puntos en el espacio cuya distancia euclidiana al origen es 1 forman una esfera.
De hecho, en 0, Lp no satisface las propiedades de la desigualdad triangular, por lo que no es una norma en sentido estricto. Tome p=0.5, coordenadas bidimensionales (1,4), (4,1), (1,9) como ejemplo, . Por lo tanto, la norma LP aquí es solo una declaración conceptualmente amplia.

2. norma L0 

Cuando P = 0, es la norma L0. Como se puede ver en lo anterior, la norma L0 no es una norma real. Se utiliza principalmente para medir el número de elementos distintos de cero en el vector. La definición de L-0 que se puede obtener con la definición de LP anterior es: 

 Aquí hay un pequeño problema. Sabemos que la potencia cero de un elemento distinto de cero es 1, pero la potencia cero de cero y la potencia cero de un número distinto de cero son todos fantasmas. Es muy difícil de explicar. el significado de L0, por lo que, en circunstancias normales, todos usan: 

Indica el número de elementos distintos de cero en el vector x. Para la norma L0, el problema de optimización es: 

st Ax=b 

En aplicaciones prácticas, dado que la norma L0 en sí misma no es fácil de tener una buena representación matemática, es un problema difícil dar una representación formal del problema anterior, por lo que se considera un problema NP-difícil. Entonces, en situaciones reales, el problema óptimo de L0 se relajará a la optimización bajo L1 o L2.


3. norma L1 

La norma L1 es una norma que vemos a menudo, y su definición es la siguiente: 

Representa la suma de los valores absolutos de los elementos distintos de cero en el vector x.
La norma L1 tiene muchos nombres, como la familiar distancia de Manhattan, mínimo error absoluto, etc. Utilice la norma L1 para medir la diferencia entre dos vectores, como la suma de errores absolutos (Suma de diferencia absoluta): 

Para la norma L1, su problema de optimización es el siguiente: 

Debido a la naturaleza natural de la norma L1, la solución a la optimización L1 es una solución dispersa, por lo que la norma L1 también se denomina operador de regla dispersa. Las características escasas se pueden lograr a través de L1, y algunas características no informativas se pueden eliminar. Por ejemplo, al clasificar las preferencias de películas del usuario, el usuario tiene 100 características y puede haber solo una docena de características que son útiles para la clasificación. La mayoría de las características como altura, peso, etc. pueden ser inútiles y se pueden filtrar utilizando la norma L1.


4. norma L2 

La norma L2 es nuestra norma más común y de uso común. La distancia de medida más utilizada es la distancia euclidiana, una especie de norma L2. Se define de la siguiente manera: 

 Representa la raíz cuadrada de la suma de los elementos de un vector. 
Al igual que la norma L1, L2 también puede medir la diferencia entre dos vectores, como la suma de las diferencias al cuadrado (Suma de la diferencia al cuadrado): 


Para la norma L2, su problema de optimización es el siguiente: 

 La norma L2 generalmente se usa como un término de regularización para optimizar la función objetivo, evitando que el modelo sea demasiado complejo para ajustarse al conjunto de entrenamiento y causando sobreajuste, mejorando así la capacidad de generalización del modelo.


5. L\inftyNorma

En ese momentoP = \infty , es decir, L\inftyla norma, se usaba principalmente para medir el valor máximo del elemento vectorial, como L0, generalmente expresado como 

RepresentarL\infty

 Reimpreso en: Norma (norma) Una breve introducción a varias normas_Blog de Norstc-Blog de CSDN

Supongo que te gusta

Origin blog.csdn.net/weixin_58045467/article/details/131091687
Recomendado
Clasificación