Red de gráficos: de la convolución del dominio espectral a la convolución espacial

Convolución de mapa espectral

Idea de realización

通过f 1 (t) ☆ f 2 (t) = F - 1 [F 1 (w) ⋅ F 2 (w)] f_1 (t) ☆ f_2 (t) = F ^ {- 1} [F_1 (w) \ cdot F_2 (w)]F1( t ) f2( t )=F- 1 [F1( w )F2( W ) ]
dondef 1 (t) f_1 (tF1( t ) representa la señal de entrada en el espacio aéreo,f 2 (t) f_2 (t)F2( t ) representa el núcleo de convolución del dominio espacial,F 1 (w) F_1 (w)F1( w ) representa la señal de entrada en el dominio de la frecuencia,F 2 (w) F_2 (w)F2( w ) representa el núcleo de convolución en el dominio de la frecuencia,F - 1 F ^ {- 1}F- 1 representa la transformada de Fourier inversa.
Es decir, la información espacial se convierte primero en el dominio espectral, luego se multiplica y luego se vuelve a convertir al dominio espacial utilizando la transformada de Fourier inversa.

Inserte la descripción de la imagen aquí
Como se muestra arriba, LLLa matriz L Laplaciana se puede descomponer en autovectores y autovalores. Al realizar la convolución de gráfico, primeroxxx PasandoUTU ^ TUT realiza la transformada de Fourier y la transforma en el dominio espectral, y luego pasag θ (⋅) g_ \ theta (\ cdot)gramoyo( ) Realice una operación de convolución similar y luego paseUUU vuelve al espacio aéreo para obtener el resultado.

Convolución de mapa de dominio espectral clásico

  1. SCNN
    utiliza una matriz diagonal que se puede aprender para reemplazar el núcleo de convolución en el dominio espectral.
    Expresión: x ⋆ G g θ = UFUT xx \ star_ {G} g _ {\ theta} = UFU ^ {T} xXGgramoyo=U F UT xFFF es la matriz diagonal
  2. ChebNet
    utiliza polinomios de Chebyshev en lugar de núcleos de convolución de dominio espectral.
    Expresión: x ⋆ G g θ = U g θ UT x = ∑ k = 0 K β k T k (L ^) xx \ star_ {G} g _ {\ theta} = U g _ {\ theta} U ^ {T } x = \ sum_ {k = 0} ^ {K} \ beta_ {k} T_ {k} (\ hat {L}) xXGgramoyo=U gyoUT x=k = 0KsegundokTk(L^ )x
    β k \ beta_ {k}segundokEs un parámetro que se puede aprender. T k (L ^) T_ {k} (\ hat {L})Tk(L^ )Es la expresión de Chebyshev de la matriz de Laplace.

  3. La versión simplificada de GCN ChebNet solo considera los polinomios de Chebyshev de orden 1, y cada núcleo de convolución tiene solo un parámetro.
    Expresión: x ⋆ G g θ = θ (D ~ - 1/2 W ~ D ~ - 1/2) xx \ star_ {G} g _ {\ theta} = \ theta \ left (\ tilde {D} ^ { -1 / 2} \ tilde {W} \ tilde {D} ^ {- 1/2} \ right) xXGgramoyo=θ(re~- 1 / 2W~re~- 1 / 2 )X

Defectos de la convolución del mapa de dominio espectral

1. No es adecuado para gráficos dirigidos, pero la mayor parte de la vida real no son gráficos no dirigidos, es decir, W ij ≠ W ji W_ {ij} ≠ W_ {ji}Wi j=Wj yo, Y si no se puede utilizar el gráfico de Fourier y la información espacial no se puede convertir en información de dominio espectral, tampoco se puede realizar la convolución del gráfico.
2. Debido a la matriz característica de Laplace UULa inmutabilidad de U conduce al hecho de que la estructura del gráfico no se puede cambiar durante el entrenamiento (el peso de los bordes, la adición y eliminación de nodos), pero en la vida real, el gráfico (datos de redes sociales) a menudo cambia todo el tiempo.
3. La convolución de la red de gráficos anterior, SCNN es computacionalmente intensiva y requiere mucho tiempo; aunque ChebNet y GCN no requieren descomposición de gráficos, los parámetros utilizados para el aprendizaje son demasiado simples, lo que reduce la complejidad del modelo y también reduce el rendimiento.

Comparación de convolución de dominio espectral y gráfico de dominio espacial

Convolución del gráfico de dominio espectral :
hay teoría de grafos y teorema de convolución, los datos se transfieren desde el dominio espacial al dominio espectral en funcionamiento y la teoría básica es sólida.
Convolución de grafos espaciales :
no se basa en la teoría de grafos y define directamente la operación de convolución en el espacio. Intuitivo pero sin fundamento teórico.

Convolución de gráfico espacial

Varios tipos de redes tienen enlaces específicos:

1. GNN
El enfoque de GNN es cambiar a la fuerza los datos de la estructura de un gráfico en datos de reglas similares, para lograr una convolución unidimensional.

2. GraphSAGE
completa la operación de convolución mediante muestreo y agregación de información y, a diferencia del punto de vista GNN, la función de agregación no tiene nada que ver con el orden de entrada, es decir, los nodos de la vecindad están fuera de orden.

3. GAT
GAT cree que la convolución se puede definir como una agregación diferenciada de nodos vecinos utilizando el mecanismo de atención.

4. PGC
PGC cree que la convolución se puede considerar como una función de muestra específica (función de muestra) multiplicada por una función de peso específica (función de peso) y luego sumada.

Comparación :
Inserte la descripción de la imagen aquí
GNN, GraphSAGE y GAT no requieren una estructura gráfica fija, es decir, la estructura gráfica del conjunto de entrenamiento y el conjunto de prueba pueden ser diferentes.
La capacidad de generalización de PGC es más fuerte que los tres tipos anteriores Aunque el experimento se aplica a datos de gráficos de esqueleto fijo, no debería requerir una estructura de gráfico fija.

Características de la convolución espacial.

1. Evita la teoría de grafos y no necesita convertir la señal entre el dominio espacial y el dominio espectral;

2. Defina la operación de convolución directamente en el espacio aéreo, que es más intuitivo;

3. Sin las limitaciones de la teoría de grafos, la definición es más flexible y los métodos son más diversos;

4. Comparado con la convolución del mapa de dominio espectral, carece de soporte teórico matemático.

Supongo que te gusta

Origin blog.csdn.net/qq_41214679/article/details/109960338
Recomendado
Clasificación