GNN/GCN

Destilar: https://distill.pub/2021/gnn-intro/

Insertar descripción de la imagen aquí

Tres preguntas importantes:

Tarea a nivel de gráfico (clasificación)
Tarea a nivel de nodo (juicio de atributo de vértice)
Tarea a nivel de borde (juicio de atributos de borde)

Almacenamiento de información: (el almacenamiento es eficiente y no se ve afectado por la clasificación)

Nodos: Escalar/Vector
Aristas: Escalar/Vector
Lista de adyacencia: la longitud es la misma que la del borde. El elemento i-ésimo indica a qué dos vértices está conectado el borde i-ésimo.
Global: escalar/vectorial

El marco de la “red neuronal de paso de mensajes” es de entrada y salida de gráficos y no cambia la conectividad del gráfico.

El GNN más simple

El vector de nodos, el vector de bordes y el vector global construyen un MLP respectivamente como una capa. No se considera toda la información de conexión .

Operación de agrupación

¿Cómo obtener el valor previsto de la salida de la última capa?

Si se hace predicción para vértices: dos clasificaciones: ingrese MLP, softmax con dimensión de salida 2 para cada vértice. Tenga en cuenta que solo hay un MLP , compartido por todos los vértices.

¿Qué hacer con un vector que no corresponde a un vértice?

Los vectores de borde conectados al vértice y el vector global se suman (suponiendo que las dimensiones sean las mismas), se ingresan en el MLP y se generan.

¿Qué pasa si solo hay vértices y no hay vectores de aristas?

Para agregar (agregar) los vectores de vértice a los bordes (vértices conectados), puede hacer +U vector, ingresar el MLP de los bordes y generar

¿Qué pasa si no hay vectores globales sino solo vectores de vértice?

Los vectores de vértice se suman en el MLP de U, y la salida

El diagrama de estructura del GNN más simple es el siguiente:

Insertar descripción de la imagen aquí

limitación:

La información estructural del gráfico no se utiliza durante la transformación y la información del gráfico no se actualiza en el gráfico.

Mejora: pasar mensajes

Insertar descripción de la imagen aquí

El paso de mensajes más simple: al actualizar un vértice, agréguelo con los vértices vecinos e ingrese MLP

Similar a CNN, está conectado a píxeles adyacentes, los pesos del núcleo de convolución son los mismos y el canal es MLP.

La agregación de información de bordes y vértices se puede realizar temprano:

Pase la información del vértice a los bordes, la información del borde se actualiza y luego agregue la información del borde actualizada a los vértices, y los vértices se actualizan (las dimensiones son diferentes)
A su vez, los resultados son diferentes.
Actualización alternativa

¿Cómo hacer información global U?

El gráfico es grande y los mensajes se transmiten muy lejos. Agregue el nodo maestro o vector de contexto (conectado a todos los vértices y todos los bordes), es decir, U

U está conectado a todo en E y V. Cuando se reúnen los bordes/vértices, también se agregará U. La actualización de U traerá todos los EV e ingresará al MLP.

Similar a atención, obtenga información similar a q

Agregación: media, máximo, suma

Otras fotos

Hay diferentes lados (dirigidos y no dirigidos)
Hay subimágenes
。。。。

muestreo por lotes de gráficos

1. Muestreo de puntos al azar, luego busque vecinos y cree subgrafos para reducir el almacenamiento

2. Muestre aleatoriamente un punto, camine aleatoriamente y fije el número de pasos aleatorios para obtener el subgrafo.

3. Camine unos pasos al azar y encuentre vecinos.

4.muestreo de difusión: tome un punto y mueva los N vecinos más cercanos hacia adelante k pasos para obtener un subgrafo.

Sesgos inductivos

Cualquier aprendizaje automático tiene suposiciones.

CNN: invariancia de transformación espacial

RNN: continuidad temporal

GNN: mantiene la simetría del gráfico (no importa cómo se intercambien los vértices, GNN permanece sin cambios)

En la operación de agregación, la suma media máxima es casi la misma.

GCN como aproximadores de funciones de subgrafo

GCN: (El que tiene convergencia) Si hay k capas y solo miras a los vecinos, cada vértice verá su subgrafo, hasta k pasos de distancia.

Dualidad de puntos y aristas

graficar redes de atencion

Los pesos de convolución están relacionados con la posición y los pesos GNN deben ser insensibles a la posición.

Los pesos pueden depender de la relación entre los vectores de vértices, el producto escalar, softmax y los vértices obtienen pesos.

Interpretabilidad de gráficos.

Dualidad de puntos y aristas

graficar redes de atencion

Los pesos de convolución están relacionados con la posición y los pesos GNN deben ser insensibles a la posición.

Los pesos pueden depender de la relación entre los vectores de vértices, el producto escalar, softmax y los vértices obtienen pesos.

Interpretabilidad de gráficos.

modelado generativo

GNN/GCN

GNN/GCN

Tres preguntas importantes:

Almacenamiento de información: (el almacenamiento es eficiente y no se ve afectado por la clasificación)

El GNN más simple

Operación de agrupación

¿Cómo obtener el valor previsto de la salida de la última capa?

¿Qué hacer con un vector que no corresponde a un vértice?

¿Qué pasa si solo hay vértices y no hay vectores de aristas?

¿Qué pasa si no hay vectores globales sino solo vectores de vértice?

limitación:

Mejora: pasar mensajes

La agregación de información de bordes y vértices se puede realizar temprano:

¿Cómo hacer información global U?

Otras fotos

muestreo por lotes de gráficos

Sesgos inductivos

GCN como aproximadores de funciones de subgrafo

graficar redes de atencion

graficar redes de atencion

Supongo que te gusta