Investigación sobre detección de noticias falsas basada en aprendizaje multimodal

De: Experiencia

Ingrese al grupo de PNL—> Únase al grupo de intercambio de PNL

Si bien las redes sociales brindan comodidad a las personas, también se han convertido en un canal para la difusión desenfrenada de noticias falsas. Si no se detectan y se detienen a tiempo, fácilmente pueden provocar pánico entre las masas y provocar malestar social. Por lo tanto, explorar una tecnología de detección de noticias falsas precisa y eficiente tiene un valor teórico y una importancia práctica extremadamente altos. Este artículo proporciona una revisión exhaustiva de las tecnologías de detección relacionadas con noticias falsas . En primer lugar, se organizan y resumen los conceptos relevantes de las noticias falsas multimodales y se analizan las tendencias cambiantes de los conjuntos de datos de noticias unimodales y multimodales. En segundo lugar, se introducen tecnologías unimodales de detección de noticias falsas basadas en el aprendizaje automático y el aprendizaje profundo. Estas tecnologías se han utilizado ampliamente en el campo de la detección de noticias falsas. Sin embargo, dado que las noticias falsas suelen contener múltiples representaciones de datos, estas tecnologías tradicionales unimodales No puede explorar plenamente la lógica profunda de las noticias falsas y, por lo tanto, no puede abordar eficazmente los desafíos que plantean los datos multimodales de noticias falsas. En respuesta a este problema, se clasificaron las tecnologías avanzadas de detección de noticias falsas multimodales de los últimos años, y estos métodos técnicos de detección multimodal se resumieron y discutieron desde la perspectiva de la arquitectura de flujo múltiple y la arquitectura de gráficos, y las ideas y Se discutieron conceptos de estas tecnologías y defectos potenciales. Finalmente, se analizan las dificultades y obstáculos actuales en el campo de la investigación sobre detección de noticias falsas y se dan direcciones de investigación futuras.

http://fcst.ceaj.org/CN/abstract/abstract3314.shtml

Descripción general

La difusión de información en plataformas sociales tiene las características de bajo costo, alta eficiencia y conveniencia en tiempo real. Estas comodidades hacen posible que las noticias se difundan ampliamente en la comunidad. Sin embargo, la publicación y difusión de información también conduce a la difusión desenfrenada. de noticias falsas en las redes sociales. Según un informe de investigación económica de 2019 elaborado por CHEQ y la Universidad de Baltimore [1], las pérdidas globales anuales causadas por noticias falsas ascienden a 78 mil millones de dólares. En julio de 2020, robaron una comida para llevar en una comunidad de Nanjing, Jiangsu. Según la policía, el residente era sospechoso de múltiples robos y ha sido detenido. Tres días después del incidente, muchos medios de comunicación en línea publicaron noticias diciendo que la persona involucrada era un estudiante universitario que estaba realizando exámenes de ingreso de posgrado. El informe también afirmaba que "para apoyar sus estudios posteriores, otros tres hermanos y hermanas de la familia abandonaron fuera de la escuela." En la tarde del 20 de julio, la policía emitió un aviso: El sospechoso Li Moumou se graduó de la universidad durante dos años y actualmente tiene un ingreso fijo. La razón por la que robó la comida para llevar fue porque tenía un deseo de venganza después de que la comida para llevar fuera. quitado. Actualmente, el sospechoso Li Moumou ha sido puesto en libertad bajo fianza en espera de juicio. Los padres de Li Moumou y su hermana mayor cultivan en su ciudad natal, mientras que la segunda y tercera hermanas trabajan en Beijing y Hainan, respectivamente. En otras palabras, la identidad del "estudiante de posgrado" es información falsa. La familia de Li Moumou no es pobre y robar comida para llevar no es para mantener la vida, como se muestra en la Figura 1 (a) y la Figura 1 (b). Los malos medios difundieron estas noticias falsas para despertar la simpatía de las masas y ganar tráfico y atención, estas noticias falsas no fueron detenidas hasta que el funcionario refutó los rumores. Se puede observar que las noticias falsas se han convertido en una herramienta para que un gran número de malos medios obtengan beneficios ilegales, su existencia fortalecerá las relaciones de desconfianza entre las personas y provocará efectos sociales adversos. Por lo tanto, es particularmente importante explorar métodos precisos y eficientes para detectar noticias falsas. En el caso de las noticias falsas, el texto de la noticia se origina a partir de la fabricación maliciosa de imágenes y el contenido descrito debe entrar en conflicto con el verdadero contenido de la imagen, es decir, existe una inconsistencia semántica entre las modalidades. Si se analiza únicamente desde la perspectiva de las imágenes o el texto, Esta inconsistencia semántica es muy grave, es difícil de reconocer por el modelo y puede conducir fácilmente a errores de clasificación del modelo, por lo que es necesario explorar la tecnología de detección de noticias falsas desde una perspectiva multimodal.

Al observar los artículos de revisión sobre detección de noticias falsas a lo largo de los años, pocos las han analizado desde una perspectiva multimodal. Los primeros investigadores se dedicaron a encontrar y construir características artificiales para representar el contenido de las noticias. La mayoría de las revisiones en ese momento giraban en torno a la inducción y clasificación de estas características [2-3]. Más tarde, con el desarrollo de la tecnología de aprendizaje profundo, los académicos centraron sus esfuerzos en investigación sobre Centrándose en esta tecnología de extracción automatizada de características, ha surgido una gran cantidad de artículos de detección de noticias falsas basados en el aprendizaje profundo. En los últimos años, algunos académicos han resumido estos métodos [4-5]. Sin embargo, la perspectiva de investigación de estos artículos es limitada y no tiene en cuenta otras modalidades de noticias falsas. Algunos estudios han encontrado [6-7] que el contenido visual de las noticias es un factor clave que puede engañar a los lectores. Además, la información de propagación de noticias falsas contenida en el gráfico social de noticias es un factor importante en el éxito de la detección [8], por lo que es necesario analizar las noticias desde una perspectiva multimodal. En respuesta a esto, este artículo detalla algunos trabajos previos en el campo de la detección de noticias falsas y proporciona un resumen y una revisión completos de este campo desde una perspectiva unimodal a multimodal. Las aportaciones de este artículo son las siguientes:

(1) Resumir y organizar detalladamente las tecnologías relacionadas en el campo de la detección de noticias falsas desde una perspectiva unimodal a multimodal; (2) Utilizar tecnología de detección basada en gráficos sociales de noticias como un método especial de procesamiento multimodal, y El estado de la investigación se complementa y mejora su última tecnología; (3) se solucionan los obstáculos de la investigación de la tecnología existente de detección de noticias falsas y se dan direcciones de investigación futuras.

Tecnología multimodal de detección de noticias falsas

Las diferentes formas de fuentes de información pueden considerarse como diferentes modalidades [51]. Las noticias son datos multimodales típicos. Las noticias escritas suelen contener dos tipos de información: imágenes y texto. Las noticias cortas en vídeo contienen al menos imágenes, audio y subtítulos. La información modal, como el contenido de las noticias y el comportamiento de las noticias, se incluye en el gráfico social de noticias. La clave de la tecnología de detección de noticias falsas multimodal es cómo construir un marco modelo para aprender la información multimodal de los datos de noticias para mejorar el rendimiento de la detección de noticias falsas. Resumiendo algunos de los artículos propuestos hasta ahora, se pueden dividir aproximadamente en dos categorías: tecnología de detección de noticias falsas multimodal basada en forma de flujo y tecnología de detección de noticias falsas multimodal basada en forma de gráfico.

Tecnología de detección de noticias falsas basada en forma de streaming

Tecnología basada en arquitectura de flujo único

La arquitectura de flujo único significa que antes de ingresar el modelo, las características principales de diferentes datos modales se fusionarán mediante empalme, mapeo de funciones, etc. La información de cada modalidad en las características multimodales obtenidas es independiente y la información multimodal La información modal debe aprenderse en modelos posteriores. Los más representativos son los modelos multimodales basados en la arquitectura Transformer, como ViLT (transformador de visión y lenguaje) [52], MBT (transformador de cuello de botella multimodal) [53], etc. Los datos de cada modalidad serán preprocesados en un Secuencia: Los datos, por ejemplo, el texto se convertirán en una secuencia compuesta de múltiples tokens, las imágenes se convertirán en múltiples secuencias de parches de imágenes que no se superpongan, los datos de audio se convertirán primero en espectrogramas y, finalmente, en múltiples secuencias de parches de espectrogramas que no se superpongan. Se formarán. Las características de múltiples modalidades eventualmente se unirán para formar las características de entrada multimodal del modelo. El marco de arquitectura de flujo único se muestra en la Figura 2.

Actualmente, los modelos de arquitectura de flujo único se utilizan ampliamente en campos multimodales como la clasificación de videos, el análisis de sentimientos y la generación de imágenes. El modelo de flujo único tiene las ventajas de una estructura simple, fácil implementación y alta precisión. La detección de noticias falsas es una importante dirección de investigación con gran potencial. Sin embargo, en referencia a algunas investigaciones actuales, también tiene algunas deficiencias: (1) Se necesitan más iteraciones para obtener una buena representación multimodal durante el entrenamiento de la red; (2) Dado que las características de entrada del modelo generalmente son múltiples modalidades, las características están empalmadas juntos, el modelo tiene una alta complejidad computacional; (3) El aprendizaje de modelos de flujo único requiere una gran cantidad de conjuntos de datos de entrenamiento, y actualmente no hay suficientes datos de entrenamiento en el campo de la detección de noticias falsas.

Tecnología basada en arquitectura multi-stream

En los últimos años, en el campo de la detección multimodal de noticias falsas, los investigadores han utilizado con mayor frecuencia tecnologías basadas en arquitectura multiflujo. La arquitectura de flujo múltiple se refiere al diseño de diferentes modelos basados en diferentes datos modales para extraer características modales de alto nivel, aprender características multimodales de las características de alto nivel de cada modalidad e ingresarlas en clasificadores posteriores para predecir la probabilidad de cada categoría. En comparación con la arquitectura de flujo único, la arquitectura de flujo múltiple es más flexible y puede diseñar modelos de forma independiente para extraer características modales para diferentes datos modales. El marco de múltiples flujos se muestra en la Figura 3.

Método de detección de noticias falsas basado en gráficos

La socialidad es una de las características básicas de las noticias. Los datos de las noticias se pueden representar como un gráfico de red social en el que interactúan las noticias y las audiencias de noticias. El gráfico de la red social de noticias contiene datos de texto plano, como artículos de noticias y comentarios, así como tipos de relaciones como como nodos y bordes Los datos y los gráficos compuestos de estas diferentes formas de datos pueden considerarse datos multimodales especiales. Esta sección analiza principalmente la tecnología de detección de noticias falsas basada en gráficos sociales de noticias, que se pueden dividir aproximadamente en dos categorías: tecnología basada en el aprendizaje automático de gráficos y tecnología basada en redes neuronales de gráficos.

La difusión de información técnica falsa basada en el aprendizaje automático de gráficos involucra principalmente tres factores [71]: primero, la racionalidad del contenido de la noticia; segundo, la personalidad y credibilidad del comunicador; y tercero, la homogeneidad de la red de comunicación. Con base en los factores anteriores, los investigadores han establecido diferentes gráficos sociales de noticias basados en el contenido de las noticias y la información social, como árboles de comunicación de noticias, redes de posición de noticias, etc., para explorar los patrones de comunicación de noticias falsas. El árbol de propagación representa la relación entre publicaciones y retuits de artículos de noticias en las redes sociales. Wu y otros [72] describen el modelo de propagación de mensajes como una relación estructurada en árbol, que no solo puede reflejar la relación entre el reenviador y el autor, sino que también refleja el comportamiento inmediato y las emociones del reenviador. En segundo lugar, Ma y otros [13] construyeron árboles de propagación de mensajes para noticias reales y noticias falsas respectivamente, y utilizaron los diferentes modos de propagación de noticias reales y noticias falsas para calcular la similitud de las subestructuras entre los dos árboles de propagación. Los experimentos demostraron que esto El método puede ayudar eficazmente a detectar noticias falsas.

Los nodos de la red de posiciones representan noticias y publicaciones, y los bordes representan las relaciones de apoyo y oposición entre publicaciones. Utilice stance network para detectar noticias falsas, es decir, detectar la credibilidad de publicaciones relacionadas con una determinada noticia, cuanto menor sea la credibilidad, mayor será la posibilidad de que la noticia sea falsa. En la difusión de noticias, algunos académicos han descubierto [73] que cierta información incorrecta puede autocorregirse a través de opiniones, especulaciones y evidencia compartida por los usuarios. Como se muestra en la Figura 5, la Figura 5 (a) muestra la red de posturas de noticias falsas y la Figura 5 (b) muestra la red de posturas de noticias reales. Además, algunos académicos han realizado un análisis exhaustivo de los árboles de propagación de noticias falsas y las redes de posturas. Davoudi y otros [74] propusieron un marco de detección que incluye tres estructuras: análisis dinámico, análisis estático y análisis estructural. Utiliza redes neuronales recurrentes, redes neuronales completamente conectadas y Node2Vec para aprender los patrones de evolución del árbol de propagación y la red de postura a lo largo del tiempo, las características generales del árbol de propagación y la red de postura al final de la detección y las características estructurales de la árbol de propagación y red de postura, y finalmente resume tres La salida de la estructura completa la detección de noticias falsas.

Tecnología basada en red neuronal gráfica.

En los últimos años, los investigadores se han basado en las ideas de redes convolucionales, redes recurrentes y codificadores automáticos profundos para diseñar una estructura de red neuronal que pueda usarse para procesar datos gráficos: "red neuronal gráfica" [76]. Esta tecnología tiene ventajas únicas en el procesamiento de datos relacionales de gráficos, y la difusión y difusión de noticias falsas se implementa en forma de gráficos. Los nodos en el gráfico representan información de la entidad relacionada con las noticias y los bordes representan las conexiones entre diferentes entidades. . El diagrama de comunicación social de noticias se muestra en la Figura 6.

La red convolucional gráfica (GCN) es un modelo de red neuronal gráfica propuesto tomando prestada la idea de una red convolucional para procesar datos gráficos. Su idea central es aprender una función de mapeo. Para un nodo en el gráfico, agregue el nodo. Las características del nodo y las características de los nodos vecinos se utilizan para generar una nueva representación del nodo. El modelo SAFER (marco de detección de noticias falsas con conciencia social) propuesto por Chandra et al.[78] utiliza GCN para obtener representaciones de noticias con información del usuario, sin embargo, construyen una red de gráficos homogénea, lo que conducirá a problemas de pérdida de información. Sobre esta base, Wang y otros [79] construyeron un gráfico heterogéneo utilizando textos de noticias, imágenes y conceptos de conocimiento como nodos, lo que alivió este problema hasta cierto punto. Además, Bian y otros [80] estudiaron el modelo de difusión de noticias falsas desde las dos perspectivas de profundidad y amplitud de propagación de noticias, como se muestra en la Figura 7. Propusieron una red neuronal convolucional gráfica bidireccional, de arriba hacia abajo y de abajo. -arriba Las dos direcciones anteriores obtienen respectivamente los patrones de propagación y difusión de noticias falsas, y los resultados experimentales finales demuestran la eficacia de este método.

En general, el método de detección de noticias falsas basado en gráficos tiene las ventajas de una alta precisión y flexibilidad: puede identificar nodos importantes que afectan la difusión de información falsa y proporciona cierta interpretabilidad al modelo. Pero también hay algunos problemas. Por ejemplo, el gráfico social de las noticias debe construirse artificialmente con antelación. Cuando hay demasiadas entidades relacionadas con las noticias, lleva mucho tiempo y, a veces, es posible que se pierda información clave de las entidades. , el entrenamiento del gráfico lleva mucho tiempo y exige mucho hardware, y la necesidad es mayor, además, la tecnología de detección de gráficos que involucra factores de tiempo aún está poco desarrollada.

en conclusión

En la era de Internet, cómo identificar de manera precisa y eficiente información falsa en noticias masivas se ha convertido en un tema candente de preocupación internacional. Después de años de investigación y exploración, la tecnología de detección de noticias falsas se ha desarrollado desde la detección manual temprana hasta la detección automatizada actual. La extracción manual de características basada en el aprendizaje automático se ha transformado en la extracción automática de características de aprendizaje profundo actual. El método de detección de objetos de noticias individuales ha evolucionado hacia el usuario. Funciones, texto, imágenes, funciones de video y funciones de propagación y otros métodos de detección conjunta multimodal.

Este artículo organiza las teorías relevantes de la investigación sobre la detección de noticias falsas, realiza una revisión exhaustiva de los conjuntos de datos de detección de noticias falsas y las tecnologías relacionadas desde una perspectiva unimodal a multimodal y resume las deficiencias de la investigación existente . Se dan direcciones de campo y de investigación futura. Este artículo no solo sirve como referencia para académicos posteriores, sino que también proporciona un importante valor de aplicación práctica para que las plataformas de medios profesionales aborden el impacto de las noticias falsas.

Ingrese al grupo de PNL—> Únase al grupo de intercambio de PNL

Investigación sobre detección de noticias falsas basada en aprendizaje multimodal

Supongo que te gusta