Evolución y Práctica Jingdong algoritmo de creación de contenido inteligente: basada en palabras clave de resumen generada automáticamente

Fuente | Jingdong desarrolladores chi nube

: REVISIÓN capacidades técnicas de IA Jingdong Mall, detrás Secreto: basan en palabras clave de resumen generada automáticamente

Durante las últimas décadas, la potencia de cálculo humana era una gran mejora; A medida que se acumulan los datos, cada vez más sofisticado algoritmo, hemos entrado en la era de la inteligencia artificial. De hecho, es difícil entender el concepto de la inteligencia artificial, la tecnología es grande, los datos y los algoritmos detrás de la muy grande y complejo. Muchas personas se preguntan, ¿Qué aplicaciones prácticas, ahora o en el futuro AI es así?

De hecho, en la aplicación práctica de la IA y el valor de negocio y no tan "fantasía", ya menudo a nuestro lado. A continuación, [ la lectura de la IA de papel ] columna ,, tecnología de IA es la forma de energizar, y se asocia de aterrizaje y la práctica en el campo del comercio electrónico para todos profundidad secreta mediante la lectura de documentos relacionados con la IA.

tecnología de inteligencia artificial en el campo del comercio electrónico, tiene una gran cantidad de escenarios de aplicación. Escenario es la entrada de datos, los datos obtenidos por la técnica de refinación, a su vez, actúa sobre la tecnología, dos se complementan entre sí.

Jingdong basado en la comprensión del lenguaje natural y la tecnología mapa del conocimiento desarrollado AI mercancía comercialización de los servicios de redacción de contenidos. Y aplicar esta tecnología para encontrar mejores productos Jingdong Mall, [] canal.

Jingdong [Canal] encontró que las buenas cosas

Foto por cientos de miles de productos básicos comercialización de material de creación AI, no sólo para llenar el enorme brecha entre las actualizaciones y actualizaciones de productos de la gente que escribe el contenido, sino también aumentar la riqueza de los contenidos del canal.

Mientras tanto, el contenido generado por AI en términos de exposición CTR, porcentaje de conversiones y otros detalles en el negocio en realidad mostró una mejor que la creación artificial de la comercialización de contenidos.

Vamos a dejar que me través de la lectura seleccionada  2020 AAAI  papeles para echar un vistazo a la forma de aplicar los diferentes grupos que utilizan diferentes estrategias de marketing y diferentes estilos de copia de la comercialización para mejorar la comercialización de conversión por AI.

Resumen automático de textos (en adelante, "resumen automático") es un papel tradicional en el campo del procesamiento del lenguaje natural, que se propuso en la década de 1950. Target tareas de resumen automático para un texto dado, el acceso a algunos de los más importantes de los cuales incluyen una información de texto simplificado. métodos usados ​​comúnmente incluyen el resumen automático Abstracts automáticos de extracción (Extractive de resumen) y fórmula resumen automático (Abstractive Summarization). resumen automático extraíble mediante la extracción de un texto dado ya existe en la clave de palabras, frases u oraciones digerir; la generación de resúmenes automáticos mediante el establecimiento de un texto dado representación semántica resumen, la tecnología de generación, generación de lenguaje natural abstracto.

Descrito en este artículo se basa en una fórmula orientación de palabras clave frase de resumen, que combina la extracción y la fórmula abstracta automática automática de resúmenes, la comparación con el modelo comparativo de conjunto de datos Gigaword Resumen frase, y lograr un mejor rendimiento.

Papeles enlace:

http://box.jd.com/sharedInfo/B2234BB08E365EEC

 

Resumen sentencia generativa

fórmula Resumen frase de entrada (Summarization Sentence Abstractive) tarea es una frase larga, la salida de la frase de entrada se simplifica frase.

Observamos, introduzca algunas palabras importantes (es decir, palabras clave) condena proporciona las señales de orientación para generar resumen. Por otro lado, cuando la gente creativa en el resumen frase de entrada, también tienden a identificar en primer lugar las palabras clave en la frase de entrada, y luego organizar estas palabras clave del lenguaje conectados en serie. Por último, el contenido generado no sólo cubrirá estas palabras clave, sino también para asegurar su fluidez y la corrección gramatical. Creemos que, en comparación con el resumen automático extraíble pura y abstracta, la orientación basada en palabras clave de generación de generación automática de resúmenes automáticos más cerca de la costumbre de la gente creativa digerir.

Figura 1 : solapa la palabra clave entre la frase de entrada y la referencia de digerir ( marca roja ) cubre la frase de entrada de información crítica, podemos generar un resumen basado en palabras clave extraídas de la frase de entrada

Damos un ejemplo de un resumen simple frase. 1, podemos sustancialmente la superposición de la frase de entrada y la palabra de referencia digerir (excluir las palabras) como palabra clave, cubiertas de palabras la frase de entrada superpuestos punto. Por ejemplo, podemos palabra clave "líderes mundiales", "cerrar" y "Chernobyl", se puede obtener la esencia de la frase de entrada de información, que "los líderes mundiales pidieron el cierre de Chernobyl", que es el actual resumen de referencia "instó a los líderes mundiales para apoyar el plan de cierre de la planta nuclear de Chernobyl" es consistente. Este fenómeno es común en la tarea de resumen frase: conjunto de datos Resumen sentencia el Gigaword, las palabras se refieren a la síntesis de más de la mitad aparecerá en la frase de entrada.

Introducción al modelo

Introduzca tarea de resumen condena por una sentencia más larga, la salida es un breve resumen del texto. Nuestra motivación es la palabra clave en el texto de entrada puede proporcionar una orientación importante para el sistema de resumen automático. En primer lugar, vamos a introducir la palabra superposición entre el texto y la referencia de digerir (excepto palabra desactivado) como la palabra clave realidades sobre el terreno, por el aprendizaje de manera multi-tarea, compartiendo el mismo codificador para codificar el texto de entrada, la extracción de palabras clave modelo de tren y un modelo de generación de digestión, en el que el modelo se basa en la extracción de palabras clave estado codificador secuencia denotada oculta modelo de capas, los modelos de generación de digerir se basan en la guía del modelo de fin de palabra clave. Después de que el modelo de extracción de palabras clave y modelo abstracto de generación están capacitados convergencia, se utiliza el modelo de extracción de palabras clave entrenado sobre el texto conjunto de entrenamiento para extraer palabras clave, palabras clave de uso dibujados a ajustar el modelo para generar resúmenes. Cuando se prueba, el primero en utilizar el modelo de extracción de palabras clave para la extracción de prueba texto de palabras clave, con el tiempo utilizando las palabras clave extraídos, y el resumen original de prueba de generación de texto.

1, el aprendizaje multi-tarea

tareas de resumen de texto y tareas de extracción de palabras clave son muy similares en un sentido, es para extraer la información clave de entrada de texto. Diferentes puntos de la forma de su producción: la salida de la tarea de resumen de texto era un texto completo, salida de la tarea de extracción de palabras clave es un conjunto de palabras clave. Creemos que estas dos tareas requieren el codificador para identificar la información importante de la capacidad de entrada de texto. Por lo tanto, utilizamos marco de aprendizaje multi-tarea, estas dos tareas comparten el codificador para mejorar el rendimiento del codificador.

2, la orientación basada en palabras clave digerir modelo de generación

Trabajamos por Zhou et al. [1] inspirados, propone una basada en palabras clave selectiva orientación de codificación. Específicamente, ya que más información importante que contiene la palabra clave, la orientación de palabras clave, hemos construido una selecta red de puertas, que codifica la información semántica texto de entrada secundaria capa oculta, la construcción de una nueva capa oculta. La posterior decodificación basada en esta nueva capa oculta.

Nos decodificador basado en red Pointer-Generator [2] , es decir, de extremo a extremo de fusión mecanismo de replicación de modelo. Para el módulo generador, presentamos fusión puerta de manera directa e integración jerárquica del texto de entrada original y la fusión de la información contextual de palabras clave; Puntero al módulo, nuestro modelo puede ser un texto de entrada de forma selectiva y palabras clave en el original copiado en el resumen de salida.

Experimentar y Análisis

1, un conjunto de datos

En este experimento, se optó por experimentar en el set de datos Gigaword, el conjunto de datos contiene aproximadamente 3,8 millones de capacitación Resumen sentencia de la derecha. Utilizamos 8000 pares como un conjunto de validación, 2000 pares como un conjunto de prueba.

2, los resultados experimentales

La Tabla 1 muestra el modelo que proponemos es mejor que ninguna orientación modelo de rendimiento de palabras clave. Hemos probado diferentes esquemas de codificación selectividad se seleccionan del texto de entrada, selección de palabras clave y selección mutua, los resultados experimentales muestran que la mejor selección mutua; para el módulo generador, hemos encontrado el camino de integración jerárquica mejor que otra dos vías de fusión; nuestra mejor rendimiento del módulo bi-puntero que el modelo original se puede copiar del texto de entrada.

Tabla 1

  

resumen

Este documento tiene por objeto generativa Resumen sentencia de la tarea, es decir, cuánto tiempo será una sentencia convertida en un breve resumen. Nuestro modelo propuesto puede utilizar palabras clave como guía para producir más Resumen de alta calidad, mejores resultados obtenidos con respecto al modelo comparativo.

1) para extraer palabras clave y generar Resumen utilizando marco de aprendizaje multi-tarea;

2) a través del acceso a la información importante durante el proceso de codificación en base a la codificación selectiva palabra clave estrategia;

3) a través de un mecanismo de enfoque dual, una mezcla dinámica de la frase de entrada original y la información de palabras clave;

4) por el mecanismo de replicación dual, copiar las palabras de entrada originales en frases y palabras clave para el resumen de salida.

En el conjunto de datos de resumen frase estándar, se verifica la eficacia de la tarea de resumen frase de palabras clave.

comentario:

[1]   Zhou, Q .; Yang, N .; Wei, F .; y Zhou, M. 2017. codificación diferencial para la integración frase abstractive. En Actas del ligamento cruzado anterior, 1095-1104.

[2]  Ver, A .; Liu, PJ; y Manning, CD 2017. Ve al grano: Recapitulación con las redes puntero del generador. En Actas del ligamento cruzado anterior, 1073-1083.

Al mismo tiempo, abierto a todos los desarrolladores bajo el relleno de lectura de códigos de Fanger Wei a cabo las "grandes desarrolladores y la investigación en IA", a sólo 2 minutos, se puede cosechar valor de 299 yuanes, "Los desarrolladores de AI millones de personas de congresos" entradas en vivo en línea!

推荐阅读全球呼吸机告急!医疗科技巨头美敦力“开源”设计图和源代码京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要互联网之父确诊新冠,一代传奇:任谷歌副总裁、NASA 访问科学家微软为一人收购一公司?破解索尼程序、写黑客小说,看他彪悍的程序人生!在Kubernetes上部署一个简单的、类PaaS的平台,原来这么容易!2020年,这20个大家都认识的加密交易所过得怎么样?
你点的每个“在看”,我都认真当成了AI
Liberadas 1375 artículos originales · ganado elogios 10000 + · vistas 6,85 millones +

Supongo que te gusta

Origin blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/105320698
Recomendado
Clasificación