Lea las notas - NLG flujo de información de grupo de EE.UU.


artículo enlace

1, la forma de medir el efecto de la optimización?

Y recomendar problemas similares, mejorar los indicadores comunes CTR, tasa de conversión, incluyendo, teniendo en cuenta la experiencia de lectura.

Cómo cuantificar la experiencia de la lectura?

2, el formulario de solicitud

2.1 para el contenido

Título de la generación de un fragmento de contenido.

2.2 para los negocios

Se refiere a recomendar redacción y el contenido de la página polimérico.

Redactor recomendada: una descripción del punto central de venta de la empresa, diciendo recomendación.

la agregación de contenidos: Título + pedazos cortos de texto recomendado caso razón.

3, técnicos específicos

3.1 La generación de texto

Teoría! = Real

  • Teoría: el destino de los datos medida de similitud y la formación basada en una muestra.
  • Real: a efecto de línea orientado a, complementado por la evaluación artificial.

3.2 Modelado de texto

Para que el terminal para completar más tareas: clasificación, generación de secuencias, razonamiento semántica, coincidente similitud.

  • contextuales incrustación

    • Abordar el problema central: cómo usar una gran cantidad de datos de texto no está marcado aprendieron un modelo de pre-formados y asistido por el modelo a través de diferentes objetivos han mejor realizar las tareas de anotación.
    • Modelo: Elmo, GPT, el BERT.
  • Tree-Based Embedding

    • Incrustación puede caracterizarse por el nodo raíz como un contexto
    • La sintonía es difícil, no se utiliza.

4, la práctica

## 4.1 信息流标题生成

### 4.1.1 方法

#### 抽取式
#### 受限生成式
#### 抽取+生成混合

### 4.1.2 业务指标与生成式模板的gap

### 持续获取标注数据

copia 4.2 comerciante

  • Resumen: contexto
  • objetivo de negocio: CTR, página transmitancia
  • Objetivos técnicos: generar siguientes, de acuerdo con diferentes requisitos de los generalizada
  • Categoría de la tarea: Data2Text
  • Características: requisitos de baja precisión, de baja complejidad
  • Dificultad: generalizada exigentes

4.2.1 los minoristas

[+ Listados de propiedades críticas Comerciante] y [+] y [punto de venta de la información del mapa punto de venta]

En el medio de información de la empresa [+] punto de venta es la información de texto de destino. A principios LDA o similares pueden ser realizadas por la venta de la minería.

4.2.2 aplicación lateral de Control

De hecho, un problema de optimización restringida es: lado decodificación Fuerte Débil control + control; añadió dinámicamente al objetivo de control deseado.

La venta de control de punto

El 地域, 品牌otro se refiere al control fuerte y directa de las entidades codificadas en la venta context; venta basada en la probabilidad de co-ocurrencia se añadiócontext

control de estilo

En la que el estilo de la escritura comocontext

4.3 Sindicación

control de la diversidad

La razón es que la naturaleza de la predicción de la decodificación de Beam Searchelegir siempre la mayor probabilidad de secuencia, no tiene en cuenta la diversidad. Pero si la probabilidad de predicción del decodificador Random Searchmétodo, entonces habrá un problema mayor en grados fluidas.

El método real

resultados de optimización global directos, cuando la predicción de la polimerización de una página Contexten el mismo batchmedio, batch_sizea saber, el número de copia de la secuencia de repetición entidad se han generado y detectado n-gramdetección de duplicados, además de una puntuación de penalización detectado la determinación del peso.

Publicados 120 artículos originales · ganado elogios 35 · vistas 170 000 +

Supongo que te gusta

Origin blog.csdn.net/u012328476/article/details/102872362
Recomendado
Clasificación