Hay 10 artículos en este tema, que incluyen algo de exploración y experiencia práctica del enlace básico de la aplicación Taobao en el campo de la ciencia de datos de la experiencia del usuario (incluidos detalles comerciales, logística, rendimiento, noticias, servicio al cliente, viaje, etc.) en el último año .artículos.
La extracción de factores de toma de decisiones del usuario en función de las líneas de movimiento del usuario y el VOC en la página de detalles comerciales mejora la experiencia de navegación; en el lado de la logística, la comprensión de la relación entre el tiempo de búsqueda de ayuda del usuario y el tiempo real de estancamiento de la logística formula estrategias de expresión para mejorar la satisfacción del producto logístico ; construye en el dominio de optimización del rendimiento El modelo de correlación subjetiva y objetiva encuentra el número mágico de tiempo de inicio e indicadores de retroalimentación negativa para aclarar el objetivo de optimización; construye un sistema de etiquetado de VOC de múltiples fuentes para usar de manera integral el comportamiento del usuario y la información de VOC del usuario, estrategia de optimización de experiencia de aterrizaje, y resume un conjunto de metodología de análisis de experiencia de usuario.
Este artículo es el segundo artículo de esta serie, consulte el artículo anterior——
Parte 1: Metodología de análisis de la experiencia del usuario de Taobao
prefacio
La experiencia del usuario es un sentimiento subjetivo establecido por los usuarios en el proceso de uso de un producto. Está fuertemente relacionado con las expectativas del usuario. Diferentes usuarios tienen diferentes experiencias cuando usan el mismo producto con diferentes necesidades. Si estas diferencias se pueden percibir a través de datos y formar la la implementación de la estrategia de optimización del producto está destinada a mejorar la experiencia del producto.
En este artículo, el autor presentará brevemente cómo la ciencia de datos construye indicadores y etiquetas en función de la dinámica del comportamiento del usuario y los datos de VOC (Voice Of Customer) del usuario, obtendrá información sobre las diferencias entre la dinámica del comportamiento del usuario y las intenciones del usuario, y extraerá los factores que afectan. experiencia de navegación de los consumidores en detalle El factor clave guía la estrategia de optimización de implementación del producto y trae un efecto de mejora de la experiencia. Además, este artículo se escribirá utilizando el marco de casos matemáticos BPPISE para que los lectores puedan comprender claramente el proceso de trabajo de todo el caso.
conocimiento de los negocios
De acuerdo con las encuestas de satisfacción de los usuarios, los consumidores tienen grandes demandas de adquisición de información clave y eficiencia de filtrado de información en la página de detalles del bebé. En ese momento, los factores clave de la industria (tamaño, parámetros, ingredientes, etc.) estaban dispersos y el fijo la expresión mental de la recepción necesitaba ser mejorada. Para mejorar la experiencia de navegación de los consumidores en detalle, esperamos actualizar módulos clave como la imagen principal del producto y la información de la primera pantalla sobre los factores de toma de decisiones de diferencia dimensional de la industria, para mejorar la fluidez de los enlaces de toma de decisiones del consumidor y llevar el crecimiento del negocio.
El suministro de factores de toma de decisiones de productos básicos tradicionales se basa en la experiencia de los jóvenes de la industria, y algunas industrias se basan en la investigación del usuario, que tiene un alcance limitado y una granularidad gruesa, y no se puede refinar en categorías y grupos de personas para operaciones refinadas. Por lo tanto, en este caso, la ciencia de datos utiliza de manera integral datos subjetivos y objetivos para establecer un modelo de análisis para obtener información sobre los comportamientos detallados, las necesidades y las diferencias de los usuarios en diferentes grupos y categorías, brindar sugerencias de optimización de la experiencia del producto y diseñar experimentos AB para verificar el efecto.
definición del problema
La ciencia de datos es una disciplina que convierte los "problemas comerciales reales" en "problemas en el mundo de los datos", y luego utiliza teorías, técnicas y herramientas de ciencia de datos para transformar los datos en conocimiento y brindar orientación directa para resolver problemas comerciales. En torno a los problemas comerciales, necesitamos definir con precisión los problemas que se pueden resolver con datos.
▐Selección de datos
Una mujer inteligente no puede cocinar sin arroz.Antes de definir un problema de datos, es necesario aclarar qué datos se necesitan para resolver el problema, a fin de garantizar la mensurabilidad del problema. Sobre la base de la comprensión de los problemas comerciales, considere la suposición central detrás de la actualización de la experiencia detallada del producto: Diferentes usuarios pueden prestar atención a diferentes factores después de explorar diferentes categorías de productos con diferentes necesidades Si los productos detallados se crean con una diferenciación flexible La capacidad de emprender está obligado a brindar oportunidades de crecimiento a la eficiencia de la toma de decisiones y la tasa de conversión de transacciones .
En base a esta suposición, se puede deducir que el estudio de dos tipos de datos jugará un papel clave en la resolución de problemas:
Datos de movimiento del usuario : una serie de datos de comportamiento de serie temporal de los usuarios desde que ingresan hasta que salen de los detalles, incluida la exposición del módulo, el deslizamiento, el clic, la permanencia, etc. Este tipo de datos puede reflejar el rendimiento específico de los usuarios.
En particular, a diferencia de los datos tradicionales de puntos ocultos a nivel de página (es decir, vistas de página, exposiciones y eventos de clics), este escenario debe refinarse a datos de puntos ocultos a nivel de módulo dentro de una sola página (incluido el deslizamiento del módulo, la exposición, los clics). , estancias, etc.).
Datos de voz originales del usuario (VOC): la voz original expresada por los usuarios a través del canal de comentarios de la aplicación. Este tipo de datos puede extraer diferentes necesidades de diferentes usuarios para diferentes expresiones de información de productos básicos.
En particular, debido a las muchas fuentes de VOC, el procesamiento de información de texto es complejo y costoso, es necesario seleccionar con precisión los datos de destino para mantener la dirección y el enfoque en el proyecto.
canal COV |
Características y limitaciones de los datos |
Consulta de servicio al cliente comercial |
La consulta del usuario sobre productos y servicios antes y después de la venta es más activa |
Comentarios de los usuarios de la aplicación |
Los usuarios encontraron problemas de experiencia del producto en el proceso de uso de Taobao móvil, prefiriendo preventa, proactivo |
plataforma de ayuda |
Solicite ayuda y disputas encontradas por los usuarios después de realizar un pedido, posventa parcial, proactivo |
revision de producto |
La evaluación del usuario después de recibir la mercancía, posventa parcial, pasiva |
pregunta a todos |
La consulta C2C del usuario sobre información de productos básicos es parcial a la preventa y proactiva |
Resumen de las fuentes y características de los datos de COV de Taobao
Combinado con las características y limitaciones de los datos de VOC de Taobao, la consulta de servicio al cliente comercial se selecciona como la fuente de datos de destino en este caso para comprender las necesidades diferenciadas expresadas por los usuarios para productos detallados. En particular, la selección de estos datos se basa en una cognición básica : es probable que la primera oración efectiva de la consulta en línea de un consumidor desde la entrada de detalles de la tienda sea la información del usuario más preocupada por la información del producto antes de la venta, es decir, puede mejor reflejan las necesidades del Usuario. El problema puede ser dudas sobre el producto, falta de información, consulta de consejos, etc.
▐Definición del problema
Después de confirmar que hay datos de destino para resolver el problema comercial, damos la definición del problema de datos en este caso:
Cómo establecer un modelo de datos basado en líneas de movimiento de usuarios y consulta de servicio al cliente de comerciantes VOC, analizar y resumir los factores clave que afectan la toma de decisiones de los usuarios en detalles y obtener información sobre las diferencias en los factores de toma de decisiones de diferentes grupos de personas en diferentes industrias para guiar la estrategia de expresión estructurada de productos detallados y mejorar la eficiencia de conversión de navegación.
preparación de datos
La recopilación, el procesamiento y el preprocesamiento de datos son una parte importante de la ciencia de datos. Esta sección presenta cómo preparar puntos enterrados a nivel de módulo y datos de etiquetas VOC para garantizar datos básicos limpios, consistentes y utilizables para ayudar a los proyectos a obtener resultados más precisos.
▐Datos dinámicos de usuario
módulo |
evento |
Nombre de punto relleno |
Parámetros enterrados |
módulo de precio |
exposición |
Exposición-Página de inicio-Precio Componente-Exposición |
Page_Detail_Mostrar-Precio |
hacer clic |
Controles - Página de inicio - Componente de precio - Clic |
Page_Detail_Button-Precio |
|
módulo de título |
exposición |
Exposición-Página de inicio-Marca Logotipo comercial-Exposición |
Page_Detail_Show-Brand |
hacer clic |
Controles-Página de inicio-Logotipo comercial de la marca-Clic |
Page_Detail_Button-Marca |
|
exposición |
Exposición-Página de inicio-Título Componentes-Exposición |
Page_Detail_Show-Title |
|
hacer clic |
Controles-Página de inicio-Título-Pulsación larga-Compartir |
Page_Detail_Button-BienesTitleShare |
|
... |
... |
Diagrama detallado del punto de entierro del evento
Los datos de movimiento de usuarios se centran en el siguiente enlace de recopilación de puntos de enterramiento: a diferencia de los puntos de entierro de la página del cliente tradicional, este caso requiere un análisis preciso a nivel de módulo dentro de la página, por lo que se personaliza un conjunto de especificaciones de puntos de entierro para percibir a los usuarios entre los módulos Centrarse en las diferencias . Como se muestra en la tabla anterior, los puntos de clic, visualización y desaparición de varios componentes del módulo, como el título, los parámetros de atributo y los detalles gráficos en los detalles, se definen y recopilan para respaldar la salida de los indicadores principales de navegación del usuario (tasa de exposición de control). , tasa de clics, tasa de cierre, tasa de deslizamiento, tiempo de permanencia, etc.).
▐Datos VOC del usuario
Los datos de la sesión de consulta de servicio al cliente de los comerciantes ocultan una gran cantidad de apelaciones de los usuarios y la información de toma de decisiones para los productos Para respaldar el análisis estructural posterior, es necesario etiquetar los datos de VOC para garantizar la disponibilidad y la eficiencia de los datos.
diseño de etiquetas
Etiqueta de nivel 1 |
etiqueta secundaria |
Etiqueta terciaria |
Consulta de productos básicos |
parametros del producto |
Origen, método de almacenamiento, ingredientes,... |
Empaquetado del producto |
Método de embalaje, cantidad regular... |
|
Uso de productos básicos |
Formas de comer, precauciones. |
|
... |
... |
|
Consultoría de Inventario |
¿Está en stock? |
... |
... |
... |
... |
Ejemplo de diseño de etiqueta VOC
Para garantizar la consistencia de la salida de datos de la etiqueta, es necesario aclarar los principios de diseño de la etiqueta Las etiquetas se dividen en tres niveles:
Nivel 1: para tipos generales de consultoría que se pueden comparar y analizar entre industrias, y las habilidades de consultoría no son significativamente diferentes debido a diferencias en productos e industrias;
Nivel 2: para tipos de consultoría que se pueden comparar y analizar en categorías de primer nivel dentro de una sola industria , con una semántica similar en una categoría de palabras clave de consultoría, como té frente a productos lácteos en la industria alimentaria;
Nivel 3: para tipos de consulta que se pueden comparar y analizar en categorías de hoja dentro de una sola categoría de primer nivel y tienen una semántica similar en una categoría de palabras clave de consulta, como en la categoría de té, Puer vs té de hierbas. El tercer nivel incluye: tiempo de recolección, juego de té adecuado, temporada de crecimiento, etc.
extracción de etiquetas
Diagrama esquemático del proceso de extracción de etiquetas.
La esencia de la extracción de etiquetas VOC es un problema de clasificación de texto. La clasificación NLP ha madurado con la propuesta y evolución de Bert. El factor clave que afecta el efecto de clasificación es cómo construir un conjunto de entrenamiento preciso. En combinación con las demandas de la situación comercial actual, los requisitos para crear un conjunto de capacitación son los siguientes:
El conjunto de entrenamiento debe cubrir posibles situaciones de datos tanto como sea posible para garantizar la capacidad de generalización del modelo.
El proceso de construcción del conjunto de entrenamiento debe ser lo más eficiente posible para cumplir con el ritmo del proyecto y ahorrar costos de procesamiento.
Como se muestra en la figura anterior , para resolver los dos problemas de a y b, en el proceso, primero se utiliza la agrupación de texto para resumir la voz original de los usuarios en la misma categoría para percibir completamente la composición de las intenciones de consulta del usuario. el proceso iterativo de producción de etiquetas, se puede hacer en un corto período de tiempo Llegar a un consenso sobre las definiciones de etiquetas para mejorar la eficiencia de la construcción del conjunto de entrenamiento.
En los datos de voz originales del usuario real, habrá incoherencia entre oraciones largas y cortas. Los métodos de agrupamiento de texto convencionales (como el método de generación de vectores de oraciones por medio de TF-IDF/Word2Vec) están muy dispersos, con poca precisión y el los resultados de la agrupación también son deficientes. No se puede marcar como resultado. En este caso, el método de BIO+CRF se usa para extraer frases clave binarias de VOC, combinado con el juicio de parte del discurso para la extracción de características, ensamblado en: verbo+verbo, verbo+sustantivo, adjetivo+sustantivo y otras combinaciones, y luego agrupados por DBSCAN. Las características de este tipo de método son:
Extracción de frases clave: es probable que un texto breve que represente mejor su significado central sea una combinación de frases binarias, y las combinaciones de frases como verbo+verbo, verbo+sustantivo, sustantivo+adjetivo pueden resaltar mejor la idea central del texto breve. . Tales como: página #no se puede abrir (n+adj), cerrar #transacción (v+n).
Agrupación de DBSCAN: para una nueva categoría de producto, es imposible evaluar la cantidad de etiquetas que se pueden diseñar y la utilización general de VOC. El método de agrupamiento DBSCAN basado en la densidad divide naturalmente los COV en dos categorías: grupos que se pueden formar y grupos que no se pueden formar (ruido); los indicadores de relación de ruido se pueden usar para evaluar la utilización de COV y optimizar continuamente varios parámetros en la cadena de producción.
Visión analítica
Después de preparar los datos requeridos, comenzamos el análisis, generalmente en cuatro pasos: aclarar el objetivo del análisis, diseñar la idea del análisis, formar la conclusión del análisis e implementar la estrategia de datos.
▐Objetivos de análisis
Los tres temas principales del análisis detallado de líneas móviles son "usuarios", "productos" y "comportamiento de navegación", y "qué tipo de comportamiento de navegación" se genera alrededor de "qué tipo de usuario" ingresa "qué tipo de producto" para recopilar el navegación y clic de cada módulo, datos de tiempo de permanencia y tiempo de comportamiento. Resuma de manera integral la ruta de comportamiento y la información de atención de los usuarios principales, actualice la experiencia del producto para satisfacer las demandas de los consumidores; al mismo tiempo, descubra las diferencias en el comportamiento y el enfoque de algunos usuarios para juzgar si tiene valor de amplificación comercial.
Qué tipo de usuario: características objetivas (edad, poder de consumo, género, etc.) + intención subjetiva (compra/shopping)
Qué producto: categoría, ciclo de decisión, características del precio, etc.
Qué tipo de comportamiento de navegación: tasa de clics de exposición del módulo, duración de la estadía, situación de omisión, etc.
▐Ideas de análisis
El análisis de la línea móvil se basa en la siguiente hipótesis: la diferenciación y la expresión mejorada de los factores de toma de decisiones de los usuarios de diferentes grupos, categorías y escenarios pueden mejorar la experiencia de navegación de los usuarios detallados y mejorar la eficiencia de la toma de decisiones de compra.
árbol de hipótesis
Dimensión de análisis
Indicadores de análisis
▐Conclusión del análisis (ropa de hombre)
Análisis de movimiento
análisis COV
▐Salida estratégica (ropa de hombre)
conclusión general
Para la página de detalles de la categoría de ropa para hombres, los usuarios prestan más atención a los módulos a, b y c, y el módulo a guía más el servicio al cliente, principalmente porque los detalles existentes pueden tener algunos problemas de experiencia, como la falta de imágenes detalladas/visualización de efectos , y es difícil encontrar información básica sobre los componentes de tamaño. Para las decisiones de compra de ropa de hombre, los usuarios se centran principalmente en la talla, la calidad,… etc. (con características estacionales).
Desde la perspectiva de la fuente, los usuarios que primero adivinan la fuente tienen características obvias de compras y están más inclinados a encontrar productos de interés a través de recomendaciones de tiendas o ingresando a la tienda; mientras que la profundidad general de navegación de los usuarios que adivinan la fuente de la página en vivo es significativamente más superficial....
Desde la perspectiva de la multitud, los hombres están más dispuestos a usar el módulo a y prestan más atención a los estilos, los miembros prestan más atención a x, los nuevos clientes prestan más atención a y, y los usuarios de compras altas prestan más atención a z.
En términos de categorías, los usuarios prestan más atención a a, b y c en la categoría x.
sugerencia de optimización
Para dar sugerencias de optimización del producto basadas en las conclusiones del análisis, es necesario aclarar si el negocio es adoptado y seguir el ritmo de implementación. En particular, los estudiantes de matemáticas tienen una cognición y una comprensión diferentes de los productos/negocios, y es posible que sus sugerencias de optimización no se adopten siempre. Algunas sugerencias se lanzaron en el pasado y se requiere una comunicación estrecha con los estudiantes de productos para promover la implementación.
Implementación de la estrategia
evaluación del efecto
Estratificación Experimental
Datos experimentales: la tasa de conversión de las transacciones es significativamente +x%, el valor uv único es significativamente +y% y la tasa de conversión uv de la transacción es ligeramente positiva; el ipv per cápita es significativamente -a% y el tiempo de permanencia per cápita es significativamente -b%.
Interpretación del experimento: el método de optimización basado en este caso puede mejorar significativamente la eficiencia de conversión de productos detallados (tasa de conversión significativamente mayor), mejorar la eficiencia de la toma de decisiones del usuario (reducir significativamente el ipv per cápita y el tiempo de permanencia), pero al mismo tiempo no permite que más usuarios se conviertan (el efecto de la tasa de conversión de la transacción uv es débil), lo que esencialmente trae consigo la mejora de la experiencia del producto y el efecto cumple con las expectativas.
introducción del equipo
Somos el gran equipo de ciencia de datos de rendimiento de transacciones de tecnología de Taobao, responsable de extraer DAU, DAC y oportunidades de crecimiento de la experiencia del usuario a partir de datos masivos en enlaces de rendimiento de transacciones de Taobao (pedidos, pagos, carritos de compras, logística, inversa, etc.). El equipo se compromete a comprender las necesidades de los usuarios en torno a las rutas de comportamiento de los usuarios y los VOC de los usuarios, y a mejorar la experiencia de compra del consumidor en función de las estrategias de conversión, recompra y experiencia de enlaces de transacciones de destino que coincidan entre humanos y bienes.
Actualmente, el equipo está reclutando. Talentos con experiencia en análisis de datos/ciencia de datos en consumo, productos básicos, comercio, marketing y otros campos relacionados pueden unirse. Si está interesado, envíe su currículum a [email protected].
¤ Lectura ampliada ¤
Tecnología 3DXR | Tecnología de terminal | Tecnología de audio y video
Tecnología de servidor | Calidad técnica | Algoritmos de datos