Marco de caso de ciencia de datos BPPISE

919b4ea03087fc92ace6d3c54b5bbd49.gif

Este tema tiene un total de 10 artículos, que incluyen cierta exploración y experiencia práctica de los enlaces básicos de la aplicación Taobao en el campo de la ciencia de datos de la experiencia del usuario (incluidos detalles comerciales, logística, rendimiento, mensajería, servicio al cliente, viaje, etc.) en el pasado. año.

En la página de detalles del negocio, extraer factores de toma de decisiones del usuario basados ​​en el movimiento del usuario y VOC mejora la experiencia de navegación; en el lado de la logística, obtenemos información sobre la relación entre el tiempo de ayuda del usuario y el tiempo real de estancamiento de la logística y formulamos estrategias de expresión para mejorar la logística. satisfacción del producto; en el dominio de optimización del rendimiento, construimos modelos de correlación subjetiva y objetiva que encuentran los números mágicos del tiempo de inicio y los indicadores de retroalimentación negativa para aclarar los objetivos de optimización; construimos un sistema de etiquetas VOC de múltiples fuentes para utilizar de manera integral el comportamiento del usuario y sus conocimientos sobre VOC. , implementar estrategias de optimización de la experiencia y resumir un conjunto de metodologías de análisis de la experiencia del usuario.

Este artículo es el cuarto de la serie. Para los primeros tres artículos, consulte——

Primera parte: Metodología de análisis de la experiencia del usuario de Taobao

Parte 2: Aplicación y práctica de conocimientos de datos de COV en las páginas de detalles de Taobao

Tercera parte: Diagnóstico y optimización de la experiencia del producto logístico

cae30cec3d965111971558a661153242.png

Prefacio

Los estudiantes a menudo preguntan "¿Cómo evaluar si el trabajo de ciencia de datos está bien hecho?" Los estudiantes de algoritmos pueden observar la precisión de los modelos de algoritmos, y la investigación y el desarrollo de datos pueden observar la cobertura y utilización de los modelos de datos. ¿Qué examinan las matemáticas? El autor cree que las materias de matemáticas necesitan examinar el resultado de los casos.

Basado principalmente en las siguientes consideraciones:

  1. Los casos exitosos deben tener resultados comerciales significativos : la posición de la ciencia de datos es proporcionar soluciones de datos de alta calidad para que el negocio tenga éxito. Los casos exitosos se pueden aprender y consultar. Los casos sin resultados comerciales significativos son más difíciles de probar. Factibilidad, el valor de referencia es bajo.

  2. El caso es una revisión detallada del proceso : bajo la premisa de resultados comerciales significativos, Matemáticas debe demostrar su participación y contribución en el proyecto, y qué nuevas ideas y métodos se utilizaron para ayudar a la empresa a alcanzar sus objetivos. escudriñado, uno de los materiales que se pueden revisar.

  3. Los casos pueden reflejar el nivel de habilidad del autor : Las matemáticas son una materia que enfatiza la habilidad personal. Los casos no se tratan solo de exponer lo que se ha hecho. La cognición y el pensamiento revelados entre líneas pueden reflejar el nivel de habilidad del autor. En particular, la escritura puede tener un período de amortiguación para el pensamiento, y los estudiantes con mala expresión pueden compensar su falta de capacidad mediante la escritura.

Por lo tanto, un caso de ciencia de datos de alta calidad es la base central para probar los resultados. El autor compartirá sus puntos de vista y pensamientos basados ​​en su experiencia en una gran cantidad de casos matemáticos.

1c8645b28eb651a928f65d062c7599d8.png

Introducción al marco BPPISE

Un buen marco puede resaltar los puntos clave de la descripción del caso, reducir el costo del pensamiento estructurado y centrarse en la expresión del contenido. Hay dos marcos estándar de minería de datos comúnmente utilizados en la industria: CRISP-DM y SEMMA . La introducción es la siguiente:

  1. CRISP-DM:

  • comprensión empresarial

  • comprensión de datos

  • preparación de datos

  • modelado

  • evaluación

  • despliegue

MENCIONAR:

  • Muestreo ( Muestra )

  • Explorar _ _

  • Modificar _ _

  • Modelado ( Modelo )

  • Evaluar _ _

Ambos marcos están orientados a problemas de modelado algorítmico y determinista , mientras que la ciencia de datos es una disciplina que se centra en definir y resolver problemas inciertos y requiere un conjunto de problemas de conocimiento analítico orientados a la incertidumbre. A partir del pensamiento y el resumen de una gran cantidad de casos matemáticos, se forma un conjunto de marcos de casos para la ciencia de datos de productos : BPPISE :

BPPISE:

    • Entendimiento empresarial _

    • Definición del problema _

    • Preparación de datos _

    • Perspectivas _ _

    • Implementación de la estrategia _

    • Evaluacion_ _ _

La diferencia entre BPPISE , CRISP-DM y SEMMA es que dado que aún no se ha formado un problema de datos determinista, enfatiza el problema de negocio->etapa de definición del problema de datos, etapa de análisis de conocimiento y etapa de implementación de estrategia; las dos últimas se centran demasiado en el establecimiento e implementación de modelos algorítmicos.La evaluación, BPPISE se centra en el descubrimiento e implementación de oportunidades de negocio basadas en datos.

c24f12ff6f97c6230ebeb347d2bffabb.png

Descripción del proceso BPPISE

▐Comprensión   empresarial

En esta etapa, los estudiantes de matemáticas deben comprender los antecedentes, las necesidades empresariales y los problemas específicos a resolver desde una perspectiva empresarial. Una forma rápida y eficaz de comprender el negocio del lado C es clasificar el recorrido del usuario y clasificar los principales escenarios y recorridos de un determinado producto o servicio desde la perspectiva del usuario. Mientras comprende el negocio, puede hacer suposiciones y juicios cualitativos, clasificar los puntos débiles y las oportunidades en los vínculos comerciales y prepararse para definiciones de problemas posteriores.

El núcleo de la etapa es explicar el estado y los problemas del negocio. Por ejemplo: en el caso de los detalles, describa el estado del negocio y los problemas en una oración: El núcleo de suministro de los factores clave para la toma de decisiones de los detalles se basa en la experiencia de los asistentes de la industria. Algunas industrias se basan en la investigación de los usuarios, pero el alcance es limitado. y la granularidad es tosca y no se puede refinar en categorías. Realice operaciones refinadas desde la dimensión de la multitud.

▐Definición del problema  

Esta etapa requiere definir con precisión los problemas que se pueden resolver con datos en función de los problemas comerciales existentes. La ciencia de datos es una disciplina que convierte "problemas comerciales reales" en "problemas en el mundo de los datos" y luego utiliza teorías, técnicas y herramientas matemáticas para transformar los datos en conocimiento, brindando orientación directa para resolver problemas comerciales. El núcleo son los datos en sí, debemos prestar atención a algunos puntos:

  1. Determinar si hay datos disponibles

    Si los datos necesarios para resolver problemas empresariales simplemente no están disponibles, las matemáticas no servirán de nada.

  2. Seleccione con precisión los datos de destino

    La selección precisa de los datos objetivo permitirá a los matemáticos mantener la dirección y centrarse en el proyecto. Por ejemplo: el proyecto necesita extraer etiquetas de usuario de los comentarios de los usuarios (VOC), y VOC es de múltiples fuentes y multimodales. Múltiples fuentes significa que VOC ocurre en diferentes escenarios (precompra, poscompra) y múltiples -modalidad significa diferentes dificultades de procesamiento. Por lo tanto, las elecciones deben tomarse con precisión en función de los problemas comerciales y el por qué de la selección de datos debe explicarse en el caso.

En el caso de los detalles, el problema de los datos se define como: cómo analizar y resumir los factores clave que afectan la toma de decisiones de los usuarios en detalles basados ​​en el movimiento del usuario y los datos VOC de la consulta del servicio al cliente comercial, y obtener información sobre las diferencias en las decisiones. factores de creación para diferentes grupos de personas en diferentes industrias para guiar la expresión estructurada de detalles y mejorar la eficiencia de conversión de la navegación.

En el caso del rendimiento, el problema de los datos se define como: cómo encontrar un indicador objetivo que esté fuertemente relacionado con la satisfacción, establecer metas razonables, tener en cuenta el retorno de la inversión técnica y mejorar eficazmente la satisfacción subjetiva del rendimiento del usuario.

▐Preparación de datos  

Esta etapa se refiere principalmente a la recopilación, procesamiento y preprocesamiento de datos, que es una parte importante de la ciencia de datos. Debido a que suele ser algún medio convencional de ETL, muchos estudiantes no saben cómo escribir cuando escriben casos. Se recomienda resaltar aquí las características especiales del caso.

Por ejemplo: el caso detallado implica la preparación de datos de movimiento del usuario, centrándose en cómo definir las especificaciones de los puntos enterrados a nivel de módulo y el proceso de adquisición de datos dentro de la página, que es diferente de la adquisición de datos a nivel de página convencional; implica el procesamiento y adquisición de etiquetas de texto VOC, centrándose en cómo mejorar la eficiencia del procesamiento de datos mediante la introducción de capacidades de agrupación de VOC en el contexto de una participación empresarial limitada.

En general, se centra en qué ideas y métodos se deben utilizar para garantizar una producción de datos posterior limpia, consistente, confiable y utilizable para ayudar al proyecto a obtener resultados más precisos.

▐Perspectiva   _

La etapa de análisis y comprensión es el núcleo del caso de las matemáticas. El marco general se puede subdividir en:

  • Analizar problemas

Los diferentes objetos de análisis explican los problemas de análisis de diferentes maneras:

008e262fc1239dcb4210d424ac529806.png

  • análisis de ideas

Árbol lógico (árbol de cuestiones/árbol de hipótesis)

d7a22ae27d0a596a43ef307167974536.png

  • Dimensiones de análisis

Profundice en el pensamiento de la selección de dimensiones, cómo seleccionar con precisión las dimensiones de análisis para mejorar la eficiencia del análisis, en lugar de desperdiciar innecesariamente recursos de análisis en una gran cantidad de desgloses multidimensionales.

  • Indicadores de análisis

Explique el nombre del indicador, el calibre del indicador, el significado comercial representado por el indicador, etc.

  • Conclusión del análisis

En la conclusión del análisis cabe señalar los siguientes puntos:

El argumento es claro

Al analizar la conclusión se debe prestar atención a tener un argumento central claro, durante el proceso de redacción se debe incluir el contenido relacionado con el argumento y descartar el contenido irrelevante. Se recomienda que una cuestión se centre únicamente en un argumento central para evitar "perder el foco".

Combinando figuras, tablas y texto.

La conclusión del análisis debe tener argumentos y evidencia, y los cuadros de análisis de datos son la mejor evidencia fáctica objetiva. Generalmente, los diagramas se utilizan para describir cambios en la tendencia comercial general, la relación de tamaño de las tendencias dimensionales y la relación de composición entre hijos y padres, etc., mientras que las tablas se utilizan para describir en detalle los resultados del análisis . Además, los estudiantes de matemáticas también deben realizar resúmenes textuales, deducciones y explicaciones del contenido de los cuadros.

Reducir la especulación subjetiva innecesaria

No todas las conclusiones del análisis pueden estar compuestas de resultados objetivos y fácticos, e inevitablemente incluirán las especulaciones, juicios, etc. del autor. Cuando los estudiantes de matemáticas escriben conclusiones de análisis, deben tratar de reducir especulaciones subjetivas innecesarias, y las inferencias subjetivas que hacen también deben basarse en hechos objetivos tanto como sea posible, y no deben hacer juicios apresurados basados ​​únicamente en la experiencia.

  • salida de la estrategia

El resultado de la estrategia es el final de toda la fase de análisis e información. Las matemáticas deben centrarse en cada conclusión del análisis y dar sugerencias de optimización del producto basadas en su propia comprensión del negocio. En particular, el resultado de la estrategia debe seguir el ritmo de adopción e implementación empresarial, de modo que la estrategia pueda analizarse y ajustarse más a fondo en el proceso. Se puede organizar a través de la siguiente tabla:

86a8b4692b425d45e13b7478ac4f42e0.png

▐Estrategia   _

La implementación de la estrategia es una etapa clave para demostrar la contribución del caso de Matemáticas. Es necesario establecer claramente si la transformación del producto se refiere a la conclusión del análisis anterior y el alcance de la referencia. Al mismo tiempo, se presenta cómo las Matemáticas implementan el negocio. de manera rítmica basada en las estrategias anteriores.

Los métodos de implementación de la estrategia se pueden explicar de manera concisa y clara a través del diagrama de demostración del producto + sugerencias de estrategia.

afeb2bc228e39a3ff169dc93b0ee9cbf.png

▐Evaluación   _

Las estrategias de optimización de productos suelen verificar el efecto mediante experimentos AB, experimentos de baja respuesta (PSM, etc.). Tomando el experimento AB como ejemplo, el diseño experimental y las cifras de efectos específicos deben darse tanto como sea posible en el caso. Incluyendo: diseño jerárquico experimental, ritmo de expansión de volumen experimental, diseño de indicadores experimentales y efectos comparativos experimentales. En particular, cuando los resultados de la comparación de indicadores muestran fluctuaciones anormales, se deben proporcionar resultados de verificación científica experimental, como comparación de grupos AA, pruebas de significancia, etc.

d9e74d2f658261acde796962e22e0706.png

introducción del equipo

Somos el equipo técnico de ciencia de datos de cumplimiento de transacciones de Taobao, responsable de extraer DAU, DAC y oportunidades de crecimiento de la experiencia del usuario a partir de datos masivos en los enlaces de cumplimiento de transacciones de Taobao (pedidos, pagos, carrito de compras, logística, inversión, etc.). El equipo está comprometido a obtener información sobre las necesidades de los usuarios basándose en las rutas de comportamiento del usuario y el VOC del usuario, y a mejorar la experiencia de compra del consumidor basándose en las estrategias de alcance, conversión, recompra y experiencia de hacer coincidir los vínculos de transacciones entre personas y bienes.
El equipo está actualmente reclutando y damos la bienvenida a talentos destacados con experiencia en análisis de datos/ciencia de datos en consumo, productos básicos, comercio, marketing y otros campos relacionados para que se unan. Si está interesado, envíe su currículum a [email protected] .

¤Ampliar  lectura¤  _

Tecnología 3DXR  |  tecnología de terminales  |  tecnología de audio y vídeo

Tecnología del lado del servidor  |  Calidad técnica  |  Algoritmo de datos

Supongo que te gusta

Origin blog.csdn.net/Taobaojishu/article/details/132769616
Recomendado
Clasificación