Retrato del cliente

Retrato del cliente Paso
1: selección de variables

  • Consolidar datos, asumiendo más de 800 variables.
  • Eliminar variables no disponibles
  • Análisis de agrupamiento / correlación de variables, combinado con enfoque comercial para seleccionar variables
  • Inicialmente pruebe la agrupación y elimine las variables
    que no tienen efecto en la agrupación , suponiendo que haya 50 variables en este momento, luego realice la agrupación jerárquica en estas 50 variables y luego determine la agrupación más estable (k) en función del coeficiente rand Suponiendo que encontramos que k = 10 es la más estable, significa que las variables se dividen en 10 categorías y finalmente se eliminan las 50 variables asignadas a estas 10 categorías. Por lo general, podemos usar la primera de cada categoría en estas 10 categorías. Una variable para representar la clase, obteniendo así 10 variables, para lograr el propósito de la reducción de la dimensionalidad; lo
    anterior es usar el agrupamiento jerárquico para reducir la dimensionalidad de la variable, además de este método, si el caso no requiere la variable original, El análisis de componentes principales también se puede utilizar para lograr la reducción de la dimensionalidad. Al estirar 50 variables, se construyen nuevas variables relacionadas con las variables, y luego las variables que pueden explicar mejor el 80% del modelo original se seleccionan como nuevas variables, y las restantes solo se descartan. Puede explicar el 20% de las variables y también lograr la reducción de dimensionalidad
  1. Se determina el número de grupos (k)
  • De acuerdo con el proyecto y las necesidades comerciales, determine inicialmente el valor de k (3-8), use el algoritmo K-Means para agrupar
  • Configure grupos de 3-8 grupos y calcule estadísticas relacionadas (R ^ 2), y seleccione un rango razonable de grupos basados ​​en las estadísticas (5-6)
  • Al comparar los grupos (bondad de agregación o coeficiente de perfil) a través de indicadores clave, se encuentra que algunos grupos son relativamente similares y la proporción de grupos es muy pequeña cuando se utilizan 6-7 grupos. Creemos que solo se necesitan seleccionar 5 grupos
  1. Cuantifique cada grupo cuantitativamente
  • Elija la dimensión necesaria para dibujar al cliente y calcule su media / distribución entre grupos
  • Sobre la base de estos promedios / distribuciones y otros grupos o indicadores generales, comprender las características del grupo.
Publicado 69 artículos originales · elogiado 11 · 20,000+ visitas

Supongo que te gusta

Origin blog.csdn.net/weixin_41636030/article/details/94361537
Recomendado
Clasificación