[Análisis de los datos], mientras que comer albóndigas, el flujo de datos de análisis mientras que el pensamiento!

Reproducido Fuente: https://mp.weixin.qq.com/s/6KdKczONYngcFg8qZuV-Kg

 

juegos previos

Festival de albóndigas Bueno, de repente quiere comer albóndigas, se supone que vamos a comprar bolas de masa hervida cantan! Ahora el cambio de escena si, suponiendo que usted es una red dieta analista de datos, ahora algunas bolas de masa hervida Magnate quieren tomar el dinero para dejar a su jefe (publicidad).

Jefe: "las joyas vienen aquí."

Joyas: "Sí Boss"

Jefe: "Hay una comunidad albóndigas tirano de golpearnos."

Joyas: "¿Quién se atreve a golpear a su jefe como la gente espera de mí?"

Jefe: "Estoy pidiendo es la forma en que la carga!"

Joyas: "Vaya por delante jefe, le dan una oferta la próxima semana, los informes"

(Relación ANTECEDENTES soplado End)

Como un analista de datos se podría pensar de la CPC, CPS este tipo de palabras clave, pero al final se carga o de otra manera utilizar el CPC, la forma de facturación, a la que la promoción de la línea del canal? Lo que puede ser adecuado para los usuarios albóndigas magnate? Estas cuestiones deben página web de su empresa para un tráfico de datos completos recogidos de una profunda comprensión del análisis.

 

contenido Introducción

Personal y análisis de negocio etapa de aprender a entender, recolección de datos de contenido al análisis usuario (indicadores de rendimiento KPI) se puso en marcha esta línea siguiente. Los principales contenidos del directorio son los siguientes:

 

Análisis de datos de tráfico

Recolección de datos

Lo que se "Buried"?

Para decirlo claramente es que los datos de cobro revertido, lo primero que se piensa podría ser gatear reptiles, pero hay que averiguar, está ahora en línea de productos de la compañía, no se sube a través del reptil "joyas ×× buscar elementos apuntan a abrir la caja", por lo los eventos conductuales que? esto es, obviamente, poco realista.

¿Cómo ese evento como éste los datos del comportamiento del usuario que recoge? La respuesta es por "Buried" Buried llamada, se refiere al caso por el comportamiento de captura de usuario, las tecnologías relacionadas y el proceso de implementación y de envío.

Para el castaño: Si el personal de operaciones internas Jingdong quieren ver la figura de abajo " bolas de masa hervida aman Festival del Bote del Dragón efecto" esta actividad, los investigadores pueden colocar en el sentido de "Buried" por la flecha roja en la siguiente figura, cuando el usuario hace clic en este campo, de fondo se activará y reportar un usuario haga clic datos tales comportamientos.

 

Umaten acción?

  1. Para la supervisión del tráfico (situación en línea, PV, análisis del índice de UV, etc.)

  2. camino de construcción para facilitar el comportamiento de los usuarios (Buried adquirido de enlace de datos del comportamiento del usuario)

  3. Por el análisis de los puntos de venta y otros datos para determinar la eficacia del producto y la campaña y la dirección futura

  4. Monitoreo de aplicaciones en ejecución, fácil de localizar y rastrear problemas

  5. Proporcionar datos para apoyar las decisiones de marketing

  6. Implementación de AB Testting

campos de adquisición y de flujo de datos en la tabla subyacente

Cuando Buried Con el fin de recopilar datos, pero no todos los datos que deben recogerse para arriba. En primer lugar tiene que saber cuáles son las necesidades de negocio, como jefe ahora quieren ver los últimos siete días de tendencia DAU, esta vez hay que pensar en la forma de calcular los analistas DAU, y el producto tras otro para discutir cómo se puede conseguir un punto "campo" enterrado con en el cálculo de la DAU (un punto de notificación puede ser enterrado cuando el usuario la identificación de inicio de APP).

En el funcionamiento real, los siguientes aspectos de los datos pueden ser adquiridos:

  1. Característica del sistema de atributos de usuario

    1. sistema operativo

    2. navegador

    3. nombre de dominio

    4. La velocidad de acceso

    5. estado de la red (2G, 3G, 4G, etc.)

    6. otro

  2. Características del acceso del usuario

    1. el tiempo de acceso de inicio

    2. Al final del tiempo de acceso,

    3. La primera visita, la última visita

    4. Haga clic en el URL

  3. características de usuario de origen

    1. Tipo de red de información de contenido

    2. categoría de contenido

    3. visita URL

  4. Características del producto

    1. Código de producto

    2. Categoría de producto

    3. color

    4. precio

    5. Cantidad, etc.

En resumen, se puede recopilar datos de tráfico que subyacen en la tabla de abajo (ejemplificado aquí, solamente un simple, más su propio Ahora Reflexión):

 

El procesamiento de datos (ETL)

Objetivo : De acuerdo a las necesidades de seguimiento estadístico indicadores separados por filtración de varios temas (en varios trayectoria temas) datos básicos (Tabla crean representación intermedia diferente).

Método : General de HQL directamente por las dimensiones de extracción y datos de métricas (extraídos de la original puede ser difícil tabla de colección subyacente, los datos de la tabla original también necesita pasar por el sistema de negocio a través de la extracción de ETL, lavado cargado en el almacén de datos después de la conversión). Después de la fundación se puede basar en la curación de negocios indicadores de necesidades guión, empujado a la plataforma de BI para informar pantalla interna.

Para las castañas , el cálculo de casi un 7 por UV, la conexión del usuario y el acceso IP y otros indicadores:

SELECT  dt,  COUNT(DISTINCT deviceid) AS uv ,  COUNT(DISTINCT CASE WHEN length(trim(user_id)) > 0 THEN user_id else NULL end) AS login_users ,COUNT(DISTINCT ip) AS ip_num ,COUNT(session_id)  AS session_num FROM  dwd_caiji_table WHERE  dt between sysdate(-7) and sysdate()GROUP BY  dt

problema :

Muchos de mis amigos les gustaría ser extraído por los datos anteriormente mencionados HQL en lugar de SQL, de hecho, el propósito del diseño HIVE-SQL es dejar que SQL y no MapReduce personas de programación también se puede utilizar Hadoop para procesar datos (después de todo, del real de la empresa la cantidad de datos es la tuberculosis, PB aún mayor).

Populares grandes datos asociados marco computacional puede manejar grandes cantidades de datos y de computación, depende básicamente de la plataforma de computación distribuida (como MapReduce), y distribuido de computación, es un clúster compartido tareas de computación, el estado ideal se calcula para cada nodo debe asumir una cantidad similar de datos de tareas de computación, pero la realidad puede ser debido a un grave desequilibrio en la distribución de los datos conducir a sesgo de los datos.

Por eso, cuando la necesidad de considerar los problemas de datos ETL haciendo de inclinación, el contenido relevante mucho tu opinión.

 

Indicadores de Estadísticas y Análisis de usuarios

Descripción : Debido a las limitaciones de espacio, el directorio 3,4 ensartados.

Datos de producto es de muy buena, las ventajas de :

  1. Visualización: Visualización del comportamiento de los usuarios, puede ser un claro entendimiento del comportamiento del usuario

  2. La trazabilidad: problema posicionamiento del producto

  3. Verificar: soporte de datos y la verificación

  4. Predecible: los cambios de datos, predicho huelga finales

Los datos se basan en la premisa necesita algunos indicadores a medida, aquí a joyas indicadores de las métricas de tráfico y las métricas de comportamiento de los usuarios del sitio, lo que significa que parte de casi indicadores de análisis universales , basado en una parte del conjunto de escenas diferentes requisitos empresariales .

Para el significado específico de cada indicador, si usted no entiende la necesidad de mirar a sí mismo. Tenemos que entender que cada indicador definido papel .

Para las castañas , DAU:

Definiciones : Daily activa del usuario (usuarios activos al día)

Papel : el usuario puede medir el producto (como Jingdong app) de la actividad, se puede utilizar para comprender y reducir las tendencias de crecimiento de abonado.

Ahora se va a dividir en dos categorías en el foco de hablar de algunos de los puntos de vista de los usuarios joyas análisis (indicadores de rendimiento KPI), los primeros usuarios analizar individual, uno es la base del análisis, se trata de un modelo de análisis estratégico. Dijo que el simple punto es que desea indexar la base del análisis, se ajustó la estrategia operativa, y de acuerdo a las diferentes necesidades de negocio, modelo de usuario del sistema de generación.

 

1, el análisis básico

indicadores de análisis Fundamentales divide en dos, una es para un nuevo usuario, el antiguo es para el usuario, y el nuevo usuario correspondiente a tirar de nuevo y conversión . Y para los usuarios antiguos se pueden dividir en activo, conservado, de recompra . Para el castaño:

Nuevo tirón (canal) :

Jingdong tienden a tener APP, terminal móvil, al final de micro-canales, el canal del lado del PC, donde el énfasis es diferente de acuerdo a los diferentes negocios, tráfico, junto con los teléfonos celulares y dispositivos móviles cada vez más inteligente de la pantalla grande, en circunstancias normales, el día del proveedor de electricidad 618 datos muestran que los usuarios que no son PC de consumo final más. Ahora las empresas prestan más atención a la comercialización de extremo no-PC (micro-canales, APP, terminal móvil), se entiende que los dispositivos y canales utilizados por el usuario puede realizar las operaciones y maximizar los beneficios.

transformación :

Se refiere a la relación entre el número de usuarios para acceder a la objetivo correspondiente de la operación para el número total de visitas. La acción apropiada puede ser un inicio de sesión de usuario, registro de usuarios, los usuarios se suscriban a, descarga, los usuarios compran una serie de comportamiento de los usuarios, la tasa de conversión del sitio web es un concepto amplio. En resumen, cuando los visitantes al sitio, el visitante convierten en sitio del usuario residente, los visitantes también pueden entenderse como la conversión para el usuario.

 

 

Para los viejos usuarios activos, conservado, salto, la recompra de la empatía puede estar directamente relacionado a una búsqueda por palabra clave en su propia lectura.

 

2, la estrategia de modelo de análisis

Creo Dale a un hombre un pez que dar la pesca, esto es una parte muy importante del contenido, es imposible dejar claro en un tweet. Aquí estos enlaces para aprender algunos ponen correspondiente pieza de referencia, queda mucho por comprender su visión:

Evento comportamiento del modelo de usuario :

http://www.woshipm.com/data-analysis/686576.html

El análisis de rutas de comportamiento de los usuarios :

http://www.woshipm.com/data-analysis/704261.html

La experiencia del usuario Analytics :

http://www.woshipm.com/discuss/53005.html.

https://www.jianshu.com/p/f10f706d3ddd?from=groupmessage

análisis retrato del usuario :

https://mp.weixin.qq.com/s/ZBdRn8nBLQk9Qp049c_tqQ

El valor del cliente puntuación y la precisión de marketing :

https://wenku.baidu.com/view/7e156f087275a417866fb84ae45c3b3567ecdd18.html

Embudo Modelo :

http://www.woshipm.com/data-analysis/697156.html

Tráfico Monetización :

https://baike.baidu.com/item/%E6%B5%81%E9%87%8F%E8%B4%A7%E5%B8%81%E5%8C%96/17219976

 

Artículo de referencia :

https://www.cnblogs.com/yjd_hycf_space/p/7772722.html.

https://www.cnblogs.com/shujuxiong/p/10218727.html.

https://blog.csdn.net/haoyuexihuai/article/details/53453100.

https://blog.csdn.net/wuxintdrh/article/details/81990385.

https://www.admin5.com/article/20180629/862661.shtml.

Publicado 44 artículos originales · elogios ganado 16 · Vistas a 10000 +

Supongo que te gusta

Origin blog.csdn.net/YYIverson/article/details/105078696
Recomendado
Clasificación