Colmena Indicadores de análisis de datos de uso común-Indicadores de datos de acceso web-Indicadores de actividad del usuario-Indicadores de comportamiento pagados

Directorio de artículos


      Aquí hay algunos indicadores de análisis de datos de uso común, y aumentarán lentamente los indicadores utilizados en su trabajo e incluso creados. En cuanto a sql, agréguelo lentamente.

1. Indicadores de datos de acceso web

1. Visitante independiente de UV (UniqueVisitor)

      uv-número de visitantes únicos: el número de todos los visitantes en un día. Esa es la cantidad de deduplicación de uid en un día.
      El terminal de cliente independiente (computadora, teléfono móvil, teclado, etc.) visitado es un visitante independiente, y la dirección MAC se utiliza técnicamente como la identificación de identificación única. En teoría (limitado a la teoría), el terminal de acceso repetido de 24 horas solo se cuenta una vez. (PD: UV también es diferente del comportamiento de visita de las visitas. Las visitas generalmente toman media hora como período estadístico de deduplicación).

2. Vistas de página PV (Vista de página)

      pv-El número total de visitas en un día. El número de veces que se visita una página web también se puede referir simplemente al número de visitas o visitas. Algunas herramientas estadísticas calculan el PV cada vez que el usuario actualiza (esta es también una de las razones del alto PV de muchos sitios web). Debido a que los datos PV suelen ser uno de los indicadores de datos más altos (UV / IP / RU / WAU), entonces El número de visitas al sitio web es actualmente el calibre más utilizado en las estadísticas publicadas por las compañías de Internet.

3. (Protocolo de Internet) IP independiente

      4. Agregar IP. Es decir, una identificación que nunca antes había aparecido, es decir, el número de todas las IP que se han deduplicado en un día y que nunca han aparecido en los datos históricos.

select count(distinct dataclear.cip) 
from dataclear 
where dataclear.reportTime = '2020-02-17'
and cip not in
(
	select dc2.cip 
	from dataclear as dc2 
	where dc2.reportTime < '2020-02-17'
);

4. BR (tasa de rebote) tasa de rebote

      Se refiere a la página de destino (página de destino), sin hacer clic para ingresar a ninguna otra página u otro comportamiento interactivo, es decir, el porcentaje de visitantes que dejan directamente la visita a la página de destino. Este indicador puede medir la calidad de una página web o un sitio web.

/* 等几天再写字段和表啥意思   */
select 
	round(br_taba.a/br_tabb.b,4)as br 
from (
	select 
	count(*) as a 
	from (
		select ssid from dataclear
		where reportTime='2020-02-17' 
		group by ssid 
		having count(ssid) = 1) as br_tab
	) as br_taba,
	(select
		count(distinct ssid) as b 
	from dataclear 
	where reportTime='2020-02-17'
) as br_tabb;

2. Indicadores estadísticos de los datos de actividad del usuario.

1. RU (usuarios registrados) usuarios registrados

      El número de usuarios que han completado el registro, los datos estrictos deben ser el número de usuarios registrados que se han activado mediante una verificación válida, y los datos ampliados se pueden completar y enviar para enviar la información de registro.

2.AU (usuarios activos) usuarios activos

      Usuarios que han iniciado sesión o han utilizado un producto dentro de un cierto período de tiempo.

3.DAU (Usuario activo diario) usuarios activos diarios

      Número de usuarios que inician sesión o usan un producto en un solo día (excluyendo usuarios que inician sesión repetidamente). Por lo general, el sitio web de pago tipo juego adoptará el concepto de DAU.

4. MAU (usuarios activos mensuales) usuarios activos mensuales

      Extienda el período estadístico DAU a un mes, que son los datos MAU.

5.DNU (nuevos usuarios diarios) nuevos usuarios diarios

      Es decir, el número de usuarios recién registrados y registrados ese día.

6. ACU (Promedio de usuarios concurrentes) promedio de usuarios simultáneos en línea

      El número promedio de usuarios simultáneos en línea generalmente se divide por el número total de usuarios simultáneos en línea por hora dentro de las 24 horas dividido por 24 horas.

7. PCU (usuarios de Peakconcurrent) los usuarios en línea simultáneos más altos

      El mayor número de usuarios en línea al mismo tiempo en 24 horas. Si desea un mayor rendimiento de datos, generalmente puede usar el valor del mayor número de usuarios simultáneos en línea dentro de una hora; si es más estricto, también puede contar el valor pico instantáneo del número de usuarios simultáneos en línea en un segundo determinado.

8. El tiempo promedio en línea de los usuarios de TS (gasto de tiempo)

      La duración total de todos los usuarios en línea dividida por el número de usuarios en línea en el período.

9. Tasa de retención de usuarios URR (Users RetentionRate)

      Entre los nuevos usuarios, los usuarios que aún están activos después de un cierto período representan la proporción del total de nuevos usuarios. Es relativamente estricto calcular de acuerdo con diferentes días de intervalo como la unidad de período estadístico; de acuerdo con las características de frecuencia de diferentes productos, es relativamente más razonable calcular de acuerdo con el intervalo semanal como la unidad estadística, porque pocos productos requieren que los usuarios inicien sesión todos los días Usado
      Retención al día siguiente: Retención al día siguiente el 1 de enero de 2020 = Número de visitantes que visitaron el 1 de enero de 2020 y que aún visitaron el 2 de enero de 2020 / Número de usuarios que visitaron el 1 de enero de 2020.
      Retención para los próximos 7 días: Retención para el día siguiente el 1 de enero de 2020 = Número de visitantes que visitaron el 1 de enero de 2020 y que aún visitaron el 8 de enero de 2020 / Número de usuarios que visitaron el 1 de enero de 2020
      Nota: Los siguientes 7 días de retención se refieren a visitar hoy y visitar nuevamente 7 días después; en lugar de visitar hoy, visite cualquier día dentro de 7 días a partir de hoy.

/* 
	cuid是访客的id。
	这里使用了笛卡尔积,其实使用left join也可以。
*/ 
select
	count(cuid) ci,
	count(cuid)/t11.uv  ciL 
from 
(
	select
		cuid	
	from tb_cuid_1d 
	where event_day = "20190101"
	group by cuid
) t1 
join 
(
	select
		cuid	
	from tb_cuid_1d 
	where event_day = "20190102"
	group by cuid
) t2 on t1.cuid = t2.cuid
,(
	select 
		count(cuid) uv
	from 
	(select 
		cuid
	from tb_cuid_1d 
	where event_day = "20190101"
	group by cuid
) t11
;

10.Tasa de abandono del usuario UCR (tasa de rotación de usuarios)

      Un grupo de conceptos opuestos a "tasa de retención de usuarios" se refiere a usuarios que no tienen actividades activas, como el uso de inicio de sesión después de un cierto período de nuevos usuarios.
      Tasa de rotación de usuarios = (tasa de retención de 1 usuario) * 100% de cálculo

3. Indicadores estadísticos de los datos de comportamiento de pago de los usuarios.

1.PU (usuario que paga)

      Usuarios que han pagado comportamiento. Este indicador debilita el trasfondo del ciclo estadístico, por lo que no se usa comúnmente en las estadísticas de datos.

2. Tasa de conversión pagada CR (ConversionRate)

      Entre los nuevos usuarios, nuevos usuarios con comportamiento de pago dividido por el número total de nuevos usuarios. Esta fórmula es similar al indicador de tasa de conversión de pago en las compras en línea de comercio electrónico.

3. ARPU (Ingresos promedio por usuario) ingresos promedio por usuario

      Una medida de un determinado producto pagado o nivel de ingresos comerciales dentro de un período de tiempo. Generalmente, los operadores de telecomunicaciones o las compañías de juegos en línea adoptan más, mientras que el comercio electrónico minorista usa menos.

4. ARPPU (Ingresos promedio por usuario que paga) ingresos promedio por usuario que paga

      ARPPU = Ingresos totales en un período determinado / Número total de PU en este período.

5. APA (Active PaymentAccount) usuarios activos de pago

      Se refiere al número de usuarios pagos (PU activos) que permanecen activos durante el período estadístico. Los usuarios aquí generalmente están sujetos a la identificación de registro de usuario. Es necesario excluir a los usuarios de pago silencioso (PU silencioso) que tuvieron un comportamiento pagado pero que no tuvieron un comportamiento activo durante el período estadístico.

6. Tasa de pago del usuario PUR (Paying User Rate)

      La fórmula de cálculo es: APA / AU, generalmente basada en los usuarios activos dentro de un período estadístico específico. Se refiere al número de usuarios de pago activos (APA) en el período estadístico dividido por el número total de usuarios activos (AU) en el período.

7. Valor del ciclo de vida del LTV (Life Time Value)

      El valor total de todos los beneficios económicos aportados por el usuario durante todo el ciclo de vida desde el primer inicio de sesión hasta el último inicio de sesión. Dado que el ciclo de vida del usuario suele ser difícil de contar, en la práctica, se usa más "LTV_N" para contar el valor total aportado por los nuevos usuarios dentro de N días después del primer inicio de sesión. Este indicador es más flexible y práctico.

3. Resumen

      Los anteriores son solo algunos de los términos estadísticos más utilizados para los datos operativos. No se puede decir que sea un libro completo. Hay muchos indicadores de datos más detallados en la operación de juegos y aplicaciones.
      Con las diferentes formas de productos y etapas del ciclo de vida, los indicadores de análisis de datos sesgados tendrán algunas diferencias, y los indicadores de análisis estadístico de datos también continuarán innovando. Siempre que sea eficaz analizar los datos de los productos y negocios que opera, también puede crear nuevos indicadores de análisis estadístico de datos usted mismo. Esto no es un privilegio solo para ciertas autoridades.

4. No sé de qué se trata

      Soy joven e ignorante, hay algunos indicadores que no saben cómo clasificar. . .

1. vv (no W, pero dos V)

      vv (no W, sino dos V): el número de sesiones independientes, el número de sesiones en un día, es decir, el número de ssid (el campo que identifica la sesión) dentro de un día después de la deduplicación.

2. Agregar nuevos clientes.

      El número de nuevos clientes. Es decir, clientes que nunca han aparecido antes (puede usar un campo como el identificador único del cliente y usar este campo para filtrar), similar a agregar una IP. Es decir: el número de id_usuario dentro de un día (suponiendo que este campo se use como el identificador único del cliente) y nunca ha aparecido en los datos históricos.

3. Duración media de la visita.

      Duración promedio de acceso: La duración promedio de acceso de todas las sesiones en un día (hay un campo en la tabla que registra el tiempo de acceso, suponiendo tiempo). La duración de una sesión = el valor máximo de todos los tiempos de acceso en una sesión, el valor mínimo de todos los tiempos de acceso en una sesión. (Esto no está claro, lo estudiaré más tarde)

select avg(atTab.usetime) as avgtime 
from
(	select max(stime) - min(stime) as usetime 
	from dataclear 
	/*  reportTime 是访问时间*/
	where reportTime='2020-02-17' 
	group by ssid
) as atTab;
48 artículos originales publicados · Me gusta 36 · Visitas 130,000+

Supongo que te gusta

Origin blog.csdn.net/weixin_42845682/article/details/105128496
Recomendado
Clasificación