Problema de producto recomendado por SQL

Tabla de contenido

0 necesidades

1 mesa de construcción

2 Análisis de datos

3 Resumen


0 necesidades

Dado un registro de la compra de un artículo por parte de un usuario, devuelva cada artículo que el usuario pueda querer comprar. Si otros usuarios y este usuario compran al menos dos productos idénticos, entonces el producto comprado por otros usuarios y no comprado por este usuario es el producto que este usuario puede querer comprar.

Los datos son los siguientes:

用户id、商品id
A 1
A 2
A 1
A 3
B 2
B 3
B 4
B 5
B 2
C 1
C 2
C 1
D 1
D 3
D 6

1 mesa de construcción

create table product as 
select 'A' as user_id,'1' product_id
UNION ALL
select 'A' as user_id,'2' product_id
UNION ALL
select 'A' as user_id,'1' product_id
UNION ALL
select 'A' as user_id,'3' product_id
UNION ALL
select 'B' as user_id,'2' product_id
UNION ALL
select 'B' as user_id,'3' product_id
UNION ALL
select 'B' as user_id,'4' product_id
UNION ALL
select 'B' as user_id,'5' product_id
UNION ALL
select 'B' as user_id,'2' product_id
UNION ALL
select 'C' as user_id,'1' product_id
UNION ALL
select 'C' as user_id,'2' product_id
UNION ALL
select 'C' as user_id,'1' product_id
UNION ALL
select 'D' as user_id,'1' product_id
UNION ALL
select 'D' as user_id,'3' product_id
UNION ALL
select 'D' as user_id,'6' product_id

2 Análisis de datos

El primer paso es deduplicar los datos de la tabla, según las dimensiones del usuario y del producto.

with t1 as(
select user_id,product_id
from product
group by user_id,product_id
)
user_id product_id
A       1
A       2
A       3
B       5
B       4
B       3
B       2
C       2
C       1
D       6
D       1
D       3

(2) Cómo saber que otros usuarios han comprado el mismo producto que este usuario.Para averiguar esta relación de sangre, generalmente es autoasociación

with t1 as(
select user_id,product_id
from product
group by user_id,product_id
)
select a.user_id as user_id1, b.user_id as user_id2, a.product_id
from t1 a
join t1 b
on a.product_id = b.product_id
where a.user_id!=b.user_id
user_id1        user_id2        a.product_id
A       C       1
A       D       1
A       B       2
A       C       2
A       B       3
A       D       3
B       A       2
B       C       2
B       A       3
B       D       3
C       A       1
C       D       1
C       A       2
C       B       2
D       A       1
D       C       1
D       A       3
D       B       3

(3) A través del paso 2, se pueden encontrar todos los usuarios que compraron el mismo producto que el usuario y los usuarios que compraron al menos 2 productos idénticos en pares

with t1 as(
select user_id,product_id
from product
group by user_id,product_id
)
,t2 as
(
select a.user_id as user_id1, b.user_id as user_id2, a.product_id
from t1 a
join t1 b
on a.product_id = b.product_id
where a.user_id!=b.user_id
)
select user_id1,user_id2
from t2
group by user_id1,user_id2
having count(1) >=2
user_id1        user_id2
A       B
A       C
A       D
B       A
C       A
D       A

Después del paso 3, se puede obtener la tabla de relación de usuarios con la misma tendencia de comprar el mismo producto más de 2 veces

(4) Según la tabla de relaciones, obtener los productos comprados por el usuario y usuarios con la misma tendencia

with t1 as(
select user_id,product_id
from product
group by user_id,product_id
)
,t2 as
(
select a.user_id as user_id1, b.user_id as user_id2, a.product_id
from t1 a
join t1 b
on a.product_id = b.product_id
where a.user_id!=b.user_id
)
,t3 as
(select user_id1,user_id2
from t2
group by user_id1,user_id2
having count(1) >=2
)
select t3.user_id1,t3.user_id2,a.product_id product_id_2
from t3
left join t1 a
on t3.user_id2 = a.user_id
t3.user_id1     t3.user_id2     product_id_2
A       B       2
A       B       3
A       B       4
A       B       5
A       C       1
A       C       2
A       D       1
A       D       3
A       D       6
B       A       1
B       A       2
B       A       3
C       A       1
C       A       2
C       A       3
D       A       1
D       A       2
D       A       3

Infórmese de los productos que el usuario debe recomendarle (se repetirán las recomendaciones de productos)

with t1 as(
select user_id,product_id
from product
group by user_id,product_id
)
,t2 as
(
select a.user_id as user_id1, b.user_id as user_id2, a.product_id
from t1 a
join t1 b
on a.product_id = b.product_id
where a.user_id!=b.user_id
)
,t3 as
(select user_id1,user_id2
from t2
group by user_id1,user_id2
having count(1) >=2
)
select user_id1,product_id_2
from
(select t3.user_id1,t3.user_id2,a.product_id product_id_2
from t3
left join t1 a
on t3.user_id2 = a.user_id
) t
group by user_id1,product_id_2
user_id1        product_id_2
A       1
A       2
A       3
A       4
A       5
A       6
B       1
B       2
B       3
C       1
C       2
C       3
D       1
D       2
D       3

(5) Calcule la diferencia y descubra los productos recomendados con precisión. El método de cálculo de la diferencia en colmena utiliza la combinación izquierda + es nulo para juzgar y obtener

with t1 as(
select user_id,product_id
from product
group by user_id,product_id
)
,t2 as
(
select a.user_id as user_id1, b.user_id as user_id2, a.product_id
from t1 a
join t1 b
on a.product_id = b.product_id
where a.user_id!=b.user_id
)
,t3 as
(select user_id1,user_id2
from t2
group by user_id1,user_id2
having count(1) >=2
)
,t4 as
(select user_id1,product_id_2
from
(select t3.user_id1,t3.user_id2,a.product_id product_id_2
from t3
left join t1 a
on t3.user_id2 = a.user_id
) t
group by user_id1,product_id_2
) 
select t4.user_id1 as user_id,t4.product_id_2 as product_id
from t4
left join t1
on t4.user_id1 = t1.user_id
and t4.product_id_2 = t1.product_id
where t1.product_id is null
user_id product_id
A       4
A       5
A       6
B       1
C       3
D       2

3 Resumen

Esta pregunta examina principalmente la comprensión de la asociación y obtiene resultados a través de varias transformaciones de asociación. A través de esta pregunta, puede obtener comprensión: para obtener la relación mutua entre los datos de la tabla, solo se puede obtener la autoasociación; para obtener el conjunto de diferencias, debe obtenerlo en la forma de combinación izquierda + es nulo, no hay intersección, diferencia ni unión de matrices en la función Hive, por lo que solo se puede usar la asociación para obtener el resultado.

Supongo que te gusta

Origin blog.csdn.net/godlovedaniel/article/details/126798308
Recomendado
Clasificación