MapReduce练习案例4 -求共同好友

更多大数据专栏文章请点击 : –> 小马哥大数据专栏博文导航 <–

4.1 需求

以下是qq的好友列表数据,冒号前是一个用户,冒号后是该用户的所有好友

A:B,C,D,F,E,O
B:A,C,E,K
C:A,B,D,E,I
D:A,E,F,L
E:B,C,D,M,L
F:A,B,C,D,E,O,M
G:A,C,D,E,F
H:A,C,D,E,O
I:A,O
J:B,O
K:A,C,D
L:D,E,F
M:E,F,G
O:A,H,I,J

求出哪些人两两之间有共同好友,及他俩的共同好友都有谁?

4.2 思路

​ 1, map任务: 输入每行数据key:value, 输出: 拆分好友, 好友做key, 当前用户做value;

​ 例如第一行, 输出:key=B: value=A, key=C:value=A, key=D:value=A, key=F:value=A, key=E:value=A, key=O:value=A,

​ 这样经过shuffle之后, 相同的好友共同的用户会聚集在一个分组中.

​ 2, reduce任务: 将用户组内的用户两两组合, 形成: key好友:用户1-用户2的形式输出

​ 例如: 假设共同好友C: 用户组[A, B, E, F, …], 输出: A-B: C / A-E:C / A-F:C …

4.3 代码

这里只给出了思路, 代码实现比较简单, 特别注意点是: reduce任务中, 输出的时候, 不要出现重复.

更多大数据专栏文章请点击 : –> 小马哥大数据专栏博文导航 <–

猜你喜欢

转载自blog.csdn.net/malipku/article/details/113377879
今日推荐