推荐好友
a -> b,c,d
b -> a,c,e
-------------
a-b ab_cd
a-c ac_bd
a-d ad_bc
b-a ba_ce
b-c bc_ae
b-e be_ac
-------------
b-> d
a-> e
已经直接可以排除ac是好友的情况了
~~~~~~~~~~~~~~~~~~~~~~~~~
不需要提前将相互关注的好友,只保留一条数据,因为即使是两条在reduce中已经set去重了
a b
b c
b a
map:
key:主 value:从
key:从 value:主
结果:a b ,b a, b c, c b,a b,b a
reduce:
根据key,将values做笛卡尔积,得到的结果是二度关系
结果:a c
在经过一个mr去排除已经是好友的情况即可能ac已经是好友了
hadoop求推荐好友-2度关系
猜你喜欢
转载自my.oschina.net/datacube/blog/1813254
今日推荐
周排行