hadoop求推荐好友-2度关系

推荐好友
a -> b,c,d
b -> a,c,e
-------------
a-b     ab_cd
a-c     ac_bd
a-d     ad_bc

b-a      ba_ce
b-c      bc_ae
b-e      be_ac
-------------
b-> d
a-> e

已经直接可以排除ac是好友的情况了
~~~~~~~~~~~~~~~~~~~~~~~~~
不需要提前将相互关注的好友,只保留一条数据,因为即使是两条在reduce中已经set去重了
a b
b c
b a


map:
	key:主 value:从
	key:从 value:主
结果:a b ,b a, b c, c b,a b,b a
reduce:
	根据key,将values做笛卡尔积,得到的结果是二度关系
结果:a c 
在经过一个mr去排除已经是好友的情况即可能ac已经是好友了

猜你喜欢

转载自my.oschina.net/datacube/blog/1813254
今日推荐