[電源を入れる]シンプルな商品ベースの推薦システムのHBase

アーキテクチャ:シンプルな製品の推奨システムブログHBaseのカテゴリに基づいて、

電力業界のウェブサイトを通じて、私は、ユーザーの視点に立って、多くの製品の推奨事項があります。

 

一つは、他の商品の数を表示する項目を検索し、他のユーザーを表示し、システム統計を検索するためのアイテムを表示私の検索を介して行われ、一流の私にお勧め、栗详细:
私は、「Hadoopのを見てDefinitive Guideの」、他の本の束で私に推奨システム:
 

 

一つは、栗見る商品、私は品物の関心を考えて、それのいくつかをお勧めしますシステム、淘宝網、私の最近の検索です。

私は非常に興味深いと感じ、いくつかあります。
 
 

特に、この検索のHadoop ユーザー、および多くの人がダウンジャケットを購入している最終的に、これはなぜですか?学習のHadoop チーズ、それは非常に寒いですか。それとも、北部人?
 



  1. 多種多様ハ、別の問題。のシンプルな商品推薦システムのHBaseに基づく:監督は次の人のYYのデザインのいずれかを議論します。
  2. 他のプロセスを脇に残すことは、HBaseのベースの設計、もっぱらこの勧告の条件で、OKの2つのテーブルを言うことはありません。テーブルは、アイテムのすべてのユーザのレコードビューitem_user、すべての商品を表示するために、各ユーザの記録user_item。
  3. user_item:クラスタと列項目のように公転ユーザーID、次のようにアイテムID、データは以下のとおりです。
  4. USER1項目:ItemIDをタイムスタンプ= 1234567891、値= item1から
  5. USER1項目:ItemIDをタイムスタンプ= 1234567892、値= ITEM2
  6. USER1項目:ItemIDをタイムスタンプ= 1234567893、値= ITEM3
  7. user2のアイテム:アイテムID、タイムスタンプ= 1234567894、値= ITEM4
  8. user2のアイテム:アイテムID、タイムスタンプ= 1234567895、値= item5
  9. user3    item:itemid    timestamp=1234567881, value=item1
  10. user3    item:itemid    timestamp=1234567832, value=item2
  11. user4    item:itemid    timestamp=1234567843, value=item3
  12. user4    item:itemid    timestamp=1234567854, value=item4
  13. user4    item:itemid    timestamp=1234567895, value=item5
  14. ......
  15. item_user:itemid作为行健,列簇和列为:user:userid,数据如下:
  16. item1    user:userid    timestamp=1234567891, value=user1
  17. item1    user:userid    timestamp=1234567892, value=user2
  18. item1    user:userid    timestamp=1234567893, value=user4
  19. item2    user:userid    timestamp=1234567894, value=user3
  20. item3    user:userid    timestamp=1234567895, value=user2
  21. item3    user:userid    timestamp=1234567881, value=user4
  22. item6    user:userid    timestamp=1234567832, value=user5
  23. item6    user:userid    timestamp=1234567843, value=user6
  24. item8    user:userid    timestamp=1234567854, value=user5
  25. item8    user:userid    timestamp=1234567895, value=user4
  26. ......
  27. 大概的业务是:我查看《Hadoop权威指南》(item1)时,系统从item_user表中以item1作为行健查询出所有查看过item1的用户,再分别以各userid为行健,从user_item表中查询出所有查看过的商品,最后去重、统计、排序并显示。

 

http://f.dataguru.cn/thread-33415-1-1.html

おすすめ

転載: www.cnblogs.com/shujuxiong/p/11261840.html