关联规则数据构建

关联规则数据的构建是实施算法的前提,在查阅大量的资料之后,也没有找到能讲得清晰的数据构建过程,以下数据的构建是本人对于数据的构建,仅供参考。

以下案例仅仅针对,类似“每一行代表一个用户购买一个商品”。

> x <- data.frame(item=c('a','b','a','b','c'),user=c('1','1','2','2','2'))

> x
  item user
1    a    1
2    b    1
3    a    2
4    b    2
5    c    2

# 利用xtabs()做onehot
> y <- xtabs(~ item + user,x)
# 将xtabs转化为matrix
> y <- as.data.frame.matrix(y)
> y <- as.matrix(y)
> class(y)

# 将matrix的结果转化为transactions
> yy <- as(y, "transactions") 

# 查看结果

> inspect(yy)
    items transactionID
[1] {1,2} a            
[2] {1,2} b            
[3] {2}   c   

ok!结果是我想要的。

猜你喜欢

转载自blog.csdn.net/u012111465/article/details/80344878