R-长尾词练习

一、 长尾关键词的特征 

长尾关键词通常比较长,往往是2-3个词组成,甚至是短语,存在于内容页面,除了内容页的标题,还存在于内容中。

长尾关键词搜索量虽然非常少,而且不稳定。但是搜索量甚至超越热门目标关键词,并且在大中型网站中占据大量流量! 

先在excel复制

读取长尾词

#读取长尾词
changwc<-scan("clipboard",what = "")
changwc

读取结果词

先复制:

#读取结果词
jiegc<-scan("clipboard",what = "")
jiegc
str_detect()只返回是否符合的逻辑值,实际上计数更实用。
x <- c("apple", "banana", "pear")
str_detect(x, "e")
#> [1] TRUE FALSE TRUE
install.packages("stringr")
library(stringr)
str_detect("可可登录","可可")

#创建5个空的字符串向量
a1<-a2<-a3<-a4<-a5<-character(length(changwc))
#创建一个空的数据框
xx<-data.frame(可可=a1,登录=a2,官网=a3,课堂=a4,怎么样=a5)
k<-1
cd<-length(changwc)
for (i in jiegc) {
  ff<-changwc[str_detect(changwc,i)]
  dd<-c(ff,character(cd-length(ff)))
  xx[,k]<-dd
  k<-k+1
  changwc<-changwc[!changwc%in%ff]
}
xx
#写入Excel文件
write.csv(xx,"长尾词分组.csv",row.names=F)

1111

猜你喜欢

转载自www.cnblogs.com/foremostxl/p/12075108.html