library(rvest)
url0 <- 'http://news.sina.com.cn/china/'
web <- read_html(url0)
url0 <- 'http://news.sina.com.cn/china/'
web <- read_html(url0)
News <- web %>% html_nodes('div.news-item h2 a')
#---获得新闻标题---
Title <- News%>%html_text()
#---获得新闻时间---
Time <- web %>% html_nodes('div.time') %>% html_text()
#---获得链接---
link <- News %>% html_attrs()
link1 <- c(1:length(link))
for(i in 1:length(link))
{
link1[i] <- link[[i]][1]
}
#---保存为csv文件---
#组合成数据框
dat <- data.frame(Title,Time,link1)
write.csv(dat,file = 'news.csv',row.names = FALSE)