2微博爬虫学习

一.爬虫学习

1切入点

新浪提供高级搜索功能,这个功能需要用户登录才能使用.如何在无需登录的情况下,获取"关键词+时间+区域"的新浪微博.

设置参数实现:

固定地址:https://s.weibo.com/weibo?q=

关键字二次UTF-8编码:%E6%B5%B7%E5%BA%95%E6%8D%9E%E6%9C%8D%E5%8A%A1

类型:typeall=1

suball=1

搜索时间范围:timescope=custom:2019-07-01-0:2020-07-01-0

可忽略项:Refer=g

某次请求的页数:page=1(第一页可不加)

完成.

猜你喜欢

转载自blog.csdn.net/qq_31244453/article/details/107993569