一.爬虫学习
1切入点
新浪提供高级搜索功能,这个功能需要用户登录才能使用.如何在无需登录的情况下,获取"关键词+时间+区域"的新浪微博.
设置参数实现:
固定地址:https://s.weibo.com/weibo?q=
关键字二次UTF-8编码:%E6%B5%B7%E5%BA%95%E6%8D%9E%E6%9C%8D%E5%8A%A1
类型:typeall=1
suball=1
搜索时间范围:timescope=custom:2019-07-01-0:2020-07-01-0
可忽略项:Refer=g
某次请求的页数:page=1(第一页可不加)
完成.
、