爬虫学习记录 ----持续更新

本博文主要记录一些在学习爬虫过程遇到的一些小技巧

============================================================================

3、获取网页的文本的编码格式

import  requests

url = 'https://movie.douban.com/top250?start=25&filter='
r = requests.get(url)
print(r.encoding)

运行结果如下:

utf-8

============================================================================

2、传递URL参数(此内容转摘自 https://blog.csdn.net/kangyan__/article/details/78506243

例如, httpbin.org/get?key=val

  • 想传递 key1=value1key2=value2httpbin.org/get
    代码如下:
import requests

payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.get("http://httpbin.org/get", params=payload)
print(r.url)

运行结果如下:

http://httpbin.org/get?key1=value1&key2=value2

  • 还可以将一个列表作为值传入:
import requests

payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
r = requests.get('http://httpbin.org/get', params=payload)
print(r.url)

运行结果如下:

http://httpbin.org/get?key1=value1&key2=value2&key2=value3

============================================================================

1、用chrome查看审查元素

以"豆瓣电影 Top 250"网页为例,网址:https://movie.douban.com/top250
用chrome打开网址,有两种方式打开审查元素:
①按“F12”键,点"Elements",点左上角的箭头,箭头变蓝后点击左侧页面的网页内容,Elements就会跳转至相应的位置
②快捷组合键“Ctrl+Shift+c”可直接开启审查元素功能,如下图:
在这里插入图片描述

再次按“F12”即可关闭审查元素页面。

猜你喜欢

转载自blog.csdn.net/blackeagleoht/article/details/83309534