环境:Python3、PyCharm
主要需要了解一下内容(去掉print看)
print(r.url) #输出需要访问的网页,注意区别print(r,url) 务必看清楚"." 和 ","
print(r.status_code) #查看状态码,状态码也没有那么重要,知道存在即可
print(r.encoding) #获取网页编码 ISO-8859-1是单字节编码,向下兼容ASCII,知道存在即可
print(r.headers) #得到的是一个字典
print(r.text) #获取网站源代码
代码:
import requests
#u='http://news.qq.com'
#u='https://www.baidu.com/s'
#r=requests.get(url=u)
#可以直接写成下面的样子
r=requests.get(url='https://www.baidu.com/s',params={'wd':'学习使我快乐'},timeout=20) #后面是添加的参数 params={'wd':'学习使我快乐'}
#直接写成如下格式也是对的
#r=requests.get(url='https://www.baidu.com/s?wd=%E5%AD%A6%E4%B9%A0%E4%BD%BF%E6%88%91%E5%BF%AB%E4%B9%90')
#另一种写法 r=requests.get(url='http://news.qq.com')
print(r) #输出网站链接
print(type(r))
print(r.url) #输出需要访问的网页,注意区别print(r,url) 务必看清楚"." 和 ","
print(r.status_code) #查看状态码,状态码也没有那么重要,知道存在即可
print(r.encoding) #获取网页编码 ISO-8859-1是单字节编码,向下兼容ASCII
r.encoding='utf-8' #利用这种方式,可以对编码方式进行修改
print(r.encoding)
#https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=2&tn=baiduhome_pg&wd=%E5%AD%A6%E4%B9%A0%E4%BD%BF%E6%88%91%E5%BF%AB%E4%B9%90&rsv_spt=1&oq=%25E5%25AD%25A6%25E4%25B9%25A0%25E6%2598%25AF%25E6%2588%2591%25E5%25BF%25AB%25E4%25B9%2590&rsv_pq=b5f9366d00005c71&rsv_t=a33713rdKn%2B%2FunYGLpIDYxC%2BpfU%2FGwXOyGKHsWkIsO3lzH7Rk59h97hiEKokXp413nVc&rqlang=cn&rsv_enter=1&rsv_sug3=9&rsv_sug1=3&rsv_sug7=100&bs=%E5%AD%A6%E4%B9%A0%E6%98%AF%E6%88%91%E5%BF%AB%E4%B9%90
print(r.text) #获取网站源代码
print(r.headers) #得到的是一个字典
#设置超时 timeout=x 其中x是时间,单位秒
#可以放在如下语句中
#r=requests.get(url='https://www.baidu.com/s',params={'wd':'学习使我快乐'},timeout=20)
运行结果: