爬虫学习----学习get和post请求

两种HTTP请求方法

  • get:从指定的资源请求数据
  • post:向指定的资源提交要被处理的数据,比如data还有请求头header

关于get和post的区别,这里写的很详细:
http://www.w3school.com.cn/tags/html_ref_httpmethods.asp

HTTP状态码(Http Status Code)

http状态码:当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。
常见的状态码:

  1. 200 代表着你请求成功并返回数据了
  2. 404 notfound请求的资源(网页等)不存在
  3. 500 内部服务器错误

如果我们断开网络连接,再请求数据,会返回404!
参考教程:
1.菜鸟教程:http://www.runoob.com/http/http-status-codes.html
2.在线工具:http://tool.oschina.net/commons?type=5

请求头(Request Headers)

  • 什么是请求头?
    http请求头:HTTP客户程序(例如浏览器),向服务器发送请求的时候必须指明请求类型(一般是GET或者POST)。如有必要,客户程序还可以选择发送其他的请求头。

  • 如何添加请求头
    一般在post请求中手动设置headers添加.
    这是请求百度时的请求头:

  • 请求头里的内容

    Accept
    Accept-Encoding
    Accept-Language
    Cache-Control
    Connection
    Cookie
    Host
    Upgrade-Insecure-Requests
    User-Agent

简单的请求案例:

1.urllib的request
2.requests库的get方法
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_40734650/article/details/88046636