python之路 -- 爬虫一篇 -- 爬虫基础

其他 2018-07-04 18:40:45 阅读次数: 0

爬虫最常用的模块：requests

Python标准库中提供了：urllib、urllib2、httplib等模块以供Http请求，但是他不好用。一般情况下我们都会使用一个第三方模块requests来发送http请求。requests发送请求的方式一般有2 种，get请求和post请求.

requests的安装

#cmd下执行
pip install requests

或者通过下载requests包之后再安装，一般推荐使用第一种方法。

1.get请求

1 import requests   #引用requests模块
2 #通过发送get请求获取百度主页页面
3 ret = requests.get("www.baidu.com")
4 ret.encoding = "utf-8"  #编码方式
5 print(ret.text)   #打印返回的页面文本，是html格式文本

#res.content返回页面以字节形式显示的内容

requests的get请求可以带参数：url 、[params]、[headers]、[cookies]

2.post请求

import requests

url = 'https://api.github.com/some/endpoint'
payload = {'some': 'data'}
headers = {'content-type': 'application/json'}

ret = requests.post(url, data=json.dumps(payload), headers=headers)
print(ret.text)
print(ret.cookies)

更多详细参数可以进入python官网查看

自动登录抽屉

import requests

url="https://dig.chouti.com/all/hot/recent/1"
header={
     "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"
        }

response = requests.get(
    url=pageurl,
    headers = header
)
cookie1_dict = response.cookies.get_dict()

# 发送post请求，进行登录
data = {
    "phone":"8613121758648",
    "password":"woshiniba",
    "oneMonth":1
}
response1 = requests.post(url="https://dig.chouti.com/login",
                         data=data,
                         headers=header,
                          cookies = cookie1_dict
                         )

print(response1.text)#打印登录成功后的页面

猜你喜欢

转载自www.cnblogs.com/aberwang/p/9264668.html

python之路 -- 爬虫一篇 -- 爬虫基础

python之路--爬虫第一篇

Python爬虫之路-Scrapy基础

Python爬虫第一篇--环境篇

Python网络爬虫学习这一篇就够了!（基础篇、网站反爬虫的目的与手段、配置Python爬虫环境、配置MySQL数据库。）

Python爬虫基础入门看完这一篇就学会了

一篇文章入门python爬虫（需要html,css基础）

Python爬虫入门这一篇就够了

Python爬虫进阶必备 | 关于 ReRes 的一篇教程

Python爬虫基础(一）

python爬虫基础（一）

Python爬虫之路-爬虫基础知识(理论)

最详细的Python爬虫入门教程，一篇文章入门爬虫不是儿戏！

最详细的Python爬虫入门教程, 一篇文章入门爬虫不是儿戏!

最详细的python爬虫入门教学，一篇入门爬虫不是儿戏（视频分享）

数据之路 - 爬虫基础

零基础的爬虫教程，一文快速入门Python爬虫——推一下我的一篇Chat

Python之路，第一篇：Python入门与基础

【python】爬虫篇：最后一篇之TF-IDF分类代码篇（六）

【Python爬虫】Python 爬虫的学习和案例，一篇文章带你了解爬虫的密码

Python爬虫学习（一）——爬虫基础

Python爬虫入门教程 87-100 glidedsky网站爬虫解析，爬虫闯关第一篇

Python 爬虫之路(1)

Python之路__爬虫篇:新浪新闻爬取回顾（一）

python之路 -- 爬虫二篇 -- 常用模块

Python网络爬虫基础(一)

Python爬虫基础（一）——HTTP

Python——爬虫之基础（一）

一篇关于反爬虫和反反爬虫的文章（内含Python爬虫和JS逆向以及反反爬虫练习平台）

什么是网络爬虫？有什么用？怎么爬？一篇文章带你领略python爬虫的魅力

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)