路飞学院-Python爬虫实战密训班-第1章 - 代码天地

路飞学院-Python爬虫实战密训班-第1章

其他 2018-07-04 14:30:45 阅读次数: 0

学习笔记：

通过本章的学习，学习到了requests和BeautifulSoup模块的安装及使用方法。以及爬取给类网站的方法和知识点。

1、requests和BeautifulSoup 安装 pip install requests......

2、使用

import requests
from bs4 import BeautifulSoup

GET请求

r = requests.get('http://')
r.text 返回headers中的编码解析的结果，可以通过r.encoding = 'gbk'来变更解码方式
r.content返回二进制结果
r.json()返回JSON格式，可能抛出异常
r.status_code
r.raw返回原始socket respons，需要加参数stream=True

传递headers

headers ={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36',
'Host':'github.com'
}

传递cookies

提交data
data = {
'commit':'Sign in',
'utf8':'✓',
}

req_submit = requests.post(url=url,data=data,headers=headers1,cookies=cookies)

获取页面信息

req_submit.content.decode()

####################
加载要解析的文本内容
soup = BeautifulSoup("<html>data</html>",'html.parser')
查找相应的标签
soup_html = soup.find(name='html')

取出文本
soup_html.text

猜你喜欢

转载自www.cnblogs.com/aili10000/p/9263005.html

路飞学院-Python爬虫实战密训班-第1章

路飞学院-Python爬虫实战密训班-第2章

路飞学院-Python爬虫实战密训班-第3章

路飞学成-Python爬虫实战密训-第1章

路飞学成-Python爬虫实战密训-第3章

路飞学成-Python爬虫实战密训-第2章

路飞学城-Python爬虫实战密训-第1章

路飞学城—python爬虫实战密训-—第1章（作业）

路飞学城—python爬虫实战密训-—第1章

路飞学城—Python—爬虫实战密训班第二章

路飞学城—Python爬虫实战密训班第三章

路飞学城—Python—爬虫实战密训班第一章

路飞学城—Python—爬虫实战密训班第三章

路飞学城-Python爬虫实战密训-第3章

路飞学城-Python爬虫实战密训-第2章

路飞学城-——Python爬虫实战密训-——第2章

路飞学城-python爬虫密训-第一章

路飞学城-python爬虫密训-第三章

路飞学城-python爬虫密训-第二章

路飞学城-Python爬虫集训-第1章

路飞学城-python开发集训-第1章

路飞学城－Python开发集训_第1章

老男孩爬虫实战密训课第一季，2018.6，初识爬虫训练-实战1

Python3网络爬虫开发实战——第1章开发环境

路飞学城-Python爬虫集训-第二章

Python网络爬虫第1章Python基础

路飞学城-Python开发集训-第3章

路飞学城-Python开发集训-第4章

路飞学城-Python开发集训-第2章

路飞学城-Python开发集训-第5章

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)