python正确的取网页源码的姿势 - 代码天地

python正确的取网页源码的姿势

其他 2020-02-05 13:03:29 阅读次数: 0

很多网页的源码是有问题的，这里有一个通杀方法，便于取到源码以后快速进行xpath解析

直接上源码:

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# File  : 正确的取网页源码方式.py
# Author: DaShenHan&道长-----先苦后甜，任凭晚风拂柳颜------
# Date  : 2020/1/24

import requests
from bs4 import BeautifulSoup #pip install bs4/  pip install html5lib

def redecode(r):
    r.encoding = r.apparent_encoding if r.apparent_encoding and not "gb" in r.apparent_encoding.lower() else "gb18030"
    page_source = r.text
    soup = BeautifulSoup(page_source.strip(), "html5lib")
    page_source = soup.prettify()
    return page_source

if __name__ == '__main__':
    r = requests.get("https://www.baidu.com/")
    page_source = redecode(r)
    print(page_source)

晚风拂柳颜

发布了113 篇原创文章 · 获赞 24 · 访问量 40万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_32394351/article/details/104081135

python正确的取网页源码的姿势

python如何快速的爬取小说的正确姿势

学习python的正确姿势——

Python安装scrapy的正确姿势

干货 | 学习Python的正确姿势

Python 操作 MySQL 的正确姿势

Python 访问 MySQL 的正确姿势

【Python】安装Pygraphviz的正确姿势

Python开发游戏的正确姿势

dubbo2.6.0源码编译--正确姿势

【CryptoKitties源码解析】养猫的正确姿势！

【转】阅读前端项目源码的正确姿势

阅读开源源码的正确姿势建议

阅读HBase源码的正确姿势建议

Android调试源码正确姿势打开ALOGV

网页源码爬取

查看网页源码的方法（不同姿势）

开发函数计算的正确姿势——网页截图服务

python爬虫入门（1）简单爬取网页源码

python爬虫学习资料以及多个网页爬取的源码

Python爬取网页源码，图片和文字到本地

python爬虫入门（一）——爬取整个网页的源码

用VSCode写python的正确姿势

初学python者自学anaconda的正确姿势

Python爬虫：最正确的入门姿势

Python中logging正确使用姿势

学习Python的正确姿势，新手必学

Python + Pycrypto 加密模块的正确使用姿势

正确姿势

python爬取网页

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)