python爬取网页 - 代码天地

python爬取网页

其他 2018-05-25 00:21:26 阅读次数: 2

1. 使用requests库

import requests 
url="http://www.starbaby.cn/zhinan/609987" 
req =requests.get(url) 
req.encoding='utf-8' #显式地指定网页编码，一般情况可以不用 
print(req.text)

2. 使用BeautifulSoup

from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests

def run():
    r = requests.get('http://zy.upln.cn/gongshi2014/index.html')
    soup = r.text.encode(r.encoding) #这里获取的text先按照指定的字符集解析下，这样gbk、utf8都可以了
    soup = BeautifulSoup(soup, 'html.parser')
    soup = soup.find('tbody')
    for x in soup.find_all('tr'):
        for y in x.find_all('td'):
            s = y.a.text
            print(s)


if __name__=="__main__":
    run()

猜你喜欢

转载自blog.csdn.net/sunfoot001/article/details/75805348

python爬取网页

python动态爬取网页

Python 爬虫爬取网页

Python爬取网页图片

Python爬取网页title

python 爬取静态网页

python爬取网页（简易）

python爬取网页信息

【python】爬取网页图片

Python爬取网页内容

python爬取简单网页

python爬取网页视频

Python - Python 简单爬取网页内容

python根据标签爬取网页信息

python爬取网页基本框架

python爬取网页的通用代码框架

Python 爬取网页内容，转成PDF

python获取网页精准爬取数据

python3爬取网页图片

python 爬取网页新浪新闻

python爬虫爬取淘宝网页

Python爬取网页转为PDF

python爬取动态网页的内容

python requests 简单网页文本爬取

Python爬取网页图片03

Python爬取网页图片02

Python爬取网页图片01

python爬取淘宝网页信息

Python爬取动态网页

python爬虫爬取京东网页

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)