爬虫（一）——用Requests模块获取网页信息 - 代码天地

爬虫（一）——用Requests模块获取网页信息

其他 2020-07-27 10:21:34 阅读次数: 0

调用requests库里面的get方法，获取网页的信息，调用page.text获取网页源码，然后通过print打印出网页源码

import requests
page = requests.get('https://blog.csdn.net/zt_0910/article/details/80075742')
text = page.text
print(text.encode("utf-8"))

import requests
import re

head = {'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
TimeOut = 30


def requestpageText(url):
    try:
        Page = requests.session().get(url, headers=head, timeout=TimeOut)
        Page.encoding = "gb2312"
        return Page.text
    except BaseException as e:
        print("联网失败了...", e)


site = "http://www.meizitu.com/a/qingchun_3_1.html"
text = requestpageText(site)  # 抓取网页源码
patterns = re.compile(r'http:.*?/\d*?.html')  # 匹配需要的数据
istp = re.findall(patterns, text)
for photo in istp:
    print(photo)

猜你喜欢

转载自blog.csdn.net/ZT_0910/article/details/80240358

爬虫（一）——用Requests模块获取网页信息

网页信息获取--requests库

nodejs爬虫获取网页信息

Python 爬虫，requests模块，携带cookie信息

爬虫基础：lxml与requests库, 使用爬虫获取一个确定的简单信息

初级爬虫(一) requests模块实现网页批量图片爬取

Python爬虫之用requests模块做一个简易的网页采集器

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

初学python爬虫，记录一下学习过程，requests库获取网页代码

Python爬虫（一）：用 Requests + BeautifulSoup 爬取网站上的信息

python爬虫开发（一）-------requests模块

Python爬虫requests添加头部和代理获取网页内容

requests模块：请求网页

python3爬虫-通过requests获取拉钩职位信息

使用requests爬虫简单获取知乎问题信息

爬虫----requests模块

python爬虫requests模块

爬虫（三）requests模块

爬虫（四）requests模块

爬虫之requests模块

爬虫及requests模块

爬虫概念 requests模块

爬虫-requests模块

爬虫（1）：requests模块

python爬虫-requests模块

爬虫（urllib及requests模块）

2 爬虫 requests模块

爬虫——requests模块_ajax

<爬虫> requests模块

爬虫(四)：requests模块

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)