Python :爬取糗事百科段子 - 代码天地

Python :爬取糗事百科段子

其他 2018-11-17 17:22:11 阅读次数: 0

源码：

import urllib
import random
def  JokeSet(Url,UserAgent)
'''
Url  ： 动态url网址
UserAgent :动态请求头
'''
#设置请求头
Headers ={
"User-Agent" : UserAgent
}
#设置请求体
req = urllib.request.Request(Url,headers = Headers)
response = urllib.request.urlopen(req)
data = response.read().decode("utf-8")
#爬取的数据写入文件中
path = r"D:\pythonItem\爬虫Practice\糗事百科.html"
with open(path,"w",encode="utf-8") as f :
		f.write(data)
for i in range(1,11) ：
#获取url页码，爬取的数量可以调整
	url = r"https://www.qiushibaike.com/text/page/"+str(2)+"/"
	HeadersList =[
	[
        "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36",
        "Mozilla/5.0 (Windows NT 10.0; Intel Mac OS X 10_6_8) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69."
   ]
   #随机产生列表中的请求头，预防被封ip
   UserAgent = random.choice(HeadersList)
   try :
	   JokeSet(url,UserAgent)
	   print("第{}次爬取成功".format(i))
   except :
   		print("爬取失败”)

#Html数据处理后续更新

猜你喜欢

转载自blog.csdn.net/Mr_zhangbz/article/details/83753833

Python 爬取糗事百科段子

利用Python爬取糗事百科段子信息

python爬取糗事百科段子

Python :爬取糗事百科段子

Python爬取糗事百科

芝麻HTTP:Python爬虫实战之爬取糗事百科段子

自己手写使用python爬取糗事百科段子

python笔记之利用scrapy框架爬取糗事百科首页段子

python笔记之利用BeautifulSoup爬取糗事百科首页段子

Python爬虫实战(六)：爬取糗事百科段子

Python爬虫实现爬取糗事百科段子 (26行代码简单实现)

[爬虫]用python的requests模块爬取糗事百科段子

使用python的requests、xpath和多线程爬取糗事百科的段子

Python学习之爬虫07-糗事百科段子爬取

Python爬虫（二）之使用标准库爬取糗事百科段子

python网络爬虫-爬取糗事百科段子源码

Python爬虫实战之爬取糗事百科段子【华为云技术分享】

Python爬虫框架Scrapy之爬取糗事百科大量段子数据

Python多线程爬虫实战_爬取糗事百科段子的实例

Python爬取糗事百科段子+定时发送QQ邮箱

python3糗事爬取-------------------糗事百科

python爬虫-糗事百科段子

基于python3 爬取糗事百科

python爬虫（二）爬取糗事百科

Python爬取糗事百科-多进程方法

python3 爬取糗事百科

python预加载爬取糗事百科帖子

爬虫：python爬取糗事百科网页信息

Python爬取多页糗事百科

python爬虫1、~爬取糗事百科

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)