爬取糗事百科案例 - 代码天地

爬取糗事百科案例

其他 2018-11-04 09:37:19 阅读次数: 0

from random import choice
import requests
import  re
user_agents=[
    "User-Agent:Mozilla/5.0(Windows;U;WindowsNT6.1;en-us)AppleWebKit/534.50(KHTML,likeGecko)Version/5.1Safari/534.50",
    "User-Agent:Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1",
    "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36"
]
headers={
    "User-Agent":choice(user_agents)
}
url="https://www.qiushibaike.com/text/page/1"
response=requests.get(url,headers=headers)
info=response.text
infos=re.findall(r'<div class="content">\s*<span>\s*(.+)\s*</span>',info)//返回结果是列表，\s*是匹配换行
with open('smile.txt','w',encoding="utf-8") as f:
    for info in infos:
        f.write(info + "\n\n")

猜你喜欢

转载自blog.csdn.net/qq_41386300/article/details/83217457

爬取糗事百科案例

案例_(多线程)爬取糗事百科

案例_(多线线程)爬取糗事百科

爬虫多线程案例：爬取糗事百科

爬取糗事百科图片（正则案例）

爬取糗事百科

爬取糗事百科练习

Python爬取糗事百科

爬取糗事百科段子

爬取糗事百科的页面

糗事百科段子爬取

糗事百科爬取

python3糗事爬取-------------------糗事百科

案例_(单线程)使用xpath爬取糗事百科

糗事百科段子简单爬取案例（使用正则表达式查找）

两个简单的xpath案例（爬取糗事百科 & 扇贝单词）

Scrapy入门案例--爬取糗事百科的段子界面内容

多线程爬取糗事百科

基于python3 爬取糗事百科

python爬虫（二）爬取糗事百科

Python 爬取糗事百科段子

【多线程待解决】爬取糗事百科

python爬取糗事百科段子

利用Python爬取糗事百科段子信息

爬虫实战（二）：爬取糗事百科段子

Python爬取糗事百科-多进程方法

python3 爬取糗事百科

python预加载爬取糗事百科帖子

爬虫：python爬取糗事百科网页信息

用BeautifulSoup爬取糗事百科段子

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)