python爬虫（爬取段子）

其他 2019-05-13 15:31:24 阅读次数: 0

python爬取段子

爬取某个网页的段子

第一步

不管三七二十一我们先导入模块

#http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc  段子所在的网址
import re 
import  requests   #如果没这模块运行CMD pip  install requests

第二步

获取网站的内容

#http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc  段子所在的网址
import re 
import  requests   #如果没这模块运行CMD pip  install requests
 
response = requests.get(http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc)
data = response.text

第三步

找到段子所在的位置

#http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc  段子所在的网址
import re 
import  requests   #如果没这模块运行CMD pip  install requests
 
response = requests.get('http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc')   #这个编辑器的长度关系没法放一行
data = response.text
#按F12选择自己想要的内容所在的位置copy出来
new_list = re.findall('<span class="bjh-p">(.*?)</span></p><p>',data ) # (.*?)是我们要的内容

第四部

保存文件

#http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc  段子所在的网址
import re 
import  requests   #如果没这模块运行CMD pip  install requests
 
response = requests.get('http://baijiahao.baidu.com/s?id=1598724756013298998&wfr=spider&for=pc')   #这个编辑器的长度关系没法放一行
data = response.text
#按F12选择自己想要的内容所在的位置copy出来
new_list = re.findall('<span class="bjh-p">(.*?)</span></p><p>',data ) # (.*?)是我们要的内容

for a in new_list:
    with open(r'D:\图片\段子.txt', 'a') as fw:
        fw.write(a)
        fw.flush()

猜你喜欢

转载自www.cnblogs.com/pythonywy/p/10856819.html

python爬虫（爬取段子）

Python网络爬虫与如何爬取段子的项目实例

python爬虫之爬取捧腹网段子

python爬虫--正则爬取内涵段子文字

python爬虫scrapy框架爬取糗妹妹段子首页

python爬虫实战-使用threading多线程爬取段子

Python网络爬虫与聚焦爬虫，如何用爬虫爬取段子

python内涵段子爬取练习

芝麻HTTP:Python爬虫实战之爬取糗事百科段子

Python爬虫实战(六)：爬取糗事百科段子

Python爬虫实现爬取糗事百科段子 (26行代码简单实现)

Python爬虫之爬取内涵吧段子（urllib.request）

[爬虫]用python的requests模块爬取糗事百科段子

Python学习之爬虫07-糗事百科段子爬取

Python爬虫（二）之使用标准库爬取糗事百科段子

python网络爬虫-爬取糗事百科段子源码

Python爬虫实战之爬取糗事百科段子【华为云技术分享】

Python爬虫框架Scrapy之爬取糗事百科大量段子数据

【Python学习之旅】---爬虫（xpath表达式，爬取网络段子和贴吧图片）

Python多线程爬虫实战_爬取糗事百科段子的实例

爬虫实战（二）：爬取糗事百科段子

每日爬虫练习：爬取最新搞笑段子

Python 爬取糗事百科段子

python爬取糗事百科段子

利用Python爬取糗事百科段子信息

Python :爬取糗事百科段子

【Python学习之旅】---多线程爬取段子

Python 爬虫爬取网页

python爬虫－爬取图片

python 爬虫爬取csdn

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)