爬取糗事百科段子 - 代码天地

爬取糗事百科段子

其他 2018-10-31 15:31:28 阅读次数: 0

import urllib.request
import urllib.error
import re

page = 1
url = 'https://www.qiushibaike.com/8hr/page/'+str(page)
user_agent = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36 LBBROWSER'
headers = {'User-Agent':user_agent}
try:
    request = urllib.request.Request(url,headers = headers)
    response = urllib.request.urlopen(request)
    #print(response.read())
except urllib.error.URLError as e:
    if hasattr(e,'code'):
        print(e.code)
    if hasattr(e,'reason'):
        print(e.reason)

content = response.read().decode('utf_8')
pattern = re.compile('<h2>(.*?)</h2>.*?<div.*?content">.*?<span>(.*?)</span>',re.S)
items = re.findall(pattern,content)
for item in items:
    print("用户名:"+item[0])
    print("评论内容："+item[1])

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/DMU_lzq1996/article/details/83514347

爬取糗事百科段子

糗事百科段子爬取

Python 爬取糗事百科段子

python爬取糗事百科段子

利用Python爬取糗事百科段子信息

爬虫实战（二）：爬取糗事百科段子

用BeautifulSoup爬取糗事百科段子

Python :爬取糗事百科段子

Spider—糗事百科段子爬取

爬取糗事百科

爬取糗事百科练习

Python爬取糗事百科

爬取糗事百科案例

爬取糗事百科的页面

糗事百科爬取

芝麻HTTP:Python爬虫实战之爬取糗事百科段子

自己手写使用python爬取糗事百科段子

python笔记之利用BeautifulSoup爬取糗事百科首页段子

python笔记之利用scrapy框架爬取糗事百科首页段子

Python爬虫实战(六)：爬取糗事百科段子

BeautifulSoup爬取博客园首页摘要、糗事百科首页段子

一个简单的爬虫代码爬取糗事百科段子（selenium+ChromeDriver）

Python爬虫实现爬取糗事百科段子 (26行代码简单实现)

[爬虫]用python的requests模块爬取糗事百科段子

使用python的requests、xpath和多线程爬取糗事百科的段子

Python学习之爬虫07-糗事百科段子爬取

NO.33——XPath选择器爬取糗事百科段子

Python爬虫（二）之使用标准库爬取糗事百科段子

python网络爬虫-爬取糗事百科段子源码

多线程爬取糗事百科热门段子 (改写前天的博客)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)