糗事百科爬虫 - 代码天地

糗事百科爬虫

其他 2018-07-04 00:06:29 阅读次数: 0

版权声明：未经允许，随意转载，请附上本文链接谢谢（づ￣3￣）づ╭❤～
https://blog.csdn.net/xiaoduan_/article/details/80835238

糗事百科爬虫

不怎么看糗事百科，用来试一下PyQuery选择器还是好的

import requests
from lxml import etree
import time
from pyquery import PyQuery
import pandas as pd

def get_data(page):
    text_data = []
    for i in range(1, page + 1):
        url = 'https://www.qiushibaike.com/text/page/{}/'.format(i)
        print("正在爬去第{}页\n".format(i))
        print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))
        r = requests.get(url)
        s = etree.HTML(r.text)
        jpy = PyQuery(s)
        data = jpy('#content-left > div > a >div > span').text()
        text_data.append(data)
        time.sleep(1)
    df = pd.DataFrame(text_data)
    df.to_csv('糗事百科.csv', encoding='utf-8-sig')


if __name__ == '__main__':
    get_data(2)
    print("爬去完成")
    print(time.strftime("%Y-%m-%d %H:%M:%S",time.localtime()))

这个样子的结果

猜你喜欢

转载自blog.csdn.net/xiaoduan_/article/details/80835238

糗事百科爬虫

爬虫糗事百科

python 糗事百科爬虫

python爬虫-糗事百科段子

爬虫_糗事百科 demo(1)

python糗事百科爬虫

糗事百科爬虫实现

糗事百科段子爬虫

python-爬虫-糗事百科

<爬虫实战>糗事百科

糗事百科爬虫案例

python爬虫入门实战（一）---爬糗事百科

python爬虫（二）爬取糗事百科

使用python写糗事百科的爬虫

python爬虫基础案例之糗事百科

Python3~xpath应用糗事百科爬虫

Python3爬虫糗事百科最新可用

python 初学网络爬虫（糗事百科段子）

爬虫实战（二）：爬取糗事百科段子

面向对象的爬虫基础（糗事百科）

爬虫：python爬取糗事百科网页信息

Scrapy框架糗事百科自动爬虫

Python爬虫(十七)_糗事百科案例

Python爬虫(十八)_多线程糗事百科案例

【Python3.6】糗事百科爬虫

【爬虫入门】抓取糗事百科的段子1.0

糗事百科段子多线程爬虫

爬虫多线程案例：爬取糗事百科

python爬虫1、~爬取糗事百科

Python 之糗事百科多线程爬虫案例

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)