如何分页爬去数据--beautisoup - 代码天地

如何分页爬去数据--beautisoup

其他 2018-11-05 08:18:19 阅读次数: 0

'''本次爬取讲历史网站'''
#!usr/bin/env python
#-*- coding:utf-8 _*-
"""
@author:Hurrican
@file: 分页爬取数据.py
@time: 2018/11/03 9:30

"""
from bs4 import BeautifulSoup
import requests

def get_urls():
    urls = ['http://www.jianglishi.cn/jiemi/page_{}.html'.format(str(i)) for i in range(2, 21)]
    urls.insert(0, 'http://www.jianglishi.cn/jiemi/')
    return urls

def get_title():
    for a1 in get_urls():
        web_data = requests.get(a1)

        web_data.encoding = 'utf-8'
        web = web_data.text
        soup = BeautifulSoup(web, 'html5lib')
        soup1 = soup.findAll(name='div', attrs={'class': 'title'})
        for piece in soup1:
            title = piece.a.string
            print(title)

if __name__ == '__main__':
    get_title()
运行结果：

猜你喜欢

转载自www.cnblogs.com/wujf-myblog/p/9906858.html

如何分页爬去数据--beautisoup

python如何安装BeautiSoup模块？

如何爬去别人的网页

tweepy 爬去twitter数据

爬去网页离线数据

爬去某家房价的数据

如何去使用Python爬虫来爬取B站的弹幕数据？

实时数据分页去重问题

Oracle 分页查询与数据去重

Oracle 分页查询与数据去重实例

Beautisoup库

去哪儿网数据爬取

Go爬去以太坊的价格数据

使用python爬去kibana数据

phantomJs(爬去动态加载数据)

练习python去爬取数据

如何使用Selenium Python爬取多个分页的动态表格并进行数据整合和分析

复习巩固：oracle如何实现去重和分页

如何用爬虫爬去一张图片

Oracle 分页查询与数据去重深入理解

爬去酷狗top500的数据

Java通过selenium自动化爬去数据

爬虫03_基于requests的分页数据的爬取

数据爬去(js) 中国空气质量在线监测平台加密数据爬取

oracle分页与去重

python爬取人脸识别图片数据集/python爬去图片/python爬虫

如何用Excel工具去分析数据？

大量数据如何做分页处理

如何爬取网页中的动态数据

HTTP代理是如何爬取数据的

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)