爬虫ajax(证监会处罚案例) - 代码天地

爬虫ajax(证监会处罚案例)

其他 2018-05-05 14:10:07 阅读次数: 4

import requests
from bs4 import BeautifulSoup
import pandas as pd
from pandas import DataFrame
import openpyxl
import lxml

def get_url(url):
    res = requests.get(url)
    soup = BeautifulSoup(res.content, 'lxml') #出现乱码，用二进制
    return soup
A=[]
B=[]
url="http://www.csrc.gov.cn/pub/zjhpublic/3300/3313/index_7401"  #ajax渲染，要在network的response找到文件所在的url
j=0
for i in range(0,54):
    if i==0:
        URL = url+".htm"
    else:
        URL=url+"_"+str(i)+".htm"
    # print(URL)
    soup=get_url(URL)
    for item in soup.select("a"):
        # j=j+1
        # print(j)
        # print(item)
        A.append(item.get_text())
        B.append("http://www.csrc.gov.cn/pub/zjhpublic" + item["href"][5:])

# print(A)
# print(B)
data={"处罚书": A, "地址": B}
# print(data)
df=DataFrame(data)
pd.set_option('max_colwidth', 200)  #变量太长，Dateframe不能显示
print(df)
df.to_excel("处罚案例.xlsx")

猜你喜欢

转载自www.cnblogs.com/L736/p/8994564.html

爬虫ajax(证监会处罚案例)

证监会处罚公告爬取

Python爬虫爬取ajax动态加载页面——证监会法规爬取

证监会对6宗内幕交易案件作出行政处罚涉及现代制药等

证监会依法对4宗案件作出行政处罚

Python 爬虫开发：Ajax请求响应json案例

python爬虫之爬取案例网页ajax请求的数据

Ajax案例

爬虫案例

爬虫-案例

爬虫案例~

python爬虫之爬取案例网页ajax请求的数据2之跳转url下载图片

Ajax：ajax发送Post请求、ajax案例

某某行政处罚_sojson_v6学习案例

爬虫05-ajax

爬虫——requests模块_ajax

拉勾网Ajax爬虫

Ajax使用案例

ajax.完整案例

Ajax的基础案例2

Ajax基础案例

使用AJAX的简单案例

Java：Ajax案例

js调用ajax案例

ajax原理及使用案例

ajax登录案例

Ajax小案例

Ajax 调用案例

ajax交互案例

Ajax案例实操

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)