利用python bs4爬取个人逾期数据 - 代码天地

利用python bs4爬取个人逾期数据

其他 2018-09-30 13:59:41 阅读次数: 0

'''
参考文档：http://docs.python-requests.org/zh_CN/latest/user/quickstart.html  requests

https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html bs4

'''

# -*- coding: UTF-8 -*-

from bs4 import BeautifulSoup
import  requests
result=[]
for x in range(1,35):
    url="https://www.kaopuniao.com/user/info/list/exposure"
    data={
        'pageNumber': x,
        'pageSize': 10,
    'sortColumns': '',
    'search': 'search'
    }

    html=requests.post(url,data=data).text
    content=BeautifulSoup(html,'html.parser')
    if content.table['class'][0]=='gridtable':
        html1=content.table.tr
        #for ele in html1.find_all('th'):
           #print(ele.string)
        html2=content.table.tbody
        res=[]
        for ele in html2.find_all('tr'):
            a=[]
            for ele1 in ele.find_all('td'):
                if not ele1.string is None:
                    a.append(ele1.string.strip())
            temp=",".join(a)
            res.append(temp)
    result.extend(res)


print(len(result))

猜你喜欢

转载自blog.csdn.net/huangqihao723/article/details/81713312

利用python bs4爬取个人逾期数据

利用python bs4爬取企业逾期数据

利用bs4和requests爬取股票历史交易数据

python使用bs4爬取boss静态页面

Python使用bs4爬取 cnblogs

python利用 request bs4 模块爬取imgur网站图片

用xpath、bs4、re爬取B站python数据

Python使用bs4爬取数据时乱码问题

bs4主要知识点介绍及实例解析---利用bs4爬取伯乐在线(分别存储在数据库和xls表中)

利用python的bs4和selenium库结合实现动态页面的爬取（爬取天气网上面的历史天气数据）

python结合第三方库bs4初次尝试爬取聚合数据api信息

金融数据分析（二）python预热：用bs4爬取某省的大学排名

Python3-selenium\phantomjs\bs4爬取斗鱼页面

python接口自动化测试十八：使用bs4框架爬取图片

python2使用bs4爬取腾讯社招

[Python 爬虫之路1] 爬取糗事百科（requests，bs4）

python爬虫系列(3.7-使用 bs4 爬取获取贵州农产品)

python爬虫—使用bs4爬取链家网的房源信息

Python网络爬虫requests、bs4爬取空姐图片，福利哦

Python网络爬虫requests、bs4爬取空姐网图片

在python3中使用bs4模块爬取电影名称

python爬虫学习（十一）bs4解析爬取三国演义

python 简单爬取本地文档与爬取网页使用requests和bs4，及自己问题的解决

Python：数据解析（bs4 / xpath）

Python爬虫学习笔记(2) _豆瓣电影TOP250(2)爬取详细数据，保存为CSV文件【urllib、request、bs4、error、CSV】

利用bs4爬取三国演义所有章节标题以及章节内容

python爬虫三大解析数据方法：bs4 及爬小说网案例

python的-bs4

Python爬取新浪英超曼联文章内页--bs4，json，txt和csv以及编码

python超详细零基础 bs4解析之爬取唯美图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)