几行Python代码爬取3000+上市公司的信息 - 代码天地

几行Python代码爬取3000+上市公司的信息

编程语言 2019-05-02 16:00:53 阅读次数: 0

前言

入门爬虫很容易，几行代码就可以，可以说是学习 Python 最简单的途径。

刚开始动手写爬虫，你只需要关注最核心的部分，也就是先成功抓到数据，其他的诸如：下载速度、存储方式、代码条理性等先不管，这样的代码简短易懂、容易上手，能够增强信心。

基本环境配置

版本：Python3

系统：Windows

相关模块：pandas、csv

爬取目标网站

实现代码

扫描二维码关注公众号，回复： 6095392 查看本文章

3000+ 上市公司的信息，安安静静地躺在 Excel 中：

有了上面的信心后，我开始继续完善代码，因为 5 行代码太单薄，功能也太简单，大致从以下几个方面进行了完善：

增加异常处理

由于爬取上百页的网页，中途很可能由于各种问题导致爬取失败，所以增加了 try except 、if 等语句，来处理可能出现的异常，让代码更健壮。

增加代码灵活性

初版代码由于固定了 URL 参数，所以只能爬取固定的内容，但是人的想法是多变的，一会儿想爬这个一会儿可能又需要那个，所以可以通过修改 URL 请求参数，来增加代码灵活性，从而爬取更灵活的数据。

修改存储方式

初版代码我选择了存储到 Excel 这种最为熟悉简单的方式，人是一种惰性动物，很难离开自己的舒适区。但是为了学习新知识，所以我选择将数据存储到 MySQL 中，以便练习 MySQL 的使用。

加快爬取速度

初版代码使用了最简单的单进程爬取方式，爬取速度比较慢，考虑到网页数量比较大，所以修改为了多进程的爬取方式。

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/89762129

几行Python代码爬取3000+上市公司的信息

5行Python代码爬取3000+ 上市公司的信息

Python代码爬取3000+ 上市公司的信息！能上市的都有这样一个特点

python——5行代码采集3000+上市公司信息

【Python】5行代码采集3000+上市公司信息

实战项目 1：5 行代码爬取国内所有上市公司信息

一文搞懂如何用Python爬取上市公司信息

10行代码爬取全国所有A股/港股/新三板上市公司信息

python3爬取上市公司基本数据

用Python爬取东方财富网上市公司财务报表

python爬虫：Selenium 爬取东方财富网上市公司财务报表

python爬虫 | 爬取巨潮资讯上的上市公司招股说明书

多线程爬取新浪财经上市公司要闻

地级市数字经济专题：3000+上市公司数字经济数据-含数字技术、货币、运营等多指标

【Python爬虫实战】1.爬取A股上市公司年报链接并存入Excel

Python爬取上市公司利润表数据：数据抓取、数据入库与数据可视化一气呵成

python调用tushare获取A股上市公司基础信息

python调用tushare获取A股上市公司管理层人员信息

简单几行Python代码，爬取网站图片

爬虫获取A股上市公司信息

爬虫+正向代理，30+行代码我爬取了[链家]3000+条数据

上市公司股票代码详解

Python批量下载上交所上市公司报告

上市公司与不上市公司的区别

Python3~爬取某公司招聘信息

Python 爬虫系列：爬取全球船公司信息

几行python代码爬取腾讯和爱奇艺VIP电影（利用全明解析）

python量化之路：获取历史某一时刻沪深上市公司股票代码及上市时间 python量化之路：获取历史某一时刻沪深上市公司股票代码及上市时间

上市公司内控信息披露指数（2000-2018年）

金融监管科技业务中的AI应用：上市公司公告信息风险识别

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)