python爬虫：常见python爬虫框架 - 代码天地

python爬虫：常见python爬虫框架

其他 2019-05-09 20:25:03 阅读次数: 0

一般比较小型的爬虫需求，

我是直接使用requests库 + bs4就解决了，再麻烦点就使用selenium解决js的异步加载问题。相对比较大型的需求才使用框架，主要是便于管理以及扩展等。

一、爬虫技术库-urllib.request和requests库的使用（简单）

1. requests库

2. urllib.request库

二、常见python爬虫框架

1)Scrapy:很强大的爬虫框架，可以满足简单的页面爬取（比如可以明确获知url pattern的情况）。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。但是对于稍微复杂一点的页面，如weibo的页面信息，这个框架就满足不了需求了。

https://www.cnblogs.com/Lijcyy/p/9779196.html

2)Crawley: 高速爬取对应网站的内容，支持关系和非关系数据库，数据可以导出为JSON、XML等

3)Portia:可视化爬取网页内容

4)newspaper:提取新闻、文章以及内容分析

5)python-goose:java写的文章提取工具

6)Beautiful Soup:名气大，整合了一些常用爬虫需求。缺点：不能加载JS。

7)mechanize:优点：可以加载JS。缺点：文档严重缺失。不过通过官方的example以及人肉尝试的方法，还是勉强能用的。

8)selenium:这是一个调用浏览器的driver，通过这个库你可以直接调用浏览器完成某些操作，比如输入验证码。

9)cola:一个分布式爬虫框架。项目整体设计有点糟，模块间耦合度较高。

猜你喜欢

转载自blog.csdn.net/fei347795790/article/details/89955927

python爬虫：常见python爬虫框架

python爬虫-常见反扒

常见Python爬虫框架你会几个？

python爬虫常见问题（一）

python爬虫的常见方式

Python爬虫常见问题总结

python爬虫之常见的加密方式

Python爬虫常见问题

Python爬虫面试常见问题

python爬虫入门常见错误集合

python爬虫－常见反爬虫机制与应对方法

Python爬虫一般会用什么框架?常见的五种框架介绍!

python爬虫-scrapy爬虫框架

Python3环境安装Scrapy爬虫框架过程及常见错误

python爬虫的基本框架

scrapy 框架 python 爬虫

python爬虫-scrapy框架

python爬虫scrapy框架

Python爬虫代码框架

python爬虫相关框架

Python爬虫框架

Python爬虫框架—Scrapy

python爬虫使用框架

了解python爬虫框架

常用python爬虫框架

Python爬虫框架Scrapy

python爬虫通用框架

python爬虫--scrapy框架

python：爬虫：Scrapy框架

Python爬虫---scrapy框架

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)