常见Python爬虫框架你会几个？

其他 2019-11-29 16:50:51 阅读次数: 0

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者：三名狂客

正文

注意：如果你Python技术学的不够好，可以点击下方链接获取最新Python教程：

http://note.youdao.com/noteshare?id=a3a533247e4c084a72c9ae88c271e3d1

一、python爬虫框架

一些爬虫项目的半成品

二、常见python爬虫框架

(1) Scrapy:很强大的爬虫框架，可以满足简单的页面爬取（比如可以明确获知url pattern的情况）。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。但是对于稍微复杂一点的页面，如weibo的页面信息，这个框架就满足不了需求了。

(2) Crawley: 高速爬取对应网站的内容，支持关系和非关系数据库，数据可以导出为JSON、XML等

(3) Portia:可视化爬取网页内容

(4) newspaper:提取新闻、文章以及内容分析

(5) python-goose:java写的文章提取工具

(6) Beautiful Soup:名气大，整合了一些常用爬虫需求。缺点：不能加载JS。

(7) mechanize:优点：可以加载JS。缺点：文档严重缺失。不过通过官方的example以及人肉尝试的方法，还是勉强能用的。

(8) selenium:这是一个调用浏览器的driver，通过这个库你可以直接调用浏览器完成某些操作，比如输入验证码。

(9) cola:一个分布式爬虫框架。项目整体设计有点糟，模块间耦合度较高。

以上9个你会用几个呢？

猜你喜欢

转载自www.cnblogs.com/chengxuyuanaa/p/11958767.html

常见Python爬虫框架你会几个？

python爬虫：常见python爬虫框架

8个最高效的Python爬虫框架，你用过几个？

这6个工作面试最常见的高并发缓存问题，你会几个？

干货|爬虫被封的几个常见原因

防止爬虫被反几个常见策略

爬虫抓取的几个常见小问题

你不会Python这几个库，不要说你会爬虫

Python常见框架

几个常见的Python爬虫面试题，让我顺利拿下20k的offer

python爬虫-常见反扒

面试超常见的几个问题，你真的会回答吗？（内附详细回答思路）

Python爬虫一般会用什么框架?常见的五种框架介绍!

常见的几个python基础题

python语言几个常见函数的使用

Python——pip的几个常见用法

python面试常见知识点整理，你遗漏了几个？

初学Python常见异常错误，总有一处你会遇到！

常见的Python框架--matplotlib

Python常见GUI框架

Python3环境安装Scrapy爬虫框架过程及常见错误

Python 网络爬虫迷你爬虫框架

python爬虫常见问题（一）

python爬虫的常见方式

Python爬虫常见问题总结

python爬虫之常见的加密方式

Python爬虫常见问题

Python爬虫面试常见问题

python爬虫入门常见错误集合

几个常见的网站seo误区，你注意过没？

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)