scrapy 最简易爬虫 - 代码天地

scrapy 最简易爬虫

其他 2020-06-27 12:47:52 阅读次数: 0

创建一个项目
scrapy startproject baidu 这后面是名字

#运行项目要cd 进入项目才可以运行
scrapy crawl baidu


import scrapy
from bs4 import BeautifulSoup as bs

#scrapy crawl quotes

class QuotesSpider(scrapy.Spider):
    
    name = "quotes"

    def start_requests(self):
        urls = [
            'http://top.baidu.com/buzz?b=353&c=10&fr=topcategory_c10',

        ]
        for url in urls:
            
            yield scrapy.Request(url=url, callback=self.parse)


    def parse(self, response):
        
        x = response.css('td.keyword').getall()

        import openpyxl
        wb = openpyxl.Workbook()
        word = wb.active
        
        for i in range(len(x)):

            html = bs(x[i],'lxml')
            ming = html.a.text
            u =html.a.attrs['href']
            self.log(ming)

            A = 'A{0}'.format(i+1)
            B = 'B{0}'.format(i+1)
            
            word[A] = html.a.text
            word[B] = html.a.attrs['href']

        wb.save('小说排行榜.csv')

        self.log('保存完成')

猜你喜欢

转载自blog.csdn.net/AnYeZhiYin/article/details/105455709

scrapy 最简易爬虫

爬虫scrapy

scrapy爬虫

爬虫---scrapy

scrapy 爬虫

爬虫_scrapy

[爬虫框架scrapy]scrapy的安装

Scrapy爬虫笔记(scrapy、scrapy-redis、scrapyd部署scrapy)

windows简易安装scrapy

scrapy爬虫与反爬虫

web爬虫讲解—Scrapy框架爬虫—Scrapy安装—Scrapy指令

Scrapy框架的使用之Scrapy通用爬虫

Python Scrapy 爬虫（二）：scrapy 初试

scrapy爬虫框架（一）：scrapy框架简介

scrapy专利爬虫（一）——scrapy简单介绍

爬虫框架Scrapy 之(一) --- scrapy初识

爬虫框架Scrapy 之(二) --- scrapy文件

【爬虫框架-scrapy】scrapy工具的使用

python 爬虫 6 （scrapy item、scrapy pipelines）

Scrapy框架爬虫案例

scrapy 简单爬虫实验

爬虫框架之Scrapy

scrapy爬虫编写流程

scrapy爬虫框架

scrapy爬虫基础

scrapy爬虫cookie设置

0.0.1 scrapy 爬虫示例

爬虫框架Scrapy

Scrapy创建爬虫项目

爬虫scrapy学习

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

timesten性能问题分析

hdu1017A Mathematical Curiosity

利用FragmentTabHost和ViewPager来实现可滑动切换的页面

哪里找卖百度云资源

大数据技能图谱

PHP设计模式（5）—— 观察者模式

python list删除元素是要注意的坑点

TPM简介

并查集擒贼先擒王//解密犯罪团伙

码农也要修身

每日归档

更多

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)