爬虫（4）：抓取ajax数据 - 代码天地

爬虫（4）：抓取ajax数据

其他 2018-07-24 00:29:47 阅读次数: 0

import urllib.request

import json

# 请求头
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}

# ajax请求url

for i in range(100):
    url = "https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=&start=%d" % (i * 20)

    req = urllib.request.Request(url, headers=headers)
    response = urllib.request.urlopen(req).read().decode('utf-8')
    # print(response)

    # json数据
    data = json.loads(response)

    for i in data['data']:
        # 明星
        casts = i['casts']
        # 导演
        directors = i['directors']

        print(casts, directors)
        # 写入文件
        with open('movie.txt', 'a+', encoding='utf-8', errors='ignore') as f:
            f.write(str((casts, directors)) + '\n')
            f.flush()

猜你喜欢

转载自blog.csdn.net/yx1179109710/article/details/80899738

爬虫（4）：抓取ajax数据

python 爬虫（四）抓取Ajax数据

爬虫进阶之动态网页（Ajax）数据抓取

python爬虫---实现项目(二) 分析Ajax请求抓取数据

爬虫如何抓取网页的动态加载数据-ajax加载

【python爬虫系列】4.Requests数据抓取

steam爬虫数据抓取

爬虫（爬虫原理与数据抓取）

Python爬虫4.2 — ajax(动态网页数据抓取)用法教程

【爬虫】Scrapy爬虫框架教程-- 抓取AJAX异步加载网页

Nodejs实现爬虫抓取数据

【爬虫】Scrapy 抓取网站数据

爬虫原理和数据抓取

使用selenium爬虫抓取数据

爬虫的原理和数据抓取

python零基础网络爬虫：抓取4A级猎头公司数据

爬虫Spider 05 - 代理参数-proxies | 控制台抓包 | requests.post() | 动态加载数据抓取-Ajax

Ajax数据抓取及抓取今日头条上的图片

php外挂python脚本抓取ajax数据

java爬虫抓取js/ajax动态生成的网页

爬虫 - 抓取非AJAX页面遇见的问题

爬虫原理与数据抓取-----（了解）通用爬虫和聚焦爬虫

唯品会数据抓取 | 爬虫

东方财富网数据抓取 | 爬虫

python爬虫抓取链家租房数据

python网络爬虫及数据抓取（一）

爬虫原理与数据抓取----- Requests模块

网络爬虫-神器fiddler抓取app数据

爬虫[1]---页面分析及数据抓取

爬虫的增量式抓取和数据更新

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)