java网络爬虫基础学习（三）

其他 2019-04-20 08:01:26 阅读次数: 0

尝试直接请求URL获取资源

豆瓣电影

https://movie.douban.com/explore#!type=movie&tag=%E7%83%AD%E9%97%A8&sort=time&page_limit=20&page_start=0

浏览器打开该地址：

发现是这样的

在这里我们需要用java抓取电影的信息，首先要找到资源链接，浏览器右键-》检查打开谷歌调试工具

我们可以看到下图

有很多的资源请求，在这里我是一个个搜索，看那个是电影信息的Headers

发现如下，找到一个search资源请求（即真实向后台发送的请求），这里tag=%E7%83%AD%E9%97%A是进行了编码。

在这里我把该Header中的请求URL在网址上试了一下，显示如下json（还可以是html、xml）数据发现确实是电影信息资源（在这里我用了谷歌的Json Viewer插件显示）

也可以直接看Response

接下来我们使用jsoup工具，请看我的下一篇：java网络爬虫基础学习（四）

猜你喜欢

转载自www.cnblogs.com/fmqdblog/p/10739493.html

java网络爬虫基础学习（三）

Python实现网络爬虫基础学习（三）

java网络爬虫基础学习（一）

java网络爬虫基础学习（四）

java网络爬虫基础学习（二）

Java网络爬虫基础

Java版网络爬虫基础

网络爬虫Larbin的学习（三）——整体架构

Python网络爬虫学习笔记（三）

《精通python网络爬虫》学习笔记三

JAVA网络爬虫（三）：HttpClient获取HTML

Python实现网络爬虫基础学习（二）

Python实现网络爬虫基础学习（一）

Python实现网络爬虫基础学习（四）

【爬虫学习笔记】网络协议及请求基础

网络爬虫基础知识学习

Python学习笔记-网络爬虫基础

python基础学习网络爬虫

网络爬虫基础知识（Java实现）

Java 网络爬虫基础知识

关于Java网络爬虫的基础知识

Java写网络爬虫基础篇（一）

Python 爬虫基础学习--网络爬虫与信息提取

Python网络爬虫学习手记（1）——爬虫基础

python网络爬虫学习笔记之一爬虫基础入门

Python爬虫入门基础学习（三）

java jsoup 网络爬虫学习例子（三）抓取豆瓣电影海报图片下载到本地

java基础学习（三）

Java基础学习三

Java网络爬虫该如何学习

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)