获得网站的静态资源 如css js 图片等的一些小坑

通过某些方式拿到了源代码,是f12 审查元素的那种源代码。通过url请求也好,selenium 啥的也好。总之拿到了源代码。

我个人偏好用java来处理,用的jsoup解析工具。

css:有两种存放方式

上图可知一种直接获得href就可以下载。

另外一种路径不全,需要加上网站地址才可以访问

js 也有两种,上面这种需要加上网站地址

某些图片也是类似的道理

在用java的url 下载资源的时候,需要在

网址面前加上http:   或者https:组成完整的网址。

某些资源需要区分http  https  比如浏览器用https访问的图片,用http下载  就会打不开图片

猜你喜欢

转载自blog.csdn.net/fangyuandoit/article/details/81183513
今日推荐