干货必看l爬虫的HTTP原理之URI、URL

在这里插入图片描述

HTTP的基本原理。
HTTP的基本原理中详细介绍了URI和URL,有助于进一步了解爬虫的基本原理。
URI,网址.
在理解HTTP之前,我们先来看看URI和URL。我们经常听到两个术语:URI和网址。URI被称为统一资源标识符,或统一资源标识符,网址被称为统一资源定位器,或统一资源定位器。
比如GitHub的网站图标链接https://github.com/favicon.ico,,既是URL又是URI,就是有这样的图标资源,我们用URL/URI来唯一指定它的访问模式,包括访问协议https、访问路径/根目录、资源名favicon.ico通过这样的链接,我们可以从互联网上找到这个资源,就是URL/URI。
网址是URIs的一个子集,这意味着每个网址都是URI,但不是每个URI都是网址。那么什么样的URI不是网址呢?URI还包括一个名为URN的子类,它的全名是UniversalResourceName,也就是统一资源名。URN只命名资源,但不指定如何定位它们。例如,URN:isbn:0451450523指定了一本书的isbn,它可以唯一地标识这本书,但没有指定这本书的位置。这是URN。URL、urn和URI之间的关系可以显示如下:
在这里插入图片描述

网址,URN,URI图。
然而,在目前的互联网中,URN很少使用,所以几乎所有的URIs都是网址。因此,我们可以称一般的网页链接为网址或URI,我习惯称它们为网址。
芝麻HTTP为您提供了安全、稳定、高效、便捷的爬虫代理IP服务。在提供高级代理IP资源的同时,还可以设置不同类型的HTTP代理,并设置重复数据删除等标准。简单来说,芝麻HTTP就像一个中间桥梁,可以根据用户需求设置HTTP代理类型,从而帮助你不断获取行业数据。芝麻可以为您考虑资源质量问题,帮助您轻松进入“互联网大数据”时代。官网可以免费领取。更多问题,请点击官网信息客服。————h.zhimaruanjian.com,芝麻HTTP运营管理团队。
文章部分内容源于网络,联系侵删*
文章参考源于http://h.zhimaruanjian.com/news/2079.html

猜你喜欢

转载自blog.csdn.net/zhimaHTTP/article/details/113756742
今日推荐