- 浏览器从URL中解析出服务器的主机名
- 浏览器讲服务器的主机名转化成服务器的IP地址(DNS解析)
- 浏览器将端口号从URL解析出来
- 浏览器建立一条鱼web服务器的TCP连接
- 浏览器向服务器发送一条http请求报文
- 服务器向浏览器回送一条http响应报文
- 关闭连接,浏览器显示文档
- URL通用格式:
- <scheme>://<user>:<password>@<host>:<port>/<path>:<params>?<query>#<frag>
- 最重要的3个部分:
- scheme:方案,访问服务器以获取资源时要使用哪种协议,如:http ,方案名是大小写无关的。
- host:主机,资源宿主服务器的主机名,ip地址 【最重要】
- path:路径,服务端上的资源本地名,由斜杠分割开来,如:index.html 【最重要】
- user:password,访问资源时需要的用户名和密码,中间冒号不能丢
- port:端口,默认端口为80
- params:参数,参数健值对(如:name='xiaodeng'),url可以包含多个参数字段,他们之间以及与路径的其余部分之间用‘&’分隔。
- query:查询,用字符‘?’将其与url的其他部分分割开来
http://spark.apache.org/docs/latest/api/python/index.html