1. URL: Localizador uniforme de recursos
2. La forma de URL:
<protocolo>: // [<usuario>: <contraseña>] @ <host>: <puerto> / <ruta de acceso> [: <parámetros>]? <consulta> # <fragmento>
protocolo: protocolo de acceso, como: http, https, ftp
host: nombre de host, a veces ip, a veces nombre de dominio, por ejemplo: 192.168.10.12, www.baidu.com.
puerto: Puerto, el puerto del host al acceder. El puerto del protocolo http está predeterminado en 80, que puede omitirse.
ruta: podemos encontrar el host a través de host: puerto, pero hay muchos archivos en el host, y puede localizar archivos específicos a través de la ruta. Por ejemplo: https://baike.baidu.com/item/software testing / 327953
params: pasan parámetros al servidor, generalmente raros
consulta: cadena de consulta, debe consultar el contenido del servidor, ingréselo aquí. Por ejemplo: www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E8%BD%AF%E4%BB%B6%E6%B5%8B%E8%AF%95
Fragmento: Fragmento, la página web puede dividirse en diferentes fragmentos, si desea alcanzar la posición especificada directamente después de visitar la página web, puede configurarla en esta parte
Ejemplos:
( 1) estrella Sina:
http://slide.ent.sina.com.cn/star/slide_4_704_336821.html#p=1
( 2) Búsqueda de Baidu:
3. protocolo http:
HTTP (Protocolo de transferencia de hipertexto, Protocolo de transferencia de hipertexto): es un protocolo de capa de aplicación sin estado basado en el modo de solicitud y respuesta, conectado por TCP, puerto predeterminado: 80.
4. Flujo de trabajo HTTP:
( 1) El cliente y el servidor establecen una conexión TCP.
( 2) El cliente envía una solicitud al servidor.
( 3) El servidor recibe la solicitud del cliente y devuelve el contenido de la respuesta de acuerdo con la solicitud.
( 4) El cliente recibe el contenido de respuesta del servidor, y el contenido analizado se muestra en la parte frontal; luego, el cliente se desconecta del servidor.
5. Características de HTTP:
( 1) Soporta modo cliente / servidor.
( 2) Simple y rápido: cuando un cliente solicita un servicio de un servidor, solo se debe transmitir el método de solicitud y la ruta.
( 3) Flexible: HTTP permite la transmisión de cualquier tipo de objeto de datos.
( 4) No guarde el estado: si la información previa es necesaria para el procesamiento posterior, debe ser retransmitida.
Desventajas: puede llevar a un aumento en la cantidad de datos transferidos por conexión.
Ventajas: el servidor no necesita información previa para responder más rápido, reduciendo el consumo de CPU y memoria del servidor .
c. Introducción de cookies y mecanismo de sesión: Cookie registra información en el cliente para determinar la identidad del usuario, y Session registra información en el servidor para determinar la identidad del usuario.
( 5). Sin conexión: solo se procesa una solicitud por conexión. Después de que el servidor procesa la solicitud y recibe la respuesta, se desconecta.
Desventajas: la conexión TCP debe establecerse / desconectarse para cada solicitud , y la sobrecarga de comunicación aumenta.
Ventajas: el uso de este método puede ahorrar tiempo de transmisión.
c. Introducción posterior de una conexión persistente (HTTP keep-alive): en una conexión TCP, se pueden enviar múltiples datos continuamente sin desconectarse, reduciendo el número de conexiones tcp establecidas; el servidor general establecerá el tiempo de espera de mantener vivo y el número máximo de conexiones .
tiempo de espera de mantenimiento: cierre la conexión más de este tiempo después de la transmisión
Número máximo de conexiones: después de alcanzar el número máximo de conexiones, una nueva solicitud inicia una conexión y la conexión anterior se cerrará si no se alcanza el tiempo de espera
6. Desventajas de HTTP:
( 1) Robado: la comunicación HTTP utiliza texto sin formato, sin ninguna medida de cifrado durante la transmisión, puede ser escuchada a escondidas.
( 2) Encuentro de camuflaje: durante el proceso de transmisión, sin verificar la identidad de la parte que se comunica, es posible encontrar camuflaje en el medio
( 3) Tampered: Http solo analiza el mensaje y no lo verifica por completo, por lo que la integridad del mensaje no se puede verificar y se puede alterar.