Conceptos relacionados con HTTP

Navegador

Un solicitante de protocolo HTTP usa el protocolo HTTP para obtener varios recursos en la red.

Servidor web

El respondedor del protocolo HTTP, que proporciona servicios web, es el cuerpo que responde a las solicitudes en el protocolo HTTP.

El hardware es una máquina en forma física o en forma de "nube". En la mayoría de los casos, puede no ser un servidor, sino un gran clúster compuesto por tecnologías como proxy inverso y equilibrio de carga.

El servidor web de significado de software puede ser más preocupante para nosotros. Es un programa de aplicación que proporciona servicios web y se ejecutará en un servidor de significado de hardware. Como Tomcat, Node.js, Apache, Nginx, IIS, Jetty, etc.

CDN

CDN, el nombre completo es "Content Delivery Network", traducido como "Content Delivery Network". Utiliza la tecnología de almacenamiento en caché y proxy en el protocolo HTTP en lugar de responder a las solicitudes del cliente desde el origen.

La ventaja de CDN es que puede almacenar en caché los datos del sitio de origen, de modo que la solicitud del navegador no llegue al servidor del sitio de origen "mil millas", y la respuesta se puede obtener directamente "a medio camino". Si el algoritmo de programación de CDN es excelente, puede encontrar el nodo más cercano al usuario, lo que reduce en gran medida el tiempo de respuesta.

Reptil

Como se mencionó anteriormente, el navegador es un agente de usuario que accede a Internet en nuestro nombre.

Pero el protocolo HTTP no estipula que el agente de usuario debe estar detrás de un "humano real", y también puede ser un "robot". El nombre oficial de estos "robots" se llama "Crawler", que en realidad es una especie de acceso automático. Aplicación de recursos web.

¿De dónde vino el reptil?

La mayoría de ellos son "liberados" por los principales motores de búsqueda, rastreando páginas web y almacenándolos en una gran base de datos, y luego estableciendo índices de palabras clave, para que podamos buscar rápidamente las páginas en la esquina de Internet en el motor de búsqueda.

El rastreador también tiene un lado negativo, consumirá recursos de red excesivos y ocupará el ancho de banda del servidor, por lo que hay un "txt "de acuerdo robots.txt, que estipula cuáles deben rastrearse y cuáles no.

Resumen

  1. La mayoría de los recursos en Internet se transmiten utilizando el protocolo HTTP;
  2. El navegador es el solicitante en el protocolo HTTP, es decir, el Agente de usuario;
  3. El servidor es el que responde en el protocolo HTTP, y Apache y Nginx se usan comúnmente;
  4. El CDN se encuentra entre el navegador y el servidor, y desempeña principalmente el papel de aceleración de caché;
  5. Los rastreadores son otro tipo de agente de usuario, un programa que accede automáticamente a los recursos de la red.
420 artículos originales publicados · 143 pulgares arriba · 890,000 vistas

Supongo que te gusta

Origin blog.csdn.net/jeikerxiao/article/details/93618883
Recomendado
Clasificación