A veces habrá contenido del sitio que no desea que los ROBOTS rastreen ni se hagan públicos. Para resolver este problema, la comunidad de desarrollo de ROBOTS proporciona dos métodos: uno es robots.txt y el otro es la etiqueta META de Robots.
1, <meta name = "Robots" contect = "all | none | index | noindex | follow | nofollow"> El valor predeterminado es all
. La descripción del atributo es la siguiente:
establecido en todos: el archivo se recuperará y el enlace de la página se puede Consulta;
establecido en ninguno: el archivo no se recuperará y el enlace de la página no se puede consultar;
establecido en índice: el archivo se recuperará;
establecido para seguir: el enlace de la página se puede consultar;
establecido en noindex: el archivo no se recuperará, pero se puede consultar el enlace de la página;
establecido en nofollow: el archivo no se recuperará y se puede consultar el enlace de la página.
2, revisit-after (Revisitar)
<META name = "revisit-after" CONTENT = "7 days">
Notificar a los motores de búsqueda cuántos días deben visitar una vez
Otros:
<META NAME = "GENERATOR" CONTENT = "Macromedia Dreamweaver MX">
<meta http-equiv = "Content-Type" content = "text / html; charset = gb2312">
<Meta http-equiv = "Content-Language" Content = "zh-CN">
<Meta http-equiv = "Actualizar" Contenido = "5; Url = http: //hi.baidu.com/pihi ”>
<Meta http-equiv =“ Expires ”Content =“ Wed, 26 Feb 1997 08:21:57 GMT ”>
<meta http-equiv =“ cache-control ”Content =“ no-cache ”>
<META name =“ keywords ”content =“ 关键字 ”>
<meta name =“ description ”content =“ 描述 ”>
<meta name =“ author ”content =“ 作者 ”>
< meta name = "build" content = "日期">
<meta name = "coprright" content = "版权">
<meta name = "reply-to" content = "email">
<meta name = "robots" content = " all ”>
<meta http-equiv =“ Page-Enter ”content =“ RevealTrans (Duration = 3, Transition = 23) ”>
<meta http-equiv =“ Page-Exit ”content =“ RevealTrans (Duration = 3, Transition = 23) ”>
<
-------------------------------------------------- -------------------------------------------------- -------- Las
metaetiquetas se dividen en dos partes: información de encabezado HTTP (HTTP-EQUIV) e información de descripción de página (NAME).
1.
Descripción del tipo de contenido y el idioma del contenido (configuración del conjunto de caracteres de visualización) : establezca el conjunto de caracteres utilizado en la página para indicar que el texto utilizado en la página de inicio ya está en el idioma, y el navegador llamará al conjunto de caracteres correspondiente basándose en este Mostrar el contenido de la página.
Nota: Esta metaetiqueta define el juego de caracteres utilizado en las páginas HTML como GB2132, que es el código de caracteres chino estándar nacional. Si reemplaza "charset = GB2312" por "BIG5", el juego de caracteres utilizado en esta página es el código Big5 del chino tradicional. Cuando navega por algunos sitios web extranjeros, el navegador IE le pedirá que descargue el soporte de idioma xx para mostrar la página correctamente. Esta función sabe qué juego de caracteres debe usarse para mostrar la página leyendo el atributo Content-Type de la metaetiqueta de la página HTML. Si el juego de caracteres correspondiente no está instalado en el sistema, IE le pedirá que lo descargue. Otros idiomas también corresponden a diferentes juegos de caracteres. Por ejemplo, el juego de caracteres japonés es "iso-2022-jp
" y el juego de caracteres coreano es "ks_c_5601".
Opciones de juego de caracteres: ISO-8859-1 (inglés), BIG5, UTF-8, SHIFT-Jis, Euc, Koi8-2, us-ascii, x-mac-roman, iso-8859-2, x-mac-ce, iso-2022-jp, x-sjis, x-euc-jp, euc-kr, iso-2022-kr, gb2312, gb_2312-80, x-euc-tw, x-cns11643-1, x-cns11643-2, etc. Juego de caracteres; el contenido de Content-Language también puede ser: EN, FR y otros códigos de idioma.
2. Actualizar (Actualizar)
3. Caduca (Caduca)
Descripción: Especifique el tiempo de caducidad de la página web en la caché Una vez que caduca la página web, debe recuperarse en el servidor.
Nota: Se debe utilizar el formato de hora de GMT, o establecerlo directamente en 0 (el número indica cuánto tiempo vencerá).
4.
Descripción de Pragma (modo cach) : prohíbe que el navegador acceda al contenido de la página desde la caché de la máquina local.
Nota: La página web no se guarda en la caché y la página se actualiza cada vez que la visita. Con esta configuración, los visitantes no podrán navegar sin conexión.
5.
Descripción de configuración de cookies (configuración de cookies) : cuando el navegador visita una determinada página, se almacenará en el caché y se podrá leer del caché cuando se vuelva a visitar la próxima vez para mejorar la velocidad. Cuando desee que los visitantes actualicen el icono de su anuncio cada vez o que actualicen su contador cada vez, inhabilite el almacenamiento en caché. Normalmente, no es necesario deshabilitar el almacenamiento en caché para archivos HTML. Para páginas como ASP, puede deshabilitar el almacenamiento en caché, porque cada vez que ve una página que se genera dinámicamente en el servidor, el almacenamiento en caché no tiene sentido. Si la página web caduca, se eliminará la cookie guardada.
Uso: <Meta http-equiv = "Set-Cookie" Content = "cookievalue = xxx; expires = Wednesday,
21-Oct-98 16:14:21 GMT; path = /">
Nota: Se debe utilizar el formato de hora GMT.
6. Ventana de destino (configuración de la ventana de visualización)
Descripción: Fuerza que la página se muestre como una página separada en la ventana actual.
Uso: <Meta http-equiv = "Widow-target" Content = "_ top">
Nota: Este atributo se usa para evitar que otros llamen a su página en el marco. Opciones de contenido: _blank, _top, _self, _parent.
7, Pics-label (página de clasificación RSAC)
Descripción: Hay un elemento del conjunto de Opciones de Internet de IE, puede evitar que algunos sitios web sean restringidos y los sitios web con clasificación X lo
hacen mediante la configuración de parámetros.
Uso: <META http-equiv = “Pics-label” Contect =
“(PICS - 1.1'http: //www.rsac.org/ratingsv01.html '
I gen comment'RSACi North America Sever' por'inet @ microsoft. com '
para'http: //www.microsoft.com' en '1997.06.30T14: 21-0500' r (n0 s0 v0 l0)) ”>
Nota: No establezca el nivel demasiado alto. El sistema de evaluación de RSAC proporciona un estándar para evaluar el contenido del sitio web. Los usuarios pueden configurar Microsoft Internet Explorer (IE3.0 y superior) para que excluya los sitios que contienen contenido pornográfico y violento. El HTML del ejemplo anterior se tomó de la página de inicio de Microsoft. El (n 0 s 0 v 0 l 0) en el código significa que el sitio no tiene contenido insalubre. La calificación es evaluada por RSAC, la agencia de calificación de la Comisión Estadounidense de Entretenimiento. Si desea obtener más información sobre el sistema de calificación RSAC, o si necesita calificar su propio sitio web, puede visitar el sitio web de RSAC: http: //www.rsac .org /.
8.
Descripción de Page-Enter, Page-Exit (entrar y salir) : se trata de algunos efectos especiales cuando la página se carga y se llama.
Uso: <Meta http-equiv = “Page-Enter” Content = “blendTrans (Duration = 0.5)”>
<Meta http-equiv = “Page-Exit” Content = “blendTrans (Duration = 0.5)”>
Nota: blendTrans es Tipo de filtro dinámico que produce un efecto de desvanecimiento. Otro filtro dinámico, RevealTrans, también se puede utilizar para efectos de entrada y salida de página:
<Meta http-equiv = “Page-Enter” Content = “revelTrans (duration = x, transición = y)”>
<Meta http-equiv = ” Page-Exit "Content =" revelTrans (duración = x, transición = y) "> La
duración representa la duración del efecto de filtro (unidad: segundos)
Tipo de filtro de transición. Indica qué efecto especial se utiliza, el valor es 0-23.
0 Reducción rectangular
1 Expansión rectangular
2 Reducción circular
3 Expansión
circular 4 Actualización de abajo hacia arriba
5 Actualización de arriba hacia abajo
6 Actualización de izquierda a derecha
7 Actualización de derecha a izquierda
8 Persianas verticales
9 Persianas horizontales
10 Persianas horizontales mal
colocadas 11 Persianas verticales mal colocadas
12 puntos Difusión
13 Actualización de izquierda a derecha
14 Actualización de centro a izquierda
15 De centro a arriba y abajo 16 De arriba a abajo
a centro
17 De
abajo a la derecha a arriba a la izquierda 18 De arriba a la derecha a abajo a la izquierda
19 De arriba de izquierda a abajo a la derecha
20 De abajo de izquierda a arriba a la derecha
21 Barra horizontal
22 Barra vertical
23 Más de 22 tipos seleccionados al azar Especies
9. Descripción de MSThemeCompatible (tema XP)
: si se debe desactivar el
uso del tema xp en IE : <Meta http-equiv = "MSThemeCompatible" Content = "Yes">
Nota: Desactive el estilo de visualización del sistema de botones estéreo azules de xp, para que win2k es muy similar.
10.
Descripción de IE6 (generador de páginas) : el generador de páginas es ie6
Uso: <Meta http-equiv = "IE6" Content = "Generator">
Nota: De qué está hecho, similar al fabricante del producto.
11.
Descripción del tipo de script de contenido (relacionado con el script) : esta es una especificación reciente del W3C que especifica el tipo de script en la página.
Uso: <Meta http-equiv = "Content-Script-Type" Content = "text / javascript">
★ El
nombre de la variable NAME describe la página web, correspondiente al Contenido (contenido de la página web), para que los robots de los motores de búsqueda puedan encontrar y clasificar (actualmente Casi todos los motores de búsqueda utilizan robots en línea para encontrar automáticamente valores meta para clasificar páginas web).
El valor de nombre (nombre = "") especifica el tipo de información proporcionada. Algunos valores ya están definidos. Por ejemplo, descripción (descripción), palabra clave (palabra clave), actualizar (actualizar), etc. También puede especificar otros valores arbitrarios, como fecha de creación (fecha de creación),
ID de documento (número de documento) y nivel (nivel).
El contenido del nombre especifica el contenido real. Por ejemplo, si especifica el nivel como valor, entonces el Contenido puede ser inicial, intermedio o avanzado.
1.
Descripción de las palabras clave (palabras clave) :
uso de la lista de palabras clave proporcionada para los motores de búsqueda : <Meta name = "Keywords" Content = "Keyword 1, Keyword 2, Keyword 3, Keyword 4, ...">
Nota: Las palabras clave están separadas por comas en inglés ",". El uso habitual de META es especificar palabras clave utilizadas por los motores de búsqueda para mejorar la calidad de la búsqueda. Cuando varios elementos META proporcionan información sobre la dependencia del idioma del documento, el motor de búsqueda utilizará la función de idioma para filtrar y mostrar los resultados de la búsqueda a través de la referencia de prioridad del idioma del usuario. Por ejemplo:
<Meta name = "Kyewords" Lang = "EN" Content = "vacation, greece, sunshine">
<Meta name = "Kyewords" Lang = "FR" Content = "vacances, grè: ce, soleil">
2, Descripción (Introducción)
: La descripción se utiliza para indicar a los motores de búsqueda el contenido principal de su sitio web.
Uso: <Meta name = "Description" Content = "Una breve descripción de su página web">
Nota:
3. Descripción de robots (asistente de robot)
: Robots se utiliza para indicar a los robots de búsqueda qué páginas deben indexarse y qué páginas no necesitan indexarse. Los parámetros de Contenido son all, none, index, noindex, follow y nofollow. El valor predeterminado es todo.
Uso: <Meta name = "Robots" Content = "All | None | Index | Noindex | Follow | Nofollow">
Nota: Muchos motores de búsqueda utilizan búsquedas de robots / arañas para iniciar sesión en el sitio web, y estos robots / arañas utilizarán meta Algunas características del elemento determinan cómo iniciar sesión.
todo: se recuperará el archivo y se podrá consultar el enlace de la página;
none: el archivo no se recuperará y el enlace de la página no se puede consultar; (la misma función que "noindex, no follow")
índice: se recuperará el archivo; (deje que el robot / araña inicie sesión)
siga: el enlace de la página Se puede consultar;
noindex: el archivo no se recuperará, pero se puede consultar el enlace de la página; (no permita que el robot / araña inicie sesión)
nofollow: el archivo no se recuperará y el enlace de la página se puede consultar. (No permita que el robot / araña siga los enlaces de esta página para mirar hacia abajo)
4.
Descripción del autor (autor) : marque el autor o el equipo de producción de la página web
Uso: <Meta name = "Author" Content = "Zhang San, abc @ sina .com ">
Nota: El contenido puede ser: el nombre de usted o de su equipo de producción, o Correo electrónico
5.
Descripción del copyright (copyright) : Marque el
uso del copyright : <Meta name =" Copyright "Content =" El copyright de esta página pertenece a Zerospace. Todos los derechos reservados ">
Nota:
6.
Descripción del generador (editor) : Descripción del editor
Uso: <Meta name =" Generator "Content =" PCDATA | FrontPage | ">
Nota: Content =" El editor que utiliza "
7.
Descripción de la revisión posterior (revisión) :
用法 : <META name = "revisit-after" CONTENT = "7 days">
Descripción y uso de etiquetas de encabezado de página
Supongo que te gusta
Origin blog.csdn.net/qq_36129701/article/details/104776726
Recomendado
Clasificación