Observación unificada | Mejores prácticas para monitorear SQL Server usando Prometheus

Autor: weiwei

Introducción al servidor SQL

¿Qué es SQL Server?

Microsoft SQL Server es una solución de base de datos relacional de Microsoft que admite una variedad de procesamiento de transacciones, inteligencia empresarial y aplicaciones analíticas en entornos de TI empresariales. Microsoft SQL Server es una de las tecnologías de bases de datos líderes en el mercado.

Características del servidor SQL

  • Estable: De acuerdo con las necesidades de aplicación de las empresas, se desarrollan soluciones que se adaptan al entorno para garantizar la seguridad de los datos y el buen funcionamiento de la empresa.
  • Fácil de usar: proporciona una gran cantidad de herramientas de administración gráfica para facilitar a los usuarios la creación rápida de un sistema de base de datos.
  • Compatible: adaptado de forma nativa a los sistemas Windows, proporcionando acceso API enriquecido.
  • Rendimiento: múltiples algoritmos de optimización de motores de bases de datos admiten grandes cantidades de consultas y almacenamiento de datos.

Conceptos básicos de SQL Server

Motor relacional: el motor relacional controla el procesamiento de datos del motor de almacenamiento y proporciona componentes de SQL Server para determinar exactamente cómo se deben ejecutar las consultas. El motor relacional consta de tres partes principales. El analizador CMD (analizador) es el principal responsable de identificar y eliminar errores semánticos y gramaticales y generar árboles de consulta. El Optimizador garantiza que la respuesta a la consulta solicitada sea lo más eficiente posible al eliminar tareas redundantes y encontrar el plan óptimo. El Query Executoe genera el comportamiento de la lógica de recuperación de datos.

Motor de almacenamiento: cuando los datos se almacenan mediante un motor de almacenamiento, los datos se recuperan de un sistema de almacenamiento como una SAN o un disco. Hay tres tipos de archivos en el motor de almacenamiento: archivos primarios, archivos auxiliares y archivos de registro. El Método de Acceso es responsable del intercambio de datos entre el administrador de caché y el registro de transacciones. El Buffer Manager almacena en caché las páginas y el plan de ejecución actual. El Administrador de transacciones utiliza registros y administradores de bloqueos para administrar las transacciones.

Capa de protocolo: esta capa admite la arquitectura cliente-servidor y la transmisión. La capa de protocolo admite tres tipos de arquitecturas cliente-servidor: memoria compartida, TCP/IP y canalizaciones con nombre.

Principales escenarios aplicables

Microsoft SQL Server, con su interfaz visual y las opciones y herramientas que tiene, es ideal para almacenar toda la información requerida en una base de datos relacional y administrar dichos datos fácilmente.

  • Procesamiento de transacciones: SQL Server admite el procesamiento de transacciones. Al utilizar transacciones, los usuarios pueden agrupar una serie de operaciones de base de datos y asegurarse de que todas se ejecuten correctamente o que todas vuelvan al estado original. Esto es fundamental para aplicaciones que requieren coherencia de datos, como transacciones bancarias, compras en línea y gestión de inventario.
  • Análisis inteligente de todos los datos a través de grandes clústeres de datos: SQL Server proporciona potentes capacidades de inteligencia empresarial y almacenamiento de datos. Los usuarios pueden utilizar SSIS para extraer, transformar y cargar datos de diferentes fuentes de datos en el almacén de datos. Luego puede utilizar SSAS para crear cubos y modelos de datos multidimensionales para respaldar necesidades complejas de informes y análisis de datos. Además, SQL Server también proporciona capacidades de análisis predictivo y extracción de datos para ayudar a las organizaciones a descubrir patrones y tendencias ocultos en los datos.
  • Escalabilidad: SQL Server proporciona una amplia gama de capacidades de desarrollo y programación para ayudar a los desarrolladores de aplicaciones. SQL Server también admite la expansión horizontal y vertical. Los usuarios pueden aumentar los recursos de hardware del servidor cuando sea necesario o particionar y distribuir datos entre múltiples servidores para manejar datos a gran escala y altas cargas simultáneas. SQL Server permite a los usuarios integrar fácilmente sistemas de administración de bases de datos con cualquier dispositivo y servicios de Azure para mejorar el rendimiento y las capacidades de análisis de los datos.

Introducción a la versión principal

SQL Server 2022: seguridad, rendimiento, disponibilidad y otras mejoras; almacenamiento de consultas y procesamiento inteligente de consultas

SQL Server 2019: virtualización de datos y clústeres de big data; bases de datos inteligentes, consultas inteligentes; bases de datos en memoria

SQL Server 2017: funciones de base de datos de gráficos, vistas de administración dinámica, optimización de memoria y más

SQL Server 2016: OLTP en memoria, Stretch Database, Hadoop integrado, etc.

Monitorear métricas clave

Aquí presentamos indicadores clave comunes en el monitoreo de servicios de SQL Server.

Indicadores del sistema

Estado de funcionamiento

El estado de inicio es el indicador más básico para monitorear SQL Server, indicando si la instancia de SQL Server se está ejecutando normalmente o si se ha reiniciado. Cuando se reinicia SQL Server, los datos que no se hayan confirmado se perderán y es posible que se produzcan errores con una pequeña probabilidad.

Versión/hora de instancia

Supervise si la instancia de SQL Server iniciada cumple con las expectativas y si es la versión de SQL Server requerida por la empresa. Asegúrese de que la hora local de SQL Server sea coherente con la del cliente; de ​​lo contrario, la hora devuelta por la base de datos puede ser incorrecta.

indicadores de alfabetización

índice de página

Lectura y escritura de páginas: la página es la unidad más pequeña de administración de disco del motor de almacenamiento de SQL Server. El espacio en disco asignado para archivos de datos (.mdf o .ndf) en la base de datos se puede dividir lógicamente en páginas (números continuos de 0 a n) . Las operaciones de E/S de disco se realizan a nivel de página. Es decir, SQL Server lee o escribe todas las páginas de datos. Por lo tanto, el monitoreo de lectura y escritura de páginas es particularmente importante. A través del indicador del número de páginas leídas y escritas, se puede calcular la tasa de lectura y escritura de páginas para juzgar el rendimiento de ejecución de SQL Server.

Tiempo de permanencia de la página en caché: uno de los principales objetivos de diseño de todo software de base de datos es minimizar la E/S del disco, porque las operaciones de lectura y escritura del disco consumen muchos recursos. SQL Server genera un grupo de búfer en la memoria para contener las páginas leídas de la base de datos. Necesitamos monitorear la vida útil de la página en el grupo de caché. Cuanto más tiempo exista la página en el grupo de caché, mayor será la probabilidad de que sea atacada, lo que significa que el acceso a la página no requiere acceso al disco.

Escritura diferida: después de modificar una página en la memoria caché del búfer, no se vuelve a escribir en el disco inmediatamente; en cambio, se marca como "sucia". Esto significa que una página se puede escribir lógicamente varias veces antes de escribirla físicamente en el disco. En condiciones normales de funcionamiento, las páginas sucias se descargan periódicamente en el disco. Cuando se escriben constantemente nuevos datos en SQL Server y el caché no es suficiente, una gran cantidad de páginas sucias se eliminarán del caché.

Punto de control: cuando se produce un punto de control, SQL Server requiere que todas las páginas sucias se vacíen en el disco. En este momento, el rendimiento de SQL Server se ve afectado hasta cierto punto. Necesitamos monitorear la velocidad de los puntos de control para garantizar que se actualicen tan rápido como se esperaba.

Error de página: cuando ocurre un error de página, significa que la página requerida está fuera del área de memoria que SQL Server puede administrar. Cuando se encuentra un error de página, la ejecución del programa se detiene y se establece en estado de espera. El sistema operativo busca en el disco la dirección solicitada. Cuando se encuentra la página, el sistema operativo la copia del disco a una página de RAM libre. El sistema operativo permite que el programa continúe con la ejecución.

Registrar tiempos de crecimiento

El motor de base de datos de SQL Server escribe registros para cada operación en la base de datos, incluso cuando se realiza un proceso de modificación de datos, cuando se crea o elimina una tabla o índice de base de datos y cada vez que se asigna o elimina una página y se inicia una transacción SQL. o terminado. Los registros ayudan a restaurar una base de datos a un momento específico en caso de una falla del sistema o del hardware. En sistemas altamente transaccionales con operaciones de registro excesivas, el archivo de registro de transacciones de SQL Server crecerá rápidamente hasta alcanzar su tamaño máximo, generando el error número 9002. Si la opción de crecimiento automático está habilitada, la unidad de disco subyacente se quedará sin espacio libre.

Tiempo de espera (bloqueo) de E/S

El tiempo de espera de E/S es una métrica que se puede utilizar para detectar problemas de E/S. Cuando SQL Server escribe datos en un archivo o lee datos de un archivo, necesita esperar mucho tiempo, lo que se expresa como tiempo de espera de E/S. Los tiempos de pausa prolongados indican problemas de E/S y actividad de disco ocupada. La E/S de archivos pertenece a la ruta crítica de la base de datos y el tiempo de espera refleja directamente el retraso del cliente en la lectura y escritura de SQL Server.

Cada base de datos almacena archivos diferentes y puede utilizar diferentes medios de almacenamiento. Por lo tanto, además de monitorear el tiempo de espera de E/S general, también es necesario monitorear el tiempo de espera de E/S de cada base de datos para que la operación y el mantenimiento puedan realizar optimizaciones específicas.

Métricas de conexión

En SQL Server, la ejecución de consultas depende del establecimiento y mantenimiento de conexiones de cliente. Cuando es necesario mantener la disponibilidad y el alto rendimiento de SQL Server, monitorear las conexiones es un buen punto de entrada para los trabajos de operación y mantenimiento. Cuando hay demasiadas conexiones simultáneas a SQL Server, es posible que el servidor esté sobrecargado. Cuando una conexión se establece correctamente, cada conexión genera una sobrecarga independientemente de si se utiliza o no.

Métricas de almacenamiento

Como se mencionó anteriormente, aunque SQL Server almacena datos en el disco, debido a la existencia del grupo de caché, también se debe prestar atención al uso de la memoria de SQL Server. De forma predeterminada, SQL Server administra dinámicamente sus requisitos de memoria en función de los recursos disponibles del sistema. Si SQL Server necesita más memoria, consulta el sistema operativo para determinar si hay memoria física libre disponible y utiliza la memoria disponible. Si el sistema operativo se queda sin memoria disponible, SQL Server libera memoria al sistema operativo hasta que se alivie la condición de poca memoria o hasta que SQL Server alcance el límite mínimo de memoria del servidor.

Actuación

Velocidad de procesamiento de transacciones (TPS)

Una transacción se refiere al proceso en el que un cliente envía una solicitud a SQL Server y luego SQL Server responde. El cliente comienza a cronometrar cuando envía una solicitud de consulta y finaliza después de recibir una respuesta de SQL Server para calcular el tiempo utilizado y la cantidad de transacciones completadas. Generalmente, el rendimiento de SQL Server se mide por la cantidad de solicitudes de clientes completadas por segundo.

Tasa de procesamiento por lotes (T-SQL)

T-SQL (Transact-SQL) es un conjunto de extensiones de programación de Sybase y Microsoft que agrega una variedad de capacidades al lenguaje de consulta estructurado (SQL), incluido el control de transacciones, el manejo de excepciones y errores, el manejo de filas y las variables declaradas. Todas las aplicaciones que se comunican con SQL Server lo hacen enviando declaraciones T-SQL al servidor.

Definición detallada de indicadores.

Indicadores del sistema

indicadores de alfabetización

Métricas de conexión

Métricas de almacenamiento

Actuación

Monitorear el mercado

Proporcionamos descripción general de SQL Server de forma predeterminada.

Descripción general

En este panel, puede ver los indicadores en los que debe centrarse cuando SQL Server se está ejecutando. Al verificar el estado de SQL Server, primero verifique si hay algún estado anormal en la descripción general y luego verifique los indicadores específicos.

  • Estado de inicio: el verde representa el funcionamiento normal, el rojo representa el funcionamiento anormal
  • Uso de la memoria: utilice indicaciones de color rojo, amarillo y verde. Cuando el uso de la memoria es inferior al 80%, es verde, cuando el uso de la memoria es del 80% al 90%, es amarillo y cuando el uso de la memoria es superior al 90% , es rojo.

recurso

La memoria es el recurso de hardware clave de SQL Server. A través de este panel, puede comprender el uso de la memoria de SQL Server:

  • Memoria máxima: proporciona el estado general de la memoria.
  • Uso/uso de memoria: analizar tendencias en el uso de memoria
  • Número de extensiones de archivo: analice las tendencias en el volumen de datos operativos
  • Tamaño del archivo de la base de datos: vea la tendencia del volumen de datos almacenados en la base de datos y la tendencia del volumen de almacenamiento de registros

actuación

En el siguiente panel puede ver la eficiencia operativa de SQL Server, que se divide en las siguientes tres categorías:

  • Tasa de procesamiento de transacciones: indica la cantidad de transacciones procesadas por SQL Server por segundo, lo que afecta directamente la demora de las solicitudes de consulta del cliente.
  • Tasa de procesamiento por lotes: indica cuántos Transact-SQL SQL Server puede procesar por segundo
  • Número de interbloqueos: detecte si se producen interbloqueos debido a la competencia de la base de datos, lo que afecta gravemente el rendimiento.

Lee y escribe

Puede ver la eficiencia operativa de SQL Server en el siguiente panel:

  • Velocidad de lectura y escritura de páginas: supervise la tendencia de la velocidad de las páginas de lectura y escritura, si alcanza la velocidad esperada, si se producen picos y valles, etc.
  • Tasa de escritura diferida: ingrese periódicamente la tendencia de la tasa de páginas sucias y controle si es estable
  • Esperanza de vida de la página: cuanto mayor sea la esperanza de vida de la página, mejor
  • Tiempo de espera de E/S: tendencia del tiempo de espera de SQL Server para leer y escribir archivos
  • Tasa de punto de control: cuando ocurre un punto de control, es necesario monitorear la tasa de funcionamiento

Bloqueo de E/S de la base de datos

Además de monitorear el tiempo de espera de E/S general de SQL Server, también necesita monitorear el tiempo de espera de E/S de la base de datos por separado. Cada base de datos almacena diferentes archivos y puede almacenarse en diferentes discos, por lo que es necesario realizar soluciones de optimización específicas.

conectar

Es necesario verificar el estado de la conexión de SQL Server en cualquier momento para evitar que una concurrencia excesiva afecte el rendimiento.

  • Conexiones totales: supervise las tendencias en las conexiones generales
  • Número de errores de conexión: supervise si algún cliente tiene un error de conexión para garantizar el funcionamiento normal del sistema.
  • Usuarios de conexión de cada base de datos: supervise los clientes conectados a cada base de datos por separado y la cantidad de conexiones iniciadas por cada cliente.

Estado de la base de datos

Supervise si cada base de datos se está ejecutando normalmente. La siguiente tabla define el estado de la base de datos.

estado definición
EN LÍNEA Se puede acceder a la base de datos. El grupo de archivos principal permanece en línea aunque la fase de deshacer de la recuperación aún no se haya completado.
DESCONECTADO La base de datos no se puede utilizar. La base de datos está fuera de línea debido a una acción explícita del usuario y permanece fuera de línea hasta que se realiza una acción adicional del usuario. Por ejemplo, la base de datos podría desconectarse para que los archivos se puedan mover a un disco nuevo. Luego, una vez completada la operación de movimiento, vuelva a poner la base de datos en línea.
RESTAURANDO Se están restaurando uno o más archivos del grupo de archivos principal, o uno o más archivos secundarios se están restaurando sin conexión. La base de datos no está disponible.
RECUPERACIÓN Recuperando base de datos. El proceso de recuperación es un estado temporal y la base de datos estará en línea automáticamente una vez que la recuperación sea exitosa. Si la recuperación falla, la base de datos estará en un estado sospechoso. La base de datos no está disponible.
RECUPERACIÓN PENDIENTE SQL Server encontró un error relacionado con los recursos durante la recuperación. La base de datos no está dañada, pero es posible que falten archivos o que las limitaciones de recursos del sistema impidan que se inicie la base de datos. La base de datos no está disponible. Se requiere una acción adicional del usuario para resolver el problema y permitir que se complete el proceso de recuperación.
SOSPECHAR Al menos el grupo de archivos principal es sospechoso o posiblemente esté dañado. Durante el inicio de SQL Server, la base de datos no se puede recuperar. La base de datos no está disponible. Se requiere una acción adicional del usuario para resolver el problema.
EMERGENCIA El usuario realizó cambios en la base de datos y estableció su estado en EMERGENCIA. La base de datos está en modo de usuario único y se puede reparar o restaurar. La base de datos está marcada como READ_ONLY, el registro está deshabilitado y el acceso está limitado a los miembros de la función fija de servidor sysadmin. EMERGENCIA se utiliza principalmente para solucionar problemas. Por ejemplo, una base de datos marcada como "sospechosa" se puede establecer en estado de EMERGENCIA. Esto permite al administrador del sistema acceso de solo lectura a la base de datos. Solo los miembros de la función fija de servidor sysadmin pueden establecer una base de datos en estado de EMERGENCIA.

Reglas de alerta clave

Al configurar reglas de alarma para SQL Server, recomendamos configurar reglas de alarma a partir de los siguientes aspectos según los indicadores recopilados anteriormente, es decir, estado de ejecución, uso de recursos y uso de conexión. En términos generales, generamos reglas de alarma que afectan el uso normal de SQL Server de forma predeterminada, con mayor prioridad. Los usuarios personalizan las alarmas relacionadas con el negocio, como las tasas de lectura y escritura. Las siguientes son algunas reglas de alerta recomendadas.

Estado de operación

Servidor SQL caído

El tiempo de inactividad de SQL Server es una regla de alarma con un umbral de 0/1. En términos generales, los servicios de SQL Server implementados en entornos de Alibaba Cloud como ACK tienen capacidades de alta disponibilidad. Cuando una instancia de SQL Server se detiene, otras instancias continuarán funcionando. Esta alarma puede deberse a que todos los servidores SQL no se inician normalmente o al error del exportador y la imposibilidad de obtener datos. De forma predeterminada, configuramos una alarma que indica que SQL Server no puede recuperarse en 5 minutos.

Reinicio del servidor SQL

El reinicio de SQL Server es una regla de alarma con un umbral de 0/1. En la mayoría de los casos, no hay pérdida de datos en SQL Server debido a la existencia de registros. Sin embargo, después de reiniciar SQL Server, el contenido del grupo de caché se borra, lo que provoca una lentitud temporal en las consultas. La transacción que se está ejecutando debe revertirse al cliente, lo que provoca una serie de errores temporales que requieren que el cliente reinicie la solicitud.

El uso de recursos

El uso de memoria es demasiado alto

La política de uso de SQL Server para la memoria del servidor es ocupar tanta memoria como utiliza, sin restricciones, puede ocupar todos los recursos de memoria del nodo. Cuando el uso de memoria es demasiado elevado, SQL Server no puede ejecutarse correctamente. Los umbrales de uso de memoria que establecemos son: valor de peligro 80%, valor de advertencia 90%. Cuando el uso de la memoria es del 80%, el nodo opera bajo una carga alta, pero generalmente no afecta el uso normal. Cuando la tasa de uso de la memoria es del 90% durante un período prolongado, se emitirá una alarma para indicar la escasez de recursos de operación y mantenimiento y se debe solucionar lo antes posible.

Se produce un punto muerto

La aparición de interbloqueos en SQL Server es una regla de alarma con un umbral de 0/1, independientemente del número de interbloqueos. La cantidad de interbloqueos encontrados en un sistema suele ser muy pequeña, pero una vez que ocurre un interbloqueo, es necesario finalizar el lote actual ejecutado por el subproceso, revertir la transacción de la víctima del interbloqueo y revertir un mensaje de error al cliente. .

Uso de la conexión

Se produjo un error de conexión.

El error de conexión de SQL Server es una regla de alarma con un umbral de 0/1. Este error puede ocurrir por muchas razones, tales como: el host remoto cierra por la fuerza la conexión existente o el tiempo de espera expira. Ha transcurrido el período de tiempo de espera antes de que se complete la operación o el servidor no responde, no se puede generar el contexto SSPI, etc. Debe iniciar sesión en la base de datos y verificar el registro para ver la causa del error.

Escenarios de problemas típicos y su resolución de problemas/soluciones

El rendimiento de SQL Server es deficiente

El bajo rendimiento de SQL Server se refleja en los indicadores de baja tasa de procesamiento de transacciones (TPS) y tasa de procesamiento por lotes (T-SQL) . El bajo rendimiento puede deberse a muchas razones. Necesitamos contactar múltiples indicadores para solucionar problemas.

Verificar el uso de la memoria

  • Motivo: cuando no hay suficiente memoria, el grupo de caché no puede almacenar en caché todos los datos del punto de acceso, lo que genera que se envíen múltiples solicitudes de acceso a datos al disco.
  • Método de solución de problemas: verifique el panel de uso de memoria en el disco para verificar si el uso de memoria es siempre alto. Verifique el historial de alarmas para ver si hay recursos de memoria insuficientes.
  • Solución: Optimice los recursos de disco del nodo correspondiente;

Verificar el tiempo de espera de E/S

  • Causa: Los tiempos de espera de E/S prolongados indican problemas de E/S y actividad intensa del disco.
  • Método de solución de problemas: verifique el panel de tiempo de espera de E/S en el mercado y verifique si el tiempo de espera de E/S siempre es alto. Verifique el historial de alarmas para ver si hay recursos de memoria insuficientes.
  • Solución: Puede haber una gran cantidad de accesos máximos y un aumento repentino en el acceso al disco. Considere optimizar la arquitectura de SQL Server, verifique más a fondo si el sistema de archivos del nodo tiene problemas de E/S, optimice los recursos del disco del nodo correspondiente;

Verifique los tiempos de crecimiento del registro

  • Causa: Cuando se realiza cualquier modificación en la base de datos, SQL Server escribe las modificaciones en el búfer de registro y luego escribe los datos del búfer en el disco. Cuando se escriben demasiados datos, el contenido del registro no se puede vaciar en el disco a tiempo.
  • Método de solución de problemas: consulte el panel de tiempos de crecimiento de registros en el mercado y verifique si hay un aumento repentino en los tiempos de crecimiento de registros en un período de tiempo determinado.
  • Solución alternativa: el disco seleccionado para el archivo de registro debe funcionar bien en términos de rendimiento de lectura y escritura secuencial y latencia mínima.

comprobar punto de control

  • Motivo: al realizar un punto de control, SQL Server vacía todas las páginas sucias de la memoria en el disco, lo que afectará el rendimiento general de la base de datos y ejercerá una mayor presión sobre el disco.
  • Método de solución de problemas: verifique el panel del punto de control para ver si hay datos de velocidad del punto de control que indiquen que se realizó una operación del punto de control durante este período de tiempo.
  • Solución: Diseñar el horario de los puntos de control para evitar las horas pico.

Construcción del sistema de monitoreo.

Puntos débiles de construir su propio Prometheus para monitorear SQL Server

Por lo general, nuestro SQL Server actual se implementa en ECS, por lo que cuando construimos nuestro propio Prometheus para monitorear SQL Server, los problemas típicos que enfrentaremos son:

  1. Debido a factores como la seguridad y la gestión organizacional, los servicios de usuario generalmente se implementan en múltiples VPC aisladas, y Prometheus debe implementarse repetidamente e independientemente en múltiples VPC, lo que genera altos costos de implementación y operación y mantenimiento.

  2. Cada sistema de monitoreo completo de construcción propia requiere la instalación y configuración de Prometheus, Grafana, AlertManager, etc. El proceso es complejo y el ciclo de implementación es largo.

  3. Carece de un mecanismo de descubrimiento de servicios (ServiceDiscovery) que esté perfectamente integrado con Alibaba Cloud ECS y no puede definir de manera flexible objetivos de rastreo basados ​​en etiquetas ECS. Si implementa funciones similares usted mismo, debe usar el lenguaje Golang para desarrollar código (llame a la interfaz POP de Alibaba Cloud ECS), integrarlo en el código abierto de Prometheus, compilarlo, empaquetarlo e implementarlo. El umbral de implementación es alto , el proceso es complejo y las actualizaciones de versión son difíciles.

  4. El Grafana SQL Server de código abierto de uso común no es lo suficientemente profesional y carece de una optimización profunda basada en los principios, características y mejores prácticas de SQL Server.

  5. Faltan plantillas de indicadores de alarma de SQL Server, lo que requiere que los usuarios investiguen y configuren los elementos de alarma por sí mismos, lo que supone una gran carga de trabajo.

Utilice Alibaba Cloud Prometheus para monitorear SQL Server de construcción propia

  • Inicie sesión en la consola ARMS [ 1] .
  • Seleccione Monitoreo de Prometheus > Lista de instancias de Prometheus en la barra de navegación izquierda para ingresar a la página de lista de instancias de la versión de monitoreo observable de Prometheus.
  • Haga clic en el nombre de la instancia de Prometheus de destino para ingresar a la página del centro de integración.
  • Haga clic en Instalar para la tarjeta SQL Server

  • Configure los parámetros relevantes y haga clic en Aceptar para completar el acceso al componente.

Los componentes conectados se mostrarán en el área de instalación de la página del centro de integración. Haga clic en la tarjeta del componente y podrá ver objetivos, indicadores, mercado, alarmas, configuración de descubrimiento de servicios, exportador y otra información en el panel emergente.

Como se muestra en la figura siguiente, puede ver los indicadores de alarma clave proporcionados actualmente por la versión de monitoreo observable de Prometheus.

Puede hacer clic en la miniatura del mercado en la pestaña Mercado para ver el mercado de Grafana correspondiente.

Puede hacer clic en la pestaña Alarmas en el panel para ver las alarmas de SQL Server Prometheus. También puede agregar reglas de alarma según las necesidades comerciales. Para operaciones específicas sobre la creación de reglas de alarma de Prometheus, consulte Reglas de alarma de Prometheus [ 2] .

Comparación de las ventajas y desventajas del monitoreo observable de Prometheus y Alibaba Cloud de construcción propia Monitoreo de versiones de Prometheus SQL Server

La versión de monitoreo observable de Prometheus proporciona a los nuevos usuarios del producto una cuota diaria de informes de indicadores personalizados de 20 millones durante tres meses. Haga clic aquí para probarlo gratis ahora.

Enlaces de referencia:

[1]  https://learn.microsoft.com/zh-cn/sql/sql-server/what-s-new-in-sql-server-2022?view=sql-server-ver16#query-store-and -procesamiento-inteligente-de-consultas

[2]  https://www.sqlshack.com/sql-server-troubleshooting-disk-io-problems/

[3]  https://learn.microsoft.com/en-us/sql/relational-databases/rendimiento/monitor-and-tune-for-rendimiento?view=sql-server-ver16

[4]  https://learn.microsoft.com/zh-cn/sql/relational-databases/pages-and-extents-architecture-guide?view=sql-server-ver16

[5]  https://learn.microsoft.com/zh-cn/troubleshoot/sql/database-engine/rendimiento/troubleshoot-sql-io-rendimiento

[6]  https://learn.microsoft.com/zh-cn/sql/relational-databases/memory-management-architecture-guide?view=sql-server-ver16

[7]  https://www.sqlshack.com/sql-server-memory-performance-metrics-part-1-memory-pagessec-memory-page-faultssec/

[8]  https://www.sqlshack.com/sql-server-transaction-log-growth-monitoring-and-management/

[9]  https://blog.csdn.net/Superman7658/article/details/130799559

[10]  https://learn.microsoft.com/zh-cn/sql/relational-databases/databases/database-states?view=sql-server-ver16&redirectedfrom=MSDN

Enlaces relacionados:

[1] consola ARMS

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Farms.console.aliyun.com%2F#/home

[2] Reglas de alerta de Prometheus https://help.aliyun.com/zh/arms/prometheus-monitoring/create-alert-rules-for-prometheus-instances#task-2121615

El autor del marco de código abierto NanUI pasó a vender acero y el proyecto fue suspendido. La primera lista gratuita en la App Store de Apple es el software pornográfico TypeScript. Acaba de hacerse popular, ¿por qué los grandes empiezan a abandonarlo? Lista de octubre de TIOBE: Java tiene la mayor caída, C# se acerca Java Rust 1.73.0 lanzado Un hombre fue alentado por su novia AI a asesinar a la Reina de Inglaterra y fue sentenciado a nueve años de prisión Qt 6.6 publicado oficialmente Reuters: RISC-V La tecnología se convierte en la clave de la guerra tecnológica entre China y Estados Unidos. Nuevo campo de batalla RISC-V: no controlado por ninguna empresa o país, Lenovo planea lanzar una PC con Android.
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/3874284/blog/10117579
Recomendado
Clasificación