1. Introducción
El servidor de la compañía está recién instalado con tarjeta de red 10G y nvme, listo para construir un clúster ceph. Pero la Dell R620 tiene edad suficiente para preocuparse por eso. Registre los hoyos pisados aquí.
Dos, instalación de elrepo
Al principio, los resultados de la verificación de la red fueron los mismos, usando elrepo para actualizar el kernel. Pero la versión lt de elrepo solo llega a 4.4, que no cumple con los requisitos del kernel de cephfs.
Instale ml versión 5.9.8 con la mentalidad de intentarlo. El resultado es que el raid todavía se puede reconocer, pero igb y 10G no se pueden reconocer. Solo se puede cambiar el kernel.
Registre el método de actualización de elrepo
Instale la fuente elrepo y la clave GPG
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
yum -y install https://www.elrepo.org/elrepo-release-7.0-4.el7.elrepo.noarch.rpm
yum -y --enablerepo=elrepo-kernel install kernel-ml kernel-ml-devel
Elrepo contiene dos versiones del kernel, kernel-ml y kernel-lt.
-
kernel-ml es la versión principal, que ha estado siguiendo la última versión, actualmente 5.9.8
- kernel-lt es una versión a largo plazo, soporte a largo plazo, actualmente 4.4.243
CephFS requiere que el kernel mínimo sea 4.17 , así que elija instalar kernel-ml
Nota : Con respecto al problema de la instalación del controlador, elrepo también proporciona paquetes y métodos relacionados: http://elrepo.org/tiki/DeviceIDs. Pero después de la práctica, descubrí que era inútil para mí, así que vayamos al sitio web oficial para encontrar el controlador más reciente .
Tres, centos fuente oficial del altar
La versión oficial del kernel de centos7 es 3.10, no importa cómo actualice la versión grande, es 3.10. En este momento, pensé en la fuente de centos de altarch. Los paquetes en esta fuente son relativamente nuevos. El funcionario lo usa para reemplazar el experimental anterior. Y su estabilidad y compatibilidad deberían ser mejores que elrepo.
Descarga e instala el kernel
cd ~
wget https://mirrors.tuna.tsinghua.edu.cn/centos-altarch/7/kernel/x86_64/Packages/kernel-5.4.65-200.el7.x86_64.rpm
wget https://mirrors.tuna.tsinghua.edu.cn/centos-altarch/7/kernel/x86_64/Packages/kernel-core-5.4.65-200.el7.x86_64.rpm
wget https://mirrors.tuna.tsinghua.edu.cn/centos-altarch/7/kernel/x86_64/Packages/kernel-devel-5.4.65-200.el7.x86_64.rpm
wget https://mirrors.tuna.tsinghua.edu.cn/centos-altarch/7/kernel/x86_64/Packages/kernel-modules-5.4.65-200.el7.x86_64.rpm
yum install kernel-*
Descripción de la estructura del paquete de kernel
- núcleo
- función del núcleo del kernel-core
- kernel-modules Los módulos básicos del kernel (los controladores más utilizados están aquí)
Por supuesto, también puede hacerlo en forma de un repositorio de yum.
altarch.repo
[altarch]
name=CentOS-$releasever - altarch
baseurl=http://mirror.centos.org/altarch/$releasever/kernel/$basearch/
gpgcheck=0
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-7
Establecer la secuencia de arranque del kernel
Ver el kernel de arranque actual
grub2-editenv list
Seleccione el kernel especificado para comenzar
grub2-set-default 0
Después de instalar el nuevo kernel, generalmente se coloca en el primer lugar para comenzar, solo necesitamos ejecutar el comando anterior para configurar el primer kernel para que se inicie. Puede usar el siguiente comando para ver el orden
egrep ^menuentry /etc/grub2.cfg | cut -f 2 -d \'
Reiniciar el sistema
Contenido extendido
Después de reemplazar el kernel de 5, el nombre de la tarjeta de red del servidor cambiará, busque el nombre correcto de la tarjeta de red mediante el siguiente método
Activación de NIC
Utilice wake-on para averiguar qué puerto Gigabit de la tarjeta de red del servidor está conectado con el cable de red. Después de encenderlo, ethtool puede comprobar si la tarjeta de red tiene velocidad. Si hay velocidad, el cable de red está conectado.
Compruebe si la tarjeta de red es compatible con WOL
ethtool eth0
Si el valor de wake-on es d, significa que wake on lan
está deshabilitado y el valor es g, lo que significa que wake on lan está habilitado.
Utilice el siguiente comando para habilitar la activación en lan
ethtool -s eth0 wol g
La tarjeta de red 10G se puede encontrar a través de dmesg
[root@]# grep Up dmesg
[ 2.549298] microcode: Microcode Update Driver: v2.2.
[ 3.859307] i40e 0000:04:00.1 eth2: NIC Link is Up, 10 Gbps Full Duplex, Flow Control: Non
Compruebe el controlador de la tarjeta de red utilizado
Puede ver el modelo de la tarjeta de red y la versión del controlador
lspci -nn|grep Eth
01:00.0 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
01:00.1 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
01:00.2 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
01:00.3 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
04:00.0 Ethernet controller [0200]: Intel Corporation Ethernet Controller X710 for 10GbE SFP+ [8086:1572] (rev 02)
04:00.1 Ethernet controller [0200]: Intel Corporation Ethernet Controller X710 for 10GbE SFP+ [8086:1572] (rev 02)
Ver ruta de la unidad
Utilice este comando para comparar si el raid de los dos núcleos es consistente con el controlador de la tarjeta de red
]# lsinitrd -k 5.4.65-200.el7.x86_64|grep igb
-rw-r--r-- 1 root root 3618 Oct 31 2018 usr/lib/kbd/keymaps/xkb/ng-igbo.map.gz
drwxr-xr-x 2 root root 0 Nov 16 11:41 usr/lib/modules/5.4.65-200.el7.x86_64/kernel/drivers/net/ethernet/intel/igb
-rw-r--r-- 1 root root 94760 Sep 16 22:30 usr/lib/modules/5.4.65-200.el7.x86_64/kernel/drivers/net/ethernet/intel/igb/igb.ko.xz
Encienda BBR
echo 'net.core.default_qdisc=fq' | sudo tee -a /etc/sysctl.conf
echo 'net.ipv4.tcp_congestion_control=bbr' | sudo tee -a /etc/sysctl.conf
sudo sysctl -p
verificación
sysctl net.ipv4.tcp_available_congestion_control
lsmod | grep bbr
Tiene salida
tcp_bbr 20480 880
Significa que tuvo éxito.
Si no tiene éxito, ejecute y verifique uname -r
la versión del kernel. Si se determina que es mayor a 4.9, reinicie la máquina para verificar.