华为云计算IE面试笔记-FusionCompute上的虚拟机A和虚拟机B不能正常通信,请描述可能的故障点和排除方法(分析虚拟机A和虚拟机B不通)

首先从物理层进行故障排除,再从虚拟化层进行排除,最后从虚拟机层进行排除

物理侧

物理层可能是CNA主机和交换机出现问题。

主机:①网卡出现问题 ②主机本身性能差,挂了出现问题 ③主机到交换机的网线松动出现问题

交换机:可能是配置出现问题,AB两台虚拟机分属于两个VLAN,如果在底层交换机没有将端口设置为Trunk模式,或者没有给Vlan做网关的话就有可能不通

虚拟化层(DVS层)

DVS三要素:上行链路,VLAN池,端口组。DVS是调用底层的OVS来实现的,OVS做的就是虚拟交换的一个功能。端口组出错的话就是A属于端口组100,B属于端口组200,可能还创建了别的端口组比如端口组101,不小心吧B划进了端口组101然后就通不了了,然后可能就是端口组对应的VLAN给错了。

虚拟机侧

防火墙没关。获得无效IP。网关信息配置错误。安全组限制。杀毒软件。对端VM故障。

 

同一个DVS:

相同主机:

相同端口(VM1和VM2):不走路由

两VM端口组是否一致à是否在同一个安全组àOVS/EVS故障(检查流表)。

不同端口(VM1和VM2):会走路由

两VM端口组是否配置正确à TOR端口是否放行相应的VLANà路由器配置是否正确,检查ACL策略,是否存在数据包的过滤à是否在同一个安全组àOVS/EVS故障(检查流表)。

    不同主机:

      相同端口(VM1和VM3):不走路由

两VM端口组是否一致àToR端口是否放行相应的VLAN à是否在同一个安全组àOVS/EVS故障(检查流表)。

      不同端口(VM1和VM3):同相同主机不同VLAN(VM1和VM2)

不同DVS、不同主机(VM1和VM4):隐含条件是VM1和VM4一定不在同一个端口组里。(DVS由端口组和上行链路组成,一个端口组只能属于一个DVS)

     默认VM1和VM4在不同物理网络,不能二层互通。只能通过三层路由互通,前提是它们在不同网段。

    或者是将VM4添加一个网口,连上DVS1,配置成同一个网段也可以实现通信。

    若一定要二层互通的条件:两虚拟机在同一网段,且VM1端口组的VLAN与VM4端口组的VLAN一致。将两TOR交换机连起来允许该VLAN通过。

VM1与VM4不通的原因:

1. 虚拟机没有配置网关

2. 路由器或三层交换机挂掉了

3. 三层设备上配置了限制策略

4. 路由条目出现错误

*快速定位故障点:(考到)

ARP:同一二层内可以通过ARP -a命令查询到要访问的主机IP(ARP表项中记录了同一二层中的IP和MAC的对应关系),若查询不到,说明二层出现问题(Vlan 间不通)或者硬件问题(交换机策略限制,交换机挂了,服务器挂了,线缆松动)。若查询得到一般是虚拟机侧的问题。

tracert/traceroute目的端:路由跟踪。若失败,三层出现问题。大可能是网关出现问题(网关在路由器上设置错误,加入了错误的路由条目,虚拟机侧未设置正确网关,虚拟机网卡未设置正确网关)

同网段:

先互相ping对方 VM,如果能ping通,那么就是虚拟机侧的问题。(防火墙没关、获得无效IP、网关信息配置错误、安全组限制、杀毒软件。)

  如果不能ping通,那就arp -a,

如果没有目的MAC地址说明是物理问题(物理链路不通,交换机策略限制,交换机挂了,服务器挂了)或者 Vlan 间不通(VLAN隔离)。

不同网段:

如果在同一路由器下,可以在源目 VM 分别查看 arp 表是否存在对应的网关MAC地址,不存在,则是本端二层有问题(物理硬件或VLAN间不通);存在或者通,问题可能就出在虚拟机侧。(防火墙没关、获得无效IP、网关信息配置错误、安全组限制、杀毒软件。)

不同路由器,用traceroute命令检查每一跳的情况,可能是链路上的路由出了问题,若失败,三层出现问题。大可能是网关出现问题(网关在路由器上设置错误,加入了错误的路由条目,虚拟机侧未设置正确网关,虚拟机网卡未设置正确网关)。

如果不是同一主机,条件允许的情况下,可以将虚拟机移至同一主机,如果通,则是物理网络配置错误。

*DVS、OVS、EVS的区别:

DVS是FC中VRM上的一个用于管理和统一下发配置的虚拟分布式交换机,它是一个逻辑上的概念,不存在的,只在VRM上体现。

OVS是一款使用开源软件实现的虚拟交换机,是DVS在底层的体现,真正负责主机内部流量转发的组件,在底层是实际存在的,是内核态的。

EVS是OVS的升级版,是华为结合intel的DPDK技术去实现了用户态(免内核)的虚拟交换机,可以直接通过用户态去转发,不需要再经过内核再去找它的原生驱动再找网卡再进行转发了,路径变短,性能提升。

A能ping通B,B ping不通A是什么原因?

 A开启了防火墙、A和B不在一个安全组。

开启了防火墙流量可以出去,进来的流量会有限制,端口组会拒绝ping,保证安全性。

*在SC上创建的两台虚拟机不通有哪些原因?

(四种网络)路由,内部,外部,直连 (考试环境是 type 3,只有外部网络和内部网络) 1. 可能在不同的 VPC。

2. 同 vpc 可能在不同的网络中,内部和路由不通,内部和外部也不通--是天然不通,配弹性 IP或者snat可以实现路由网络和外部网络的通信(弹性 ip 可以双向,snat 只能单向内访外)。

3. 位于不同的安全组中、安全组的隔离,(要安全组放行)。

*两虚拟机昨天还通,今天就不通了,有什么原因导致?

1. 虚拟机侧:虚拟机蓝屏故障(pvdriver驱动监控);物理主机进入维护状态或者物理机故障;端口组被人为误改了,不在同一个端口组内。

2. DHCP模块故障后,动态ip用不了。

3. CNA节点EVS进程故障。

4. 中间链路故障。

*如果是两个部门之间不通,有什么原因导致?

两个部门,通常情况下,处在不同的 vlan,也就是处于不同的端口组。

可能原因有:端口组 vlan 是否配置错误、上行链路是否处于不同的物理平面;TOR 交换机是否配置错误;网关设备是否配置错误;中间系统是否拦截流量;

*如果两台虚机在两个DVS上,怎么互通?

三层互通,使用路由器将两个物理平面打通;

或者如果两个交换机是三层交换机 直接链接然后放通相应VLAN就好

*安全组是怎么理解的?

安全组是具有同等安全要求的一组虚拟机,不同 VPC 下的安全组默认是不可以通的。

不同安全组之间的访问控制由 IPtable 和 iNIC 来实现。

*两个 VPC 里面的主机就一定不通吗?

不一定,VM 的路由网络,绑定弹性 IP 后可以通信。

或者配置安全组策略,使两个 VPC 中的 VM 可以通信。

或把 VM 放入直连网络

*一个物理网络就对应一个 DVS 吗?

一个 CNA 主机内一个 DVS 绑定一个 CNA 主机物理网口

*Fusionscompute的三个概念:存储资源、存储设备和数据存储。

1. 存储资源:告知数据在哪里,硬盘在哪里

2. 存储设备:数据存放的空间

3. 数据存储:FusionCompute维持出来的统一概念(使用存储时,存储资源告知位置,找到存储设备)

虚拟化数据存储:实现存储虚拟化时,采用主机存储虚拟化+文件系统实现。

非虚拟化数据存储:存储设备虚拟化

裸设备映射数据存储:裸设备+逻辑卷

裸设备映射和非虚拟化存储的区别就是。存储本身是不是高级存储

*虚拟磁盘类型以及差别

 

*主机和 VRM 心跳连接异常?怎么解决?

可能原因:

1. CNA 节点下电。

2. 网络出现异常。

3. CNA 节点管理网口异常。

4. CNA 节点进程异常。

在告警信息中确认异常主机的 IP 和 BMC IP 登录 BMC,检查主机是否下电

如果是下电状态,选择上电,待主机上电成功后,查看告警是否清除

用 putty 登录 VRM 后台,尝试 ping 主机的 ip,如果不通,检查网络问题。

如果通的话,用 putty 登录 CNA 节点,service vnad status 查看 vnad 服务是否启动如果没有启动,service vnad restart。

PS:VRM 之所以能接管 CNA,因为 VRM 调用了 CNA 里的 vnad 进程

*虚拟磁盘的类型有哪些?配置模式有哪些?磁盘模式有哪些?

类型:

普通:只能给单个虚拟机使用

共享:可以绑定给多个虚拟机使用

配置模式:

普通:根据磁盘容量为磁盘分配空间,在创建过程中会将物理设备上保留的数据置零。这种格式的磁盘性能要优于其他两种磁盘格式,但创建这种格式的磁盘所需的时间可能会比创建其他类型的磁盘长。  建议系统盘使用该模式。

精简:该模式,系统首次仅分配磁盘容量配置值的部分容量,后续根据使用情况,逐步进行分配,直到分配总量达到磁盘容量配置值为止。

      使用精简模式可能导致数据存储超分配,建议超分配比例不超过50%,超分配率可通过数据存储的概要页面“已分配容量”和“总容量”的比率关系来确定。数据存储类型为“FusionStorage”或“本地内存盘”时,只支持该模式;数据存储类型为“本地硬盘”或“SAN存储”时,不支持该模式。

普通延迟置零:根据磁盘容量为磁盘分配空间,创建时不会擦除物理设备上保留的任何数据,但后续从虚拟机首次执行写操作时会按需要将其全部置零。创建速度比“普通”模式快;IO性能介于“普通”和“精简”两种模式之间。

              只有数据存储类型为“虚拟化本地硬盘”、“虚拟化SAN存储”或版本号为V3的“Advanced SAN存储”时,支持该模式。

磁盘模式:

从属:快照中包含该从属磁盘。

独立-持久:更改将立即并永久写入磁盘,持久磁盘不受快照影响。

            即对虚拟机创建快照时,不对该磁盘的数据进行快照。使用快照还原虚拟   机时,不对该磁盘的数据进行还原。

独立-非持久:关闭电源或恢复快照后,丢弃对该磁盘的更改。

1. 当数据存储类型为“SAN存储”、“本地硬盘”或“本地内存盘”时,不支持创建快照,默认“独立-持久”。

2. 当数据存储类型为“虚拟化本地硬盘”、“虚拟化SAN存储”、“NAS存储”、“Advanced SAN存储”或“FusionStorage”,且磁盘类型为“共享”时,该磁盘不支持创建快照,默认“独立-持久”。

3. 当磁盘类型为“普通”且数据存储类型为“虚拟化本地硬盘”、“虚拟化SAN存储”、“FusionStorage”、“NAS存储”、版本号为V3的“Advanced SAN存储”或“本地内存盘”时,磁盘才可以创建为“独立-非持久”模式。

*数据存储是虚拟化或非虚拟化的本质差别:

当数据存储的虚拟化特性是由主机侧去实现时,其根本就是将存储设备格式化为文件系统。本地存储格式成ext4,共享存储格式成vims。

非虚拟数据存储就是一个块设备。

*FusionStorage是不是虚拟化数据存储?

不是,虚拟化数据存储特指由CNA自身实现的虚拟化特性,例如快照、精简磁盘等,即对应存储虚拟化为主机存储虚拟化+文件系统。FusionStorage支持虚拟化特性,是通过FusionStorage存储系统自身机制实现的,CNA并未参与。

AdvancedSAN对于V3时,也是非虚拟化数据存储,理由同上。

*FusionCompute 集群内无法执行调度策略的原因

1. 对于不满足迁移要求的虚拟机,将不会进行自动迁移。例如下面的情况:

1) 聚集或互斥规则将阻止迁移虚拟机。

2) 已为虚拟机禁用了 DRS。

3) 某个设备挂载到了一个或多个虚拟机上,使 DRS 无法移动虚拟机,从而无法平衡负载。

4) 虚拟机与 DRS 的目的主机不兼容。

5) 虚拟机与所在主机进行了绑定。

2. 迁移后会产生新的不平衡状态,这类情况将不会迁移虚拟机。例如:

1) 衡量因素选择“CPU 和内存”时,部分主机 CPU 相对高,另外部分主机内存相对高。

2) 衡量因素选择“CPU”或“内存”时,迁移任何一个虚拟机都无法达到平衡。

3. 动态资源调度=DRS模块+策略+vMotion(自动),故无法执行调度策略的原因可以从以上三点去考虑。

4. DRS 需要共享的存储

*虚拟机热迁移、存储热迁移和完整迁移:

虚拟机热迁移是虚拟机在服务器之间存储不变。

存储热迁移是更换存储主机不变。

完整热迁移是主机和存储一起变。

*虚拟机HA是什么?如何实现?

概念:物理服务器或虚拟机故障时,系统在资源池中自动启动虚拟机到另一可用物理服务器上。

物理机故障类型:主机下电、重启、宕机

虚拟机OS故障类型:Windows蓝屏,Linux Panic等

特性实现:

 1. VM故障或计算节点故障

 2. 管理节点查询VM状态,发现VM故障

 3. 管理节点判断VM有HA属性,则根据保存的VM信息(规格、卷),选择可用的CNA启动VM

 4. CNA节点收到HA请求,根据VM规格、卷信息启动新的VM

 5. 启动过程中,将VM之前的卷重新挂在,包括用户卷

HA时,业务会中断,准确的说,HA触发时,业务已中断。HA需要共享的存储。

热迁移是计划性迁移,HA是非计划性迁移。

*如何让VM1与VM4通,那个路由器怎么配置?

TOR怎么配

端口配IP, 然后开启路由功能,比如 OPSF 然后加入路由条目

*安全组 

安全组是基于iptables实现的。

默认出流量全部放行 入流量全部禁止

可以限制哪些协议?CMP TCP UDP 等

存储虚拟化实现方式?

裸设备+逻辑卷:通过给宿主机CNA挂载块设备,宿主机采用DeviceMapper的内核模块对块设备空间进行逻辑划分成逻辑卷,此时逻辑卷即为虚拟磁盘。在FC的环境中,非虚拟化的本地数据存储、非虚拟化的SAN数据存储就是采用该方式实现。

存储设备虚拟化:赋予虚拟化平台的管理节点VRM管理存储设备的能力(添加存储资源),在VRM界面上操作创建虚拟磁盘后,VRM会通过控制流在存储设备上创建相应块设备(AdvanceSAN为LUN,FusionStorage为卷)。在VRM界面上将该累虚拟磁盘挂在给某台虚拟机并点击打开电源后,VRM会通过控制流在存储设备上将LUN或卷映射给即将运行虚拟机的CNA主机,CNA主机再通过RDM的方式将映射上来的块设备挂载给虚拟机。

主机存储虚拟化+文件系统:

1. 通过给宿主机CNA挂载块设备,CNA主机对其格式化成文件系统(本地硬盘:ext4、SAN:VIMS,添加数据存储时选择虚拟化的数据存储),并通过文件的形式存放虚拟磁盘。

2. 通过给宿主机CNA挂载共享文件系统(NFS),并通过文件的形式存放虚拟磁盘。

特性对数据存储要求的总结

 

在FusionCompute中,大LUN和小LUN是什么?有什么差别?

大 LUN 是将一个 LUN 添加为数据存储后,在上面创建多个虚拟机;小 LUN 是一个 LUN 添加为数据存储后只供一个虚拟机底层一个 LUN,被虚拟化平台接管,直接将该 LUN 作为虚拟机的磁盘使用大 LUN 方便几种管理虚拟机,可以实现更多高级特性小 LUN 性能达到最优化,容灾设计时可以针对具体虚拟机磁盘进行容灾。

虚拟机大范围无法访问的原因?

可以从三层来考虑,一是存储问题,二是网络问题,三是底层系统的故障:

1. 登录 portal 查看告警信息,以及用户是否有误操作。

2. 查看网络、计算、存储资源是否有问题。

3. 登录 FusionCompute,查看虚拟机状态是否正常。

4. 硬件排查。

如果部署 VRM 时出错怎么解决?

1. 部署工具版本不一致。

2. VRM 与 CNA 网络故障。

3. CNA 故障,硬件或软件不兼容。

4. CNA 虚拟化指令集在 BIOS 中没有开启。

5. 安装失败后清理不彻底。

6. VRM 创建的 VM 下发配置失败(配置错误)。

存储资源使用对比

存储资源类型

底层协议

存储设备类型

是否支持虚拟化

是否支持存储卸载

IP SAN

TCP/IP

LUN

FC SAN

光纤

LUN

NAS

TCP/IP

共享目录

本地磁盘

本地连接

本地磁盘

AdvancedSAN

TCP/IP

存储池

FusionStorage

TCP/IP

存储池

存储卸载:指将部分存储操作(模板部署、删除清零等操作)下移到存储侧进行,这样做可以不浪费主机侧资源,同时也可以提升操作效率。

虚拟化:对于LUN或者本地磁盘,在不支持虚拟化的场景不能支持快照,链接克隆等高级功能,但是所创建的卷具有很好的性能。虚拟化后的数据存储,支持各种高级功能,卷格式也支持多种,但是性能低于非虚拟化的存储设备。

考官追问:

上行链路怎么配置?上行链路对应的交换机端口怎么配置?上行链路是主备?负载分担?

上行链路 可以配链路聚合 端口可以负载 也可以主备

怎么看dvs状态

vlan是基于端口创建的?

不是

不同网段的虚拟机通讯一定要经过路由吗? 

要经过路由。vlan就是划分物理网络的功能,可以把一个物理二层网络划分成多个逻辑网络

TOR1和TOR2连接后交换机要怎么配,把具体命令写出来?

连接交换机 那你肯定要配网关 然后 打上路由 比如相连网段的OSPF路由

如何知道vm地址等配置错误

比如说你要分配给vm 192.168.1.0/24的网段  但你配置错了 vm获取到的地址是 192.168.100.0/24  你可以在 FC界面 直接看网卡IP 地址

假如vm1属于vlan10网段为192.168.10.0,vm3属于vlan30网段为193.168.30.0在tor交换机上应该如何配置?在物理主机上如何配置?端口组如何配置?基于以上条件vm2属于vlan20,网段为20.0上述的东西应该如何配置?

猜你喜欢

转载自blog.csdn.net/weixin_42592728/article/details/120455109