目前,不少企业都在推进 VMware 虚拟化的替代,这就要求基于 KVM 技术的国产虚拟化能够提供与之对标的产品能力。其中,SmartX 原生虚拟化 ELF 经过 10+ 年的持续迭代,不仅已广泛应用于金融、医疗、制造等行业的头部企业生产环境,还将实践中积累的经验转化为更好用、更智能的产品能力,帮助用户解决日常使用与运维中遭遇的各种挑战。

本期,我们聚焦“网络拓扑可视化”功能,解读 SmartX 榫卯企业云平台如何通过虚拟+物理全链路网络拓扑可视化能力,提高日常运维与故障定位效率。

观看视频,快速了解用户故事与功能特性!《虚拟网络运维难?你需要更细致的网络拓扑可视化!》

为什么需要直观且细致的网络拓扑可视化

传统的物理网络设备间以实体连接,网络拓扑结构直观可见,而虚拟网络通过软件定义的技术构建,网络拓扑具备更强的灵活性和动态性,不仅增加了网络运维的复杂性和成本,还可能对业务的连续性和安全性造成严重影响。因此在虚拟网络的复杂环境中,网络拓扑可视化功能显得尤为重要。

以 VMware vSphere 为例,虚拟机的网络流量首先进入与其虚拟网卡连接的虚拟交换机的某个端口组(Port Group),随后虚拟交换机通过上行链路(Uplink)端口将流量转发至物理网络中,实现虚拟机网络与外部物理网络的数据交换。VMware 在虚拟交换机的设置中,提供了网络拓扑展示功能,较清晰地展示了网络数据的链路,如下图所示:

但在实际的使用场景中,我们也发现 VMware 的网络拓扑展示功能存在关系不清晰、展示不直观、操作不灵活等问题:

  1. 当使用标准交换机VSS时,端口组(Port Group)与 VMkernel 在同一层级展示,当端口组、虚拟交换机数量较为庞大时,二者之间的从属关系难以在图上清晰呈现,也无法在图上直接查看某一特定端口组所关联的物理主机
  2. 拓扑图不具备筛选功能,无法直接搜索指定端口组、虚拟交换机下的所有虚拟机;
  3. 当虚拟机配置了多张虚拟网卡并同时关联多个端口组时,需分别在指定的端口组下逐一选取查看虚拟机,才能观察其数据流路径,无法在单一界面中全面分析指定虚拟机关联的所有端口组、虚拟交换机、物理适配器或物理主机;
  4. 在配置了集群(Cluster)服务的情况下,拓扑图上不能直观展示集群内虚拟交换机与物理主机之间的关联关系;
  5. 拓扑图内无法直观查看物理适配器(例如vmnic1、vmnic3)所连接的上联交换机信息和交换机的端口号,拓扑图的边界仅局限于物理主机
  6. 当物理适配器或上联的物理网络出现异常状况时,无法迅速查看、定位以及统计受影响的虚拟交换机和端口组,难以准确评估影响范围。

这些问题经常会给用户的故障根因定位、升级维护带来不便之处:

1. 异常访问难以溯源

在虚拟网络环境中,多网卡、多网络、多租户的场景极其常见。攻击、未授权访问或异常流量若无法及时定位源头,就会给安全团队和运维团队带来巨大的排查压力。

用户故事 1

某用户安全团队发现,某专用网络存在大量异常访问流量,该专用网络仅在部分配置了多张网卡的虚拟机上可以访问。虚拟化管理员需要判断这些流量来自哪些虚拟机,通过传统的网络探查方式,仅能确认网络流量来自某个交换机端口(MAC 地址),及其连接的某台物理主机,而无法进一步跟踪到虚拟机。虚拟化管理员需要手动检索该物理主机上配置了多张网卡的虚拟机,并逐一通知相关用户展开排查,整个过程费时费力。

2. 系统卡顿难以归因

当业务出现网络访问卡顿时,通常可能涉及虚拟网卡、端口组、虚拟交换机、物理网口、交换机端口等多层因素。定位瓶颈往往需要多团队、多系统交互,耗时且低效。

用户故事 2

某用户向虚拟化管理员反馈,其业务系统 A 从外部访问时在高峰期频繁卡顿,用户希望了解该业务系统的最大物理网络带宽,并收集与该系统存在带宽争抢的其它业务系统信息。物理网络中,多个 VLAN 共享复用某一交换机端口是常见配置方案,因此业务系统 A 可能与其它业务共享使用某物理端口的带宽。该需求下,虚拟化管理员除了需要向用户提供业务系统 A 使用某虚拟网络的最大带宽外,还需要向用户提供共享该虚拟网络实际物理带宽的其它虚拟机信息、网络 VLAN 等,涉及操作步骤较多

3. 升级维护存在风险

网络变更(如光纤更换、端口迁移、交换机升级)因虚拟化与物理机关联不透明,常常在变更前难以评估影响范围。

用户故事 3

某网络管理员准备更换交换机 GE1/0/43 端口的光纤线缆,从交换机配置中,他查询到该端口不属于任何端口聚合组,因此更换线缆将造成网络中断。不过,在查看使用该端口的物理主机时,管理员了解到该物理主机有多张网卡并连接到了其它交换机端口,因此无法判断是否所有该物理主机上运行的虚拟机都将受到影响。为了评估风险、缩小用户通知范围,他求助了虚拟化管理员,希望收集使用了该物理端口并将受到明确影响的所有虚拟机信息,但 VMware 虚拟化平台难以提供类似支持,延缓了更换进度。

用户故事 4

某网络管理员计划对物理交换机进行固件升级,升级过程中可能造成连接到该交换机的物理主机和虚拟机断网。通过网络设备中的 ARP 表他收集到了正在使用该交换机的 IP 地址,但无法确认使用 IP 地址的所有虚拟机。他希望虚拟化管理员协助,快速查看受影响的虚拟机,并通知相关用户。

SmartX 网络拓扑可视化:虚拟+物理全链路可视,运维全面提速!

SmartX 榫卯企业云平台的 CloudTower 管理平台提供完整的虚拟 + 物理全链路网络拓扑可视化能力,帮助管理员用一张图理解复杂网络结构,加速日常运维与故障定位效率,优化网络性能。

观看视频,了解更多功能特性!《利用网络拓扑展示功能提升网络管理效率|SmartX 超融合虚拟化|3 分钟特性解读》

功能特点

  • 直观展示网络结构:通过图形化方式清晰呈现虚拟网络及其连接关系,帮助管理人员快速理解复杂网络结构,辅助网络规划和设计。
  • 实时监控与故障诊断:实时显示虚拟设备与链路的状态,支持多种条件搜索和过滤,灵活查看虚拟资源,便于及时发现问题链路,快速定位和解决故障,减少网络中断时间。
  • 优化网络性能:全链路展示从虚拟网络到物理网络的拓扑,可视化分析网络流量路径,助力潜在问题和性能瓶颈的识别,为网络优化提供依据,提升整体服务质量。

创新点与产品对比

能力项SmartX 网络拓扑可视化功能VMware 虚拟化
拓扑范围✅ 虚拟+物理全链路仅虚拟层
筛选/搜索✅ 支持多维度过滤不支持
异常定位✅ 一键高亮显示受影响节点需人工排查
物理交换机信息✅ LLDP 识别端口与设备描述不可见
动态更新✅ 实时同步网络状态静态展示

业务价值与用户收益

SmartX 网络拓扑可视化功能以“洞察虚拟网络”为核心,直观呈现虚拟网络架构与其动态关联,可为企业云的网络管理带来多维度的价值提升:

  • 动态拓扑全览:通过图形化展现虚拟机、虚拟机网络、虚拟交换机、物理主机、物理网卡、物理交换机等网络组件的实时连接状态,打破虚拟网络“黑盒化”的困境。
  • 智能关联追踪:依托动态关联能力,自动呈现虚拟机网络与物理主机的从属关系、虚拟机关联的多路径流量走向、虚拟机的物理网络带宽
  • 精准问题定位:当网络异常时,通过拓扑图快速定位故障点、识别受影响资源,缩短MTTR(平均恢复时间),点亮故障排查的“最短路径”。
  • 科学评估成本:直观呈现集群内虚拟交换机与物理主机、物理交换机的映射关系,帮助管理员评估资源冗余或过度集中的风险,推动网络架构维持高可用状态。
  • 风险提前预警:通过物理网卡上联信息的透明化(如交换机端口、链路状态),提前预警物理网络风险,降低潜在故障损失。
  • 降低运维难度:以图形化的交互设计,将复杂的网络关系转化为直观的图形语言,使初级运维也能快速上手。

用户故事 1 后续:迅速溯源异常访问

网络团队已定位到的异常流量来自NODE03主机,因此利用 SmartX 网络拓扑可视化功能,虚拟化管理员仅需 3 步即可筛选出所有“嫌疑”虚拟机:

  1. 在主机列搜索筛选出NODE03主机;
  2. 点击NOD03主机使其高亮显示相关的网络资源;
  3. 通过视图内的连线关系,找到最左侧虚拟机列中配置了两张以上虚拟网卡并连接到不同网络的高亮显示的所有虚拟机;获取虚拟机名称后,快速通知用户开展排查。

用户故事 2 后续:精准识别带宽竞争

虚拟化管理员首先检索到业务系统 A 的虚拟机当前运行在 NODE02 主机上,随后通过 3 步操作即可查询到业务系统 A 的最大带宽以及与业务系统 A 共享带宽的其他虚拟机:

  1. 在网络拓扑视图中,查看 NODE02 业务网口的状态、绑定模式、带宽,其中带宽即为业务系统 A 的最大带宽;
  2. 查询关联业务网口的虚拟分布式交换机和虚拟机网络(共享物理带宽的其它虚拟机网络);
  3. 查询并收集使用这些虚拟机网络的所有虚拟机,即为共享业务系统 A 物理网络带宽的其它虚拟机。

用户故事 3&4 后续:交换机维护前快速评估影响范围

虚拟化管理员利用 SmartX 网络拓扑可视化功能,可快速定位到变更交换机光缆可能影响的所有虚拟机:

  1. 选择需要维护的交换机端口;
  2. 通过连线关系,查看连接的物理主机网口;
  3. 查看最左侧高亮显示的所有正在使用该端口的虚拟机,即为受影响虚拟机;随后即可通知所有使用虚拟机的相关用户(未高亮显示的虚拟机同属一个虚拟机网络但未使用受影响端口,不受变更影响)。

同样地,也可查看交换机固件升级的影响范围:

  1. 选中需要维护的交换机并使其高亮显示;
  2. 通过连线关系,在主机列查看使用该交换机的所有主机;
  3. 从最左侧,查看高亮显示的虚拟机,即为正在使用该物理交换机的所有虚拟机。

配置实践:简单易用

SmartX 网络拓扑可视化,可分为网络拓扑概览查看网络资源两个主要功能。

一、网络拓扑概览

1. 查看网络连接

在集群的管理界面选择网络拓扑,可以查看集群的网络拓扑视图。网络拓扑视图默认展示相关资源间的连线,取消勾选右上方显示连线,可取消显示连线。在拓扑视图选中某一资源,可高亮展示与该资源存在网络连接的其他资源。

2. 筛选网络资源

网络拓扑视图默认展示了集群中所有运行的虚拟机、虚拟分布式交换机、主机和物理交换机。如需查看特定的网络资源的网络连接,我们可以对网络资源进行筛选。

  • 筛选虚拟机:可根据虚拟网络分组或虚拟机的运行状态筛选,支持多选,可查找同时关联多个虚拟网络的虚拟机。
  • 筛选虚拟分布式交换机和虚拟机网络:可按虚拟分布式交换机虚拟机网络筛选,可同时查看多个不同虚拟交换机下的虚拟网络及虚拟机。
  • 筛选主机:可按主机名称可用域(双活集群)筛选。
  • 筛选物理交换机:可按物理交换机名称筛选。

3. 查看异常网口

当集群中存在异常使用或连接异常状态的网口时,拓扑视图右上方的图标可显示异常网口数量。单击该图标可查看所有异常网口的名称,选中一个异常网口,可高亮展示此异常网口及其相关资源链路。单击上下切换按钮,可在多个异常网口的链路间切换,排查网口链路及影响范围。

二、查看网络资源

1. 查看虚拟机

在虚拟机列单击虚拟机网络分组的展开按钮,可查看组内所有虚拟机信息,包括虚拟机数量、虚拟机名称、虚拟机运行状态和其使用的网络设备等。

2. 查看虚拟分布式交换机

在虚拟分布式交换机列可查看集群中的所有虚拟分布式交换机、系统网络以及虚拟机网络等信息。

3. 查看主机

在主机列可分组查看主机中的所有 OVS 网桥以及物理网口信息。其中主机可显示主机名称、管理 IP,对于处于维护模式的主机,将显示黄色标识。OVS 网桥为虚拟交换机到物理网络的逻辑链路,若 OVS 网桥包含多个物理网口,还将显示网口的 Bonding 模式,包括 active-backup、balance-tcp、balance-slb、balance-xor 和 802.3ad。

将鼠标悬浮在网口上,可进一步查看其传输速率、状态、活动/备用网口(active-backup 绑定模式)、MAC 地址等信息。

4. 查看物理交换机

对于状态为 UP,物理链路状态为已连接,且所连接的物理交换机开启了 LLDP 的网口,可以在主机网口列查看所连接的物理交换机的端口号。通过点选指定交换机端口和主机网口,可查看物理交换机的详细信息,包括交换机名称、设备描述(交换机型号)、管理地址、端口VLAN ID等。

更多参考:更详细的安装与配置指南,请联系 SmartX 技术支持或查看产品文档 https://docs.smartx.com/

欲了解更多 SmartX ELF 虚拟化及榫卯企业云平台核心功能,欢迎扫码获取电子书《SmartX ELF 虚拟化核⼼功能集》

推荐阅读:

业务视角下的告警通知:避免告警“噪音”,让运维更专注!

业务视角下的自定义告警:为每台虚拟机量身定制监控方案!

业务视角下的集群升级中心:三键实现全自动升级,用时缩短 70%!

业务视角下的主机维护模式:三重自动化,提升运维效率与业务连续性

业务视角下的虚拟机工具:提升运维效率的全能助手

业务视角下的虚拟化特性|内容库:灵活的模板分发让基线管理更便捷

以 SmartX ELF 替代 VMware vSphere:生产级虚拟化特性,深度适配国产生态

继续阅读