一文了解微分段应用场景与实现机制

在《零信任安全，从微分段做起》这篇文章中，我们介绍了如何通过微分段技术实现超融合环境下的“零信任”安全策略。同时，日趋显著的“东西向”安全威胁和“等保 2.0”的落实都要求企业尽快在生产环境中实现虚拟机间的安全保护策略。那么，为什么企业需要将微分段纳入现有网络安全策略？如何通过微分段保护实际生产场景中的数据安全？本文将聚焦以上两个问题解读微分段的作用与应用。

为什么虚拟化环境中需要微分段？

1. 虚拟化环境的复杂性必然加大了安全管控的难度

在探讨微分段的作用之前，我们需要了解虚拟化环境为基础架构安全带来了哪些新的挑战。相较于基于物理服务器的传统架构，虚拟化环境中，一个物理服务器上会运行多个虚拟机，这就给数据中心内部构成带来了三个主要变化：

被管理对象总体上增多了——从若干台物理服务器增加为十倍以上数量的虚拟化服务器。
被管对象的位置不再是长期确定的——每一台虚拟机可能在不同的时间运行在不同的物理服务器上。
被管对象数量和属性的变动更快了——对虚拟机的创建 / 启动 / 关闭 / 删除等操作频率远远高于物理服务器。

这些变化不仅让虚拟化环境变得复杂，也给新形势下安全策略的编写和管理出了一道难题：

传统数据中心架构下，网络安全策略主要部署在数据中心的边界上，难以对数据中心内部的物理服务器之间、虚拟机之间的通信进行管控。
由于虚拟机数量相比物理服务器数量大幅增加，它们之间的访问控制策略数量必然随之“爆发式”增长，想要人为设置、管理十分困难。
常见的安全策略，是通过 IP 地址来标识被保护和被拒绝的通信对象，但由于虚拟机更加频繁地被创建、删除、关闭、启动，IP 地址的变动频率也更高了——这些都要求对应的安全策略必须及时更新。

2. “东西向”安全威胁已不再是“小题大做”

虚拟机间的安全管理，也就是常说的“东西向”防御，主要是在数据中心内部的服务器、虚拟服务器之间部署安全措施进行网络通信的管理。

数据中心的安全设计中，普遍会在“南北向”关键通路上设置防火墙、入侵检测 / 防御、病毒查杀、防 DDoS 等一系列安全设备和措施，来识别并拦截由数据中心外向内进行的攻击。然而，“未知安全威胁”的种类和数量正在不断增加，难免有些会因为技术或管理上的瑕疵而成功侵入某台服务器，随后更容易顺着防备薄弱的“东西向”通路快速扩散，造成数据中心内部的虚拟机 / 服务器连锁沦陷。Apache Log4j 的远程代码执行漏洞就是一个典型的例子：

2021 年 12 月，Apache Log4j 2 被发现存在远程代码执行漏洞，该漏洞允许攻击者在目标服务器上执行任意代码，可导致服务器被黑客控制，并可能以此为跳板，继续侵入并控制数据中心内部其他服务器——有些服务器不能从外网进行访问，忽视了安全防护措施，导致它们更容易从内网被侵入。

由此可见，虚拟化环境中的网络安全策略应充分保护“东西向”网络通信安全，避免安全威胁在数据中心内部横向扩散。

3. “等保 2.0”的客观要求

随着数据中心内部虚拟化比例越来越高，虚拟化环境安全风险越来越大，在 2019 年颁布并实施的《信息安全技术网络安全等级保护基本要求 GB/T 22239 — 2019》（以下简称为“等保 2.0”）中，也明确将“虚拟机之间的访问控制”列为所有安全级别都应满足的要求：

6.2.4.1 访问控制
本项要求包括：
a) 应保证当虚拟机迁移时，访问控制策略随其迁移；
b) 应允许云服务客户设置不同虚拟机之间的访问控制策略。

这就意味着，所有需要通过等保 2.0 的企业系统，都必须满足上述要求，来保障数据中心内部的通信安全。微分段，即在任意虚拟机之间都设置安全访问控制的技术，是虚拟化环境中有效的、必应采用的安全机制。

微分段在实际生产场景中如何应用？

知易行难！在 SmartX 超融合中，是如何对生产环境进行高效率的东西向微分段呢？

1. 从“默认允许”到“默认拒绝”的转变

现在经常采用的“明确拒绝、默认允许”安全策略（俗称“黑名单”模式），只能防御已知的攻击，却给未知安全威胁留了机会。而且，由于已知安全威胁数量不断增加，因此需要为阻拦这些具有潜在危险的通信制定很多安全策略。

而 SmartX 超融合环境下的安全策略基于“明确允许、默认拒绝”的逻辑（俗称“白名单”模式），这也是“等保 2.0”中对访问控制的明确要求。

6.1.3.2 访问控制
本项要求包括：
a) 应在网络边界根据访问控制策略设置访问控制规则，默认情况下除允许通信外受控接口拒绝所有通信。

在虚拟化环境中，物理服务器的功能逐渐被拆分到不同虚拟服务器上运行，每个虚拟服务器需要对外暴露的协议端口屈指可数——只需明确允许对这几个协议端口的访问，便可满足虚拟服务器正常工作的要求，而其他端口上的通信“默认拒绝”，就杜绝了来自未知安全漏洞的威胁——实现了“以最少数量的安全规则，最大限度保障通信安全”的目标。

以 WannaCry 蠕虫病毒举例，它利用 Windows 操作系统 445 端口存在的漏洞，主要在主机 / 虚拟机之间进行横向扩散，并具有自我复制、主动传播的特性，感染计算机后会向计算机中植入敲诈者病毒，导致电脑大量文件被加密。当时普遍认为 Windows 系统的 445 端口主要在内网使用，没什么风险，因此这个端口上的通信都被“默认允许”了；病毒一旦因某种偶然契机成功侵入了一台 Windows 系统，就可以借 445 端口在内网进行横向扩散，导致整个数据中心的 Windows 系统都被感染。

在启用了虚拟机之间的微分段机制之后，只有经过“明确允许”的数据流才能够到达虚拟机，不再“默认允许”。假设某台 Windows 虚拟机是用作网页和 FTP 服务器的，那么对它的安全规则只会包含“明确允许”这几种协议，其他所有通信（包括 445 端口）会被“默认拒绝”。这种安全配置模式下，不仅外部威胁通过未知端口上侵入到内网的概率将大大降低，也避免了偶发的安全漏洞在数据中心内部被放大。

所以，SmartX 微分段安全策略对虚拟机进行保护的基本原则就是“默认拒绝”，只有经过管理员指定的通信流可以到达 / 离开虚拟机。

2. 用“看得懂”的方式简化虚拟机之间安全策略

要实现安全策略模式的转变，为所有的虚拟机的网络通信制定“明确允许”的策略，这个工作量会不会太大？会不会导致安全管理过于复杂而无法运维？

上一小节的对比已经表明，对某一个虚拟服务器而言，采用“白名单”模式所需的安全规则数量，会远远少于“黑名单”模式。那么扩展到多个虚拟服务器、扩展到整个数据中心 / 多个数据中心呢？

我们试想一下为如下场景编写安全策略的工作量：

HR 部门的虚拟机需要能够访问 OA 系统的其他 5 种虚拟机服务器。
OA 系统包含至少 10 种服务器，使用者涉及到 20 多个部门。
除了 OA 系统，公司内部还有研发系统、生产系统、供应链系统、客户关系系统等等十余个系统。
以上涉及到的各种虚拟机、服务器的 IP 地址，会随着业务 / 应用 / 部门的调整而变化，不能保证来自连续的地址段。

这些部门、系统、应用之间的复杂业务联系，确实有可能导致基于 IP 地址的安全规则数量爆炸式增长（参考上文配图中的安全策略数量级），安全体系过于复杂而无法维护，亟需更好的方法对安全策略进行优化。

SmartX 超融合的微分段机制原生于自身的 ELF 虚拟化系统，允许管理员为每一个虚拟机设置自定义的“标签”。这个“标签”可以理解为虚拟机的“别名”，比如：“HR 部门的虚拟机”、“HR 专用文件服务器”等等。有了这些标签，制定出来的安全策略就大大简化了，就像是下面这样：

允许 “HR 部门的虚拟机”访问 “HR 专用文件服务器”

为虚拟机设置了标签（比如，“HR 部门的虚拟机” ），就意味着它遵循“默认拒绝”原则，除了这些被“明确允许”的行为以外，其他的网络通信都会被拒绝。

这样的策略基于业务场景，比起使用一串 IP 地址编写的安全规则更加容易被理解，而且规则条目也经过了汇总简化。今后，即便这个应用环境发生了一些变化，比如：

HR 部门的虚拟机数量增减或 IP 地址变化。
被访问的文件服务虚拟机数量增减或 IP 地址变化。
客户端虚拟机或服务器虚拟机，在不同物理服务器、不同机房之间发生了位置迁移。
……

以上这些场景下，每个虚拟机设置了“标签”就会和对应的安全策略自动关联，具有以下优点：

不单纯依赖边界安全设备。
不单纯依赖使用 IP 地址（段）作为安全策略的条件。
不必为虚拟机的每次变动而手动调整安全策略。

3. 对可疑虚拟机进行“一键式”隔离

对于运维人员而言，没有什么安全措施是万全的保障，必须提前备好在突发安全状态下的紧急预案，才能对“万一”发生的安全事件进行快速响应。SmartX 超融合的微分段功能，也包含了对于虚拟机进行紧急隔离的技术方法。

具体来说，当管理员或安全运维中心（SOC）发现某个虚拟机的行为异常，比如某个用作文件服务器的虚拟机上的收 / 发流量突增，但所有普通用户都无法连接到这个服务器，此时就可以：

立刻通过超融合管理界面或 API 将这台虚拟机置于“网络隔离”状态。
被“隔离”的虚拟机与周边的通信被完全切断，不会再影响到同一环境内的其他虚拟机，为管理员排除安全威胁或系统故障争取了时间。
如果排查 / 修复过程中，管理员需要临时与虚拟机进行通信（比如需要通过运维跳板机上传补丁文件、运行远程诊断程序），则可以通过设置“诊断隔离白名单”，允许被隔离虚拟机与特定目标之间的临时单点通信。
故障 / 安全漏洞修复后，还可以“一键式”恢复虚拟机的正常运行状态，隔离之前已经应用在这个虚拟机上的安全策略无需调整，重新生效。

我们可以将超融合系统中的安全机制总结为两个“常态”和一个“非常态”：

将“明确允许、默认拒绝”的安全模式常态化。
将“安全规则与虚拟机属性自动关联”常态化。
支持对“非常态”下的虚拟机进行快速隔离。

SmartX 微分段的内在机制

为什么 SmartX 超融合可以实现虚拟化环境安全机制的彻底转型？

1. “安全微分段”内生在超融合架构中

SmartX 的安全微分段内生于超融合操作系统，在每台主机上运行专用进程，对虚拟机之间的通信流量进行直接管理。要对一个或多个超融合集群启用安全微分段，仅需在集中管理器上将此功能与对应的虚拟交换机进行关联就可以。开启后，虚拟机之间的数据包被“允许”或“拒绝”动作，由集群上的每台主机分布式执行，优势体现为：

不装插件：不在虚拟机上安装任何代理或插件，虚拟机可以采用任何操作系统、运行任何应用程序。
不动网络：无需变更任何网络线路，无需修改物理网络上路由器、交换机、防火墙的任何配置。
没有瓶颈：安全功能分布在所有主机上，不会由于少数主机性能消耗过大而形成瓶颈。

这是对于整体架构影响最小的方式，也要求超融合系统具有过硬的自主核心技术才能实现。

2. CloudTower 实现统一安全管理

以上提到的虚拟机管理、标签管理、安全策略管理、虚拟机隔离等安全运维操作，都可以在 SmartX 超融合系统的“管理中心”—— CloudTower ——上完成。CloudTower 是 SmartX 自主研发的多集群管理软件，在同一个管理界面上即可对不同集群上的虚拟机、分布式存储和安全微分段进行配置。虚拟机即使发生了跨集群的迁移，也仍然在原有 CloudTower 管理范围内，虚拟机标签可以保持、与标签关联的安全策略也可以在不同集群上被执行。

CloudTower 的管理任务可以通过图形界面和 API 接口完成。管理员的人工操作主要在图形界面上完成；API 接口可以对接独立的“安全运维中心（SOC）”，按照 SOC 的指令完成超融合集群内部的配置调整。而且，由于安全微分段机制完全不需要变更任何物理线路、不需要配置任何物理网络设备，因此可以实现基于 API 的安全管理智能化和自动化。

结语

企业建设数据中心的目的是为了提高数字化应用的服务质量和效率，部署相应的安全措施也是为了保障数字化服务的连续性。在外部和内部网络安全威胁越来越严重的情势下，如果仅仅是简单地累加安全设备的种类和数量，有可能适得其反——不合理的安全措施会降低数据中心的效率、弹性、敏捷性和业务处理能力。

SmartX 基于自主研发的超融合系统，通过在数据中心的虚拟机之间部署分布式微分段安全机制，帮助用户减轻、消除数据中心内部的东西向安全威胁，在运行效率和安全保障之间很好地实现了平衡，特别适合于符合以下特点的虚拟化环境：

虚拟化比例高，虚拟机数量大，是应用的主要载体形式。
多业务 / 应用 / 部门混用的虚拟化集群。
面向外部用户提供服务的虚拟化集群（DMZ 区）。
DevSecOps 方法论驱动的自动化流程。
需要通过等保 2.0 测评。

参考文章：

1. 信息安全技术网络安全等级保护基本要求
http://gxxxzx.gxzf.gov.cn/szjcss/wlyxxaq/P020200429546812083554.pdf

点击了解 SMTX OS 如何通过微分段构建零信任安全。

继续阅读

一文了解微分段应用场景与实现机制

为什么虚拟化环境中需要微分段？

微分段在实际生产场景中如何应用？

SmartX 微分段的内在机制

结语

SmartX 博客

关于 SmartX 公司

在 SmartX 工作