在云时代,IT 基础设施为企业带来的业务“增值”作用逐渐凸显,不少企业都加快了 IT 基础设施现代化转型的脚步。不过随着越来越多的企业采用混合云计算、基础设施平台工程等技术,企业 IT 基础设施的发展路线也蔓生出更多岔口,令用户感到困扰:如何选择最佳的 IT 基础设施建设与转型方案?

近期,Gartner 在《What Good Modern Infrastructure Looks Like》报告中,分享了 IT 基础设施建设的评估方法、最佳实践与转型方案,通过“基础设施类型象限图(Infrastructure Profile Quadrants)”这一工具,帮助企业明确 IT 基础设施建设的当前阶段与未来转型方向,更好地支撑业务持续增长和创新。

图片来源:What Good Modern Infrastructure Looks Like, Gartner

您可直接观看 SmartX 视频号的往期视频,快速了解报告核心内容与重点建议!

核心建议

在基础设施现代化转型实践中,企业应重点关注以下三个方面:

  • 先评估基础设施现状,再根据战略采取行动。需要评估的方面不仅包括基础设施技术,还包括用户的服务满意度、服务的交付时间、服务弹性等多个方面。
  • 采用能够提升企业 IT 工程与运营水平的最佳实践。无论基础设施现状如何,企业的发展目标都应该是在满足用户对灵活性与交付速度需求的同时,确保服务组合的安全性和稳定性。
  • 确定发展目标后,企业应制定基础设施转型战略。该战略既要关注转型的最终目标,又要求企业识别转型路上的推动和阻碍因素。

评估:根据基础设施类型象限确定发展现状

Gartner 通过两个维度对企业 IT 基础设施类型进行了划分,分别为:

  • 数据中心 vs 云:这一维度主要关注基础设施环境位置和/或资产“重量”。本地部署/重资产的是“数据中心”,第三方提供/轻资产的是“云”。
  • 基础设施 vs 平台:这一维度主要关注基础设施的抽象程度和/或层级(即服务的技术栈)。基础性的、专注于提供底层/构建块组件的是“基础设施导向型”,抽象化的、专注于提供高层服务的是“平台导向型服务”。

“平台导向型服务”致力于为开发者和用户提供高层级的服务与抽象化的解决方案,“基础设施导向型服务”则关注网络、存储和计算资源等基础设施底层组件和核心要素,这些服务往往为“平台导向型服务”提供技术底座。

基于这两个维度,Gartner 构建了基础设施类型象限图(如下图),将企业 IT 基础设施主要划分为 4 种类型,帮助企业判断其在基础设施现代化转型进程中所处的阶段:

  • 以数据中心基础设施为核心:采用虚拟化,基础设施层具备容器化改造的可行性。
  • 以数据中心平台为核心:采用虚拟化,并搭配使用容器与应用基础设施。
  • 以云基础设施为核心:采用以按需、可扩展方式提供的虚拟化和基础设施容器化改造服务。
  • 以云平台为核心:采用全套云服务。
图片来源:What Good Modern Infrastructure Looks Like, Gartner

很多企业在构建 IT 基础设施时,往往会在不同环境中采用不同的基础设施类型,但仍会有一种或两种类型占主导地位。Gartner 建议企业的 IT 基础设施策略与建设方式,聚焦在象限图中的 1-2 种基础设施类型上,以便企业更好地掌握这些基础设施架构。

类型一:以数据中心基础设施为核心

采用这种基础设施类型的企业主要需要支持和维护关键工作负载,这些工作负载可能需要保持本地运行状态、要求低延迟,或有严格的服务水平协议(SLA)等要求。这一类型不仅要求企业具备技术高度熟练的运维管理团队(可由第三方提供,如托管服务供应商提供的支持团队),而且也需要具备经济高效、灵活弹性、高性能等特性的基础设施。

这一基础设施类型包括:

  • 本地虚拟化部署
  • 私有云
  • 日益增长的数字化主权环境——企业需要部署具备本地治理、本地运营和技术自主的工作环境

类型二:以数据中心平台为核心

这一类型将基础设施建设从基础架构层扩展到上层的平台服务栈。企业同样需要管理关键工作负载,对运维管理团队的技术能力要求也更高,需要具备云原生基础设施和混合基础设施运营的相关知识和能力。此外,由于基础设施是构建新应用、部署打包软件、对传统应用进行现代化改造等工作的关键驱动因素,该类型下 IT 基础设施团队还需要与应用开发团队、软件工程师形成紧密的合作。

例如,在现有虚拟化环境中部署容器管理软件并自行管理,就属于这种类型。

更多资料:

类型三:以云基础设施为核心

这种类型的基础设施具有明显的混合云特性。以云基础设施为核心的企业,已经具备了成熟的工作流程和稳固的 IT 基础设施技术,并希望将基础设施扩展至公有云环境。此时,企业需确保已经具备能够支持或至少能够监管此类扩展建设的团队。

例如,企业将虚拟化平台扩展至一个或多个公有云环境,并主要采用原样迁移上云(lift-and-shift)的方式,就属于这种类型。

类型四:以云平台为核心

在这种情况下,企业已经全面采用战略云服务商提供的服务,或者与多个提供商合作进行混合多云部署。此时,企业使用云服务商提供的全套服务,并可能结合第三方多云管理工具进行补充。

值得注意的是,基础设施类型间不存在“哪个更好”的问题,关键在于确定哪一种类型最适配当前的企业需求以及未来的发展目标。

更多企业基础设施发展现状与类型象限的匹配示例:

  • 企业希望将工作负载混合使用并迁移到公有云云原生服务平台(以云平台为核心),其余工作负载则部署在虚拟化环境中(以数据中心基础设施为核心)。
  • 企业希望将所有工作负载都迁移到公有云中(以云平台为核心)。
  • 企业正在使用现有的虚拟化工具和流程,并将成熟的虚拟化环境扩展到多个公有云环境中(以云基础设施为核心)。
  • 企业需要为各类开发人员提供本地容器管理(以数据中心平台为核心)和公有云容器管理服务(以云平台为核心)。
  • 出于监管方面的考虑,企业正在建设和运营私有云(以数据中心基础设施为核心,如果使用容器管理能力,则属于以数据中心平台为核心的类型)。

实践:基于 4 种基础设施类型的最佳实践

过去几年,Gartner 一直强调基础设施平台工程(Infrastructure Platform Engineering,IPE)的重要性,采用 IPE 准则是基于基础设施类型进行建设实践的成功关键。

IPE 准则:

  • 采用自助服务体验以减轻用户的认知负担,改善工作流程,减少用户挫败感。
  • 采用明确一致的应用程序接口,将功能集成到平台外的流程中并实现自动化。
  • 提供符合安全、架构和合规准则的使用方式,让用户愿意使用。
  • 模块化,团队可以根据自己的需要选择使用或组合功能。
  • 以产品管理为导向,注重满足多数人而非少数人需求的功能。
  • 没有规定的方法,但是要识别、支持和鼓励好的实践。
  • 核心要保护组织和用户,满足合规要求。
  • 通过遥测技术实现可视化。平台团队将利用数据指标和趋势来主动应对运行挑战,并指导平台发展路线(roadmap)。
  • 鼓励更大范围的社区参与,以加强平台能力。
  • 根据服务级别目标(SLO)提供可预测的可用性和性能。

1. 以数据中心基础设施为核心的最佳实践

以数据中心基础设施为核心的企业,需要打破传统的基础设施运维管理功能孤岛,关键在于将这些基础设施嵌入自动化。为此,企业需要建立一个用于资源配置和编排的编码环境,并内嵌可观测功能和治理机制。此外,还需要将自服务功能整合到资源调配流程中。从本质上讲,就是为了将用户从基础设施功能的内部运作中解放出来。

针对这一类型的人员配置,不仅需要涵盖计算、存储和网络等传统领域的专家,还应包括具备基础设施即代码(IaC)和自动化技能的人才。特别地,考虑到数据中心通常存储和处理关键数据,随着未来越来越多地承担 AI 工作负载的运行,企业的相关人员也需要开始规划这方面的计算资源,保障业务的平稳运行。

2. 以数据中心平台为核心的最佳实践

该类型在“以数据中心基础设施为核心”类型的基础上进行了扩展,增加了平台构建能力(platform enabling capabilities),二者均与私有云部署密切相关。这一类型的建设目标是构建两条并行且一致的工作管道:一条用于应用程序,另一条用于基础设施,二者在操作层面上紧密结合,实现工程与运营的联通。用户可以将其近似地理解为 GitOps 部署模式,在代码被推送后底层基础设施即可自动进行配置。当前,许多企业正在建立 IPE 团队来推进这一建设。

在人员技能方面,相较于“数据中心基础”类型,“数据中心平台”类型增加了对于平台相关能力的要求,尤其是部署与支持容器管理平台方面的能力。

3. 以云基础设施为核心的最佳实践

“云基础设施”类型标志着数据中心向云环境的扩展,通常使用统一的控制平面以实现资源调配和可视化。企业可采用以下三种云运营方式。

基础架构团队“孤岛式”运营(I&O-Siloed CloudOps)

由已有的基础架构团队独立进行云环境的运维管理,往往采用混合管理形式,不过很少关注云自动化、助力编码人员、采用敏捷实践的云运营模型。这种方式比较适合以下企业:

  • 较少使用云技术,因此不需要可扩展的云运营模式。
  • 不准备采用任何基础设施即服务(IaaS)或平台即服务(PaaS)。
  • 希望将工作负载原样上迁至 IaaS 云平台,并能够接受这种方法的缺点。

以产品为中心的运营(Product-Centric I&O CloudOps)

这种运营模式下,云运营功能被嵌入到基础架构团队“计划-建设-过渡-运行”(PBTR)的工作流程中,基础架构团队不以项目和技术为导向,而是以服务为导向,更加重视自动化和敏捷实践。这种模式类似于基础架构团队“孤岛式”运营模式,但更迎合基于云的数字化发展趋势,比较适合以下企业:

  • 仅有非常少数量的项目采用了 IaaS+PaaS。
  • 已经进行了 IaaS 云上迁。

专职运营(Dedicated CloudOps)

这种模式下,云运营作为一个独立的职能,由专门的人员全职负责。企业的部分组织架构设置可能是虚拟的,例如,虚拟团队的成员可能只专注于云 IaaS,但他们可以汇报给服务器虚拟化团队。采用虚拟团队的企业架构需要确保人员专注于云计算的运营,不能变成混合管理的形式,从而回归到基础架构团队“孤岛式”运营模式。这种方式比较适合以下企业:

  • 希望采用“小步快跑”的渐进式方式来培养云计算运营能力。
  • 不希望将云运营责任推给应用开发或应用管理团队。
  • 希望将与云相关的技能集中在一个运营团队中。
  • 愿意对重新分配到该小组的员工进行再培训,并补充具备云技术的新人才。
  • 如果使用虚拟团队模式,企业可能需要为内部运作补充人员,因为将人员分配到虚拟团队会影响内部运作的可用资源。

除了需要前面提到的基础设施即代码和自动化相关技能,采用这种运营模式的企业还需要具备云财务管理和安全相关的 Day 2 技能。此外,团队也需要具备企业选择的云环境的相关知识。

4. 以云平台为核心的最佳实践

以云平台为核心的企业将全面使用云服务的原生功能。这要求企业能够对部署进行有效管理,包括控制成本、保障安全以及确保云平台符合架构配置标准。企业可采用以下两种运营方式。

云平台运营(Cloud Platform Ops)

这种运营模式下,云平台运营是一个独立的功能部门,类似由企业内部管理的云服务商(MSP)。它遵循平台工程的理念,将云视作一个共享的自助服务平台,团队主要负责创建和维护的“产品”通常包括云管理工具、技术规范、模板和自动化脚本,并为内部客户提供“人力支持”功能。这种模式具有很高的灵活性,并且多以实体团队的形式运作。很多时候,企业在云技术采用初期会将该团队划分到“云卓越中心(Cloud Center of Excellence,CCoE)”或与 CCoE 紧密合作的基础架构团队中。这种方式比较适合以下企业:

  • 不确定选择哪种模式,也不想进行大范围/有争议的需求分析,只想尝试一种灵活的、更行之有效、能随着时间变化的模式。
  • 希望采用更先进的管理方式,以应对规模快速增长或复杂度快速提升的云应用。
  • 希望云运营由一个团队负责,但仍能覆盖所有类型的云服务,满足双模式和多云管理需求。
  • 希望采用以产品为中心的方法,或对云原生 DevOps 管理风格感兴趣,但不具备站点可靠性工程 (SRE) 所需的 DevOps 成熟度。
  • 希望将云计算运营功能嵌入到 CCoE 中,使其成为组织内所有云计算能力的来源。

云平台工程(Cloud Platform Engineering,I&O)

这种模式下,云运营职能被划分到企业基础架构团队中更普遍的 IPE 小组中,其主要职责不是云运营,而是致力于工程设计和共享服务运营。该模式所需的专业技能与“云基础设施”类型相似,但除此之外,还要求运维人员对企业所使用的云计算 PaaS 服务有基本的了解。这种方式比较适合以下企业:

  • 应用程序构建人员(无论是开发组织还是其他技术团队)只能自助访问基础架构平台工程团队提供的元素,无法直接访问云提供商的本地自助服务接口。
  • 平台专为在云环境中运行而设计。

发展:IT 基础设施现代化转型路径

在明确了 IT 基础设施的建设现状和发展目标后,企业可以参考下图,规划 IT 基础设施现代化转型路径。需要注意的是,虽然也存在逆向发展路径——比如从“以云基础设施为核心(右下)”转向“以数据中心基础设施为核心(左下)”——但 Gartner 观察到这种情况相对罕见,而且通常是由最初项目规划和执行不力导致的。

图片来源:What Good Modern Infrastructure Looks Like, Gartner

以“数据中心基础设施”类型为起点

  • 向着“以数据中心平台为核心”发展:选择这一方向通常是由于用户存在本地容器化应用的支持需求。这要求企业实现较高的自动化水平,并加强技术人员对云原生基础设施的理解。
  • 向着“以云基础设施为核心”发展:选择这一方向通常是由于企业需要退出或扩展现有数据中心,比如将分布式混合基础设施(DHI)从本地扩展到云端,因而需要选择一种更偏重基础设施的云运营模式。
  • 向着“以云平台为核心”发展:最具挑战性的转型路径,通常由企业对云技术全面应用的目标所推动,要求企业深入了解云环境中的原生服务,并转向更偏重平台的云运营模式。

从“以数据中心平台为核心”转向“以云平台为核心”

对基础架构团队而言,这或将是最容易的转变方向,因为它将平台运营的重担转移给了云服务提供商。但同时,这也意味着企业需要具备运营外部云环境的能力,例如从本地的 OpenShift 或 Tanzu 迁移到云平台容器服务。

从“以云基础设施为核心”转向“以云平台为核心”

这一转变涉及到更多高层级的云原生技术,因此将会带来成本管理和优化方面的挑战,也需要企业采用更侧重平台层面的云运营模式。选择这种转型路径可能由于,例如,在企业实现应用上云后,希望对应用实现进一步的现代化转型,包括从 VMware VCF 迁移到全栈云原生服务。

在确定 IT 基础设施现代化转型路径时,Gartner 建议企业:

  • 准确判断企业 IT 基础设施建设的当前阶段,只有明确发展的起点,才能规划发展的目标与路径。
  • 充分利用用户需求指导路径规划。基础架构团队很多时候并不能“希望” IT 基础设施发展成什么样子,而是需要以用户需求为导向进行发展。
  • 确保转型的基本准则得到了全程贯彻落实,如 IPE 原则、自服务和自动化的发展方向。此外,确保针对云相关的工作选择了正确的运营模式。

更多 IT 基础设施现代化转型趋势与技术解读,欢迎点击下方链接下方二维码,获取电子书大礼包

【全行业】 《超融合从评估到落地:用户常见问题解答》

【医疗】《医疗行业 IT 基础架构转型方案与实践》

【制造】《制造行业 IT 基础架构转型方案与实践》

【金融】《SmartX 金融核心生产业务场景探索文章合集》

继续阅读