假设您正在管理一个忙碌的 IT 团队,每天都要处理各种重复性工作,如安装软件、扩展解决方案、检查系统健康状况或推出安全补丁。这些挑战连同其他事务,构成了 IT 从业人员的日常。现在,您的首席技术官找到您,要求将新的 AI 基础架构和应用从实验性概念验证阶段推进到生产阶段。您没有新的人手或资源来支持这些工作,而且最终解决方案需要与现有的业务关键型工作流集成。
自动化助您一臂之力
当企业级 IT 策略中包含标准化时,您可以将自动化用于 AI 基础架构,以帮助解决这些额外的工作负载。如果您已经在使用红帽 Ansible 自动化平台,那么您将能够利用已掌握的技能来应对 AI 挑战。
不过,刚开始接触自动化的用户也不必担心。您可以快速上手使用 Ansible 自动化平台,甚至可以利用生成式 AI 功能,即红帽 Ansible Lightspeed,来帮助缩短学习曲线。
无论您的自动化技能处于什么水平,将自动化应用于 IT(而 AI 本质上仍属于 IT 范畴)都将有助于降低成本,同时缩短实现 AI 价值的时间。
如何开始实现 AI 价值?我建议采取的第一步可能在您的意料之中,那就是:自动化您的 AI 部署!红帽将其称为“AI 基础架构自动化”,它通过节省总体时间、减少错误和提高系统可靠性来提供可衡量的商业价值。
如何实现 AI 基础架构自动化
通过利用 Ansible 自动化平台自动安装、配置和维护红帽 OpenShift AI 和红帽企业 Linux AI(RHEL AI),您可以部署预测性 AI 和生成式 AI 解决方案、减少手动任务,并跨 AI 部署提供一致的配置和优化。
尽管 AI 基础架构为最终用户创造了巨大的价值,但 IT 运维要求仍高度依赖手动操作完成。以下是有助于您开始在 RHEL AI 和 OpenShift AI 上部署 AI 解决方案的自动化示例:
- 在系统(包括边缘)之间建立安全连接,用于传输和访问驱动 AI 解决方案的数据
- 使用 Ansible Playbook 实现标准化部署,以提高 RHEL AI 和 OpenShift AI 的一致性和可靠性
- 实现安全防护自动化,使用户只能访问他们有权访问的数据和系统
此外,AI 解决方案的其他基础架构也能够从自动化中受益:
- 仍然需要安装和配置的硬件,如架顶式网络交换机和路由器
- 需要安装和管理的用于检索增强生成(RAG)解决方案的向量数据库
- 通过 OpenAI 或 Llama Stack 等 API 实现 AI 模型 HTTP 访问所需的负载平衡硬件和软件
- 需要设置和管理的模型训练和对齐数据的连接和存储
还有更多用例需要实现自动化。需要处理的工作有很多,但许多部署拓扑都包含可以自动化的组件,如下所示:

利用事件驱动的 Ansible 构建 AIOps 工作流
好了,AI 基础架构自动化……搞定!接下来该怎样做呢?如前文所述,您已掌握的自动化技能可以应用于 AI 技术,这些技术基于该 AI 基础架构或与之相连接。但是,如果有新的技能要求,或者仅仅是希望提高整体自动化生产力,又该如何呢?AI 能提供助力吗?当然!
采用搭载 IBM watsonx Code Assistant 的红帽 Ansible Lightspeed,自动化开发人员能够获享生成式 AI 功能与强大的自动化工具的组合优势,使您和您的团队能够更智能地开展工作、更快地部署解决方案,从而简化全面实现 AI 基础架构自动化的过程。此外,如果您在使用 OpenShift AI,那么就意味着您已经在使用红帽 OpenShift,它可以运行许多其他工作负载(包括虚拟机虚拟化和管理),Ansible Lightspeed 也可以帮助您实现这些工作负载的自动化。
值得注意的是,Ansible Lightspeed 中内置的生成式 AI 开发人员工具不仅仅是一个简单的“打勾式”AI 解决方案。红帽经过深思熟虑,将生成式 AI 和预测性 AI 无缝集成到自动化工作流中,因此用户甚至可能没有意识到自己正在使用它。这使得 Ansible 自动化平台内容创作者能够更快、更高效且更准确地开发自动化代码。
全面自动化 AIOps 工作流
到目前为止,本文中的所有内容都涉及人员参与。但是,自动化能否在没有人工干预的情况下自主执行操作?当然可以!
正确的 AI 运维(AIOps)工作流由事件驱动型自动化提供支持,后者会自动执行由现有 IT 部署中发生的事件触发的操作。部署到位后,事件驱动型自动化可帮助 AIOps 提供以下优势:
- 解决速度:AIOps 可通过检测和应对新出现的问题来缩短停机时间,从而有助于减少平均解决时间(MTTR)。
- 自我修复或闭环自动化系统:它支持自我修复基础架构,该架构可显著提升性能和正常运行时间。
- 大数据:AIOps 可以通过更高效地清理、分析大数据并采取相应操作,充分释放大数据的应用价值。
- 效率和规模:它可以通过使用 AI 模型的见解来识别行动和扩展检测,从而提高人员的效率。
- 简化:AIOps 可以简化许多重复性 IT 服务管理任务,并有可能完全自动执行这些任务。
- 实时数据关联和决策:如果 AIOps 包含自动化引擎,它可以根据数据来自动响应,从而减少人为干预和错误,同时最大限度地减轻噪音干扰。
- 规模化数据关联和预测:AIOps 可以自动分析更多的数据,远远超出人力所能及的范围。
添加业务和安全防护策略以保护 AI 工作流
最后,在部署和自动化 AI 基础架构,成功集成 AIOps 工作流并实现完整的自我修复闭环自动化后,您现在需要构建防护措施来确保 AI 仅按预期运行。
您的 AI 策略必须值得信赖、可靠,且对您多年来制定的业务策略负责。最后一步是策略实施,您需要为 AI 决策构建护栏,以确保即使某些内容可以实现自动化,也并不意味着它可以在未经必要合规和安全检查的情况下实现自动化。
了解更多
您可以阅读这篇文章,详细了解选择红帽 Ansible 自动化平台作为 AI 基础的好处。如果您想深入了解 AIOps,请观看这个短视频并查看这篇博客。
此外,还有两个红帽交互式体验供您浏览(每个演示不超过 2 分钟):Red Hat Ansible unlocks AIOps(红帽 Ansible 解锁 AIOps)和 Event-Driven Ansible with Red Hat OpenShift(事件驱动的 Ansible 与红帽 OpenShift 搭配使用)。
关于作者
With over thirty years in the software industry at companies like Sybase, Siebel Systems, Oracle, IBM, and Red Hat (since 2012), I am currently an AI Technical Architect and AI Futurist. Previously at Red Hat, I led a team that enhanced worldwide sales through strategic sales plays and tactics for the entire portfolio, and prior to that, managed technical competitive marketing for the Application Services (middleware) business unit.
Today, my mission is to demystify AI architecture, helping professionals and organizations understand how AI can deliver business value, drive innovation, and be effectively integrate into software solutions. I leverage my extensive experience to educate and guide on the strategic implementation of AI. My work focuses on explaining the components of AI architecture, their practical application, and how they can translate into tangible business benefits, such as gaining competitive advantage, differentiation, and delighting customers with simple yet innovative solutions.
I am passionate about empowering businesses to not only harness AI to anticipate future technological landscapes but also to shape them. I also strive to promote the responsible use of AI, enabling everyone to achieve more than they could without it.