全球领先的开源解决方案提供商红帽公司近日宣布启动全新开源项目
通过融合vLLM
的创新架构与Kubernetes的成熟编排能力,llm-d开 创了跨混合云环境实现分布式、可扩展且高性能AI推理的新范式。 其支持任意模型、任意加速器、任意云环境的特性,正在推动‘无限 AI潜能’愿景的实现。
虽然训练仍然至关重要,但生成式AI的真正影响取决于更高效和可
通过llm-d满足可扩展生成式AI的推理需求
红帽及其行业合作伙伴正通过llm-d应对这一挑战。llm-d
llm-d提供了一套强大的创新,其中包括:
- vLLM已迅速成为开源领域的事实标准推理服务器,
为新兴的前沿模型提供Day 0模型支持,并支持各种加速器,现已包括Google Cloud张量处理器单元(TPU)。 - 预填充和解码分离将AI的输入上下文和token生成阶段分离成
离散操作,然后将它们分布到多个服务器上。 - 键值缓存卸载,基于LMCache,将键值缓存的内存负担从GP
U内存转移到更具成本效益且容量更大的标准存储,如CPU内存或 网络存储。 - 由Kubernetes驱动的集群和控制器可在工作负载需求波动
时更高效地调度计算和存储资源,同时确保性能和较低的延迟。 - AI感知网络路由,
用于将传入请求调度到最有可能拥有过去推理计算热缓存的服务器和 加速器。 - 高性能通信API可实现服务器之间更快、更高效的数据传输,支持
NVIDIA推理传输库(NIXL)。
llm-d:受到行业领导者的支持
该全新开源项目已经获得了由领先的生成式AI模型提供商、AI加
基于对开放合作的坚定承诺,红帽认识到,在快速发展的生成式AI
红帽的愿景:任意模型,任意加速器,任意云,自由部署
AI的未来应当充满无限机遇,而不应受到基础设施孤岛的限制。
正如红帽通过将Linux转变为现代IT的基石,
支持证言
红帽高级副总裁兼AI首席技术官Brian Stevens
“由AI领域先锋力量共同发起的llm-d社区正式成立,
AMD AI产品管理企业副总裁Ramine Roane
“AMD很荣幸能成为llm-d社区的创始成员,
思科开源项目办公室副总裁兼思科DevNet主管Shannon McFarland
“llm-d项目是实用型生成式AI领域的一项重要进展。llm
CoreWeave工程高级副总裁 Chen Goldberg
“CoreWeave很荣幸能成为llm-d项目的创始贡献者,
Google Cloud AI与计算基础设施副总裁兼总经理Mark Lohmeyer
“在企业大规模部署AI,并为用户创造价值的过程中,高效的AI
Hugging Face产品主管Jeff Boudier
“我们相信,每家公司都应该能够建立和运行自己的模型。vLLM
IBM Research混合云与AI平台副总裁Priya Nagpurkar
“IBM认为,AI的下一阶段聚焦于效率和规模。
英特尔数据中心与AI软件解决方案及生态系统副总裁Bill Pearson
“llm-d的推出将成为行业推动大规模AI转型的关键拐点,
Lambda ML平台高级员工工程师Eve Callicoat
“推理是AI真正发挥实际价值的地方,而llm-d代表了一个重
NVIDIA工程AI框架副总裁Ujval Kapasi
“llm-d项目是对开源AI生态系统的重要补充,体现了NVI
加州大学伯克利分校教授兼Sky Computing Lab总监Ion Stoica
“我们很高兴看到红帽在vLLM既有成功的基础上继续发展,vL
芝加哥大学LMCache Lab CS教授Junchen Jiang
“分布式键值缓存优化,如卸载、压缩和混合,
1预测分析:AI半导体,全球范围,Alan Priestley,Gartner,2024年8月2日 - ID G00818912 GARTNER是GARTNER, Inc.和/或其附属公司在美国和国际上的注册商标和服务标志,
Additional Resources
- 进一步了解llm-d
- 进一步了解vLLM
- 查看如何为llm-d做贡献
- 了解更多红帽全球峰会相关信息
- 查看红帽全球峰会新闻中心
- 关于红帽
红帽是开放混合云技术的领导者,为变革性的IT创新和AI应用提供可信、一致且全面的基础。红帽的云、开发者、AI、Linux、自动化和应用平台等技术产品组合,协助企业从数据中心到边缘跨环境部署任意应用。作为全球领先的企业级开源软件解决方案提供商,红帽积极投入开放生态系统和社区,解决未来的IT挑战。通过与合作伙伴和客户紧密协作,帮助他们构建、连接、自动化、保护和管理IT环境,并提供咨询服务以及屡获殊荣的培训和认证方案。
- 前瞻性声明
除本新闻稿中所载的历史信息与讨论外,其他陈述可能构成1995年《美国私人证券诉讼改革法案》项下的前瞻性声明。此类声明基于公司对未来业务和财务表现的当前预期与假设,涉及多项风险、不确定性及其他可能导致实际结果与预期大相径庭的因素。本新闻稿中的任何前瞻性声明仅反映其发布当日的情况。除非法律另有规定,公司不承担更新或修订任何前瞻性声明的义务。
###
红帽及红帽标识为Red Hat, Inc.或其子公司在美国及其他国家/地区的商标或注册商标。