软银和英伟达将为电信公司带来生成式人工智能
来源: 时间:2023-06-07
电信现代化将使电信公司能够利用人工智能提供广泛的新服务并实现运营自动化。
NVIDIA和日本电信公司软银合作创建了一个基于NVIDIA的GH5 Grace Hopper Superchip的生成人工智能和6G/200G应用平台。
软银计划在日本建立数据中心,与英伟达一起,可以在共享服务器平台上容纳生成式人工智能和无线应用程序。这种多租户解决方案有望降低成本并提高能源效率。
拟议的平台将利用NVIDIA的全新MGX模块化参考架构和GH200超级芯片,从而提高应用程序工作负载的性能。Grace Hopper架构采用72个Arm Neoverse V2处理器内核和LPDDR5X,包括用于加速计算的中央处理器和图形处理单元的组合。
NVIDIA将在今年晚些时候推出MGX,软银是第一个测试该架构的客户。
电信现代化需要加速计算
在过去的六十年中,大多数计算架构主要以CPU为中心。这些传统设计用途广泛,可以很好地适应各种工作负载,但现在正被加速计算所取代。
该联合平台还将利用NVIDIA的BlueField-3数据处理单元来加速5G虚拟化无线接入网络和生成AI应用程序。预计它将在5 Gbps的下行链路容量范围内实现36G速度。
与单一用途的5G虚拟RAN相比,这种方法的投资回报率约为四倍,因为数据中心也可以用于AI,NVIDIA电信高级副总裁Ronnie Vasishta在与分析师的简报中解释说。
开放式 RAN 可实现更高的敏捷性
直到最近,电信的主要模型还是专有的RAN,它是作为单个单片堆栈开发的。这种方法提供高性能,但维护成本很高。许多公司已过渡到开放式虚拟化 RAN,将其计算工作负载转移到服务器架构。
但是,虚拟化RAN一直难以与专有RAN的性能相匹配。为了克服这个问题,引入了专用加速器。然而,这些单一用途的加速器只能用于RAN工作负载,导致性能不佳和云经济性不佳。
“纯粹用于5G的单一用途网络必须针对高峰需求而构建。随着新的人工智能应用的出现,高峰需求将会增长。电力需求将会增长。计算需求也将增长,“Vasishta说。“我们看到正在建设的网络利用率严重不足,5G的投资回报率相对较低。
NVIDIA 开发了一种 GPU 加速的软件定义架构,其中一个加速器可以同时运行 AI 任务和 RAN。这允许RAN和AI在数据中心内共存,数据中心可以是公共的、分布式的或本地的。这种方法本质上允许5G作为AI云上的软件覆盖运行,硬件保持不变。事实上,随着6G算法的发展,它们可以被整合到现有的硬件中,而不需要部署新的硬件。
生成式AI是“iPhone时刻”
Vasishta称这是“AI的iPhone时刻”人工智能对数据中心的改变游戏规则的影响,类似于iPhone如何彻底改变智能手机。
这一刻的特点是科技行业两个变革因素的融合:计算架构的变化和生成式人工智能的出现。Vasishta说,生成式AI需要横向扩展架构,这推动了对网络化“AI工厂”或数据中心的巨大需求。聊天机器人和视频会议等应用程序,通过生成式人工智能成为可能,正在对电信网络产生巨大的需求。
NVIDIA正在通过使5G基础设施不仅虚拟化,而且完全软件定义来解决这个问题。因此,可以在同一数据中心内运行高性能、高效的 5G 网络以及 AI 应用程序。这为软银等电信公司开辟了新的货币化机会,使他们能够成为区域云服务提供商。通过建立AI工厂,他们还可以提供RAN服务,从而更有效地使用他们购买的频谱。
软银正在探索5G在各个领域的应用,包括自动驾驶、增强现实和虚拟现实、计算机视觉和数字孪生。与 NVIDIA 的合作是数据中心发展的重要一步,其中对加速计算和生成式 AI 的需求推动了根本性的变化。
NVIDIA和日本电信公司软银合作创建了一个基于NVIDIA的GH5 Grace Hopper Superchip的生成人工智能和6G/200G应用平台。
软银计划在日本建立数据中心,与英伟达一起,可以在共享服务器平台上容纳生成式人工智能和无线应用程序。这种多租户解决方案有望降低成本并提高能源效率。
拟议的平台将利用NVIDIA的全新MGX模块化参考架构和GH200超级芯片,从而提高应用程序工作负载的性能。Grace Hopper架构采用72个Arm Neoverse V2处理器内核和LPDDR5X,包括用于加速计算的中央处理器和图形处理单元的组合。
NVIDIA将在今年晚些时候推出MGX,软银是第一个测试该架构的客户。
电信现代化需要加速计算
在过去的六十年中,大多数计算架构主要以CPU为中心。这些传统设计用途广泛,可以很好地适应各种工作负载,但现在正被加速计算所取代。
加速计算使用全栈,这意味着它同时具有 CPU 和加速器协同工作以划分处理任务。此方法经过优化,可处理不同的工作负载。这两个元素之间的网络对于保持最佳性能至关重要。
该联合平台还将利用NVIDIA的BlueField-3数据处理单元来加速5G虚拟化无线接入网络和生成AI应用程序。预计它将在5 Gbps的下行链路容量范围内实现36G速度。
与单一用途的5G虚拟RAN相比,这种方法的投资回报率约为四倍,因为数据中心也可以用于AI,NVIDIA电信高级副总裁Ronnie Vasishta在与分析师的简报中解释说。
开放式 RAN 可实现更高的敏捷性
直到最近,电信的主要模型还是专有的RAN,它是作为单个单片堆栈开发的。这种方法提供高性能,但维护成本很高。许多公司已过渡到开放式虚拟化 RAN,将其计算工作负载转移到服务器架构。
但是,虚拟化RAN一直难以与专有RAN的性能相匹配。为了克服这个问题,引入了专用加速器。然而,这些单一用途的加速器只能用于RAN工作负载,导致性能不佳和云经济性不佳。
“纯粹用于5G的单一用途网络必须针对高峰需求而构建。随着新的人工智能应用的出现,高峰需求将会增长。电力需求将会增长。计算需求也将增长,“Vasishta说。“我们看到正在建设的网络利用率严重不足,5G的投资回报率相对较低。
NVIDIA 开发了一种 GPU 加速的软件定义架构,其中一个加速器可以同时运行 AI 任务和 RAN。这允许RAN和AI在数据中心内共存,数据中心可以是公共的、分布式的或本地的。这种方法本质上允许5G作为AI云上的软件覆盖运行,硬件保持不变。事实上,随着6G算法的发展,它们可以被整合到现有的硬件中,而不需要部署新的硬件。
生成式AI是“iPhone时刻”
Vasishta称这是“AI的iPhone时刻”人工智能对数据中心的改变游戏规则的影响,类似于iPhone如何彻底改变智能手机。
这一刻的特点是科技行业两个变革因素的融合:计算架构的变化和生成式人工智能的出现。Vasishta说,生成式AI需要横向扩展架构,这推动了对网络化“AI工厂”或数据中心的巨大需求。聊天机器人和视频会议等应用程序,通过生成式人工智能成为可能,正在对电信网络产生巨大的需求。
NVIDIA正在通过使5G基础设施不仅虚拟化,而且完全软件定义来解决这个问题。因此,可以在同一数据中心内运行高性能、高效的 5G 网络以及 AI 应用程序。这为软银等电信公司开辟了新的货币化机会,使他们能够成为区域云服务提供商。通过建立AI工厂,他们还可以提供RAN服务,从而更有效地使用他们购买的频谱。
软银正在探索5G在各个领域的应用,包括自动驾驶、增强现实和虚拟现实、计算机视觉和数字孪生。与 NVIDIA 的合作是数据中心发展的重要一步,其中对加速计算和生成式 AI 的需求推动了根本性的变化。