在疫情以来的首次现场主题演讲中,NVIDIA的创始人兼CEO黄仁勋今天在台北举行的COMPUTEX大会上宣布了一些平台,这些平台可以帮助公司乘风破浪,参与到一波历史性的生成式人工智能浪潮中,这个浪潮正在改变从广告到制造业再到电信等行业。
“我们回来了,”黄仁勋在他的家中厨房进行了几年的虚拟主题演讲之后在舞台上大声喊道。“我已经有将近四年没有公开演讲了–祝我好运!”
他向约3500名观众演讲了近两个小时,介绍了加速计算服务、软件和系统,这些都使新的商业模式成为可能,也让现有的商业模式更加高效。
“加速计算和人工智能标志着计算机的重新发明,”黄仁勋说道,他在过去一周在家乡的旅行每天都被当地媒体追踪报道。
为了展示它的强大,他使用了他所在的巨大的8K墙,展示了一个文本提示,生成了一首主题歌,可以随意地唱,就像任何卡拉OK歌曲一样。黄仁勋偶尔用他的家乡语言和观众开玩笑,并短暂地带领观众唱了这首新歌。
“现在我们处于一个新的计算时代的临界点,加速计算和人工智能已经被全球几乎所有的计算和云计算公司所接受,”他说道,指出现在有40,000家大型公司和15,000家初创公司使用NVIDIA技术,去年CUDA软件下载量达到2500万次。
主题演讲的重要新闻公告
-
-
- Grace Hopper提供大内存超级计算机,用于生成式人工智能。
- 模块化参考架构可以创建100多个加速服务器变体。
- WPP和NVIDIA在Omniverse中创建数字广告内容引擎。
- SoftBank和NVIDIA在日本建立5G和生成式人工智能数据中心。
- 网络技术加速基于以太网的人工智能云。
- NVIDIA ACE for Games利用生成式人工智能为角色赋予生命。
- 全球的电子制造商都在使用NVIDIA人工智能。
-
企业人工智能的新引擎
对于需要最佳人工智能性能的企业,他推出了DGX GH200,一个大内存人工智能超级计算机。它使用NVIDIA NVLink将多达256个NVIDIA GH200 Grace Hopper超级芯片组合成一个单一的数据中心大小的GPU。
Huang说,GH200超级芯片现在已经全面投产,它将一个高效的NVIDIA Grace CPU和一个高性能的NVIDIA H100 Tensor Core GPU结合在一个超级芯片中。
DGX GH200具有1艾斯普的性能和144TB的共享内存,几乎比单个NVIDIA DGX A100 320GB系统的内存高出500倍。这使得开发人员可以构建用于生成式人工智能聊天机器人的大型语言模型、用于推荐系统的复杂算法以及用于欺诈检测和数据分析的图神经网络。
Google Cloud、Meta和Microsoft是预计首批获得DGX GH200使用权限的公司,它可以作为未来超大规模生成式人工智能基础设施的蓝图。
“DGX GH200人工智能超级计算机集成了NVIDIA最先进的加速计算和网络技术,扩展了人工智能的前沿,”黄仁勋告诉台北的观众,其中许多人在开放大厅门前排队等候了几个小时。
NVIDIA正在建造自己的大型人工智能超级计算机NVIDIA Helios,该计算机将在今年上线。它将使用四个DGX GH200系统,连接NVIDIA Quantum-2 InfiniBand网络,以加快大型人工智能模型的训练数据吞吐量。
DGX GH200是数百个系统中的顶峰。它们共同将生成式人工智能和加速计算带给了数百万用户。
在宣布数百种由NVIDIA最新的Hopper、Grace、Ada Lovelace和BlueField架构支持的系统配置上,黄仁勋放眼大局。它们旨在应对人工智能、数据科学和高性能计算中最复杂的挑战。
各种规模的加速
为适应各种数据中心的需求,黄仁勋宣布了NVIDIA MGX,一个用于创建加速服务器的模块化参考架构。系统制造商将使用它来快速、经济地构建100多个不同的服务器配置,以适应广泛的人工智能、高性能计算和NVIDIA Omniverse应用程序。
MGX让制造商使用通用架构和模块化组件构建CPU和加速服务器。它支持NVIDIA的全系列GPU、CPU、数据处理单元(DPU)和网络适配器,以及x86和Arm处理器,适用于各种空气和液冷机箱。
QCT和Supermicro将成为首批推出MGX设计的公司,这些设计将于8月份亮相。Supermicro的ARS-221GL-NR系统将使用Grace CPU,而QCT的S74G-2U系统也将使用Grace Hopper。
ASRock Rack、ASUS、Gigabyte和Pegatron也将使用MGX创建下一代加速计算机。
5G/6G呼唤Grace Hopper
另外,黄仁勋表示,NVIDIA正在帮助塑造未来的5G和6G无线和视频通信。演示显示,运行在Grace Hopper上的人工智能将把今天的2D视频通话转变为更生动的3D体验,提供惊人的存在感。
为新型服务奠定基础,黄仁勋宣布NVIDIA正在与电信巨头软银合作,在日本建立一个分布式数据中心网络。它将在一个公共云平台上提供5G服务和生成式AI应用。
这些数据中心将使用NVIDIA GH200 Superchips和NVIDIA BlueField-3 DPU在模块化MGX系统中,以及NVIDIA Spectrum以提供5G协议所需的高精度时序。该平台将通过提高频谱效率降低成本,同时减少能源消耗。
这些系统将帮助软银探索在自动驾驶、人工智能工厂、增强和虚拟现实、计算机视觉和数字孪生方面的5G应用。未来的用途甚至可能包括3D视频会议和全息通信。
加速云网络
另外,黄仁勋推出了NVIDIA Spectrum-X,这是一个专门用于提高以太网为基础的AI云的性能和效率的网络平台。它将Spectrum-4以太网交换机与BlueField-3 DPU和软件结合起来,以比传统以太网更高的AI性能和功率效率提供1.7倍的增益。
NVIDIA Spectrum-X、Spectrum-4交换机和BlueField-3 DPU现已从包括戴尔技术、联想和Supermicro在内的系统制造商处获得。
让游戏角色栩栩如生
生成式AI也影响着人们的游戏。
黄仁勋宣布NVIDIA Avatar Cloud Engine(ACE) for Games,这是一项铸造服务,开发人员可以使用它构建和部署用于语音、对话和动画的定制AI模型。它将使无法玩的角色具备会话技能,以便它们能够以栩栩如生的个性回答问题。
NVIDIA ACE for Games包括AI基础模型,例如NVIDIA Riva用于检测和转录玩家的语音。文本提示会激发NVIDIA NeMo生成定制响应,并使用NVIDIA Omniverse Audio2Face进行动画处理。
在Windows上加速Gen AI
黄仁勋介绍了NVIDIA和微软如何合作推动生成式AI时代的Windows PC创新。
新的和增强的工具、框架和驱动程序使PC开发人员更容易开发和部署AI。例如,用于优化和部署GPU加速AI模型的Microsoft Olive工具链和新的图形驱动程序将提高在Windows PC上具有NVIDIA GPU的DirectML性能。
这种合作将增强和扩展RTX GPU的安装基数,该GPU具有Tensor Cores,可以提高400多个AI加速的Windows应用程序和游戏的性能。
数字化全球最大的产业
生成式AI也在价值7000亿美元的数字广告行业中孕育着新机遇。
例如,全球最大的营销服务组织WPP正在与NVIDIA合作,在Omniverse Cloud上构建首个启用生成式AI的内容引擎。
在演示中,黄仁勋展示了创意团队如何连接他们的3D设计工具,例如Adobe Substance 3D,以在NVIDIA Omniverse中构建客户产品的数字孪生体。然后,通过基于负责任数据源训练的生成AI工具(使用NVIDIA Picasso构建),他们可以快速制作虚拟场景。 WPP客户可以使用完整的场景生成一系列广告、视频和3D体验,供全球市场和用户在任何Web设备上体验。
“今天的广告是被检索的,但在未来,当您接触信息时,其中很多将是生成的 – 计算模型已经改变了,”黄仁勋说。
工厂铸造人工智能未来
估计有1000万个工厂的46000亿美元制造业是工业数字化的丰富领域。
“全球最大的产业是制造实物。先在数字上建造它们可以节省数十亿美元,”黄仁勋说。
主题演讲展示了包括富士康工业互联网、英纳迪斯克、和硕、广达和纬创等电子制造商如何使用NVIDIA技术铸造数字化工作流程,以实现完全数字化的智能工厂的愿景。
他们正在使用Omniverse和生成AI API连接他们的设计和制造工具,以便他们可以构建工厂的数字孪生体。此外,他们使用NVIDIA Isaac Sim进行机器人模拟和测试,使用NVIDIA Metropolis(一种视觉AI框架)进行自动光学检查。
最新的组件NVIDIA Metropolis for Factories可以创建定制的质量控制系统,为制造商带来竞争优势。它正在帮助企业开发最先进的AI应用程序。
人工智能加速生产线
例如,和硕 – 在全球制造300种产品,包括笔记本电脑和智能手机 – 正在使用Omniverse、Isaac Sim和Metropolis创建虚拟工厂。这允许它在模拟环境中尝试流程,从而节省时间和成本。
和硕还使用NVIDIA DeepStream软件开发工具包来开发智能视频应用程序,从而实现了吞吐量的10倍提高。
全球最大的技术制造商的服务部门富士康工业互联网正在与NVIDIA Metropolis合作伙伴自动化其电路板质量保证检查点的重要部分。
在一段视频中,黄仁勋展示了Quanta的子公司Techman Robot如何利用NVIDIA Isaac Sim优化台湾巨头生产线上的检查。它基本上是使用模拟机器人来训练机器人如何制造更好的机器人。
此外,黄仁勋宣布了一个新平台,以实现下一代自主移动机器人(AMR)车队。Isaac AMR可帮助模拟、部署和管理自主移动机器人车队。
黄仁勋说,包括ADLINK、Aetina、Deloitte、Quantiphi和Siemens在内的众多合作伙伴生态系统正在帮助推出所有这些制造解决方案。
这是NVIDIA如何帮助企业通过加速计算获得生成AI的好处的又一个例子。
“我很久没有见到你了,所以有很多事情要告诉你,”他在两小时的演讲后激动人心地掌声。
欲了解更多信息,请在此处查看NVIDIA在Computex 2023的一周亮点的四分钟视频。请观看以下完整的主题演讲。