张大大到底是什么来头-绿茶通用站群

张大大到底是什么来头 “AI春晚”英伟达放大招：亮算力“杀器”、助游戏“捏人”；黄仁勋帮算账：GPU多买多省

　　“AI热潮”最大(dà)赢(yíng)家之一、英伟达背(bèi)后(hòu)的那个身(shēn)穿黑色皮(pí)衣的男(nán)人(rén)又(yòu)来了。

　　前脚(jiǎo)才交出亮眼业绩狂拉股价，英伟(wěi)达CEO黄仁(rén)勋(xūn)后脚就(jiù)在(zài)昨日的COMPUTEX大(dà)会上宣(xuān)布，“我们已到达生成式AI引爆点。从此，全世界的每个角落，都(dōu)会有计算需求。”

　　如今英(yīng)伟达掌握(wò)着全(quán)球多家科技(jì)公司“算(suàn)力命(mìng)脉(mài)”，而(ér)在这场(chǎng)大会上(shàng)，黄(huáng)仁勋激情演讲2个小时，甩(shuǎi)出了多项重磅新发布，包括算力“杀器”DGX GH200超级计算机(jī)、针对(duì)游戏(xì)的ACE代工(gōng)服(fú)务、MGX服务器规(guī)范等内容(róng)。

　　算力(lì)“杀器”：DGX GH200超级计算机+GH200超级芯(xīn)片(piàn)

　　先(xiān)看“集成(chéng)了(le)英伟达最先进加速计算和网络技术”的DGX GH200人工智能超级(jí)计算机。

　　这款(kuǎn)超算(suàn)专为大规模生成式AI的负载所设(shè)计，由256块GH200超级芯(xīn)片组成(chéng)，拥有1 exaflop超凡(fán)AI性(xìng)能、144TB内(nèi)存（是(shì)英伟达(dá)目前DGX A100系统(tǒng)的近500倍）、150英里光纤(xiān)、2000多(duō)个风扇。

　　DGX GH200重达40000磅（约(yuē)合18143千克(kè)），堪比四只成(chéng)年大(dà)象的体(tǐ)重。

　　预(yù)计DGX GH200将于今年年底投入问世(shì)，英伟(wěi)达(dá)暂(zàn)未(wèi)公布价格，而(ér)谷歌(gē)云、Meta与微软(ruǎn)将是首批用户。

　　同时，英(yīng)伟达(dá)也(yě)正在打造自家基于DGX GH200的(de)大(dà)型AI超(chāo)级计算(suàn)机NVIDIA Helios，以支持其研究(jiū)和开发团队的工作。其中采用4个DGX GH200系统、1024颗Grace Hopper超级芯(xīn)片，每(měi)个都将与英(yīng)伟达Quantum-2 InfiniBand网络连接，带宽高达400Gb/s，将于今年年底上线(xiàn)。

　　值得一提(tí)的是，黄仁勋(xūn张大大到底是什么来头)透露，DGX GH200集成的GH200 Grace Hopper超级芯片(piàn)已进入全面生(shēng)产。

　　“拉(lā)踩”CPU：成本、功耗(hào)、处理数据量不如(rú)GPU

　　在本次大(dà)会上，黄仁勋还“拉踩”了(le)一波CPU。他(tā)从功耗、处理(lǐ)数据(jù)量等方(fāng)面，指出使用GPU胜过CPU。

　　举例来说(shuō)，花费10张大大到底是什么来头00万美(měi)元，可(kě)以(yǐ)建(jiàn)设一(yī)个有960颗(kē)CPU的(de)数(shù)据中心，其可处理1X LMM（大语言模型）数据量，需要11GWh功耗；

　　同(tóng)样成本下，也可以建(jiàn)设(shè)一个有48个(gè)GPU的数据中心，其可处张大大到底是什么来头理(lǐ)44X LLM数据(jù)量，仅需要3.2GWh功耗。

　　若只想(xiǎng)处理1X LMM数据量，则只需40万美元，便可拥(yōng)有(yǒu)一个搭载2个GPU、功耗仅0.13GWh的(de)数(shù)据中心。

　　“买越多，省(shěng)越多（The more you buy， the more you save）。”黄仁(rén)勋(xūn)再次表示。

　　同(tóng)时(shí)，他也列出了数据中心成本公(gōng)式：数据中心(xīn)总持有成本=f[成(chéng)本（芯片、系(xì)统(tǒng)、硬件生态系统）、吞吐量（GPU、Algo软件、网(wǎng)络、系统(tǒng)软件、软件生态(tài)系统）、使用率（Algo Lib，软件生(shēng)态系统）、采购运营(yíng)、生命(mìng)周期(qī)最佳化(huà)、电(diàn)力]。

　　ACE代工服务(wù)：用AI激活NPC生命

　　游戏一直是备受关注的一大AI应用(yòng)落地(dì)领(lǐng)域。英伟达也在(zài)大(dà)会上宣(xuān)布，推出面(miàn)向游戏的(de)定制(zhì)AI模(mó)型代工服务NVIDIA Avatar Cloud Engine（ACE）。

　　它能赋予非玩家角(jiǎo)色（NPC）更智(zhì)能且(qiě)不断(duàn)进(jìn)化的对话技能，中(zhōng)间件(jiàn)、工具和游戏开发者可(kě)使用它来(lái)构建和部(bù)署定制(zhì)的(de)语音、对话和动画AI模型。

　　其(qí)中包(bāo)括(kuò)：英伟(wěi)达NeMo，使用专有数(shù)据构(gòu)建(jiàn)、定制和部署语(yǔ)言(yán)模型；英伟达Riva，用于自动语音(yīn)识别和文本(běn)转语音实(shí)现实时语音(yīn)对话；英伟达Omniverse Audio2Face，用于即时(shí)创建游(yóu)戏角色表情动画，以匹配任何(hé)语(yǔ)音轨道。

　　开发人员(yuán)可(kě)选择集(jí)成整个NVIDIA ACE for Games解决(jué)方(fāng)案，也可仅使(shǐ)用需要的组件(jiàn)。

　　新参(cān)考工作流程(chéng)：帮助建(jiàn)设数字(zì)化(huà)智能工厂

　　黄仁(rén)勋(xūn)表示，全球电子(zi)制造商正在使(shǐ)用一种(zhǒng)全新的综合(hé)参考工作流程推进工业(yè)数字化(huà)工(gōng)作，该(gāi)工作流程结合了英伟达(dá)用于生成式(shì)AI、3D协作、仿真(zhēn)和自主(zhǔ)机器(qì)的技术(shù)，包括：

　　英伟达Omniverse，其连接了顶级(jí)计算(suàn)机辅助(zhù)设(shè)计应用以及生(shēng)成式AI的API和前沿框架；用于模拟和测(cè)试(shì)机器人的英伟达Isaac Sim应(yīng)用程(chéng)序；英(yīng)伟达(dá)Metropolis视觉(jué)AI框架，用(yòng)于(yú)自动光(guāng)学检测。

　　同时，黄仁勋现场展示了一个完(wán)全数字化的(de)智能工厂的演示。

　　目前(qián)富士康工业互联网、宜鼎国际、和硕、广达和纬创正在使用这(zhè)一参考工作流程，具体用例包括(kuò)电路板(bǎn)质(zhì)保(bǎo)检(jiǎn)测点自(zì)动化(huà)、光学检测自动(dòng)化(huà)、建设虚(xū)拟工厂、模拟(nǐ)协作机(jī)器人、构建及运营数字孪生等。

　　MGX服务器规范：快速高效构建百(bǎi)余种服务器配置

　　英伟(wěi)达发布(bù)NVIDIA MGX服(fú)务器规范，为(wèi)系(xì)统制(zhì)造(zào)商提供(gōng)模块化参考(kǎo)架构，满足各种规模的数据(jù)中心需求(qiú)。系(xì)统制(zhì)造商可使用它快速且经济(jì)高效地构建100多(duō)种服务(wù)器配(pèi)置，以(yǐ)适应(yīng)广(guǎng)泛的AI、HPC及NVIDIA Omniverse应用。

　　MGX支持英伟达全系列(liè)GPU、CPU、DPU和(hé)网络适配(pèi)器、各种x86、完整软件堆栈及Arm处理器，还可(kě)集成到云和企(qǐ)业数(shù)据中心中。

　　华(huá)硕、和硕、QCT、超微（Supermicro）等都将采用MGX构建下一代加速计(jì)算(suàn)机，可将开发成本削减多(duō)达3/4，并(bìng)将开发(fā)时间缩短2/3至(zhì)仅(jǐn)需6个(gè)月。

　　其中，QCT和超(chāo)微基(jī)于MGX的(de)设计将于(yú)8月面世(shì)。超(chāo)微昨(zuó)日(rì)公布的ARS-221GL-NR系统(tǒng)将采用Grace CPU，而QCT的S74G-2U系统将采用(yòng)Grace Hopper。

　　推出Spectrum-X网(wǎng)络平(píng)台(tái) 构(gòu)建超大规模生成式AI超级计算(suàn)机Israel-1

　　另外，黄仁勋(xūn)宣布推出NVIDIA Spectrum-X网络(luò)平台(tái)，旨在提高基于(yú)以太网的AI云的(de)性能和(hé)效率。

　　相(xiāng)比传统以太网结构，Spectrum-X可实现(xiàn)1.7倍的整(zhěng)体(tǐ)AI性能(néng)和(hé)能效提升，并(bìng)具(jù)有高(gāo)度通用性，可用于各种AI应用(yòng)。它使用完全基于标准的以(yǐ)太(tài)网，并(bìng)可与基(jī)于以太网(wǎng)的堆栈互(hù)操作(zuò)。该平台支持256个200Gb/s端口，通(tōng)过单个(gè)交(jiāo)换(huàn)机连接，或在两层leaf-spine拓(tuò)扑中提供16000个端(duān)口，以支(zhī)持AI云(yún)增长(zhǎng)和扩展，在保持(chí)性能的同(tóng)时(shí)最大限度减少(shǎo)网(wǎng)络延迟(chí)。

　　全球领(lǐng)先云计算提(tí)供商(shāng)正(zhèng)在采用Spectrum-X平台扩展生成式AI服务，而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴(dài)尔(ěr)、联想等系(xì)统制(zhì)造商处提供。

　　此(cǐ)外，作为Spectrum-X参(cān)考(kǎo)设计的蓝图和测(cè)试平台(tái)，英伟达正构建一台超大规模生成式AI超(chāo)级计算机Israel-1。这台AI超算价值数亿美(měi)元，将采(cǎi)用(yòng)戴尔PowerEdge XE9680服(fú)务器、英伟达HGX H100超级计算平台(tái)、内置(zhì)BlueField-3 DPU和Spectrum-4交(jiāo)换机的Spectrum-X平台(tái)。

　　结语(yǔ)

　　“40年(nián)来，我(wǒ)们创造了PC、互(hù)联网、移动(dòng)、云，现在(zài)是人工智能时代。你会创造什么？不(bù)管(guǎn)是什么，都要像我(wǒ)们一样(yàng)追赶它。要(yào)奔跑，不要走(zǒu)。要么为了食(shí)物(wù)奔跑，要(yào)么作(zuò)为(wèi)食物(wù)奔跑。”

　　在5月27日(rì)的台湾(wān)大学发表了毕(bì)业典礼演(yǎn)讲上，黄(huáng)仁勋再(zài)次强调(diào)了(le)掌握AI技术的重要性：很多人担心，AI会抢走自己的(de)工作。但真正会抢(qiǎng)走你饭碗的，是掌握了AI技(jì)术的人。

　　他表示(shì)，从各方面来看，AI的兴(xīng)盛是计算机产业的再生契机(jī)。在下个(gè)十(shí)年，我们(men)的产(chǎn)业将使用(yòng)新型AI电脑(nǎo)，取代价值万(wàn)亿美元(yuán)的(de)传统(tǒng)电(diàn)脑(nǎo)。

　　而从昨(zuó)日大(dà)会上(shàng)黄仁勋的展示中，人工智能时(shí)代的未来轮廓似乎已逐渐浮(fú)现。

未经允许不得转载：绿茶通用站群张大大到底是什么来头