绿茶通用站群绿茶通用站群

别急老师今天晚上随你弄,别急老师来满足你

别急老师今天晚上随你弄,别急老师来满足你 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大赢家之一、英(yīng)伟达背后的那个身穿黑(hēi)色皮衣(yī)的男(nán)人又来了(le)。

  前脚才交(jiāo)出亮眼业绩(jì)狂拉股价,英伟达CEO黄仁勋后脚就在(zài)昨日(rì)的COMPUTEX大会上宣布(bù),“我们(men)已(yǐ)到(dào)达生(shēng)成式AI引爆点。从此,全(quán)世界的每个角(jiǎo)落,都(dōu)会有计算需求。”

  如今英(yīng)伟(wěi)达掌握着(zhe)全球多家科技公(gōng)司“算(suàn)力命脉”,而在这(zhè)场大会上,黄(huáng)仁勋激情演(yǎn)讲(jiǎng)2个小时,甩出(chū)了(le)多项重磅新发布,包括算力“杀器(qì)”DGX GH200超级计(jì)算机、针对(duì)游戏(xì)的ACE代工服务、MGX服(fú)务器规范等内容。

  算力“杀器(qì)”:DGX GH200超级计算机+GH200超级芯(xīn)片

  先(xiān)看“集成了英伟达最先进加速计算和网(wǎng)络技术(shù)”的DGX GH200人工智能超级计算(suàn)机

  这(zhè)款超算专(zhuān)为(wèi)大规模生成式AI的负载所设计,由256块GH200超级芯(xīn)片组成(chéng),拥有1 exaflop超(chāo)凡AI性能(néng)、144TB内存(是英伟达(dá)目前DGX A100系统的近500倍)、150英(yīng)里光纤、2000多个风扇(shàn)。

  DGX GH200重达40000磅(约别急老师今天晚上随你弄,别急老师来满足你合18143千克),堪比(bǐ)四只(zhǐ)成年大象的(de)体重。

  预计DGX GH200将于(yú)今年年底投入问世,英伟达暂(zàn)未公布价格,而谷歌云、Meta与微(wēi)软将(jiāng)是首(shǒu)批(pī)用户

  同时,英(yīng)伟达也正在(zài)打造自(zì)家基于(yú)DGX GH200的大型(xíng)AI超级计算机(jī)NVIDIA Helios,以(yǐ)支持(chí)其研(yán)究(jiū)和(hé)开发(fā)团队(duì)的(de)工作。其中采用4个DGX GH200系统、1024颗Grace Hopper超(chāo)级芯(xīn)片,每(měi)个都(dōu)将与英伟达Quantum-2 InfiniBand网络(luò)连接,带宽高达400Gb/s,将于今年年(nián)底上线(xiàn)。

  值得一提的是,黄仁勋透露,DGX GH200集成的(de)GH200 Grace Hopper超级芯片已进入(rù)全面(miàn)生产

  “拉踩”CPU:成(chéng)本、功耗、处(chù)理(lǐ)数(shù)据量不如GPU

  在(zài)本次大会上,黄(huáng)仁勋(xūn)还“拉踩”了一波CPU。他(tā)从功耗、处理(lǐ)数据量等(děng)方面,指出使(shǐ)用(yòng)GPU胜过(guò)CPU。

  举例来说(shuō),花费1000万美元,可(kě)以(yǐ)建设一个(gè)有(yǒu)960颗CPU的(de)数据(jù)中心(xīn),其可处理(lǐ)1X LMM(大语言模(mó)型)数据量,需(xū)要11GWh功耗;

  同样成本下,也(yě)可以建(jiàn)设(shè)一个有48个GPU的数据(jù)中心,其可处(chù)理44X LLM数(shù)据量,仅需要3.2GWh功耗。

  若只想处(chù)理(lǐ)1X LMM数(shù)据量,则只(zhǐ)需40万美元,便可拥(yōng)有一(yī)个(gè)搭(dā)载2个GPU、功耗(hào)仅0.13GWh的(de)数据(jù)中心。

  “买越(yuè)多,省越多(The more you buy, the more you save)。”黄(huáng)仁勋(xūn)再次表示(shì)。

  同(tóng)时,他也列(liè)出(chū)了数据中心成本公式(shì):数据中心总持有成(chéng)本=f[成(chéng)本(芯片(piàn)、系(xì)统(tǒng)、硬件生态系统)、吞(tūn)吐量(GPU、Algo软件、网络(luò)、系统软件、软件(jiàn)生(shēng)态系统)、使(shǐ)用率(Algo Lib, 软(ruǎn)件生态系统)、采购(gòu)运营、生(shēng)命周期最(zuì)佳化、电力(lì)]

  ACE代工服务:用AI激活NPC生命

  游戏一直是(shì)备(bèi)受关注的一大AI应(yīng)用(yòng)落地领域。英伟达也在(zài)大会上宣(xuān)布,推出(chū)面向游戏的(de)定制AI模型(xíng)代工服务(wù)NVIDIA Avatar Cloud Engine(ACE)

  它能赋予(yǔ)非玩(wán)家角(jiǎo)色(NPC)更(gèng)智(zhì)能且不断(duàn)进化的(de)对话(huà)技能,中间件(jiàn)、工(gōng)具和游(yóu)戏开发者可使用(yòng)它来(lái)构建和部署(shǔ)定(dìng)制(zhì)的语音、对话和动(dòng)画AI模型(xíng)

  其中包(bāo)括:英伟(wěi)达NeMo,使(shǐ)用专有数据(jù)构建、定制和(hé)部署语言模型;英(yīng)伟达Riva,用于自(zì)动语音识别和文本转语音实现(xiàn)实时语音对话;英伟(wěi)达Omniverse Audio2Face,用于即(jí)时(shí)创建游戏角色表情动(dòng)画,以匹配任(rèn)何语(yǔ)音轨道。

  开(kāi)发人员可选(xuǎn)择集成(chéng)整个NVIDIA ACE for Games解决方案,也(yě)可仅使用需要的(de)组件。

  新参(cān)考工作流程:帮助建设数字(zì)化智能工厂

  黄仁勋表示(shì),全球电(diàn)子制(zhì)造商正在(zài)使用一(yī)种全新的综合参(cān)考工作流程推进工业数字(zì)化工(gōng)作,该(gāi)工(gōng)作流程结合了英伟(wěi)达(dá)用于生成式AI、3D协(xié)作(zuò)、仿(fǎng)真和自主机器的技术(shù),包(bāo)括(kuò):

  英伟(wěi)达(dá)Omniverse,其连接了顶级计(jì)算机(jī)辅助设计应用(yòng)以及(jí)生成(chéng)式AI的(de)API和前沿框架;用于模拟和测试机(jī)器人的英(yīng)伟达Isaac Sim应用程序;英伟达Metropolis视觉AI框架,用于自动光学检测。

  同时,黄(huáng)仁勋现(xiàn)场展示了一个完全数字化(huà)的智能工(gōng)厂(chǎng)的演示(shì)。

  目前富士康工业(yè)互联网、宜(yí)鼎国(guó)际(jì)、和硕、广达和纬创正在使用这(zhè)一参考工作流程,具体用例包(bāo)括电(diàn)路板质保(bǎo)检(jiǎn)测点自动化、光学检测自(zì)动化、建设虚(xū)拟工厂、模拟协作机器人、构建(jiàn别急老师今天晚上随你弄,别急老师来满足你)及运(yùn)营数(shù)字孪生等。

  MGX服务器规范:快速高效构建百余种(zhǒng)服(fú)务器配置

  英伟达发布NVIDIA MGX服务器(qì)规范,为(wèi)系统制造商提供模块(kuài)化参考架构,满足各种规模的数据中心需求(qiú)。系统制造商(shāng)可(kě)使用它快(kuài)速且经济高效地(dì)构(gòu)建100多种(zhǒng)服务(wù)器配(pèi)置,以适应广泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持(chí)英伟达全(quán)系列(liè)GPU、CPU、DPU和网络适配器(qì)、各种x86、完整软件(jiàn)堆栈及Arm处理器,还可集成到云(yún)和企业数据中(zhōng)心中。

  华硕、和(hé)硕、QCT、超(chāo)微(Supermicro)等都将(jiāng)采用MGX构建下一代加速计算机,可将开发(fā)成本削减多达3/4,并将(jiāng)开发时(shí)间缩短2/3至仅需6个月

  其中,QCT和(hé)超微基于MGX的(de)设计将于8月面(miàn)世(shì)。超微昨日公(gōng)布的ARS-221GL-NR系(xì)统将采(cǎi)用Grace CPU,而(ér)QCT的(de)S74G-2U系统将采用Grace Hopper。

  推(tuī)出(chū)Spectrum-X网络平台 构建超大规模(mó)生(shēng)成式AI超级(jí)计算机Israel-1

  另(lìng)外,黄仁勋(xūn)宣(xuān)布推出NVIDIA Spectrum-X网络平台,旨(zhǐ)在提高基于以太网的AI云的(de)性能和效率。

  相比传(chuán)统以(yǐ)太网结构,Spectrum-X可(kě)实现1.7倍的整(zhěng)体AI性能和能效提升,并(bìng)具有(yǒu)高度通(tōng)用性,可用于各种AI应用。它使用完(wán)全基于标准的以太网,并(bìng)可与(yǔ)基于以太网(wǎng)的堆栈互操作(zuò)。该平台支持256个200Gb/s端口(kǒu),通过单(dān)个交换机连(lián)接,或在两层leaf-spine拓扑中(zhōng)提(tí)供(gōng)16000个端(别急老师今天晚上随你弄,别急老师来满足你duān)口,以支持AI云增长和扩展(zhǎn),在保持(chí)性能的同时最大限度(dù)减少网络延迟(chí)。

  全球领先云计算提供商(shāng)正在采用Spectrum-X平台扩展生成(chéng)式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴尔、联想等系统(tǒng)制造商处提(tí)供。

  此(cǐ)外(wài),作为Spectrum-X参考设计的蓝图和(hé)测试平台,英(yīng)伟达正(zhèng)构建一台(tái)超大(dà)规模生成式(shì)AI超(chāo)级计算机Israel-1。这(zhè)台AI超算(suàn)价(jià)值(zhí)数亿(yì)美元,将采用戴尔PowerEdge XE9680服务器、英(yīng)伟达HGX H100超(chāo)级计算平台、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台。

  结语

  “40年来,我们创造(zào)了PC、互联网(wǎng)、移动、云,现(xiàn)在是人工(gōng)智(zhì)能时代。你(nǐ)会创造什么?不(bù)管(guǎn)是什么(me),都要(yào)像(xiàng)我们一(yī)样追赶它。要奔跑,不(bù)要走。要么为了(le)食(shí)物(wù)奔跑,要(yào)么作为食物奔跑。”

  在5月27日的台湾大学发(fā)表了毕业(yè)典(diǎn)礼演讲上,黄仁(rén)勋再次(cì)强调了掌(zhǎng)握AI技术(shù)的重要性:很(hěn)多人(rén)担心,AI会抢走自己的工(gōng)作。但真(zhēn)正会(huì)抢(qiǎng)走你饭碗的,是掌(zhǎng)握了AI技(jì)术(shù)的人。

  他表示,从各方面来看,AI的兴(xīng)盛是(shì)计算机产业的再生(shēng)契机。在(zài)下个(gè)十年,我们(men)的产业将使用(yòng)新型AI电脑,取代(dài)价值万(wàn)亿(yì)美元的传(chuán)统电脑。

  而从昨日大会上黄仁勋的展示(shì)中,人工(gōng)智能(néng)时代的未来轮(lún)廓(kuò)似乎已逐渐浮现。

未经允许不得转载:绿茶通用站群 别急老师今天晚上随你弄,别急老师来满足你

评论

5+2=