绿茶通用站群绿茶通用站群

张大大到底是什么来头

张大大到底是什么来头 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大(dà)赢(yíng)家之一、英伟达背(bèi)后(hòu)的那个身(shēn)穿黑色皮(pí)衣的男(nán)人(rén)又(yòu)来了。

  前脚(jiǎo)才交出亮眼业绩狂拉股价,英伟(wěi)达CEO黄仁(rén)勋(xūn)后脚就(jiù)在(zài)昨日的COMPUTEX大(dà)会上宣(xuān)布,“我们已到达生成式AI引爆点。从此,全世界的每个角落,都(dōu)会有计算需求。”

  如今英(yīng)伟达掌握(wò)着全(quán)球多家科技(jì)公司“算(suàn)力命(mìng)脉(mài)”,而(ér)在这场(chǎng)大会上(shàng),黄(huáng)仁勋激情演讲2个小时,甩(shuǎi)出了多项重磅新发布,包括算力“杀器”DGX GH200超级计算机(jī)、针对(duì)游戏(xì)的ACE代工(gōng)服(fú)务、MGX服务器规(guī)范等内容(róng)。

  算力(lì)“杀器”:DGX GH200超级计算机+GH200超级芯(xīn)片(piàn)

  先(xiān)看“集成(chéng)了(le)英伟达最先进加速计算和网络技术”的DGX GH200人工智能超级(jí)计算机

  这款(kuǎn)超算(suàn)专为大规模生成式AI的负载所设(shè)计,由256块GH200超级芯(xīn)片组成(chéng),拥有1 exaflop超凡(fán)AI性(xìng)能、144TB内(nèi)存(是(shì)英伟达(dá)目前DGX A100系统(tǒng)的近500倍)、150英里光纤(xiān)、2000多(duō)个风扇。

  DGX GH200重达40000磅(约(yuē)合18143千克(kè)),堪比四只成(chéng)年大(dà)象的体(tǐ)重。

  预(yù)计DGX GH200将于今年年底投入问世(shì),英伟(wěi)达(dá)暂(zàn)未(wèi)公布价格,而(ér)谷歌(gē)云、Meta与微软(ruǎn)将是首批用户

  同时,英(yīng)伟达(dá)也(yě)正在打造自家基于DGX GH200的(de)大(dà)型AI超(chāo)级计算(suàn)机NVIDIA Helios,以支持其研究(jiū)和开发团队的工作。其中采用4个DGX GH200系统、1024颗Grace Hopper超级芯(xīn)片,每(měi)个都将与英(yīng)伟达Quantum-2 InfiniBand网络连接,带宽高达400Gb/s,将于今年年底上线(xiàn)。

  值得一提(tí)的是,黄仁勋(xūn张大大到底是什么来头)透露,DGX GH200集成的GH200 Grace Hopper超级芯片(piàn)已进入全面生(shēng)产

  “拉(lā)踩”CPU:成本、功耗(hào)、处理数据量不如(rú)GPU

  在本次大(dà)会上,黄仁勋还“拉踩”了(le)一波CPU。他(tā)从功耗、处理(lǐ)数据(jù)量等方(fāng)面,指出使用GPU胜过CPU。

  举例来说(shuō),花费10张大大到底是什么来头00万美(měi)元,可(kě)以(yǐ)建(jiàn)设一(yī)个有960颗(kē)CPU的(de)数(shù)据中心,其可处理1X LMM(大语言模型)数据量,需要11GWh功耗;

  同(tóng)样成本下,也可以建(jiàn)设(shè)一个有48个(gè)GPU的数据中心,其可处张大大到底是什么来头理(lǐ)44X LLM数据(jù)量,仅需要3.2GWh功耗。

  若只想(xiǎng)处理1X LMM数据量,则只需40万美元,便可拥(yōng)有(yǒu)一个搭载2个GPU、功耗仅0.13GWh的(de)数(shù)据中心。

  “买越多,省(shěng)越多(The more you buy, the more you save)。”黄仁(rén)勋(xūn)再次表示。

  同(tóng)时(shí),他也列出了数据中心成本公(gōng)式:数据中心(xīn)总持有成本=f[成(chéng)本(芯片、系(xì)统(tǒng)、硬件生态系统)、吞吐量(GPU、Algo软件、网(wǎng)络、系统(tǒng)软件、软件生态(tài)系统)、使用率(Algo Lib, 软件生(shēng)态系统)、采购运营(yíng)、生命(mìng)周期(qī)最佳化(huà)、电(diàn)力]

  ACE代工服务(wù):用AI激活NPC生命

  游戏一直是备受关注的一大AI应用(yòng)落地(dì)领(lǐng)域。英伟达也在(zài)大(dà)会上宣(xuān)布,推出面(miàn)向游戏的(de)定制(zhì)AI模(mó)型代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非玩家角(jiǎo)色(NPC)更智(zhì)能且(qiě)不断(duàn)进(jìn)化的对话技能,中(zhōng)间件(jiàn)、工具和游戏开发者可(kě)使用它来(lái)构建和部(bù)署定制(zhì)的(de)语音、对话和动画AI模型

  其(qí)中包(bāo)括(kuò):英伟(wěi)达NeMo,使用专有数(shù)据构(gòu)建(jiàn)、定制和部署语(yǔ)言(yán)模型;英伟达Riva,用于自动语音(yīn)识别和文本(běn)转语音实(shí)现实时语音(yīn)对话;英伟达Omniverse Audio2Face,用于即时(shí)创建游(yóu)戏角色表情动画,以匹配任何(hé)语(yǔ)音轨道。

  开发人员(yuán)可(kě)选择集(jí)成整个NVIDIA ACE for Games解决(jué)方(fāng)案,也可仅使(shǐ)用需要的组件(jiàn)。

  新参(cān)考工作流程(chéng):帮助建(jiàn)设数字(zì)化(huà)智能工厂

  黄仁(rén)勋(xūn)表示,全球电子(zi)制造商正在使(shǐ)用一种(zhǒng)全新的综合(hé)参考工作流程推进工业(yè)数字化(huà)工(gōng)作,该(gāi)工作流程结合了英伟达(dá)用于生成式(shì)AI、3D协作、仿真(zhēn)和自主(zhǔ)机器(qì)的技术(shù),包括:

  英伟达Omniverse,其连接了顶级(jí)计算(suàn)机辅助(zhù)设(shè)计应用以及生(shēng)成式AI的API和前沿框架;用于模拟和测(cè)试(shì)机器人的英伟达Isaac Sim应(yīng)用程(chéng)序;英(yīng)伟达(dá)Metropolis视觉(jué)AI框架,用(yòng)于(yú)自动光(guāng)学检测。

  同时,黄仁勋现场展示了一个完(wán)全数字化的(de)智能工厂的演示。

  目前(qián)富士康工业互联网、宜鼎国际、和硕、广达和纬创正在使用这(zhè)一参考工作流程,具体用例包括(kuò)电路板(bǎn)质(zhì)保(bǎo)检(jiǎn)测点自(zì)动化(huà)、光学检测自动(dòng)化(huà)、建设虚(xū)拟工厂、模拟(nǐ)协作机(jī)器人、构建及运营数字孪生等。

  MGX服务器规范:快速高效构建百(bǎi)余种服务器配置

  英伟(wěi)达发布(bù)NVIDIA MGX服(fú)务器规范,为(wèi)系(xì)统制(zhì)造(zào)商提供(gōng)模块化参考(kǎo)架构,满足各种规模的数据(jù)中心需求(qiú)。系(xì)统制(zhì)造商可使用它快速且经济(jì)高效地构建100多(duō)种服务(wù)器配(pèi)置,以(yǐ)适应(yīng)广(guǎng)泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英伟达全系列(liè)GPU、CPU、DPU和(hé)网络适配(pèi)器、各种x86、完整软件堆栈及Arm处理器,还可(kě)集成到云和企(qǐ)业数(shù)据中心中。

  华(huá)硕、和硕、QCT、超微(Supermicro)等都将采用MGX构建下一代加速计(jì)算(suàn)机,可将开发成本削减多(duō)达3/4,并(bìng)将开发(fā)时间缩短2/3至(zhì)仅(jǐn)需6个(gè)月

  其中,QCT和超(chāo)微基(jī)于MGX的(de)设计将于(yú)8月面世(shì)。超(chāo)微昨(zuó)日(rì)公布的ARS-221GL-NR系统(tǒng)将采用Grace CPU,而QCT的S74G-2U系统将采用(yòng)Grace Hopper。

  推出Spectrum-X网(wǎng)络平(píng)台(tái) 构(gòu)建超大规模生成式AI超级计算(suàn)机Israel-1

  另外,黄仁勋(xūn)宣布推出NVIDIA Spectrum-X网络(luò)平台(tái),旨在提高基于(yú)以太网的AI云的(de)性能和(hé)效率。

  相(xiāng)比传统以太网结构,Spectrum-X可实现(xiàn)1.7倍的整(zhěng)体(tǐ)AI性能(néng)和(hé)能效提升,并(bìng)具(jù)有高(gāo)度通用性,可用于各种AI应用(yòng)。它使用完全基于标准的以(yǐ)太(tài)网,并(bìng)可与基(jī)于以太网(wǎng)的堆栈互(hù)操作(zuò)。该平台支持256个200Gb/s端口,通(tōng)过单个(gè)交(jiāo)换(huàn)机连接,或在两层leaf-spine拓(tuò)扑中提供16000个端(duān)口,以支(zhī)持AI云(yún)增长(zhǎng)和扩展,在保持(chí)性能的同(tóng)时(shí)最大限度减少(shǎo)网(wǎng)络延迟(chí)。

  全球领(lǐng)先云计算提(tí)供商(shāng)正(zhèng)在采用Spectrum-X平台扩展生成式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴(dài)尔(ěr)、联想等系(xì)统制(zhì)造商处提供。

  此(cǐ)外,作为Spectrum-X参(cān)考(kǎo)设计的蓝图和测(cè)试平台(tái),英伟达正构建一台超大规模生成式AI超(chāo)级计算机Israel-1。这台AI超算价值数亿美(měi)元,将采(cǎi)用(yòng)戴尔PowerEdge XE9680服(fú)务器、英伟达HGX H100超级计算平台(tái)、内置(zhì)BlueField-3 DPU和Spectrum-4交(jiāo)换机的Spectrum-X平台(tái)。

  结语(yǔ)

  “40年(nián)来,我(wǒ)们创造了PC、互(hù)联网、移动(dòng)、云,现在(zài)是人工智能时代。你会创造什么?不(bù)管(guǎn)是什么,都要像我(wǒ)们一样(yàng)追赶它。要(yào)奔跑,不要走(zǒu)。要么为了食(shí)物(wù)奔跑,要(yào)么作(zuò)为(wèi)食物(wù)奔跑。”

  在5月27日(rì)的台湾(wān)大学发表了毕(bì)业典礼演(yǎn)讲上,黄(huáng)仁勋再(zài)次强调(diào)了(le)掌握AI技术的重要性:很多人担心,AI会抢走自己的(de)工作。但真正会抢(qiǎng)走你饭碗的,是掌握了AI技(jì)术的人。

  他表示(shì),从各方面来看,AI的兴(xīng)盛是计算机产业的再生契机(jī)。在下个(gè)十(shí)年,我们(men)的产(chǎn)业将使用(yòng)新型AI电脑(nǎo),取代价值万(wàn)亿美元(yuán)的(de)传统(tǒng)电(diàn)脑(nǎo)。

  而从昨(zuó)日大(dà)会上(shàng)黄仁勋的展示中,人工智能时(shí)代的未来轮廓似乎已逐渐浮(fú)现。

未经允许不得转载:绿茶通用站群 张大大到底是什么来头

评论

5+2=