绿茶通用站群绿茶通用站群

日本最想干掉的国家,日本最恨哪个国家

日本最想干掉的国家,日本最恨哪个国家 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热(rè)潮”最大赢家之一(yī)、英(yīng)伟达背(bèi)后的(de)那个(gè)身穿(chuān)黑(hēi)色皮衣的男人(rén)又(yòu)来了。

  前脚(jiǎo)才交出亮眼业绩(jì)狂拉(lā)股(gǔ)价,英伟达CEO黄仁勋后脚就在昨日的COMPUTEX大会上宣布,“我们已到(dào)达生成式AI引(yǐn)爆点。从此,全(quán)世界的每个角落,都会有计算(suàn)需求。”

  如今(jīn)英伟(wěi)达掌握着全(quán)球多家科(kē)技公司“算力命脉”,而在这场大(dà)会上,黄仁勋(xūn)激情演讲2个小时(shí),甩出了多项重磅(bàng)新发(fā)布(bù),包括(kuò)算力(lì)“杀器”DGX GH200超级计算机(jī)、针(zhēn)对游戏的ACE代工服(fú)务、MGX服务器规范等内容。

  算力(lì)“杀器”:DGX GH200超(chāo)级计(jì)算机+GH200超级芯(xīn)片

  先看(kàn)“集成了英伟达最(zuì)先进加速计算和网络(luò)技术”的(de)DGX GH200人工(gōng)智能(néng)超级(jí)计(jì)算机

  这款超算专为大规模(mó)生成(chéng)式(shì)AI的负载所设计,由(yóu)256块GH200超级芯片组成,拥有1 exaflop超凡(fán)AI性能、144TB内存(是英伟达目前(qián)DGX A100系统的近500倍(bèi))、150英里光(guāng)纤、2000多(duō)个风扇。

  DGX GH200重达40000磅(约合18143千克),堪比四只成年大(dà)象(xiàng)的体重。

  预计DGX GH200将于今年年底投入问(wèn)世,英伟达暂未公布价格(gé),而谷歌(gē)云、Meta与(yǔ)微软将是(shì)首批用(yòng)户(hù)

  同时(shí),英伟达也正(zhèng)在打(dǎ)造自(zì)家基于DGX GH200的(de)大型AI超级计算机NVIDIA Helios,以(yǐ)支(zhī)持其研究和开发团队的工(gōng)作。其中(zhōng)采用4个DGX GH200系统、1024颗Grace Hopper超级(jí)芯片,每个都将与英(yīng)伟达(dá)Quantum-2 InfiniBand网(wǎng)络连接,带(dài)宽高(gāo)达(dá)400Gb/s,将于今年年底(dǐ)上线。

  值得一提(tí)的是,黄(huáng)仁(rén)勋透露(lù),DGX GH200集成的GH200 Grace Hopper超(chāo)级芯(xīn)片已(yǐ)进入全(quán)面(miàn)生(shēng)产

  “拉(lā)踩”CPU:成本、功耗、处理(lǐ)数据量不如GPU

  在(zài)本次(cì)大会(h日本最想干掉的国家,日本最恨哪个国家uì)上,黄仁勋还“拉踩”了一波(bō)CPU。他从功(gōng)耗、处(chù)理数(shù)据量(liàng)等(děng)方面(miàn),指出使用(yòng)GPU胜(shèng)过CPU。

  举例(lì)来说,花费1000万美元,可以(yǐ)建设一个有960颗CPU的数(shù)据中心,其可处理1X LMM(大语言(yán)模型(xíng))数(shù)据量(liàng),需(xū)要(yào)11GWh功(gōng)耗;

  同样(yàng)成(chéng)本下,也可以建设(shè)一个有48个GPU的数(shù)据中(zhōng)心,其(qí)可处(chù)理44X LLM数据量,仅(jǐn)需(xū)要3.2GWh功耗(hào)。

  若只想处理(lǐ)1X LMM数据量,则只需(xū)40万美(měi)元,便可拥有一(yī)个搭载(zài)2个GPU、功耗仅0.13GWh的数(shù)据(jù)中心(xīn)。

  “买越多(duō),省越多(The more you buy, the more you save)。”黄仁勋再次表示(shì)。

  同时,他(tā)也列出(chū)了数据中心成本公(gōng)式:数(shù)据中心总(zǒng)持(chí)有成本=f[成(chéng)本(芯(xīn)片(piàn)、系统、硬件生态系统(tǒng))、吞吐(tǔ)量(GPU、Algo软(ruǎn)件、网络、系统(tǒng)软件、软件生(shēng)态系统(tǒng))、使用率(Algo Lib, 软件生态系统)、采购运(yùn)营、生(shēng)命周期最佳化、电力(lì)]

  ACE代(dài)工服务:用AI激活NPC生命

  游戏一直是(shì)备受关注的一(yī)大AI应(yīng)用落地领(lǐng)域。英伟达(dá)也在(zài)大会(huì)上宣布,推出面向游(yóu)戏的(de)定制AI模(mó)型代工服(fú)务NVIDIA Avatar Cloud Engine(ACE)

  它能(néng)赋(fù)予非玩家角色(sè)(NPC)更(gèng)智能(néng)且不断(duàn)进化的对(duì)话技能,中间件、工具和游戏开发者可使用(yòng)它来(lái)构建和部署定制的语音、对话和(hé)动画AI模型

  其中包括(kuò):英伟达NeMo,使用专有数据构建、定(dìng)制(zhì)和部署语言(yán)模型;英伟达Riva,用于(yú)自动(dòng)语音识别和(hé)文本转语音实现实时语音对话(huà);英伟(wěi)达Omniverse Audio2Face,用于即时创(chuàng)建游戏角(jiǎo)色表(biǎo)情动画,以(yǐ)匹(pǐ)配任何语(yǔ)音轨(guǐ)道。

  开发人员(yuán)可选(xuǎn)择集成整个NVIDIA ACE for Games解决方案,也可仅使用需要的组件。

  新参考工作流程:帮(bāng)助建设数字化智能工厂

  黄仁勋表示,全球(qiú)电子制造商正在使用一种全新的综合参考工作流(liú)程推进工业数字(zì)化工作,该工(gōng)作流(liú)程结合了英伟达(dá)用于生成式AI、3D协作、仿真和自主机器的技术(shù),包括:

  英伟达Omniverse,其(qí)连接了顶级(jí)计算机辅助(zhù)设计(jì)应用(yòng)以及生成式AI的API和前(qián)沿框架;用于模拟和测(cè)试机器人的(de)英(yīng)伟达Isaac Sim应用(yòng)程序;英(yīng)伟达(dá)Metropolis视(shì)觉AI框架,用于自(zì)动光学检测。

  同(tóng)时,黄(huáng)仁勋现场展示了一个完全数字化(huà)的智能工厂的演示。

  目前富士康(kāng)工业互(hù)联网(wǎng)、宜鼎国(guó)际、和硕(shuò)、广达(dá)和纬(wěi)创(chuàng)正在使用这一参考工作流程(chéng),具体用例(lì)包括电(diàn)路板质保检测点(diǎn)自动化、光学检测(cè)自(zì)动(dòng)化、建设虚拟工厂、模拟协作机器人、构(gòu)建(jiàn)及运营数字(zì)孪生等。

  MGX服务器规范:快速高(gāo)效构建百(bǎi)余(yú)种服务器配置

  英伟达发布NVIDIA MGX服务器规范,为系统制造商提供(gōng)模块化参考架(jià)构,满足各种规模(mó)的(de)数据中心需求。系统制造(zào)商可(kě)使用它(tā)快速(sù)且经济高效地构建100多种服务器配置,以适应广泛的AI、HPC及NVIDIA Omni日本最想干掉的国家,日本最恨哪个国家verse应(yīng)用。

  MGX支持英伟(wěi)达全系列GPU、CPU、DPU和网络适(shì)配器、各(gè)种(zhǒng)x86、完整(zhěng)软件堆(duī)栈(zhàn)及Arm处理器(qì),还可集成到云(yún)和企(qǐ)业数(shù)据中心(xīn)中(zhōng)。

  华(huá)硕(shuò)、和硕、QCT、超微(Supermicro)等都将采用(yòng)MGX构建下一代加速计算机,可将开发(fā)成本削减多达3/4,并将开发时(shí)间(jiān)缩短2/3至仅(jǐn)需6个(gè)月

  其中,QCT和(hé)超微基于MGX的设计将(jiāng)于8月(yuè)面世(shì)。超微昨日公(gōng)布的ARS-221GL-NR系(xì)统将采(cǎi)用Grace CPU,而QCT的S74G-2U系统将采用Grace Hopper。

  推出(chū)Spectrum-X网络(luò)平台 构(gòu)建超大规模生成式AI超(chāo)级计算机Israel-1

  另外,黄(huáng)仁勋宣布推出NVIDIA Spectrum-X网络平台,旨(zhǐ)在提(tí)高基于以太(tài)网的AI云的(de)性能和效率。

  相(xiāng)比传统以太网结构,Spectrum-X可实(shí)现(xiàn)1.7倍的整(zhěng)体AI性(xìng)能(néng)和能(néng)效提升,并具有(yǒu)高度通用性,可用于各种(zhǒng)AI应用。它使用(yòng)完全基于标准的以太网(wǎng),并可与基于以太网(wǎng)的堆(duī)栈互操(cāo)作。该平台支(zhī)持256个(gè)200Gb/s端口(kǒu),通过单(dān)个交换机连接,或在两层leaf-spine拓扑(pū)中提供16000个端口,以支持(chí)AI云增长和(hé)扩展,在保持(chí)性能的(de)同(tóng)时最大限度减少网络延迟。

  全球领先云计算提(tí)供(gōng)商正(zhèng)在采用Spectrum-X平(píng)台(tái)扩展生成(chéng)式(shì)AI服务(wù),而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴(dài)尔、联想等系统制造商(shāng)处(chù)提(tí)供。

  此外,作为Spectrum-X参考设计的蓝图(tú)和测试平台,英伟达正构(gòu)建一(yī)台超(chāo)大规模生成(chéng)式AI超级计算机Israel-1。这台(tái)AI超算价值数(shù)亿(yì)美元,将(jiāng)采(cǎi)用戴尔(ěr)PowerEdge XE9680服(fú)务器、英(yīng)伟达HGX H100超级计(jì)算平台(tái)、内置BlueField-3 DPU和Spectrum-4交(jiāo)换机的(de)Spectrum-X平台。

  结语

  “40年(nián)来,我们创造了(le)PC、互联网、移(yí)动、云,现在是(shì)人(rén)工智能时代。你会创造什么?不(bù)管是什(shén)么(me),都(dōu)要像我们一样追(zhuī)赶它。要奔跑(pǎo),不要走。要么为了(le)食物奔跑,要么作(zuò)为食物奔跑。”

  在5月27日的(de)台湾大学发表了毕业(yè)典礼(lǐ)演讲上(shàng),黄仁勋再(zài)次强调(diào)了掌(zhǎng)握AI技术的(de)重要性:很多人(rén)担心,AI会抢(qiǎng)走(zǒu)自(zì)己的工作(zuò)。但真(zhēn)正会抢走(zǒu)你饭碗(wǎn)的,是掌握(wò)了AI技术的人。

  他表示(shì),从各方面来看,AI的兴盛是计算机(jī)产业(yè)的再生契机。在下个十年(nián),我们的产业将使用新型AI电脑,取代价值万亿美元(yuán)的传统电脑(nǎo)。

  而从昨日大会上(shàng)黄仁勋的展示中,人(rén)工智能(néng)时代的未来(lái)轮廓似乎已逐渐浮现。

未经允许不得转载:绿茶通用站群 日本最想干掉的国家,日本最恨哪个国家

评论

5+2=