谁有GPU,谁等于云公司
对于英伟达总有新的音问让你诧异。
最近的一则来自好意思国的一家云初创公司 CoreWeave 。
这家公司晓示融资23亿好意思金,而更让东谈主战栗的是这笔钱的典质物是其领有的GPU。在大模子激越下,GPU俨然成为一种硬通货,而CoreWeave之是以能有如斯多的英伟达稀缺物品,是因为它畴昔的身份——北好意思最大的矿工。
其时它有最初五万台GPU用来挖矿,在面临挖矿的不行执续性后,CoreWeave把主意转向AI等需要并行谋略的界限,并在 ChatGPT 爆红之前就采购了巨额英伟达芯片——其时芯片的产能还实足充分。
zh皇冠登3管理网址由此,CoreWeave自称是寰宇上独逐一个不错大界限提供H100算力的公司,也摇身一形成为了一家“云厂商”。

是的,它的GPU供给杰出了通盘云作事巨头,包括谷歌云、云和微软的Azure。
这听上去有些奇特,即使是不谈GPU数目瓶颈,构建数据中心还需要巨量的老本,小巧的空间、动力和散热瞎想以及至极复杂的软硬件协同,一般来说,能称心这些条目的只关联词巨头,而不是刚进行了B轮融资(4.21亿好意思元)的初创公司。
CoreWeave 能作念到这少量,源于一种对数据中心天差地远的结实。
传统的数据中心由CPU组成,它们侧重于通用谋略的才智,主要由最启动是英特尔,其后是AMD的芯片所把持。
但全新的用于加快谋略的数据中心则更强调并行谋略,这就意味着它需要有更大的内存、带宽以及把通盘的加快谋略单位密切商酌起来的才智,英伟达首创东谈主和CEO黄仁勋称这个历程为“数据中心当代化”,在他看来这是一个将执续10年的周期。
皇冠手机登录地址1这个新周期的启动预示着通盘数据中心的建构面孔,软硬件协同乃至电源和散热结构都需要从头瞎想。这让通盘的云作事提供商简直重回起跑线——针对 CPU 瞎想的上一代的数据中心有筹谋简直实足无法照搬。比如英伟达商酌遍及GPU集群所用到的 Infinite Band 时期需要最初500英里的电缆,这在传统的数据中心瞎想中压根不存在。
银河酷娱官网在哪CoreWeave举了另一个例子,疏导阵势大小,GPU 集群所需要的电力是传统数据中心的 4 倍,因此新数据中心的电力系统和散热系统都需要实足从头瞎想,这致使还不算软硬件协同的老本。
申博正网霸占先机的CoreWeave由此不仅能提供遍及的H100算力,何况在比其它的云作事快几十倍的同期用度还低80%,能作念到这些,咱们不错将其归功于它很早就精确践行了黄仁勋关联数据中心的愿景——数据中心正在向加快谋略标的滚动,而紧缺的算力则通过云供应。
博彩评级官方网站就这样,一家虚构币挖矿公司就形成了一家当红的云谋略公司,只因为它是最诚心的英伟达徒弟。

英伟达云是个什么云
谁有英伟达的GPU谁等于最红的云厂商,那么谁有最多的英伟达GPU?明显是它我方。
于是在扶执访佛的云初创企业的同期,英伟达也在设备我方的云。
皇冠信用源码英伟达切身下场作念云的上风有好多,最明显的是它不受到GPU供需关系的困扰。马斯克曾在公开场合说,赢得GPU比赢得毒品要难多了,而CoreWeave之是以能提供超大界限的 H100 算力,据悉也和英伟达的充分供应关联——英伟达在几个月前参与了CoreWeave的 B 轮融资。
但明显,只是投一些初创公司还不够,生成式 AI 对算力的巨大需求最终让英伟达我方下场。在本年3月的GTC大会上,英伟达推出了我方的云作事DGX Cloud ,它已在年中肃穆上线。
从名字就不错看出,DGX Cloud 平直运用了英伟达DGX超等谋略机的才智,云的每个实例均配备8个H100或A100 GPU以及640GB内存。
DGX Cloud 选拔了一种低蔓延结构,让遍及的责任流不错在集群之间膨大,于多个谋略节点上并行分拨。举个例子来说,开首晓示与DGX Cloud和洽的甲骨文,它在OCI Supercluster上每个集群不错部署最初3万个A100 GPU,由此大模子不错在云上进行测验。用户在职何地点都能解放造访属于我方的 AI 超等谋略机(英伟达暗示算力的分拨是独享排他的),打交谈的唯有前台界面,除了开发历程自身无须再去追思任何和硬件基础尺度关联的问题。
这项作事选拔月租风物,金额高达近 4 万好意思元。虽然,比较平直买一台 DGX 作事器 20 万好意思元的价钱来说照旧低廉了许多,但不少东谈主都指出,的 Azure 一样 8 个 A100GPU 的收费唯有不到 2 万好意思元,简直是前者的一半。
自信为什么这样贵?因为英伟达的云作事和别家不同,它不仅包括算力,还包括一整套 AI 处置有筹谋。
名为Base Command Platform(基础呐喊平台)和 AI Enterprise 的两项作事被集成到了DGX Cloud里。前者是一个照拂与监控软件,不仅不错用来纪录云表算力的测验负载,提供跨云表和腹地算力的整合,还能让用户平直从浏览器造访 DGX Cloud。后者则是英伟达 AI 平台中的软件层,高达数千个软件包提供了各式预测验模子、AI 框架和加快库,从而简化端到端的 AI 开发和部署老本。除此除外,DGX Cloud 上还提供名为 AI Foundations 的模子锻造作事,让企业用户不错使用我方的独到数据定制属于我方的垂直大模子。
这套软硬件组合起来的完好处置有筹谋让 DGX Cloud 测验速率比较传统的云谋略提高了两到三倍,这成为了DGX Cloud与传统云作事最大的不同,它很好的笼统了英伟达两方面的坚硬:AI 生态和算力。对于英伟达来说,“软件即作事”这句话似乎应该改成“软硬件一体即作事”,DGX Cloud 集结代表了一个硬件厂商进取垂直整合的才智天花板。

黄仁勋的磋商和本质
这个故事发生在江苏某地的2019年。当时,一位名叫王阿姨的51岁女性经历了一段不寻常的遭遇。在半梦半醒之间,她感到有人抚摸着自己,误以为是自己的丈夫。于是,她顺从地与这位男子互动,然而,当事情进行到一半时,她突然意识到压在身上的竟然是一名陌生男子......
但这并不料味着英伟达就透彻掀了传统云厂商的桌子。它的这项作事是通过传统云厂商来提供的。DGX Cloud 最启动被晓示推出在甲骨文云上,随后微软和谷歌跟进,而英伟达与这些云厂商和洽的面孔显得颇为意旨:英伟达先把 GPU硬件卖给这些云和洽伙伴,然后再租用这些硬件以便运行DGX Cloud。
博彩行业受到越来越多人的关注,但我们必须要注意风险控制。有东谈主戏称这叫双方钱一谈赚,都不迟延。
本色上,黄仁勋阐发过这种模式:“咱们从让客户使用咱们的谋略平台中受益,而客户通过将咱们(的谋略平台)置于他们(云厂商)的云中而受益。”
如若只听黄仁勋说,这等于个齐大本心的双赢结局,关联词这只是他一贯的叙事云尔。英伟达照旧堕入与我方客户的竞争中,何况心知肚明。
DGX Cloud 阐发告诉咱们,黄仁勋并不计算只是把它叮咛于传统云厂商上。在八月的 SIGGRAPH 2023上,英伟达先是晓示了与 Hugging Face 的和洽,接着发布了名为AI Workbench的作事。它们都不错让用户方便创建、测试和定制预训大模子,其背后的算力相沿当然都包括了 DGX Cloud。
这明显会冲击英伟达和云厂商的关系:最主要的云作事商,包括谷歌、亚马逊和微软,它们一样亦然英伟达的大客户,英伟达履行自有云作事例必会抢夺它们的阛阓份额。独特是咱们在第一部分照旧谈到,当作数据中心和云作事巨头的它们在构建下一代数据中心的问题上蓝本就不具备若干上风,如若再计议到英伟达芯片产能“卡脖子”的问题,英伟达的自有云作事要挟不行谓不小。
黄仁勋不会不知谈这少量,因此他对DGX Cloud 的魄力就显得颇值得玩味了,比如他公开暗示,一个安妥的云作事组合比例应该是10%英伟达DGX加上90%的公有云。换而言之,DGX Cloud 在黄仁勋的定位里并不是传统云厂商的敌手与要挟,而是和洽伙伴。
在 Q1 季度财报公布后的分析师电话会上黄仁勋谈的更多的都是这种和洽的平允,“一个巨大的双赢”,黄仁勋如斯描述。在他的结实里,DGX Cloud 是一个纯正的英伟达堆栈(pure Nvidia stack),把东谈主工智能开发、大型数据库和高速低蔓延汇注组合在一谈,成为一种方便的AI 基础尺度从而掀开全新的、巨大的阛阓——这个阛阓的参与者包括了英伟达和传统云厂商,公共将共同受益于生成式 AI 的爆发。
勤勉避谈冲突,其实是因为,DGX Cloud 就怕很长时间内都只可保管一个较小的体量。
第一个原因虽然是算力的瓶颈。“订单多到不行想议”是黄仁勋描述数据中心业务量时的描述,英伟达的中枢要务虽然是开发并保证分娩尽可能多的合乎阛阓需求的先进芯片,不然云作事的界限是无法扩大的。
皇冠客服飞机:@seo3687
皇冠hg86a
尽管台积电在马赓续蹄的分娩,但值得注重的是算力缺口不是变小而是更大了,因为一朝大模子落地和交易化(比如像ChatGPT那样),其推理老本将跟着用户界限的耕种指数级升高,永远来看会比测验模子的算力需求大得多(有东谈主给出的倍率是 100)。
此外亦然计议到英伟达和传统云厂商和洽关系的复杂性。DGX Cloud如若当作一种纯正的竞品出现,概况会占领可不雅的阛阓份额,但例必进一步加快云厂商开脱对英伟达的依赖——它们蓝本就照旧为了少交点“英伟达税”而异曲同工地自研芯片了。

从另一个角度讲,全力扩大 DGX Cloud 界限可能也不合乎英伟达的最好利益。从芯片到游戏显卡再到作事器和数据中心,英伟达绝少我方制造硬件家具,它更心爱和OEM 厂商和洽——以至于许多时候你要采购英伟达芯片都照旧得经过 OEM 厂商。这让英伟达很好的截止老本,保管利润率。
今天英伟达和云厂商之间似乎保管了一种均衡,但均衡等于用来冲破的,尤其当一方是英伟达的时候,毕竟脚下才是黄仁勋所谓“下一代数据中心十年”更新周期的第一年。
