特斯拉 10000 塊 H100 GPU 集群上線,加速 FSD V12 落地。擁有自家超算的和 H100 集群的特斯拉,正式入局算力軍備競(jìng)賽!
根據(jù)特斯拉爆料人士 Sawyer Merritt 爆料,特斯拉將于美國(guó)時(shí)間本周一上線備受期待的,由 1 萬(wàn)片 H100 組成的超級(jí)計(jì)算機(jī)。
這個(gè) GPU 集群將用來(lái)訓(xùn)練包括特斯拉 FSD 自動(dòng)駕駛系統(tǒng)在內(nèi)的各種 AI 應(yīng)用。
這個(gè) GPU 集群由一萬(wàn)個(gè)英偉達(dá) H100 GPU 組成,能提供 340 FP64 PFLOPS 的峰值算力,為 AI 提供 39.58 INT8 ExaFLOPS 的峰值算力。
這個(gè)算力峰值超過(guò)了之前全世界排名第四的超算 Leonardo 所能提供的算力。
憑借這臺(tái)超級(jí)計(jì)算機(jī),特斯拉可以迅速訓(xùn)練并更新它的全自動(dòng)駕駛技術(shù)。
這個(gè) H100 集群不僅讓特斯拉相比其他汽車制造商更具競(jìng)爭(zhēng)力,而且將使特斯拉擁有夸張的算力儲(chǔ)備。
馬老板上個(gè)月甚至發(fā)推稱:「坦白說(shuō)…… 如果英偉達(dá)能提供足夠的 GPU,我們可能就不需要 Dojo?!?/p>
特斯拉的算力儲(chǔ)備有什么用?
而且對(duì)于特斯拉來(lái)說(shuō),這個(gè) H100 集群不單代表了無(wú)與倫比的算力,還使得擁有海量數(shù)據(jù)的特斯拉能將這些數(shù)據(jù)變現(xiàn)的能力。
特斯拉工程技術(shù)總監(jiān) Tim Zaman 發(fā)推稱,特斯拉上線的 H100 集群,將被用于訓(xùn)練視頻數(shù)據(jù)。
特斯拉擁有的訓(xùn)練數(shù)據(jù)集可能是全世界最大的,熱連接緩存大小超過(guò)了 200PB,這比大語(yǔ)言模型的數(shù)據(jù)規(guī)模要高幾個(gè)數(shù)量級(jí)!
同時(shí)他還稱,特斯拉是真正「物理上」擁有這些 GPU 集群和算力。很多其他的公司宣稱自己「擁有」多大算力時(shí),其實(shí)他們只是能「租到」這些算力。
而對(duì)于目前的特斯拉來(lái)說(shuō),上線 H100 集群的意義就在于能夠極大地加快最新版 FSD V12 的上線速度。
馬斯克在兩個(gè)月之前稱,最新版的 FSD V12 版本更新將不再是「測(cè)試版」的自動(dòng)駕駛技術(shù),暗示了這次更新可能真的能帶來(lái)完全體的自動(dòng)駕駛技術(shù)。
而就在前幾天,馬斯克自己開著特斯拉來(lái)了一場(chǎng)全網(wǎng)關(guān)注的 FSD V12 的演示直播。直播中,新版的 FSD V12 展示出了「絲滑的自動(dòng)駕駛性能」和出色的駕乘體驗(yàn)。
FSD V12 背后的技術(shù)原理,就是將海量的優(yōu)秀司機(jī)駕駛的實(shí)時(shí)視頻,通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練成一個(gè)全新的自動(dòng)駕駛 AI 來(lái)駕駛汽車。
特斯拉上線這個(gè) H100 集群后,將會(huì)大大加快 FSD V12 的訓(xùn)練速度,這也被上文中特斯拉工程總監(jiān)的帖子所證實(shí)。
馬斯克在推特上稱,V12 可能將在不到半年的時(shí)間內(nèi)更新上線!
而除了特斯拉 FSD V12 之外,特斯拉的人形機(jī)器人 Optimus 也將從特斯拉儲(chǔ)備的巨大算力中獲益。
網(wǎng)友分析到,因?yàn)橹悄軝C(jī)器人的工作原理,本質(zhì)上也是從視頻信號(hào)中去理解周圍的世界。這和自動(dòng)駕駛的本質(zhì)是一樣的,只是形態(tài)和控制方式有區(qū)別。
特斯拉超算 Dojo 怎么樣了?
Tesla 上線 H100 GPU 集群的同時(shí),也在激活自己研發(fā)制造的超算 Dojo。下圖是特斯拉內(nèi)部對(duì) Dojo 計(jì)算能力的預(yù)測(cè)。
2024 年 10 月,Dojo 的計(jì)算能力也有望達(dá)到 100 exaflops。
在 2021 年的 AI Day 上,特斯拉第一次公布了自己超算 ——Dojo。
快兩年時(shí)間過(guò)去了,在今年 7 月推特科技爆料賬戶 Whole Mars Catalog 爆料 Dojo 已經(jīng)正式開始工作了。
這一消息也得到了馬斯克本人的點(diǎn)贊確認(rèn)。
整個(gè)超算由這樣的計(jì)算模塊構(gòu)成:
每個(gè)模塊上有 25 個(gè) Soc,模塊之間通過(guò)高速寬帶連接。
然后將模塊用主機(jī)盒固定起來(lái),所有的接口都集成在了系統(tǒng)托盤上。
然后將兩個(gè)帶有主機(jī)組件的系統(tǒng)托盤安裝到一個(gè) Dojo 機(jī)柜中。
頂部的圖例展示的是每個(gè) Soc 的負(fù)載。
而現(xiàn)在,擁有 Dojo 和 1 萬(wàn)塊 H100 集群的 Tesla,正式加入了算力軍備競(jìng)賽當(dāng)中。
參考資料:
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接,用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。