深夜的辦公室里,你盯著屏幕,等待模型推理的進度條一點點挪動。哪怕只是微調(diào)一個七百億參數(shù)的模型,也要耗掉好幾個小時,更別提兩百億級別以上的大模型推理。想在數(shù)據(jù)安全有保障,同時成本可控的前提下高效運行大模型,成了一道幾乎無解的難題。
今年,Dell Pro Max with GB10帶著一種不同的解法出現(xiàn)了。它把過去只能在數(shù)據(jù)中心才能用到的Grace Blackwell架構壓縮進一本字典大小的機身里,讓高達1000 TOPS的AI算力第一次以“掌上超算”的形態(tài)走進日常辦公環(huán)境。對于那些既要本地運行、又要靈活部署AI模型的用戶來說,這是一種全新的可能。
小體積里的大算力
Dell Pro Max with GB10采用了NVIDIA今年在GTC上首次亮相的Grace Blackwell架構,將CPU與GPU深度融合,通過NVLink C2C實現(xiàn)高速互聯(lián)與統(tǒng)一內(nèi)存。128GB的高帶寬共享內(nèi)存,讓它在運行大模型時幾乎不受容量限制。戴爾科技集團大中華區(qū)客戶端解決方案事業(yè)部資深產(chǎn)品經(jīng)理汪志軍提到,這臺機器的AI算力可達1000 TOPS,能夠在本地運行規(guī)模達到兩千億參數(shù)的模型,而過去,這樣的任務幾乎只能交給機房里昂貴的服務器來完成。
這種高性能與小尺寸的結合,意味著AI使用者可以擺脫笨重設備的束縛,把強大的計算能力帶到辦公室、教室,甚至邊緣應用場景中。對于需要本地推理、對數(shù)據(jù)隱私有嚴格要求的行業(yè)來說,這樣的設計尤為重要,因為所有的計算和數(shù)據(jù)處理都可以在用戶的掌控范圍內(nèi)完成。
這臺機器并不只是一臺“縮小版”的服務器,它的設計初衷是讓AI計算融入更多日常與專業(yè)場景。用戶可以像連接外接顯卡一樣,將它接入筆記本或臺式機,為主機提供額外的AI算力,也可以把它當作獨立電腦使用,配上鍵盤和顯示器直接進行開發(fā)或教學工作。
在工業(yè)、機器人、自動駕駛等需要邊緣AI推理的領域,Dell Pro Max with GB10的優(yōu)勢更加明顯。它可以被直接嵌入到生產(chǎn)線、設備或自動化系統(tǒng)中,成為實時推理和決策的“大腦”。汪志軍表示,在醫(yī)療影像診斷、金融風控、智能客服等需要快速響應的業(yè)務中,Dell Pro Max with GB10不僅能完成模型推理,還能根據(jù)需求進行七百億參數(shù)規(guī)模的模型微調(diào)。這種靈活性讓它既能滿足原型開發(fā)的探索階段,也能勝任落地部署的嚴苛要求。
從機房到桌面,AI算力的遷移
過去,AI研發(fā)往往從數(shù)據(jù)中心起步,集中化的大算力平臺支撐著大模型的訓練與推理。但隨著行業(yè)需求的變化,越來越多的企業(yè)希望擁有能夠在本地運行的私有化模型。這不僅關乎數(shù)據(jù)安全,也與響應速度和成本優(yōu)化有關。戴爾科技將GB10這樣的數(shù)據(jù)中心級芯片引入桌面端,正是看準了這一趨勢。
汪志軍回顧稱,如今的應用正在從“共享大模型”轉向“定制化小模型”,并趨向在具體場景中落地。無論是公共服務、醫(yī)療、建筑還是媒體行業(yè),用戶都傾向于使用更貼合自身業(yè)務的模型,而這些模型的運行平臺,往往不需要動輒幾臺機柜的設備。一臺桌面級甚至便攜的AI工作站,正好契合這種變化。
盡管Dell Pro Max with GB10繼承了NVIDIA在AI加速方面的核心優(yōu)勢,戴爾科技依然在硬件設計上做了不少優(yōu)化。例如機身采用全金屬材質(zhì),并在散熱系統(tǒng)上進行重新設計,機身前面板布滿精細的散熱孔,確保在高負載狀態(tài)下仍能保持穩(wěn)定性能。兩條200G的ConnectX-7高速接口可以讓兩臺Dell Pro Max with GB10直接互聯(lián),組成一個更強大的算力節(jié)點。在FP4精度下,雙機協(xié)作可支持多達四千億參數(shù)規(guī)模的大模型推理,這一性能對于桌面級設備來說相當罕見。
連接方式的豐富性也是一大亮點。無論是高速有線網(wǎng)絡、Wi-Fi 7無線連接,還是多種Type-C數(shù)據(jù)接口,Dell Pro Max with GB10都提供了足夠的擴展性,方便開發(fā)者快速接入各種外設與數(shù)據(jù)源。存儲方面,用戶可以選擇2TB或4TB的高速硬盤,以適應不同規(guī)模的數(shù)據(jù)集和模型文件。
軟件生態(tài)與“開箱即用”
AI開發(fā)的門檻往往不在硬件,而在軟件環(huán)境的搭建上。傳統(tǒng)的AI工作站在交付后,用戶需要自行安裝操作系統(tǒng)、驅動、框架與開發(fā)工具,這一過程不僅耗時,還容易出現(xiàn)兼容性問題。Dell Pro Max with GB10則預裝了基于Ubuntu深度定制的DGX OS 7,以及NVIDIA AI Enterprise套件,涵蓋了從模型開發(fā)、調(diào)優(yōu)到部署的完整流程。
汪志軍用“智能廚房”來形容這套系統(tǒng):硬件配置就像已經(jīng)裝好的灶臺與烤箱,軟件環(huán)境則像準備好的鍋碗瓢盆和調(diào)料,開發(fā)框架與容器就是菜單模板,用戶只需要把“食材”——即數(shù)據(jù)和模型——放進去,就能迅速產(chǎn)出可用的AI應用。這種即插即用的體驗,顯著縮短了從創(chuàng)意到落地的時間。
雖然GB10屬于Dell Pro Max系列,但它與傳統(tǒng)的公共工作站在定位和架構上有明顯差別。傳統(tǒng)工作站通常基于x86架構,具備更強的擴展性和可定制性,適合超大規(guī)模的訓練任務。而GB10基于Arm架構的Grace CPU,強調(diào)固定配置的高度集成,重點面向推理和輕量訓練。這種定位讓它能夠在功耗、體積和部署便捷性上占據(jù)優(yōu)勢,同時避免了傳統(tǒng)工作站在某些場景下的資源浪費。
在兼容性方面,戴爾科技采取了開放生態(tài)策略,不強制預裝特定應用,而是通過認證和測試確保主流AI軟件在設備上的穩(wěn)定運行。這意味著企業(yè)可以根據(jù)自身需求選擇合適的軟件棧,同時享受戴爾科技提供的三至五年企業(yè)級售后支持。
面向未來的AI PC
Dell Pro Max with GB10并不僅僅是一款單一產(chǎn)品,它被視為戴爾科技在AI PC戰(zhàn)略中的前端節(jié)點。通過與NVIDIA的緊密合作,戴爾科技不斷引入最新架構的處理器和GPU,將數(shù)據(jù)中心級的計算能力持續(xù)帶到桌面端和邊緣端。在未來的AI生態(tài)中,Dell Pro Max with GB10這樣的設備有望成為研發(fā)與應用之間的橋梁,讓AI不再局限于大型機房,而是觸手可及。
汪志軍最后強調(diào),AI的發(fā)展節(jié)奏非常快,適應這種變化的最佳方式,是讓硬件與軟件的結合盡可能靈活與開放。Dell Pro Max with GB10的出現(xiàn),就是要為開發(fā)者、科研人員、企業(yè)團隊提供這樣一個平臺——小巧而強大,穩(wěn)定而高效,可以從今天的模型推理一路伴隨到明天的應用創(chuàng)新。