在2025世界智能產(chǎn)業(yè)博覽會(huì)上,一場(chǎng)關(guān)于AI計(jì)算生態(tài)的變革拉開(kāi)帷幕。中科曙光聯(lián)合20余家AI芯片、整機(jī)、大模型等產(chǎn)業(yè)鏈企業(yè),共同發(fā)布國(guó)內(nèi)首個(gè)AI計(jì)算開(kāi)放架構(gòu),并推出曙光AI超集群系統(tǒng)。這一系列動(dòng)作不僅為國(guó)內(nèi)智算產(chǎn)業(yè)注入新動(dòng)能,更標(biāo)志著中國(guó)智能計(jì)算生態(tài)向開(kāi)放協(xié)作邁出關(guān)鍵一步。
當(dāng)前,大模型技術(shù)迭代加速,AI算力需求呈指數(shù)級(jí)增長(zhǎng)。然而,國(guó)內(nèi)AI算力領(lǐng)域面臨多重挑戰(zhàn):高端算力供給短缺、國(guó)產(chǎn)加速卡性能與海外存在差距、算力成本居高不下、自主軟硬件生態(tài)尚未成熟。在此背景下,構(gòu)建更大規(guī)模、更高效率的智算集群成為破局關(guān)鍵。中科曙光高級(jí)副總裁李斌指出,單純依靠少數(shù)企業(yè)封閉式優(yōu)化已難以滿足需求,需通過(guò)產(chǎn)業(yè)鏈跨層協(xié)作,打造開(kāi)放式、標(biāo)準(zhǔn)化的集群算力體系。“國(guó)內(nèi)智算產(chǎn)業(yè)需要‘蘋(píng)果式’的頭部引領(lǐng),更需要‘安卓式’的生態(tài)創(chuàng)新。”他強(qiáng)調(diào),AI計(jì)算開(kāi)放架構(gòu)正是以GPU為核心,通過(guò)“算、存、網(wǎng)、電、冷、管、軟”全鏈條協(xié)同創(chuàng)新,突破算力瓶頸,推動(dòng)算力普惠。
作為開(kāi)放架構(gòu)的核心載體,曙光AI超集群系統(tǒng)同步亮相。據(jù)中科曙光總裁助理杜夏威介紹,該系統(tǒng)具備“超高性能、超高效率、超高可靠、全面開(kāi)放”四大特性,單機(jī)柜支持96張加速卡,提供百P級(jí)AI算力,最大可擴(kuò)展至百萬(wàn)卡規(guī)模。通過(guò)“超級(jí)隧道”存儲(chǔ)優(yōu)化、軟硬協(xié)同設(shè)計(jì)、智能調(diào)度大模型等技術(shù),系統(tǒng)實(shí)現(xiàn)千卡集群大模型訓(xùn)練推理性能達(dá)行業(yè)主流水平的2.3倍,模型開(kāi)發(fā)效率提升4倍,GPU算效提高55%,平均無(wú)故障時(shí)間(MTBF)延長(zhǎng)2.1倍,故障修復(fù)時(shí)間(MTTR)縮短47%。
與專有封閉系統(tǒng)不同,曙光AI超集群系統(tǒng)兼容多品牌GPU加速卡及CUDA等主流軟件生態(tài),為用戶提供靈活選擇,同時(shí)大幅降低硬件采購(gòu)與軟件開(kāi)發(fā)適配成本。杜夏威表示,這一設(shè)計(jì)旨在保護(hù)用戶前期投資,避免因技術(shù)路線鎖定導(dǎo)致的資源浪費(fèi),為行業(yè)用戶提供更具性價(jià)比的解決方案。
為加速生態(tài)創(chuàng)新,中科曙光宣布開(kāi)放三項(xiàng)關(guān)鍵技術(shù)能力:AI存儲(chǔ)優(yōu)化技術(shù)、液冷基礎(chǔ)設(shè)施設(shè)計(jì)規(guī)范、DeepAI基礎(chǔ)軟件棧。這些技術(shù)覆蓋部件級(jí)、系統(tǒng)層、基礎(chǔ)設(shè)施層、軟件層及數(shù)據(jù)集五大層面,可幫助合作伙伴在存儲(chǔ)性能加速、液冷超節(jié)點(diǎn)設(shè)計(jì)、GPU統(tǒng)一開(kāi)發(fā)框架等領(lǐng)域?qū)崿F(xiàn)深度定制優(yōu)化。例如,通過(guò)開(kāi)放液冷設(shè)計(jì)規(guī)范,中小企業(yè)可快速構(gòu)建高效散熱系統(tǒng),降低數(shù)據(jù)中心能耗;DeepAI軟件棧的共享則能減少重復(fù)開(kāi)發(fā),提升整體研發(fā)效率。
面對(duì)開(kāi)放生態(tài)中跨廠商技術(shù)對(duì)齊的難題,中科曙光聯(lián)合20余家產(chǎn)業(yè)鏈企業(yè),依托國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心成立“AI計(jì)算開(kāi)放架構(gòu)聯(lián)合實(shí)驗(yàn)室”。該實(shí)驗(yàn)室將聚焦技術(shù)標(biāo)準(zhǔn)制定、跨層優(yōu)化協(xié)作及生態(tài)共建,推動(dòng)從芯片到應(yīng)用的全鏈條開(kāi)放。李斌強(qiáng)調(diào),聯(lián)合實(shí)驗(yàn)室的目標(biāo)是構(gòu)建一個(gè)“無(wú)邊界”的創(chuàng)新平臺(tái),讓中小企業(yè)也能參與核心技術(shù)創(chuàng)新,共同打造普惠、可持續(xù)的中國(guó)智能計(jì)算產(chǎn)業(yè)生態(tài)。