首頁 > 科技 > 正文

中國工程院院士劉韻潔:確定性網(wǎng)絡(luò)是中國算力網(wǎng)建設(shè)的重要基礎(chǔ)

2024-09-29 10:08:25 21世紀(jì)經(jīng)濟(jì)報(bào)道 21財(cái)經(jīng)APP 駱軼琪

21世紀(jì)經(jīng)濟(jì)報(bào)道記者駱軼琪 鄭州報(bào)道

作為AI大生態(tài)的一部分,隨著大模型快速發(fā)展,“運(yùn)力”的核心部分網(wǎng)絡(luò)傳輸?shù)募夹g(shù)升級(jí)訴求也日益迫切起來。

在9月28日舉行的2024中國算力大會(huì)上,中國工程院院士劉韻潔在發(fā)言時(shí)指出,確定性網(wǎng)絡(luò)是中國算力網(wǎng)建設(shè)的一個(gè)重要基礎(chǔ)。

從產(chǎn)業(yè)背景來看,今年1月,國家數(shù)據(jù)局和工信部等17部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024-2026)》,而數(shù)據(jù)要素是人工智能最重要的基礎(chǔ)。同月,工信部等七部門聯(lián)合印發(fā)《關(guān)于推動(dòng)未來產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見》,從技術(shù)角度明確提出,加強(qiáng)新型網(wǎng)絡(luò)架構(gòu)研究,加快促進(jìn)關(guān)于低時(shí)延、智能互聯(lián)的要求。7月,黨的二十屆三中全會(huì)在公告中首次提出,建設(shè)和運(yùn)營國家數(shù)據(jù)基礎(chǔ)設(shè)施,促進(jìn)數(shù)據(jù)共享。數(shù)據(jù)基礎(chǔ)設(shè)施的重要內(nèi)容就包括網(wǎng)絡(luò)、算力、傳輸交換平臺(tái)、安全。

(中國工程院院士劉韻潔,圖源:主辦方提供)

劉韻潔指出,隨著AI發(fā)展,在智能時(shí)代的數(shù)據(jù)傳遞與計(jì)算,對(duì)網(wǎng)絡(luò)提出三大新挑戰(zhàn):一是“AI大模型”對(duì)算力提出巨大需求,由此對(duì)網(wǎng)絡(luò)有新需求、新標(biāo)準(zhǔn),需要1萬個(gè)GPU進(jìn)行協(xié)同計(jì)算;二是“空間計(jì)算”的出現(xiàn),開啟前所未見的虛擬時(shí)代,雖然蘋果發(fā)布的Vision Pro價(jià)格高昂,但Meta最新發(fā)布的Quest 3S價(jià)格在300美元,這類產(chǎn)品對(duì)算力與時(shí)延同時(shí)提出要求,需要提供更高速率、更低時(shí)延;三是“具身智能”構(gòu)筑未來工業(yè)智能機(jī)器人,特斯拉人形機(jī)器人Optimus的最終目標(biāo)是取代人類完成勞動(dòng),具備精準(zhǔn)操作的能力,這對(duì)算力、時(shí)延、可靠性提出新要求。

由此,時(shí)延敏感型、計(jì)算密集型是智能互聯(lián)網(wǎng)時(shí)代新型網(wǎng)絡(luò)業(yè)務(wù)的兩個(gè)最核心特征。

劉韻潔指出,當(dāng)前國內(nèi)算力產(chǎn)業(yè)面臨的現(xiàn)狀是,一方面,大模型算力需求激增,算力組網(wǎng)需求迫切,網(wǎng)絡(luò)帶寬成為瓶頸;在過去5年時(shí)間,GPU算力增長近90倍,但網(wǎng)絡(luò)帶寬僅增長10倍,模型訓(xùn)練時(shí)間也隨之增長。帶寬瓶頸逐漸顯現(xiàn)。

另一方面,廣域算力資源互聯(lián)共享需要解決并行協(xié)同計(jì)算來提升算能;遠(yuǎn)程使用算力資源,需要提升傳輸效率、節(jié)約傳輸成本。這些都需要確定性網(wǎng)絡(luò)提供支撐。

以美國微軟公司為例,Azure云游70%以上的流量都使用RDMA協(xié)議,在2023年初步實(shí)現(xiàn)80KM廣域RDMA互聯(lián);國內(nèi)華為公司也提到,在100GE環(huán)境下,8節(jié)點(diǎn)的VGG16模型訓(xùn)練RDMA性能是TCP的8倍多。因此,構(gòu)建“無損確定性廣域傳輸能力”成為算力高效傳輸互聯(lián)的重要基礎(chǔ)。

同時(shí),國家數(shù)據(jù)局下發(fā)的《數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)(試點(diǎn)試驗(yàn))任務(wù)書——數(shù)據(jù)流通方向》中提到,加快推動(dòng)數(shù)聯(lián)網(wǎng)數(shù)據(jù)流通利用基礎(chǔ)設(shè)施建設(shè),開展數(shù)聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)任務(wù)。在投標(biāo)方面提出,要求千公里傳輸抖動(dòng)不高于50微秒,傳輸效率要大于90%、丟包率要小于十萬分之一并支持跨域網(wǎng)絡(luò)資源統(tǒng)一調(diào)度和編排。

要實(shí)現(xiàn)這些指標(biāo),沒有確定性網(wǎng)絡(luò)技術(shù)完成不了。因此確定性網(wǎng)絡(luò)是中國算力網(wǎng)建設(shè)的一個(gè)重要基礎(chǔ)。

從國際態(tài)勢看,美國正在構(gòu)建能源科學(xué)網(wǎng)絡(luò)(ESnet),這實(shí)際上是美國的“科研算力網(wǎng)絡(luò)”,其在2022年10月升級(jí)到第六代,2023年迅速發(fā)布了第七代,就是因?yàn)榘l(fā)現(xiàn)網(wǎng)絡(luò)環(huán)境滿足不了算力的需求。

在ESnet網(wǎng)絡(luò)的下一步技術(shù)和能力規(guī)劃中,提到的其中三個(gè)目標(biāo):端到端的確定性網(wǎng)絡(luò)能力;網(wǎng)絡(luò)可編程、可重構(gòu)、可定制;整個(gè)網(wǎng)絡(luò)資源的一體化調(diào)度——這三個(gè)能力,中國的團(tuán)隊(duì)都已經(jīng)實(shí)現(xiàn)了。

劉韻潔綜合分析,“以網(wǎng)強(qiáng)算”成為我國提升綜合算力的新路徑。讓網(wǎng)絡(luò)與算力深度融合,構(gòu)建“全域超級(jí)計(jì)算機(jī)”,讓超算、智算、通算等各類型計(jì)算能力,通過計(jì)算機(jī)總線技術(shù)連接在一起,才能更好賦能數(shù)字經(jīng)濟(jì)發(fā)展。

這就需要確定性網(wǎng)絡(luò)體系架構(gòu)的不斷迭代開發(fā)。舉例來說,目前的互聯(lián)網(wǎng)只是普通馬路,通過確定性網(wǎng)絡(luò)要實(shí)現(xiàn)算力網(wǎng)成為高速公路,進(jìn)而滿足算力需求。

劉韻潔還指出,目前中國在通用大模型方面與國際領(lǐng)先水平短期內(nèi)還有差距,但也要重視發(fā)展行業(yè)大模型。“如果在通用大模型的基礎(chǔ)上,把行業(yè)數(shù)據(jù)訓(xùn)練好、行業(yè)大模型做好,完全可以走出中國自己的道路?!眲㈨崫嵵赋?。

他分析道,因?yàn)橹袊男袠I(yè)數(shù)據(jù)最為完整和全面,但這需要政府、企業(yè)、資本等多方共同解決課題,才是真正支持實(shí)體經(jīng)濟(jì)、新質(zhì)生產(chǎn)力發(fā)展的必然渠道。

21財(cái)經(jīng)客戶端下載