百萬級Token秒生成,九章智算雲如何突破算力性能瓶頸?

「Manus單次推理便可能消耗100萬個Token,Agent起勢所帶來算力需求增速將超過算力成本下降速度。」投資人澤彥告訴雷峰網。

美元基金投資人日昊同樣判斷,大規模視頻生成與Agent調用將引髮指數級算力消耗,帶來上千倍算力需求增長,推動算力市場從當前百億級邁向萬億級。

智能化轉型是當下科技變革中最為確定性的機會。九章雲極DataCanvas公司董事長方磊表示,當下的計算模式正產生從移動互聯網的「帶寬式應用」到AI「計算密集型應用」的結構性變革。

在計算需求從「數據傳輸效率」向「算力處理能力」核心遷移的背景下,算力昂貴、技術門檻高企卻成為各行業智能化轉型中最為現實的桎梏。

基於此,AI原生的智算雲平台將成為平衡效率與成本的更優解。九章雲極智能計算論壇上,新一代全棧智能計算雲平台——九章智算雲Alaya NeW Cloud 2.0正式發佈。

「AI原生智算雲平台超越了單點支撐AI的方式,是以AI為設計初衷、以公有云為載體的平台化人工智能基礎設施,通過一體化的能力實現人工智能應用全生命周期的性能最大化,兼具靈活性、伸縮性和專用性,且在價格上比通算雲服務更具經濟性。」Forrester副總裁兼首席分析師戴鯤說。

突破瓶頸、降低門檻、優化成本,九章智算雲平台如何加速算力普惠?

Serverless新型雲架構:端到端性能提升5倍、成本降低60%

伴隨智能化轉型浪潮,全球科技企業在算力基建領域掀起從萬卡集群到百萬卡集群的軍備競賽。超大規模算力資源池解決了「有算力可用」的問題,而當算力規模達到一定層級,「高效利用」成為決定算力價值釋放的核心命題。

如何突破當下的算力使用效率瓶頸?新型雲架構是核心。

傳統裸金屬的算力調度面臨嚴重的利用率低下問題,如OpenAI在GPT-4訓練中投入2.5萬張A100 GPU,歷經90-100天運算,算力利用率僅32%-36%。賽富投資基金合伙人蔣馳華表示,2024年上半年全球AI基礎設施支出同比激增97%至474億美元,其中72%的AI服務器收入源於雲端服務,印證雲服務模式推動算力普惠已成趨勢。

九章智算雲通過Serverless技術架構替代傳統虛擬化模式,構建統一高效的彈性底座,實現算力資源最大化復用。對於用戶而言,雲上服務可避免裸金屬服務器資源利用率低、運維成本高、部署周期長、彈性擴展難、技術門檻高等問題。其推動算力調度從「配置機器」向「提交任務」轉變,讓AI開發者無需關注底層調度,專註業務邏輯與模型調用。

完成全棧優化的九章智算雲,支持跨AIDC彈性資源調度,實現秒級響應與無限擴展,通過彈性伸縮自動完成環境配置與任務監控,端到端性能提升5倍。

高效之外,降低使用門檻同樣關鍵。與頭部科技企業不同,數量龐大但技術能力薄弱的企業亟需低門檻智能開發工具。

某大型集團曾投入3000萬元研發企業大模型,雖高薪聘請技術專家,卻因技術落地障礙、數據隱私風險及商業模式不清晰等問題,一年內資金耗盡導致項目終止。

面對「落地難」等問題,九章智算雲發佈系列低門檻智算工具鏈,覆蓋大模型從預訓練、精調直至適配與應用開發的ModelOps全生命周期,大幅降低模型開發與應用的技術壁壘。

通過這些工具鏈,用戶無需掌握複雜的GPU配置和集群管理技術,僅需明確數據來源、選定模型基座、確定優化方向,系統即可自動編排計算流程,真正實現對AI算力的「駕馭」。


為了讓技術落地門檻徹底降低,九章雲極同期發佈了九章強化學習雲平台AgentiCTRL,基於混合專家(MoE)架構,首創性地將強化學習能力深度融入基礎設施,顯著增強大模型推理能力,將AI智能體訓推門檻壓縮至「一行代碼」。

與傳統強化學習方案相比,該平台在性能、成本和規模三方面均具備優勢。其端到端訓練效率提升500%,綜合成本下降60%,成為全球首個支持萬卡級異構算力調度的強化學習基礎設施平台。


可用之外,成本可控是關鍵。正如方磊所言,十卡至百卡規模的算力需求群體構成的市場龐大。

九章智算雲以「按度計費」模式替代傳統裸金屬租賃,將企業總擁有成本(TCO)降低60%,使AI算力成為更多企業可負擔的生產要素。


九章智算雲通過 「技術架構創新 + 工具鏈下沉 + 經濟模型重構」 的三維路徑,實現從 「有算力可用」 到 「有高效算力可用」 的跨越。這種 「基礎設施即服務」 的模式,不僅破解了算力效率瓶頸,更讓 AI 技術從頭部企業的 「專利」 變為千行百業的 「通用生產力」,推動智能化轉型進入深水區。

「開源開放」是算力規模化應用的核心驅動力

大模型技術演進、企業垂直模型落地及Agent規模化應用推動智算市場規模化增長。《2025年中國人工智能計算力發展評估報告》顯示,中國智能算力規模將達1037.3EFLOPS,同比增長43%。

當前算力建設持續升溫,但產業供需錯配問題突出,智算中心資源點亮率僅20%。IDC數據顯示,國內百萬AI開發者中,83%因算力成本約束無法開展模型訓練。

針對算力利用率不足的行業痛點,九章智算雲突破傳統GPU租用模式,推出"一度算力"按需計費標準,以按量計費模式重構算力消費生態。

九章智算雲依託Serverless架構實現GPU資源池化管理,構建"算力即服務"的彈性供給體系,千卡級訓練任務與十卡級微調需求可共享同一資源池,使算力使用成本較傳統方案降低45%。

創新計費模式之外,生態協作是解決供需錯配的另一關鍵要素。產業內上下游的開放協作,能加速對用戶需求的理解,從而實現算力向智能成果的高效轉化。九章雲極將開放生態建設作為長期戰略,與業內企業展開深度合作,推動智能化應用在不同領域的規模化落地。

算力布局具有前瞻性,模型、Agent及應用發展雖已成為行業共識,但算力基建需先於應用浪潮部署,這導致算力項目建設與算力消納在時間維度上存在難以消除的間隙。

為加速破解算力供需時間上錯配的難題,九章雲極發起"AI-STAR企業生態聯盟",首期注資1.8億元,從產業源頭打通供需鏈路。

方磊表示,未來三年,九章雲極將在AI高端算力、模型、低門檻工具鏈、智能體應用、工程化交付等領域以「開放服務市場+生態基金投資」模式,構建中國繁榮的AI智算雲開放生態。

「AI-STAR企業生態聯盟」將根據生態合作夥伴產品成熟度,提供從技術到商業化所需的雲端資源及算力支持,幫助企業在AI領域探索創新,實現從場景探索到規模化、商業化的目標,為各行業客戶提供AI算力支持和服務。

迄今為止,九章智算雲Alaya NeW Cloud平台上支持大多數國際主流基座大模型,開源社區衍生模型也取得里程碑式突破。正如方磊所說,開源開放是加速AI普及與規模化的核心驅動力。


分享到Facebook
技術平台: Nasthon Systems