摩爾線程支持阿里 Qwen3 全系模型
4 月 30 日消息,在全球人工智能產(chǎn)業(yè)加速迭代的浪潮中,國產(chǎn) AI 領域迎來了具有里程碑意義的重大突破。日前,阿里巴巴正式發(fā)布并開源新一代通義千問模型 Qwen3,該模型以創(chuàng)新性的架構設計與算法優(yōu)化,在參數(shù)量只為 DeepSeek-R1 的 1/3 的情況下,實現(xiàn)了訓練與運行成本的大幅降低,同時在性能上實現(xiàn)了跨越式提升,一舉超越 DeepSeek-R1、OpenAI-o1 等全球前列模型,成功登頂全球開源模型寶座,成為開源 AI 領域的全新旗幟,吸引了全球 AI 開發(fā)者的目光。
就在 Qwen3 驚艷亮相的當天,國產(chǎn) GPU 企業(yè)摩爾線程迅速釋放重磅消息,宣布率先完成了對 Qwen3 全系列模型在全功能 GPU 上的高效適配與支持,展現(xiàn)出其在 AI 算力領域強大的技術研發(fā)實力與市場響應速度。這一成果的達成,絕非偶然,而是摩爾線程與阿里技術團隊數(shù)月來緊密協(xié)作、攻堅克難的結晶。雙方組建了聯(lián)合技術攻關小組,圍繞模型架構與 GPU 硬件的適配性、數(shù)據(jù)傳輸效率、計算資源調(diào)度等關鍵環(huán)節(jié)展開深度合作。通過對摩爾線程自主研發(fā)的 MUSA 架構進行多輪調(diào)試與優(yōu)化,針對 Qwen3 模型的特性進行定制化開發(fā),確保了 Qwen3 系列模型能夠在摩爾線程 GPU 上穩(wěn)定、高效運行,充分發(fā)揮出硬件與軟件的協(xié)同優(yōu)勢。
摩爾線程官方表示,此次對 Qwen3 全系列模型的成功支持,是對 MUSA 架構和全功能 GPU 技術成熟度與可靠性的有力驗證。MUSA 架構作為摩爾線程的重點技術成果,其設計理念深度契合 AI 計算需求,具備高度靈活的并行計算能力與高效的數(shù)據(jù)處理機制。該架構采用了創(chuàng)新的異構計算設計,能夠?qū)?GPU 內(nèi)的多種計算單元,如流處理器、張量重點等進行精細化協(xié)同調(diào)度,實現(xiàn)計算資源的動態(tài)分配。同時,MUSA 架構還引入了先進的內(nèi)存管理技術,通過優(yōu)化數(shù)據(jù)存儲與讀取路徑,有效降低了數(shù)據(jù)訪問延遲,提升了數(shù)據(jù)處理效率。這些特性使得 MUSA 架構在面對大規(guī)模、高復雜度的 AI 模型計算任務時,能夠提供穩(wěn)定且高效的計算環(huán)境,為 Qwen3 模型的運行筑牢了堅實的算力基礎。
目前,在摩爾線程 MUSA 平臺的支持下,主流推理引擎均可實現(xiàn)對 Qwen3 系列模型的高效調(diào)用,這一突破極大地拓展了 Qwen3 模型的應用場景與部署靈活性。摩爾線程相關負責人介紹,MUSA 平臺能夠作為 vLLM、Ollama、GPU Stack 等各類主流開源推理引擎的后端,為 Qwen3 系列模型的高效運行提供強大動力。以備受關注的 vLLM-MUSA 引擎為例,在其優(yōu)化支持下,QWen3-235B-A22B——Qwen3 系列中參數(shù)量比較大、計算復雜度比較高的 MoE 模型,不僅能夠在摩爾線程全功能 GPU 上實現(xiàn)穩(wěn)定運行,而且推理速度相比傳統(tǒng)方案提升明顯。據(jù)實測數(shù)據(jù)顯示,在處理同等規(guī)模的文本生成任務時,基于 vLLM-MUSA 引擎與摩爾線程 GPU 的 QWen3-235B-A22B 模型,推理延遲降低了 30% 以上,吞吐量提升了 40%,這一性能表現(xiàn)使得其在實際應用中更具競爭力。
此次阿里開源的 Qwen3 系列模型陣容強大,涵蓋了兩款 MoE(混合專業(yè)人員)模型和六個 Dense(密集)模型,不同參數(shù)量與架構設計的組合,滿足了從輕量化應用到大型復雜任務的多樣化需求。其中,兩款 MoE 模型 Qwen3-235B-A22B 和 Qwen3-30B-A3B,通過動態(tài)路由機制,能夠根據(jù)輸入數(shù)據(jù)的特征智能調(diào)用不同的專業(yè)人員模塊進行處理,在提升模型性能的同時,有效降低了整體計算量;六個 Dense 模型則包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,它們在結構上相對簡潔,適合對資源占用較為敏感的場景。而摩爾線程對全系列模型的支持,為開發(fā)者提供了豐富的選擇空間。無論是追求極限性能的科研機構,還是注重成本效益的企業(yè)用戶,都能根據(jù)自身需求,選擇適配的模型與 GPU 方案,快速搭建高效的 AI 應用系統(tǒng)。
從行業(yè)發(fā)展角度來看,此次摩爾線程與阿里的合作意義深遠。在過去,我國 AI 產(chǎn)業(yè)在算力基礎設施領域長期依賴國外 GPU 產(chǎn)品,不僅面臨技術封鎖風險,還存在較高的采購成本與數(shù)據(jù)安全隱患。而此次摩爾線程 MUSA 架構與 Qwen3 模型的成功適配,標志著國產(chǎn) GPU 在大模型支持能力上已達到國際先進水平,打破了國外 GPU 在大模型領域的壟斷局面。這一成果將有力推動國內(nèi) AI 產(chǎn)業(yè)供應鏈的自主可控進程,為國內(nèi) AI 開發(fā)者提供更具性價比、更安全可靠的技術方案。
業(yè)內(nèi)專業(yè)人員指出,隨著摩爾線程對 Qwen3 系列模型支持的落地,將加速 AI 技術在各行業(yè)的普及與應用。在智能客服領域,企業(yè)可以借助 Qwen3 模型強大的自然語言處理能力,結合摩爾線程 GPU 的高效算力,構建響應更快、理解更精細的智能客服系統(tǒng),提升客戶服務體驗;在內(nèi)容創(chuàng)作領域,創(chuàng)作者能夠利用 Qwen3 模型的文本生成能力,快速生成高質(zhì)量的文章、文案等內(nèi)容,而摩爾線程 GPU 的并行計算優(yōu)勢則可以大幅縮短生成時間,提高創(chuàng)作效率;在金融領域,基于 Qwen3 模型的數(shù)據(jù)分析與預測功能,配合摩爾線程 GPU 的強大算力,能夠?qū)崿F(xiàn)對海量金融數(shù)據(jù)的快速處理與深度挖掘,為風險評估、投資決策等提供有力支持。
此外,此次合作還有望帶動國產(chǎn) AI 產(chǎn)業(yè)生態(tài)的繁榮發(fā)展。一方面,它將吸引更多國內(nèi)開發(fā)者基于摩爾線程 GPU 與 Qwen3 模型進行技術創(chuàng)新與應用開發(fā),形成更豐富的軟件生態(tài);另一方面,也將促使上下游企業(yè)加大在 AI 算力與算法領域的研發(fā)投入,推動產(chǎn)業(yè)鏈協(xié)同發(fā)展。未來,隨著技術的不斷進步與生態(tài)的逐步完善,國產(chǎn) AI 產(chǎn)業(yè)有望在全球競爭中占據(jù)更有利的地位,為我國數(shù)字經(jīng)濟的高質(zhì)量發(fā)展注入強勁動力。