中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

DeepSeek“帶飛”國(guó)產(chǎn)算力板塊,寒武紀(jì)市值超5000億元,摩爾線程已支持FP8

澎湃新聞?dòng)浾?周玲
2025-08-22 20:38
來(lái)源:澎湃新聞
? 10%公司 >
字號(hào)

DeepSeek-V3.1發(fā)布徹底引燃了國(guó)產(chǎn)算力供應(yīng)鏈。

8月22日,國(guó)產(chǎn)算力產(chǎn)業(yè)鏈起飛。算力芯片廠商寒武紀(jì)(688256)、海光信息(688041)、云天勵(lì)飛(688343)均20CM漲停,其中寒武紀(jì)市值突破5200億元,海光信息市值突破4300億元。

在算力芯片的帶領(lǐng)下,國(guó)產(chǎn)算力供應(yīng)鏈集體大漲。芯片代工的中芯國(guó)際(688981)大漲近15%。半導(dǎo)體設(shè)備端的北方華創(chuàng)(002371)和中微公司(688012)漲超6%。華為算力供應(yīng)鏈也有極好的表現(xiàn),川潤(rùn)股份(002272)10%漲停、方正科技(600601)10%漲停。

消息面上,8月21日,DeepSeek正式發(fā)布DeepSeek-V3.1。這款大模型為混合推理架構(gòu),同時(shí)支持思考模式與非思考模式。思考效率更高,相比DeepSeek-R1-0528能在更短時(shí)間給出答案。此外,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。新模型在智能體能力上實(shí)現(xiàn)突破。官方資料顯示,在代碼修復(fù)測(cè)評(píng),命令行終端環(huán)境下的復(fù)雜任務(wù)測(cè)試中,DeepSeek-V3.1有明顯提高,并在多項(xiàng)搜索評(píng)測(cè)指標(biāo)上取得較大進(jìn)展。

此外,DeepSeek還表示,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。這也表明未來(lái)基于DeepSeek模型的訓(xùn)練與推理有望更多應(yīng)用國(guó)產(chǎn)AI芯片,助力國(guó)產(chǎn)算力生態(tài)加速建設(shè)。

目前,國(guó)產(chǎn)算力芯片供應(yīng)商主要有華為、海光信息、寒武紀(jì)以及沐曦、摩爾線程、燧原、天數(shù)智芯等。今年2月份,這些算力芯片都已經(jīng)對(duì)外宣布適配DeepSeek的模型。

不過(guò),澎湃新聞?dòng)浾咦钚芦@悉,摩爾線程旗艦AI訓(xùn)推產(chǎn)品MTT S5000是國(guó)內(nèi)首批原生支持FP8并已大規(guī)模量產(chǎn)的GPU。摩爾線程的MUSA架構(gòu)原生支持硬件FP8張量加速計(jì)算,能夠很好地支持UE8M0 FP8 Scale,利用硬件原生FP8,相對(duì)于傳統(tǒng)的FP16計(jì)算能夠?qū)崿F(xiàn)兩倍的浮點(diǎn)算力提升、訪存和通信帶寬效率提升和存儲(chǔ)容量利用率提升,同時(shí)最優(yōu)化張量表達(dá)精度。

今年2月份,摩爾線程對(duì)外披露,自DeepSeek啟動(dòng)“開(kāi)源周”以來(lái),已陸續(xù)開(kāi)源三個(gè)代碼庫(kù)。摩爾線程基于全新MUSA Compute Capability 3.1計(jì)算架構(gòu),可提供原生FP8計(jì)算能力,同時(shí)升級(jí)了高性能線性代數(shù)模板庫(kù)MUTLASS,快速支持了FlashMLA。不僅如此,摩爾線程還基于MUTLASS在全新GPU架構(gòu)上優(yōu)化實(shí)現(xiàn)了FP8矩陣乘法,支持DeepGEMM的相應(yīng)功能,充分展示了摩爾線程MUSA架構(gòu)和全功能GPU在生態(tài)兼容與快速適配上的強(qiáng)大優(yōu)勢(shì)。

海光信息之前宣布海光DCU(深度計(jì)算單元)已成功完成與DeepSeek V3和R1模型的適配優(yōu)化。DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計(jì)算解決方案。DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。

一位芯片行業(yè)人士表示,目前最新的FP8,國(guó)產(chǎn)芯片都不太支持,接下來(lái)會(huì)分階段進(jìn)行支持。先是通過(guò)軟件兼容,再逐步進(jìn)行硬件原生支持。

針對(duì)DeepSeek更新模型,明確支持FP8精度和即將發(fā)布的下一代國(guó)產(chǎn)芯片,中信建投研報(bào)認(rèn)為,頭部國(guó)產(chǎn)開(kāi)源模型對(duì)國(guó)產(chǎn)芯片的支持有望推動(dòng)國(guó)產(chǎn)算力生態(tài)加速落地。

中信建投還提到,騰訊在業(yè)績(jī)會(huì)上表示推理芯片的供應(yīng)渠道側(cè)具備多種選擇,國(guó)際供應(yīng)鏈波動(dòng)背景下國(guó)產(chǎn)推理算力芯片有望提供助力。華為昇騰芯片近期陸續(xù)參與政府、金融、運(yùn)營(yíng)商等行業(yè)客戶招投標(biāo)產(chǎn)品中,印證國(guó)產(chǎn)芯片競(jìng)爭(zhēng)力持續(xù)提升。

公開(kāi)信息顯示:8月12日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。華為在本次論壇上推出AI推理創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,旨在推動(dòng)AI推理體驗(yàn)升級(jí),提升推理性價(jià)比。

當(dāng)前,人工智能已步入發(fā)展深水區(qū),AI推理正成為下一個(gè)爆發(fā)式增長(zhǎng)的關(guān)鍵階段。為保障流暢的推理體驗(yàn),企業(yè)需持續(xù)加大算力投入,但如何在推理效率與成本之間找到最佳平衡點(diǎn),成為了全行業(yè)亟待解決的重要課題。

華為推出UCM推理記憶數(shù)據(jù)管理器,包括對(duì)接不同引擎與算力的推理引擎插件(Connector)、支持多級(jí)KV Cache管理及加速算法的功能庫(kù)(Accelerator)、高性能KV Cache存取適配器(Adapter)三大組件,通過(guò)推理框架、算力、存儲(chǔ)三層協(xié)同,實(shí)現(xiàn)AI推理“更優(yōu)體驗(yàn)、更低成本”。

除了DeepSeek加大對(duì)國(guó)產(chǎn)算力芯片的支持外,還有消息稱(chēng),英偉達(dá)已要求部分零部件供應(yīng)商暫停生產(chǎn)H20芯片。

8月22日,外交部發(fā)言人毛寧主持例行記者會(huì)。彭博社記者提問(wèn),據(jù)報(bào)道稱(chēng),英偉達(dá)已要求部分零部件供應(yīng)商暫停生產(chǎn)H20芯片。外交部對(duì)有關(guān)英偉達(dá)停止H20芯片生產(chǎn)的最新報(bào)道有何評(píng)論?對(duì)此,毛寧表示:“這個(gè)問(wèn)題建議你向中方的主管部門(mén)了解。作為原則,我們一貫認(rèn)為各方各國(guó)都應(yīng)當(dāng)共同維護(hù)全球產(chǎn)供鏈的穩(wěn)定暢通。”

    責(zé)任編輯:葛佳
    圖片編輯:蔣立冬
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋