中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

MiniMax發(fā)布開源混合架構(gòu)推理模型M1

澎湃新聞?dòng)浾?喻琰
2025-06-17 16:24
來源:澎湃新聞
? 未來2% >
字號

6月17日,上海AI獨(dú)角獸MiniMax正式開源推理模型MiniMax-M1(以下簡稱“M1”)。MiniMax稱,這是全球首個(gè)開放權(quán)重的大規(guī)?;旌献⒁饬ν评砟P?。憑借混合門控專家架構(gòu)(Mixture-of-Experts,MoE)與 Lightning Attention 的結(jié)合,M1在性能表現(xiàn)和推理效率方面實(shí)現(xiàn)了顯著突破。實(shí)測數(shù)據(jù)顯示,M1系列在長上下文理解、代碼生成等生產(chǎn)力場景中超越多數(shù)閉源模型,僅微弱差距落后于頂尖閉源系統(tǒng)。

開源報(bào)告截圖 來源:MiniMax提供

M1支持目前業(yè)內(nèi)最高100萬token上下文輸入,同時(shí)支持最多8萬token輸出。成本表現(xiàn)方面,在進(jìn)行8萬Token的深度推理時(shí),M1所需的算力僅為DeepSeek R1的約30%;生成10萬token時(shí),推理算力只需要DeepSeek R1的25%。MiniMax表示,M1整個(gè)強(qiáng)化學(xué)習(xí)階段只用到512塊H800三周時(shí)間,租賃成本為53.74萬美元。

天使投資人、資深人工智能專家郭濤向澎湃科技(www.dbgt.com.cn)分析認(rèn)為,目前國內(nèi)大模型市場格局早已形成,大模型競爭不僅僅是技術(shù)的競爭,而是算力、數(shù)據(jù)、應(yīng)用場景等整個(gè)生態(tài)的競爭。此次MiniMax更新填補(bǔ)了開源領(lǐng)域長上下文技術(shù)的空白,更以“開源+場景化”路徑打破技術(shù)壟斷,為國產(chǎn)大模型邁向?qū)嵱没瘶淞⑿聵?biāo)桿。

    責(zé)任編輯:宦艷紅
    圖片編輯:施佳慧
    校對:劉威
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋