中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

上海AI獨角獸,連放大招

2025-06-26 07:44
來源:澎湃新聞·澎湃號·湃客
字號

年初DeepSeek-R1發(fā)布,將大模型創(chuàng)業(yè)公司帶到了新的岔路口:是否有必要繼續(xù)斥巨資,“硬剛”自研推理模型?

分化快速顯現(xiàn),零之萬物、百川智能相繼退出大模型預(yù)訓(xùn)練。大模型“六小虎”(月之暗面、智譜AI、MiniMax、階躍星辰、百川智能、零一萬物)的敘事已被瓦解,取而代之的是“基礎(chǔ)大模型五強(qiáng)”(DeepSeek、阿里、字節(jié)、階躍星辰、智譜AI)。

近期,智譜AI、月之暗面、階躍星辰相繼拿出自研推理模型,證明自己具備留在牌桌上的實力。去年“六小虎”中估值最高、技術(shù)路線最激進(jìn)的MiniMax,奉行全棧自研,既做to C也做to B,既做國內(nèi)也做海外,戰(zhàn)線拉得過長,一度陷入進(jìn)退維谷。

沉寂近半年,MiniMax突然爆發(fā),6月17日~6月21日以“每日一更”的節(jié)奏接連發(fā)布了5款產(chǎn)品,將推理模型、視頻生成模型、Agent、語音設(shè)計一網(wǎng)打盡。

技術(shù)上新后,IPO信息也很快傳來。媒體報道,MiniMax正考慮在港股進(jìn)行首次公開募股,最快將于今年上市,估值約為30億美元。不過,一位知情人士對《財經(jīng)天下》透露,“從港股的上市進(jìn)展來看,今年IPO可能性不大,最快也要明年 ”。

這標(biāo)志著,“六小虎”總算有了一個階段性的結(jié)局——有人棄賽,“幸存者”則要左手技術(shù)迭代,右手加速商業(yè)化進(jìn)度。誰能成為“大模型第一股”,獲得搶跑先機(jī)和更高溢價估值,將成為下一程各家的角逐目標(biāo)。

01、連發(fā)五天,MiniMax“下餃子”

今年1月,MiniMax曾被DeepSeek“偷”了一次家。

知情人士向《財經(jīng)天下》透露,2024年,MiniMax的年營收超過7000萬美元。其中,超70%的收入來自MiniMax的出海C端AI應(yīng)用Talkie。

乘勝追擊,在DeepSeek-R1發(fā)布約一周前,MiniMax上線了擁有4560億參數(shù)的開源大模型MiniMax-01。該模型采用了融合線性注意力(Linear Attention)與MoE(混合專家)架構(gòu)的創(chuàng)新設(shè)計,其中MoE架構(gòu)基于標(biāo)準(zhǔn)的Transformer架構(gòu)創(chuàng)新而來。官方數(shù)據(jù)顯示,其自研的線性注意力技術(shù)“Linear Attention”在此模型中占比約八分之七,而傳統(tǒng)的Transformer計算占比則約為八分之一。

MiniMax的測試顯示,線性注意力在處理1M長度的序列時,所需時延與傳統(tǒng)方法相比,縮減了2700倍。這不僅增強(qiáng)了模型推理性能,也為智能體架構(gòu)的記憶管理、多輪對話等任務(wù)提供了計算支撐。

但幾天后,DeepSeek便拿出了更具競爭力的R1模型,用更優(yōu)解打破了算力高成本魔咒,也讓騰訊、百度等大廠紛紛轉(zhuǎn)身,接入了DeepSeek。

剛剛上線新架構(gòu)的MiniMax將何去何從,讓創(chuàng)始人閆俊杰一時陷入了路線取舍的泥沼。

大模型技術(shù)從業(yè)者李響對《財經(jīng)天下》透露,“大模型廠商大多會遵循自身原有的節(jié)奏,進(jìn)行模型升級迭代。因為基礎(chǔ)模型訓(xùn)練首先要確保穩(wěn)健性,如果倉促進(jìn)行架構(gòu)層面的重大調(diào)整,效果不理想,會直接沖擊到其競爭優(yōu)勢”。

MiniMax選擇了相對折中的方案,在國內(nèi)C端產(chǎn)品用自家模型,Talkie等海外產(chǎn)品接入DeepSeek。同時,對標(biāo)DeepSeek,研發(fā)新一代推理模型。

臥薪嘗膽半年,6月17日,MiniMax上線了自主研發(fā)的MiniMax-M1系列模型。該模型被譽(yù)為“全球首個開源大規(guī)?;旌霞軜?gòu)的推理模型”,更在長文本理解等關(guān)鍵能力上表現(xiàn)出色,支持目前業(yè)內(nèi)最高的100萬Tokens的上下文輸入,以及業(yè)內(nèi)最長的8萬Tokens的推理輸出。

M1發(fā)布后,閆俊杰在朋友圈發(fā)了一句意味深長的話:“第一次感覺到大山不是不能翻越?!?/p>

之后四個工作日,MiniMax開啟“日更模式”,先后發(fā)布了全新視頻生成大模型Hailuo 02、通用智能體產(chǎn)品MiniMax Agent、視頻創(chuàng)作智能體Hailuo Video Agent、音色設(shè)計產(chǎn)品Voice Design。

官方介紹稱,MiniMax-M1的RL(強(qiáng)化學(xué)習(xí))訓(xùn)練只用了3周時間、512塊H800 GPU,算力租賃成本僅為53.47萬美元,低于DeepSeek-R1的557.6萬美元。

得益于新的架構(gòu)能力,M1模型可對100萬Tokens做上下文回溯。這個數(shù)字與Google Gemini 2.5 Pro表現(xiàn)相當(dāng),是DeepSeek-R1的8倍——而長文本的處理能力,也是正在持續(xù)升溫的Agent產(chǎn)品的技術(shù)底座之一。

李響對《財經(jīng)天下》說道,“目前對AI Agent的最基本要求是,AI有記憶會自己規(guī)劃和執(zhí)行任務(wù)。長時記憶的引入,能顯著提升它在復(fù)雜任務(wù)中的表現(xiàn),減少分段記憶帶來的結(jié)果偏離”。

云啟資本合伙人陳昱也曾分析,“無限長的長文本能力是MiniMax團(tuán)隊一直在打磨的重要維度。對于做社交應(yīng)用、情感陪伴應(yīng)用,Agent等產(chǎn)品來說是很關(guān)鍵的技術(shù)”。

長文本能力,只是MiniMax建立復(fù)雜Agent基礎(chǔ)能力的第一步。6月19日,MiniMax在推出的通用Agent中,其能跑長程(Long Horizon)與復(fù)雜任務(wù),具體工作場景包含了寫代碼、生成PPT等。

《財經(jīng)天下》對該產(chǎn)品實測發(fā)現(xiàn),MiniMax的Agent頁面與今年3月“刷屏”的Agent應(yīng)用Manus存在不少相似之處。執(zhí)行過程中,MiniMax的Agent會對任務(wù)進(jìn)行拆解,并以思維鏈的方式呈現(xiàn)出具體步驟。

趕在6月中下旬,“六小虎”上新模型能力和Agent產(chǎn)品的不止MiniMax一家。6月17日,月之暗面發(fā)布了全新開源代碼大模型Kimi-Dev-72B。3天后,月之暗面又發(fā)布了首個Agent——Kimi-Researcher,該智能體擅長多輪搜索與推理,在執(zhí)行每個任務(wù)時,平均會進(jìn)行23個推理步驟,并瀏覽超過200個網(wǎng)址。

不過,主做海外to B端的Agent從業(yè)者陳奕對《財經(jīng)天下》表示,Agent大戰(zhàn)只是剛剛打響,目前大部分海外Agent底層調(diào)用的仍然是OpenAI的產(chǎn)品?!皣鴥?nèi)各家廠商對Agent的定義和使用也不一樣,還沒有跑出明顯差距?!?/p>

02、不服輸?shù)拈Z俊杰

在“六小虎”中,MiniMax一直以來便是表現(xiàn)較為激進(jìn)的一家。在成立之初的2021年,MiniMax便首次推出了視頻模型和音樂模型,隨之更囊括了文本、語音和視頻業(yè)務(wù),陸續(xù)開發(fā)了海螺AI、星野、AI陪伴產(chǎn)品“Talkie”等應(yīng)用。

作為一位年輕的技術(shù)型創(chuàng)業(yè)者,閆俊杰畢業(yè)于中國科學(xué)院自動化所,他先是在中國科學(xué)院和清華大學(xué)研究計算機(jī)視覺工作,后又任職于“AI四小龍”之一的商湯科技,擔(dān)任商湯副總裁、研究院副院長和智慧城市事業(yè)群CTO。

2021年12月,商湯上市前夕,閆俊杰卻毅然選擇離職,于2022年年初在上海正式創(chuàng)立了MiniMax。在一間不到100平方米的房間里,閆俊杰寫下了這家公司的成立使命——以“與所有人共創(chuàng)智能”為使命,致力于實現(xiàn)通用人工智能(AGI)。

如今,短短三年間,MiniMax已長成為一家上海AI獨角獸企業(yè),是國產(chǎn)大模型企業(yè)中不可忽視的存在。而基于對技術(shù)的信仰,閆俊杰做了不少非共識的大膽決定,尤其在技術(shù)路線選擇上十分特立獨行。

在為數(shù)不多的視頻訪談中, 閆俊杰講話語調(diào)輕柔,回答問題時面帶笑容。接觸過他的徐飛對《財經(jīng)天下》表示,“閆俊杰是非常典型的‘技術(shù)宅男’,相信的事就要堅持下去,情緒不會過分起伏和暴躁,整體比較穩(wěn)”。

但外表溫和的閆俊杰,每逢做重大決策時都十分大膽。

2023年下半年, 閆俊杰堅持要從Dense(稠密網(wǎng)絡(luò))轉(zhuǎn)向MoE (混合專家系統(tǒng))模型,為此幾乎投入了MiniMax的全部研發(fā)和算力資源。

彼時,只有OpenAI堅持MoE路線,谷歌則選擇押注Dense模型ENS,國內(nèi)同行也大多是在迭代Dense。這種模型參數(shù)固定,不需要復(fù)雜的路由選擇或?qū)<壹せ畈僮骶涂蛇M(jìn)行推理。它的缺點也很明顯,便是資源消耗極大。

而閆俊杰看中的MoE模型可以用更少的計算量和內(nèi)存需求實現(xiàn)計算,但其預(yù)訓(xùn)練挑戰(zhàn)更高,在微調(diào)階段容易出現(xiàn)泛化能力不足,導(dǎo)致過擬合等問題。

“當(dāng)時MiniMax做MoE時,內(nèi)部曾失敗了兩次,到第三次才成功。閆俊杰明確表示過,如果第三次再失敗,可能公司就掛了。因為他把全部的算力資源都堆上去了,最后他賭贏了,也證明了這個技術(shù)路線是成功的?!毙祜w說。

2024年1月,MiniMax上線了國內(nèi)首個MoE大模型abab,緊接著又在2024年4月推出了abab 6.5系列模型,并開始用MoE架構(gòu)進(jìn)行大規(guī)模商業(yè)化部署。如今,MoE架構(gòu)已經(jīng)徹底取代了稠密架構(gòu)成為大模型領(lǐng)域的行業(yè)共識。

2024年下半年,MiniMax又做了一次大膽改進(jìn),便是基于MoE+Linear Attention(線性注意力機(jī)制)技術(shù),訓(xùn)練新一代模型MiniMax-01。

這項新型架構(gòu)能更加高效地訓(xùn)練海量數(shù)據(jù),風(fēng)險也顯而易見。閆俊杰在接受采訪時坦言:“如果我們在競爭中打不贏,就應(yīng)該被淘汰,沒有其他選擇。”

“所以嚴(yán)格說來,MiniMax并不是在DeepSeek之后調(diào)整的戰(zhàn)略。至少是去年Q3后,他就已經(jīng)將核心目標(biāo)調(diào)整成‘模型優(yōu)先’了,追求研發(fā)更性能、更強(qiáng)、更好的季度模型是它優(yōu)先考慮的對象。閆俊杰認(rèn)為,更好的模型,才能衍生出更好性能的產(chǎn)品?!毙祜w說。

03、年入7000萬美元,商業(yè)化挑戰(zhàn)仍嚴(yán)峻

DeepSeek展開大模型新故事后,“六小虎”也都有了新的劇情。零一萬物基本放棄了預(yù)訓(xùn)練模型,百川智能則專注于醫(yī)療垂類賽道。然而做不做基座大模型,仍是評判AI公司是否堅信AGI之路,是否有資格參與第一梯隊角逐的核心標(biāo)準(zhǔn)。

加強(qiáng)技術(shù)迭代能力的同時,“AI一天,人間一年”的商業(yè)化之困也拷問著各家的模式選擇與融資能力。

某AI創(chuàng)企產(chǎn)品商業(yè)化負(fù)責(zé)人徐坤對《財經(jīng)天下》表示,“今年AI產(chǎn)品的商業(yè)化要比前兩年更困難。模型采購已經(jīng)趨近飽和、內(nèi)卷,各家企業(yè)需要的是能有助于收益增長、避險、安全等切實的應(yīng)用落地。需要AI公司提供更多具備行業(yè)know-how的成型產(chǎn)品或解決方案”。

相對而言,MiniMax的產(chǎn)品更聚焦于付費意愿更強(qiáng)的海外市場。其推出的模型或產(chǎn)品,都會同步在海外上線,并率先推廣。

“海外市場和國內(nèi)有兩大差異:付費意愿高,Saas模式更成熟。國內(nèi)AI to B回款困難,除了大基建類項目落地,在消費增長率、效率方面很難幫企業(yè)收到錢,也就很難拿到合同回款,想復(fù)刻海外交付->標(biāo)準(zhǔn)化->產(chǎn)品化->增長的路徑很難實現(xiàn)。做to C類業(yè)務(wù),最直接的好處就是付費意愿高。”

目前,MiniMax的絕大部分收入來自其海外明星產(chǎn)品Talkie。2024年媒體報道,這款主打AI陪伴的應(yīng)用曾躋身美國免費娛樂類App下載榜第5名 ,月活突破1100萬,其中超過一半為美國用戶。

相關(guān)人士對《財經(jīng)天下》透露, MiniMax去年to B端調(diào)用Token的API比例很少。“如果不是靠海外的Talkie,營收會很難看?!苯衲闙iniMax-01模型上線一個月后,公司負(fù)責(zé)大模型to B商業(yè)化的合伙人兼副總裁魏偉便被曝出離職,也引發(fā)了業(yè)界對于MiniMax商業(yè)化能力的猜測。

相關(guān)人士表示,Talkie入局較早,產(chǎn)品體驗更好,這讓MiniMax上半年收入更多集中于to C端。今年3月開始,MiniMax將原“海螺AI”更名為“MiniMax”,也是希望強(qiáng)化品牌認(rèn)知,“但目前公司to B產(chǎn)品和銷售能力仍舊較弱”。

6月19日,視頻生成模型Hailuo 02的會員收費制引發(fā)輿論關(guān)注,其中,最高檔的至臻版會員收費10788元/年,相當(dāng)于每月899元,用戶需付費才可使用完整視頻生成功能。由于定價過高,引發(fā)用戶強(qiáng)烈抗議,MiniMax登上了微博熱搜。

對此,MiniMax回應(yīng)表示,“Hailuo 02模型官方價格顯著低于Runway、可靈等國內(nèi)外同類產(chǎn)品,在提升創(chuàng)作質(zhì)量的基礎(chǔ)上實現(xiàn)了行業(yè)底價”。

“六小虎”的未來將何去何從,金沙江創(chuàng)投主管合伙人朱嘯虎曾有“暴論”輸出:最好的歸宿便是被大廠并購。估值、賬面現(xiàn)金、IPO速度將是接下來對幾家公司的關(guān)鍵考驗。

“有沒有10億美金在賬面上‘趴’著是一個硬門檻,沒有的話我們認(rèn)為就是非常危險的?!毙祜w說。

據(jù)其透露,MiniMax目前并不缺錢。有趣的是,MiniMax官方從未主動披露過任何融資信息。最后一筆公開可查的信息是在2024年3月,MiniMax獲得由阿里領(lǐng)投的6億美元A輪融資,投后估值25億美元。

但徐飛透露,實際上“去年MiniMax融資動作挺多的,只是不愿意披露?,F(xiàn)在也還在洽談新的投資機(jī)構(gòu)”。機(jī)構(gòu)的表現(xiàn)也都很積極,據(jù)其了解,某家美元VC便專門為MiniMax募了一只數(shù)千萬元的??铐椖客读诉M(jìn)去。

今年4月,智譜也獲得了新融資并宣布正式啟動IPO進(jìn)程。接下來對于MiniMax來說,除了在海外C端,如何打開國內(nèi)B端的商業(yè)化規(guī)模,將是其能否走向資本市場的重要考驗。

公開信息顯示,目前MiniMax已經(jīng)和高途、閱文、極狐汽車達(dá)成合作。其中,閱文有聲書借助Speech-02,可將小說轉(zhuǎn)化為有聲內(nèi)容。高途教育則把Speech-02應(yīng)用到在線課程中,用語音講解知識點。

(文中李響、徐坤、徐飛、陳奕均為化名)

(作者 | 豆蔻,編輯 | 李不清,圖片來源 | 視覺中國,本內(nèi)容來自財經(jīng)天下WEEKLY)

    本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋