MiniMax閆俊杰：未來一兩年模型推理成本還能再降一個(gè)數(shù)量級(jí)，但算力使用還會(huì)繼續(xù)增長

澎湃新聞?dòng)浾?范佳來

2025-07-26 16:20

來源：澎湃新聞

7月26日，在2025世界人工智能大會(huì)（WAIC）開幕式上，MiniMax創(chuàng)始人、CEO閆俊杰在主題發(fā)言中表示，AI公司并不是重新復(fù)制一個(gè)互聯(lián)網(wǎng)公司，AI是一個(gè)更基礎(chǔ)更根本的生產(chǎn)力，是對(duì)個(gè)人能力和社會(huì)能力的持續(xù)增強(qiáng)?！斑@里有兩點(diǎn)比較關(guān)鍵：第一，AI是一種能力，第二是AI是可持續(xù)的?！?/p>

閆俊杰

閆俊杰有一個(gè)判斷，即“AI 會(huì)變得越來越強(qiáng)，而且這種增強(qiáng)幾乎是沒有盡頭的”。

人工智能的強(qiáng)大有目共睹，業(yè)界也在討論如何更好利用好人工智能，那么AI到底會(huì)不會(huì)被壟斷？

閆俊杰在演講中表示，AI領(lǐng)域一定會(huì)有多個(gè)玩家持續(xù)存在，且AI一定會(huì)變得越來越普惠，使用成本也會(huì)變得更加可控?！斑^去一年比較受關(guān)注 AI 的排行榜，可以發(fā)現(xiàn)最好的模型還是閉源的，但最好的開源模型越來越多，同時(shí)也在不斷逼近最好的閉源模型?！?/p>

“在過去一年半， AI 模型的大小沒有發(fā)生特別大的變化，即便我們可使用算力更多了。為什么呢？對(duì)所有實(shí)用模型而言，計(jì)算速度是一個(gè)比較關(guān)鍵的因素。如果模型計(jì)算速度特別慢，就會(huì)降低用戶的使用意愿，所以所有公司都關(guān)注模型的參數(shù)量和智能水平之間的平衡?！遍Z俊杰指出，此前，模型大小增長和芯片的進(jìn)步速度基本上是成正比的。芯片進(jìn)步速度是每18個(gè)月會(huì)翻一倍，模型也會(huì)相應(yīng)保持這樣的增長趨勢。而現(xiàn)在，雖然大家都有更多的算力了，模型參數(shù)卻沒有變得更大。

那這些增長的算力花在哪呢？

閆俊杰表示，訓(xùn)練層面來看，規(guī)模增長的速度在過去半年已經(jīng)變得比較緩慢，訓(xùn)練單個(gè)模型的成本實(shí)際上卻沒有顯著增加。這些算力花在做更多的研究跟探索上。擁有非常多算力的公司和沒擁有那么多算力的公司，在訓(xùn)練上其實(shí)的差異可能不會(huì)那么大。沒有那么多算力的公司，可以通過持續(xù)提升自己的實(shí)驗(yàn)設(shè)計(jì)、提升思考能力和組織形式，讓實(shí)驗(yàn)探索變得更加高效。

其次是推理，在過去一年，最好模型的推理成本其實(shí)是降了一個(gè)數(shù)量級(jí)，通過大量的計(jì)算網(wǎng)絡(luò)系統(tǒng)和優(yōu)化算法，“我們認(rèn)為在接下來一兩年之內(nèi)，最好模型的推理成本可能還能再降低一個(gè)數(shù)量級(jí)。總結(jié)而言，我們認(rèn)為訓(xùn)練單個(gè)模型的成本不會(huì)顯著地增加。”

閆俊杰指出，大量創(chuàng)新能讓AI研發(fā)變成一個(gè)沒有那么燒錢的行業(yè)，但是算力使用還會(huì)增加。盡管Token會(huì)變得很便宜，但是使用Token的數(shù)量會(huì)顯著增加。去年ChatBot單個(gè)對(duì)話只要消耗幾千個(gè)Token，現(xiàn)在Agent單個(gè)對(duì)話可能消耗幾百萬個(gè)Token，并且因?yàn)锳I解決的問題越來越復(fù)雜，越來越實(shí)用，那么用的人也會(huì)越來越多。

責(zé)任編輯：是冬冬

圖片編輯：施佳慧

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#AI #WAIC #MiniMax #閆俊杰