- +1
MiniMax閆俊杰:未來一兩年模型推理成本還能再降一個(gè)數(shù)量級(jí),但算力使用還會(huì)繼續(xù)增長
7月26日,在2025世界人工智能大會(huì)(WAIC)開幕式上,MiniMax創(chuàng)始人、CEO閆俊杰在主題發(fā)言中表示,AI公司并不是重新復(fù)制一個(gè)互聯(lián)網(wǎng)公司,AI是一個(gè)更基礎(chǔ)更根本的生產(chǎn)力,是對(duì)個(gè)人能力和社會(huì)能力的持續(xù)增強(qiáng)?!斑@里有兩點(diǎn)比較關(guān)鍵:第一,AI是一種能力,第二是AI是可持續(xù)的?!?/p>
閆俊杰
閆俊杰有一個(gè)判斷,即“AI 會(huì)變得越來越強(qiáng),而且這種增強(qiáng)幾乎是沒有盡頭的”。
人工智能的強(qiáng)大有目共睹,業(yè)界也在討論如何更好利用好人工智能,那么AI到底會(huì)不會(huì)被壟斷?
閆俊杰在演講中表示,AI領(lǐng)域一定會(huì)有多個(gè)玩家持續(xù)存在,且AI一定會(huì)變得越來越普惠,使用成本也會(huì)變得更加可控?!斑^去一年比較受關(guān)注 AI 的排行榜,可以發(fā)現(xiàn)最好的模型還是閉源的,但最好的開源模型越來越多,同時(shí)也在不斷逼近最好的閉源模型?!?/p>
“在過去一年半, AI 模型的大小沒有發(fā)生特別大的變化,即便我們可使用算力更多了。為什么呢?對(duì)所有實(shí)用模型而言,計(jì)算速度是一個(gè)比較關(guān)鍵的因素。如果模型計(jì)算速度特別慢,就會(huì)降低用戶的使用意愿,所以所有公司都關(guān)注模型的參數(shù)量和智能水平之間的平衡?!遍Z俊杰指出,此前,模型大小增長和芯片的進(jìn)步速度基本上是成正比的。芯片進(jìn)步速度是每18個(gè)月會(huì)翻一倍,模型也會(huì)相應(yīng)保持這樣的增長趨勢。而現(xiàn)在,雖然大家都有更多的算力了,模型參數(shù)卻沒有變得更大。
那這些增長的算力花在哪呢?
閆俊杰表示,訓(xùn)練層面來看,規(guī)模增長的速度在過去半年已經(jīng)變得比較緩慢,訓(xùn)練單個(gè)模型的成本實(shí)際上卻沒有顯著增加。這些算力花在做更多的研究跟探索上。擁有非常多算力的公司和沒擁有那么多算力的公司,在訓(xùn)練上其實(shí)的差異可能不會(huì)那么大。沒有那么多算力的公司,可以通過持續(xù)提升自己的實(shí)驗(yàn)設(shè)計(jì)、提升思考能力和組織形式,讓實(shí)驗(yàn)探索變得更加高效。
其次是推理,在過去一年,最好模型的推理成本其實(shí)是降了一個(gè)數(shù)量級(jí),通過大量的計(jì)算網(wǎng)絡(luò)系統(tǒng)和優(yōu)化算法,“我們認(rèn)為在接下來一兩年之內(nèi),最好模型的推理成本可能還能再降低一個(gè)數(shù)量級(jí)。總結(jié)而言,我們認(rèn)為訓(xùn)練單個(gè)模型的成本不會(huì)顯著地增加。”
閆俊杰指出,大量創(chuàng)新能讓AI研發(fā)變成一個(gè)沒有那么燒錢的行業(yè),但是算力使用還會(huì)增加。盡管Token會(huì)變得很便宜,但是使用Token的數(shù)量會(huì)顯著增加。去年ChatBot單個(gè)對(duì)話只要消耗幾千個(gè)Token,現(xiàn)在Agent單個(gè)對(duì)話可能消耗幾百萬個(gè)Token,并且因?yàn)锳I解決的問題越來越復(fù)雜,越來越實(shí)用,那么用的人也會(huì)越來越多。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司