中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

20萬塊英偉達(dá)芯片練出Grok 3:測(cè)試得分均高于競(jìng)爭(zhēng)對(duì)手,運(yùn)算能力是上代10倍

澎湃新聞?dòng)浾?吳遇利
2025-02-18 17:53
來源:澎湃新聞
? 10%公司 >
字號(hào)

預(yù)熱許久的“地表最聰明AI”Grok 3正式亮相。

2月18日,特斯拉創(chuàng)始人埃隆·馬斯克旗下xAI推出最新大模型Grok 3,并在直播中進(jìn)行了現(xiàn)場(chǎng)演示。馬斯克稱,非常高興能夠推出 Grok3,它的能力將在短時(shí)間內(nèi)比Grok2強(qiáng)大了十倍?!皒AI和Grok的目的是理解宇宙的本質(zhì)。”

功能完整的Grok 3將在一周后正式上線,不過用戶依舊需要“鈔能力”才能體驗(yàn)到最新版本的Grok。

直播介紹,Grok 3測(cè)試版現(xiàn)已面向馬斯克旗下X平臺(tái)的X Premium訂閱用戶開放,“我們今天將推出Grok3,首先從X上的Premium Plus訂閱者開始,他們將是第一批獲得訪問權(quán)限的人。請(qǐng)確保更新您的X應(yīng)用程序以探索所有高級(jí)功能,因?yàn)槲覀儎倓偘l(fā)布了更新。如果您有興趣盡早使用Grok 3,請(qǐng)注冊(cè)Premium Plus?!?/p>

xAI還針對(duì)Grok 3開發(fā)了新的訂閱功能。“此外,我們還將為想要獲得最先進(jìn)功能和盡早使用新功能的忠實(shí)粉絲推出一項(xiàng)名為Super Grok的單獨(dú)訂閱。這項(xiàng)服務(wù)適用于Grok應(yīng)用程序和新網(wǎng)站grok.com?!睋?jù)報(bào)道,

馬斯克表示,預(yù)計(jì)一周之后Grok 3的所有功能將正式上線。他說,“如果你想要一個(gè)更完善的版本,可能值得等待一周,但每天都會(huì)有所改進(jìn)。我們還在開發(fā)語音交互功能,以便你可以擁有對(duì)話體驗(yàn)。我今天早些時(shí)候試過了,效果很好,盡管它仍然需要一些完善。我們的目標(biāo)是讓你可以像和人交談一樣和它交談。我認(rèn)為這將是Grok3最好的體驗(yàn)之一,但這應(yīng)該還要一周左右的時(shí)間?!?/p>

馬斯克說,計(jì)劃在每次發(fā)布新版本時(shí),對(duì)上一版本進(jìn)行開源,也就是說,幾個(gè)月后Grok 2即將開源。

xAI工程師介紹,雖然Grok起步較晚,但在MMLU(大規(guī)模多任務(wù)語言理解基準(zhǔn)測(cè)試)得分上以超快地速度追上了ChatGPT,Grok 3和輕量化的Grok 3 mini在多方面性能上都超過或媲美Gemini、DeepSeek和GPT-4o等對(duì)手。

據(jù)介紹,Grok 3在數(shù)學(xué)推理、科學(xué)邏輯推理和代碼寫作等項(xiàng)目的Benchmark測(cè)試(基準(zhǔn)測(cè)試)中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更優(yōu)的效果。Grok 3分別得分為52、75和57。Grok 3 mini分別得分為40、65和41。這兩個(gè)模型的得分都高于Gemini、DeepSeek、Claude和GPT。

工程師說,“大約五天前,AIME2025競(jìng)賽結(jié)束了,高中生們?cè)谝粋€(gè)特定的基準(zhǔn)上競(jìng)爭(zhēng)。然后我們讓兩個(gè)模型在同一場(chǎng)考試中在同一基準(zhǔn)上競(jìng)爭(zhēng)。有趣的是,更大的Grok3推理模型在這場(chǎng)考試中表現(xiàn)更好。這表明,與較小的模型相比,較大的模型具有更強(qiáng)的泛化能力。然而,在去年的考試中,較小的模型表現(xiàn)更好,因?yàn)樗行У貙W(xué)習(xí)了以前的考試。”

在加州大學(xué)伯克利分校推出的Chatbot Arena (LMSYS)盲測(cè)中,早期版本的Grok 3化名“巧克力”打榜,一舉奪魁并成為唯一一個(gè)得分超1400的模型,其在代碼、指令響應(yīng)等各個(gè)方面排名均為第一。

據(jù)馬斯克此前介紹,Grok 3是在大量的合成數(shù)據(jù)上訓(xùn)練的。它會(huì)反復(fù)檢查數(shù)據(jù),試圖達(dá)到邏輯一致性。如果有錯(cuò)誤的數(shù)據(jù),它會(huì)反思并刪除錯(cuò)誤數(shù)據(jù)。

值得一提的是,有工程師還透露了xAI旗下超算中心算力已經(jīng)翻倍,英偉達(dá)GPU數(shù)量已達(dá)到20萬塊。

據(jù)介紹,去年4月,馬斯克認(rèn)為xAI若想成功打造出最佳AI,唯一途徑是自建數(shù)據(jù)中心。由于想盡快推出Grok 3,時(shí)間緊迫,于是決定在四個(gè)月內(nèi)建成數(shù)據(jù)中心。最終,團(tuán)隊(duì)耗時(shí)122天讓第一批10萬個(gè)GPU啟動(dòng)并運(yùn)行。

不過要構(gòu)建理想中的AI需將集群規(guī)模翻倍。發(fā)布會(huì)上透露,這也是團(tuán)隊(duì)首次公開談?wù)摯耸?,團(tuán)隊(duì)僅用92天就已經(jīng)實(shí)現(xiàn)了超算集群的算力翻倍,也就是GPU數(shù)量已達(dá)20萬塊。如今,xAI正利用這些強(qiáng)大的計(jì)算能力持續(xù)改進(jìn)產(chǎn)品。

團(tuán)隊(duì)還透露,xAI已經(jīng)開始研究下一個(gè)集群,為了能夠帶動(dòng)更為強(qiáng)大的AI,其功率將提高約五倍,達(dá)到大約1.2千兆瓦。

現(xiàn)場(chǎng),馬斯克和工程師們演示了Grok 3的多種能力。在演示中,Grok 3為太空發(fā)射生成動(dòng)畫3D,以及開發(fā)了一款將俄羅斯方塊和寶石迷陣結(jié)合的游戲。

Grok 3為太空發(fā)射生成動(dòng)畫3D

Grok 3開發(fā)的游戲

此外,xAI的游戲工作室也正式得到官宣。馬斯克表示,“我們將在xAI推出一個(gè)人工智能游戲工作室。如果你有興趣加入我們并開發(fā)人工智能驅(qū)動(dòng)的游戲,請(qǐng)加入我們?!?/p>

    責(zé)任編輯:王杰
    圖片編輯:金潔
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋