中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

Grok 4發(fā)布,地表最強AI,所有學術領域達到博士水平

2025-07-10 17:23
來源:澎湃新聞·澎湃號·湃客
字號

原創(chuàng) 文摘菌 大數(shù)據(jù)文摘

大數(shù)據(jù)文摘出品

7月9日晚間,Elon Musk正式發(fā)布他迄今為止最強的人工智能模型:Grok 4。

這款模型由他領導的xAI團隊打造,被Musk本人形容為“大爆炸級別的智能進化”。

在推特上,官方賬號稱:Grok 4是“地表最強”(世界上最強大)的AI模型。顯然,這不是簡單升級,而是一次全方位能力的躍遷。

據(jù)悉,Grok 4具備自然語音對話功能,能像人類一樣順暢表達,打破以往AI對話割裂感。

它不僅能處理文本,還可支持圖像輸入,未來甚至可能加入視頻識別功能,大步邁入真正的多模態(tài)AI時代。

開發(fā)者還將獲得“Grok 4 Code”專屬版本,用于寫代碼、調試和解釋邏輯,直逼GitHub Copilot與GPT-4的水平。

據(jù)說,Grok 4不只是聰明,它甚至“會唱歌”,聲音自然,還能理解互聯(lián)網(wǎng)語言、俚語和段子,成為最懂網(wǎng)絡文化的AI之一。

目前,對于Gork-4,在官網(wǎng)付費用戶已經可以使用。

Grok 4的發(fā)布并非“情緒宣傳”,而是有硬核數(shù)據(jù)為背書。根據(jù)Artificial Analysis的完整基準測試,Grok 4以AI指數(shù)73分,首次登頂全球第一。

這一分數(shù)直接擊敗了OpenAI的O3(70分)、Google的Gemini 2.5 Pro(70分)和Anthropic的Claude 4 Opus(64分)。

更關鍵的是,Grok 4在數(shù)學、編碼和綜合推理測試中全面碾壓,成為“人類最后的考試”上表現(xiàn)最強的AI。

在LiveCodeBench和SciCode測試中,Grok 4取得編碼準確率88%,創(chuàng)造歷史最高紀錄。

在GPQA Diamond測試中也拿下88%的高分,超過此前由Gemini 2.5 Pro保持的84%記錄。

“人類最后的考試”中,Grok 4 heavy版獲得50.7%的突破性成績,是目前唯一觸及這一高度的模型。

在AIME 2024和MMLU-Pro這兩項權威測試中,分別斬獲94%和87%的驚人得分。

據(jù)推特網(wǎng)友,對于這個模型的能力,Elon Musk說:“Grok 4可能在所有領域達到博士水平的模型?!?/p>

也有技術觀察者提醒:“那場考試的名字叫‘人類最后的考試’,但很可能不是AI的極限,而是人類理解力的終點?!?

此外,雖然它的輸出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依舊優(yōu)于Claude 4 Opus(66 tokens/s),性能穩(wěn)居一線。

同時,Grok 4支持長達256k token的上下文處理,允許進行復雜文檔分析與記憶性任務處理。

它還能調用函數(shù)、生成結構化結果,整體架構更適合應用于科研、商業(yè)、教育等高負載任務場景。

定價方面仍與Grok 3持平:每百萬輸入token收取3美元,輸出為15美元,緩存輸入更低至0.75美元。

原標題:《Grok 4 發(fā)布,地表最強 AI,所有學術領域達到博士水平》

閱讀原文

    本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋