清華推出基座大模型ChatGLM3，多模態(tài)性能直逼GPT-4V

2023-10-30 17:53

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

大數(shù)據(jù)文摘出品

今年6月份清華系ChatGLM升級(jí)到第二代，當(dāng)時(shí)在中文圈（中文C-Eval榜單）里拿下了“榜首”的好成績(jī)。昨日，中國(guó)計(jì)算機(jī)大會(huì)（CNCC）上，ChatGLM再有突破，此次推出的ChatGLM3不僅在多模態(tài)層面性能直逼GPT-4V，也是國(guó)內(nèi)首個(gè)具備代碼交互能力的大模型產(chǎn)品（Code Interpreter）。

如上，中文圖文理解能力測(cè)評(píng)，ChatGLM3可以回答各種類(lèi)型的視覺(jué)問(wèn)題，并且可以完成復(fù)雜的目標(biāo)檢測(cè)，以及打上標(biāo)簽，完成自動(dòng)數(shù)據(jù)標(biāo)注。

而“代碼”功能目前已支持圖像處理、數(shù)學(xué)計(jì)算、數(shù)據(jù)分析等使用場(chǎng)景。即代碼增強(qiáng)模塊Code Interpreter，可支持根據(jù)用戶需求生成代碼并執(zhí)行，自動(dòng)完成數(shù)據(jù)分析、文件處理等復(fù)雜任務(wù)。

代碼繪制圖形

處理數(shù)據(jù)生成圖表

SQL代碼分析

ChatGLM 3支持的Function Call意味著以前的開(kāi)源小參數(shù)大模型都是不支持工具調(diào)用的，現(xiàn)在glm3的出現(xiàn)，小參數(shù)模型也支持了工具調(diào)用。這將助推加速模型本地化部署。

同時(shí)，ChatGLM 3支持網(wǎng)絡(luò)搜索增強(qiáng)WebGLM，接入搜索增強(qiáng)，能自動(dòng)根據(jù)問(wèn)題在互聯(lián)網(wǎng)上查找相關(guān)資料并在回答時(shí)提供參考相關(guān)文獻(xiàn)或文章鏈接。如下：

據(jù)悉，ChatGLM3系列有三個(gè)版本：基礎(chǔ)大語(yǔ)言模型ChatGLM3-6B-Base、對(duì)話調(diào)優(yōu)大語(yǔ)言模型ChatGLM3-6B和長(zhǎng)文本對(duì)話大語(yǔ)言模型ChatGLM3-6B-32K。這三個(gè)版本所有權(quán)重對(duì)學(xué)術(shù)研究完全開(kāi)放，在填寫(xiě)問(wèn)卷進(jìn)行登記后亦允許免費(fèi)商業(yè)使用。

并且，在8個(gè)中英文典型數(shù)據(jù)集上的測(cè)評(píng)，ChatGLM3的表現(xiàn)堪稱(chēng)：10B以下最強(qiáng)基礎(chǔ)大模型！

目前ChatGLM3的開(kāi)源版本已經(jīng)全部由官方發(fā)布在了國(guó)內(nèi)wisemodel.cn開(kāi)源社區(qū)。

地址：https://wisemodel.cn/models

ChatGLM3全新技術(shù)升級(jí) 更高性能更低成本

ChatGLM3擁有更豐富的訓(xùn)練數(shù)據(jù)和更優(yōu)的訓(xùn)練方案，與ChatGLM2相比，MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。

同時(shí)，ChatGLM3瞄向GPT-4V本次實(shí)現(xiàn)了若干全新功能的迭代升級(jí)，包括多模態(tài)理解能力的CogVLM-看圖識(shí)語(yǔ)義，在10余個(gè)國(guó)際標(biāo)準(zhǔn)圖文評(píng)測(cè)數(shù)據(jù)集上取得SOTA；代碼增強(qiáng)模塊Code Interpreter根據(jù)用戶需求生成代碼并執(zhí)行，自動(dòng)完成數(shù)據(jù)分析、文件處理等復(fù)雜任務(wù)；網(wǎng)絡(luò)搜索增強(qiáng)WebGLM-接入搜索增強(qiáng)，能自動(dòng)根據(jù)問(wèn)題在互聯(lián)網(wǎng)上查找相關(guān)資料并在回答時(shí)提供參考相關(guān)文獻(xiàn)或文章鏈接。ChatGLM3的語(yǔ)義能力與邏輯能力得到了極大的增強(qiáng)。

ChatGLM3還集成了自研的AgentTuning技術(shù)，激活了模型智能體能力，尤其在智能規(guī)劃和執(zhí)行方面，相比于ChatGLM2提升了1000% ；開(kāi)啟了國(guó)產(chǎn)大模型原生支持工具調(diào)用、代碼執(zhí)行、游戲、數(shù)據(jù)庫(kù)操作、知識(shí)圖譜搜索與推理、操作系統(tǒng)等復(fù)雜場(chǎng)景。

此外，ChatGLM3本次推出可手機(jī)部署的端測(cè)模型ChatGLM3-1.5B和 ChatGLM3-3B，支持包括vivo、小米、三星在內(nèi)的多款手機(jī)以及車(chē)載平臺(tái)，甚至支持移動(dòng)平臺(tái)上CPU芯片的推理，速度可達(dá)20 tokens/s。精度方面1.5B和3B模型在公開(kāi)benchmark上與ChatGLM2-6B模型性能接近。

基于最新的高效動(dòng)態(tài)推理和顯存優(yōu)化技術(shù)，ChatGLM3當(dāng)前的推理框架在相同硬件、模型條件下，相較于目前最佳的開(kāi)源實(shí)現(xiàn)，包括伯克利大學(xué)推出的 vLLM 以及Hugging Face TGI的最新版本，推理速度提升了2-3倍，推理成本降低一倍，每千tokens僅0.5分，成本最低。

隨著 ChatGPT 的現(xiàn)象級(jí)走紅，引領(lǐng)了AI大模型時(shí)代的變革，從而導(dǎo)致 AI 算力日益緊缺。而近期連用來(lái)打游戲的RTX4090顯卡都被禁售，更別說(shuō)用來(lái)訓(xùn)練AI的A100等硬件了。因此AI算力國(guó)產(chǎn)化適配勢(shì)在必行。

自 2022 年初，ChatGLM 系列模型已支持在昇騰、神威超算、海光 DCU 架構(gòu)上進(jìn)行大規(guī)模預(yù)訓(xùn)練和推理，截至目前已支持 10 余種國(guó)產(chǎn)硬件生態(tài)，包括昇騰、神威超算、海光 DCU、海飛科、沐曦曦云、算能科技、天數(shù)智芯、寒武紀(jì)、摩爾線程、百度昆侖芯、靈汐科技、長(zhǎng)城超云等。通過(guò)與國(guó)產(chǎn)芯片企業(yè)的聯(lián)合創(chuàng)新，ChatGLM 系列模型性能不斷優(yōu)化，國(guó)產(chǎn)硬件生態(tài)也得到了大模型國(guó)產(chǎn)化的閉環(huán)。

原標(biāo)題：《清華推出基座大模型 ChatGLM3，多模態(tài)性能直逼GPT-4V》

閱讀原文

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#ChatGLM