中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

清華推出基座大模型ChatGLM3,多模態(tài)性能直逼GPT-4V

2023-10-30 17:53
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

大數(shù)據(jù)文摘出品

今年6月份清華系ChatGLM升級(jí)到第二代,當(dāng)時(shí)在中文圈(中文C-Eval榜單)里拿下了“榜首”的好成績(jī)。昨日,中國(guó)計(jì)算機(jī)大會(huì)(CNCC)上,ChatGLM再有突破,此次推出的ChatGLM3不僅在多模態(tài)層面性能直逼GPT-4V,也是國(guó)內(nèi)首個(gè)具備代碼交互能力的大模型產(chǎn)品(Code Interpreter)。

如上,中文圖文理解能力測(cè)評(píng),ChatGLM3可以回答各種類(lèi)型的視覺(jué)問(wèn)題,并且可以完成復(fù)雜的目標(biāo)檢測(cè),以及打上標(biāo)簽,完成自動(dòng)數(shù)據(jù)標(biāo)注。

而“代碼”功能目前已支持圖像處理、數(shù)學(xué)計(jì)算、數(shù)據(jù)分析等使用場(chǎng)景。即代碼增強(qiáng)模塊Code Interpreter,可支持根據(jù)用戶需求生成代碼并執(zhí)行,自動(dòng)完成數(shù)據(jù)分析、文件處理等復(fù)雜任務(wù)。

代碼繪制圖形

處理數(shù)據(jù)生成圖表

SQL代碼分析

ChatGLM 3支持的Function Call意味著以前的開(kāi)源小參數(shù)大模型都是不支持工具調(diào)用的,現(xiàn)在glm3的出現(xiàn),小參數(shù)模型也支持了工具調(diào)用。這將助推加速模型本地化部署。

同時(shí),ChatGLM 3支持網(wǎng)絡(luò)搜索增強(qiáng)WebGLM,接入搜索增強(qiáng),能自動(dòng)根據(jù)問(wèn)題在互聯(lián)網(wǎng)上查找相關(guān)資料并在回答時(shí)提供參考相關(guān)文獻(xiàn)或文章鏈接。如下:

據(jù)悉,ChatGLM3系列有三個(gè)版本:基礎(chǔ)大語(yǔ)言模型ChatGLM3-6B-Base、對(duì)話調(diào)優(yōu)大語(yǔ)言模型ChatGLM3-6B和長(zhǎng)文本對(duì)話大語(yǔ)言模型ChatGLM3-6B-32K。這三個(gè)版本所有權(quán)重對(duì)學(xué)術(shù)研究完全開(kāi)放,在填寫(xiě)問(wèn)卷進(jìn)行登記后亦允許免費(fèi)商業(yè)使用。

并且,在8個(gè)中英文典型數(shù)據(jù)集上的測(cè)評(píng),ChatGLM3的表現(xiàn)堪稱(chēng):10B以下最強(qiáng)基礎(chǔ)大模型!

目前ChatGLM3的開(kāi)源版本已經(jīng)全部由官方發(fā)布在了國(guó)內(nèi)wisemodel.cn開(kāi)源社區(qū)。

地址:https://wisemodel.cn/models

ChatGLM3全新技術(shù)升級(jí) 更高性能更低成本

ChatGLM3擁有更豐富的訓(xùn)練數(shù)據(jù)和更優(yōu)的訓(xùn)練方案,與ChatGLM2相比,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。

同時(shí),ChatGLM3瞄向GPT-4V本次實(shí)現(xiàn)了若干全新功能的迭代升級(jí),包括多模態(tài)理解能力的CogVLM-看圖識(shí)語(yǔ)義,在10余個(gè)國(guó)際標(biāo)準(zhǔn)圖文評(píng)測(cè)數(shù)據(jù)集上取得SOTA;代碼增強(qiáng)模塊Code Interpreter根據(jù)用戶需求生成代碼并執(zhí)行,自動(dòng)完成數(shù)據(jù)分析、文件處理等復(fù)雜任務(wù);網(wǎng)絡(luò)搜索增強(qiáng)WebGLM-接入搜索增強(qiáng),能自動(dòng)根據(jù)問(wèn)題在互聯(lián)網(wǎng)上查找相關(guān)資料并在回答時(shí)提供參考相關(guān)文獻(xiàn)或文章鏈接。ChatGLM3的語(yǔ)義能力與邏輯能力得到了極大的增強(qiáng)。

ChatGLM3還集成了自研的AgentTuning技術(shù),激活了模型智能體能力,尤其在智能規(guī)劃和執(zhí)行方面,相比于ChatGLM2提升了1000% ;開(kāi)啟了國(guó)產(chǎn)大模型原生支持工具調(diào)用、代碼執(zhí)行、游戲、數(shù)據(jù)庫(kù)操作、知識(shí)圖譜搜索與推理、操作系統(tǒng)等復(fù)雜場(chǎng)景。

此外,ChatGLM3本次推出可手機(jī)部署的端測(cè)模型ChatGLM3-1.5B和 ChatGLM3-3B,支持包括vivo、小米、三星在內(nèi)的多款手機(jī)以及車(chē)載平臺(tái),甚至支持移動(dòng)平臺(tái)上CPU芯片的推理,速度可達(dá)20 tokens/s。精度方面1.5B和3B模型在公開(kāi)benchmark上與ChatGLM2-6B模型性能接近。

基于最新的高效動(dòng)態(tài)推理和顯存優(yōu)化技術(shù),ChatGLM3當(dāng)前的推理框架在相同硬件、模型條件下,相較于目前最佳的開(kāi)源實(shí)現(xiàn),包括伯克利大學(xué)推出的 vLLM 以及Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千tokens僅0.5分,成本最低。

隨著 ChatGPT 的現(xiàn)象級(jí)走紅,引領(lǐng)了AI大模型時(shí)代的變革,從而導(dǎo)致 AI 算力日益緊缺。而近期連用來(lái)打游戲的RTX4090顯卡都被禁售,更別說(shuō)用來(lái)訓(xùn)練AI的A100等硬件了。因此AI算力國(guó)產(chǎn)化適配勢(shì)在必行。

自 2022 年初,ChatGLM 系列模型已支持在昇騰、神威超算、海光 DCU 架構(gòu)上進(jìn)行大規(guī)模預(yù)訓(xùn)練和推理,截至目前已支持 10 余種國(guó)產(chǎn)硬件生態(tài),包括昇騰、神威超算、海光 DCU、海飛科、沐曦曦云、算能科技、天數(shù)智芯、寒武紀(jì)、摩爾線程、百度昆侖芯、靈汐科技、長(zhǎng)城超云等。通過(guò)與國(guó)產(chǎn)芯片企業(yè)的聯(lián)合創(chuàng)新,ChatGLM 系列模型性能不斷優(yōu)化,國(guó)產(chǎn)硬件生態(tài)也得到了大模型國(guó)產(chǎn)化的閉環(huán)。

原標(biāo)題:《清華推出基座大模型 ChatGLM3,多模態(tài)性能直逼GPT-4V》

閱讀原文

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋