- +1
AI大模型全景分析,讀這一篇就夠了!
人工智能大模型全景分析
伴隨人工智能技術(shù)的加速演進,AI 大模型已成為全球科技競爭的新高地、未來產(chǎn)業(yè)的新賽道、經(jīng)濟發(fā)展的新引擎,發(fā)展?jié)摿Υ?、?yīng)用前景廣。近年來,我國高度重視人工智能的發(fā)展,將其上升為國家戰(zhàn)略,出臺一系列扶持政策和規(guī)劃,為AI大模型產(chǎn)業(yè)發(fā)展創(chuàng)造了良好的環(huán)境。當(dāng)前,通用大模型、行業(yè)大模型、端側(cè)大模型如雨后春筍般涌現(xiàn),大模型產(chǎn)業(yè)的應(yīng)用落地將進一步提速。作為新一代人工智能產(chǎn)業(yè)的核心驅(qū)動力,AI大模型廣泛賦能我國經(jīng)濟社會的多個領(lǐng)域,打開邁向通用人工智能的大門,推動新一輪的科技革命與產(chǎn)業(yè)變革。
『制造前沿』本文將從定義、發(fā)展歷程、產(chǎn)業(yè)鏈、市場規(guī)模、應(yīng)用場景及區(qū)域布局等維度全景分析AI大模型。了解大模型,讀這一篇就夠了!

一、產(chǎn)業(yè)定義與分類
●定義
大模型指參數(shù)量超10億、具備跨任務(wù)泛化能力的深度學(xué)習(xí)模型(如NLP、CV、多模態(tài)),通過海量數(shù)據(jù)訓(xùn)練實現(xiàn)復(fù)雜任務(wù)處理。
●分類方式:
按輸入類型:語言大模型(NLP)、視覺大模型(CV)、多模態(tài)大模型。
按應(yīng)用層級:通用大模型(L0)、行業(yè)大模型(L1)、垂直場景大模型(L2)。
二、發(fā)展歷程

大模型的發(fā)展遵循“架構(gòu)突破→規(guī)模擴張→應(yīng)用爆發(fā)”的路徑,可分為四個階段:
1. 技術(shù)積淀(2017年前)
主要依賴RNN/LSTM架構(gòu)處理文本,存在計算效率低、難以處理長文本等瓶頸。模型規(guī)模較小,多為特定任務(wù)訓(xùn)練。
2. 范式開創(chuàng)(2017-2018)
- 2017年:Google提出Transformer架構(gòu)(核心是自注意力機制),解決了并行計算和長程依賴問題,成為所有大模型的基礎(chǔ)。
- 2018年:OpenAI發(fā)布GPT-1,Google推出BERT,確立了“預(yù)訓(xùn)練+微調(diào)”的新范式,大幅提升多項任務(wù)性能。
3. 規(guī)模競賽(2019-2022)
- 研究顯示,擴大模型規(guī)模(數(shù)據(jù)、參數(shù)、算力)能顯著提升性能。
- GPT-3(1750億參數(shù))展現(xiàn)了驚人的上下文學(xué)習(xí)和“涌現(xiàn)能力”,推動千億級模型競賽。
- 開源模型(如BLOOM、LLaMA)興起,促進生態(tài)繁榮。
4. 應(yīng)用與智能體時代(2022年至今)
- ChatGPT(基于GPT-3.5)通過RLHF技術(shù)實現(xiàn)對齊人類意圖,引爆全球AI應(yīng)用浪潮。
- 多模態(tài)成為核心:GPT-4等模型融合圖像、文本等多維度信息。
- 重心轉(zhuǎn)向智能體(Agent):模型能自主規(guī)劃、調(diào)用工具、完成復(fù)雜任務(wù)。
- 開源(DeepSeek、LLaMA)與閉源(GPT-4、Gemini)模型共同推動技術(shù)民主化與商業(yè)化。
三、產(chǎn)業(yè)鏈全景
大模型產(chǎn)業(yè)鏈可以劃分為基礎(chǔ)層、模型層、應(yīng)用層三大核心層級,以及貫穿各層的支撐服務(wù)。


圖 / 大模型生態(tài)關(guān)鍵要素
來源:大模型 2.0 產(chǎn)業(yè)發(fā)展報告

圖 / 產(chǎn)業(yè)鏈圖譜
來源:億歐智庫
01基礎(chǔ)層 (The Foundation Layer)
定位: 整個產(chǎn)業(yè)的“賣水人”和“軍火商”,提供訓(xùn)練和運行大模型所必需的底層資源。在大模型的發(fā)展過程中,數(shù)據(jù)、算力、算法和工具是大模型發(fā)展的基礎(chǔ)和支撐。AI訓(xùn)練芯片(英偉達/華為昇騰/寒武紀(jì))、存儲芯片、服務(wù)器集群,占大模型成本40%以上。

●算力(硬件)
算力是大模型落地的物質(zhì)基礎(chǔ),大模型對算力的強需求推動異構(gòu)算力技術(shù)發(fā)展。據(jù)預(yù)測,2022-2027 年中國智能算力規(guī)模年復(fù)合增長率將達到33.9%,同期通用算力規(guī)模年復(fù)合增長率為 16.6%。我國智能算力需求的增長速度遠超過通用算力增加速度。
- AI芯片:提供訓(xùn)練和推理所需的計算能力。如英偉達(NVIDIA)的GPU(A100/H100)、AMD(MI300X)、英特爾(Intel)等。
- 國產(chǎn)算力:華為(昇騰)、寒武紀(jì)、海光信息等。
- 智算/超算中心:提供大規(guī)模集群算力服務(wù)。
●數(shù)據(jù)(燃料):
訓(xùn)練集的質(zhì)量直接影響著大模型訓(xùn)練的成本與結(jié)果。隨著市場對大模型能力要求的不斷增加 , 對高質(zhì)量、精細(xì)化、定制化的數(shù)據(jù)需求日益凸顯。推動構(gòu)建高質(zhì)量數(shù)據(jù)的同時要加強數(shù)據(jù)治理。從企業(yè)來看,大部分企業(yè)的數(shù)據(jù)治理工作面臨著數(shù)據(jù)量龐大、數(shù)據(jù)種類繁多、數(shù)據(jù)管理效率低的挑戰(zhàn),目前尚未出現(xiàn)通用、可靠的數(shù)據(jù)管理工具,數(shù)據(jù)治理僅是企業(yè)的單兵作戰(zhàn)。同時,加強數(shù)據(jù)治理也是保障國家安全、社會穩(wěn)定和公民權(quán)益的迫切需要。
- 數(shù)據(jù)集:多模態(tài)、高質(zhì)量的專業(yè)數(shù)據(jù)集提供商。
- 知識庫:行業(yè)知識庫、語料庫的構(gòu)建與治理。
●算法
算法是大模型的骨架。當(dāng)前大模型的主流架構(gòu)仍是Transformer,其推理過程的無法解釋性與結(jié)果的不可控性無法得到完全解決,未來融合檢索增強生成(即RAG)+ 知識圖譜的架構(gòu)或?qū)⒊蔀樾鲁绷鳌?/p>
圖/ LLM 進化圖
●云服務(wù)(平臺):
- 公有云:AWS, Azure, Google Cloud, 阿里云,騰訊云等提供成熟的AI開發(fā)平臺和算力租賃服務(wù)。
- 私有化部署:為政企客戶提供本地化的算力解決方案。
02模型層 (The Model Layer)
定位: 產(chǎn)業(yè)的核心引擎,通過算法創(chuàng)新和訓(xùn)練,產(chǎn)出基礎(chǔ)模型。
●通用大模型:
通用大模型(General-Purpose Large Language Model)是一種通過在海量數(shù)據(jù)上訓(xùn)練、擁有龐大參數(shù)規(guī)模(通常達數(shù)十億至數(shù)萬億)的底層人工智能系統(tǒng)。它基于Transformer架構(gòu),掌握了語言、知識及邏輯推理的通用能力,無需針對特定任務(wù)重新訓(xùn)練,即可通過自然語言交互完成各種開放域任務(wù),如問答、創(chuàng)作、代碼生成和數(shù)據(jù)分析,成為推動人工智能應(yīng)用生態(tài)發(fā)展的核心引擎。
受到 GPT的沖擊,不少科技巨頭企業(yè)均嘗試以其自身的優(yōu)勢,構(gòu)建通用大模型。各家通用大模型在訓(xùn)練數(shù)據(jù)、參數(shù)量、訓(xùn)練框架、任務(wù)能力等方面互相比拼整體向更大參數(shù)、更高精度、更強能力方向發(fā)展。
- 閉源陣營:OpenAI(GPT系列)、Anthropic(Claude)、Google(Gemini)、百度(文心一言)、阿里(通義千問) 等。通過API提供服務(wù),追求極致性能。
- 開源陣營:Meta(Llama系列)、Mistral AI、DeepSeek(深度求索)、智譜AI(GLM)、百川智能等。推動技術(shù)民主化和生態(tài)創(chuàng)新。
●行業(yè)/垂直大模型:
行業(yè)大模型是在通用大模型的基礎(chǔ)上,通過引入大量專業(yè)領(lǐng)域數(shù)據(jù)(如醫(yī)療、金融、法律或工業(yè)知識)進行深度訓(xùn)練和優(yōu)化而形成的垂直化AI模型。目前,制造、金融、醫(yī)療、游戲、法律、交通等行業(yè)均憑借各自獨特的場景需求,搭建了行業(yè)大模型。這些行業(yè)大模型的意義在于深入理解和滿足行業(yè)的特殊場景,為行業(yè)智能化、高效化發(fā)展提供有力支撐。如科大訊飛(星火醫(yī)療大模型)、恒生電子(金融大模型) 等。
●模型即服務(wù) (MaaS):
模型即服務(wù)(Model-as-a-Service, MaaS)是一種云計算服務(wù)模式,它將訓(xùn)練好的人工智能模型(尤其是大模型)通過云端平臺以API(應(yīng)用程序接口)或特定工具的形式提供給開發(fā)者與企業(yè)用戶,使其無需自行構(gòu)建和維護昂貴的算力基礎(chǔ)設(shè)施及技術(shù)團隊,即可按需調(diào)用、集成并付費使用先進的AI能力,從而快速實現(xiàn)業(yè)務(wù)智能化升級。是模型層主要的商業(yè)化模式。
03 應(yīng)用層 (The Application Layer)
定位: 產(chǎn)業(yè)的價值出口,將模型能力與具體場景結(jié)合,直接面向用戶或企業(yè)解決問題。
● To B (企業(yè)服務(wù)):
- 辦公與效率:微軟Copilot、金山辦公WPS AI、釘釘/企微AI助手、Notion AI等。
- 金融:智能投顧、風(fēng)險控制、量化交易、智能客服。
- 工業(yè)與制造:AI質(zhì)檢、生產(chǎn)流程優(yōu)化、預(yù)測性維護。
- 醫(yī)療:輔助診斷、醫(yī)學(xué)影像分析、新藥研發(fā)。
- 教育:個性化學(xué)習(xí)助手、智能批改、虛擬教師。
● To C (消費者應(yīng)用):
- 聊天與陪伴:ChatGPT、Claude、豆包、文心一言App等。
- 內(nèi)容生成(AIGC):Jasper(文案)、Midjourney(繪畫)、妙鴨相機(照片)、Suno(音樂)等。
- 搜索與信息獲?。篘ew Bing、Perplexity、360AI搜索。
- 智能體(Agent):能夠自主完成復(fù)雜任務(wù)的AI,如自動訂機票、規(guī)劃行程等。
04支撐服務(wù) (Supporting Services)
定位: 貫穿全產(chǎn)業(yè)鏈的“潤滑劑”,提升產(chǎn)業(yè)效率和安全性。
大模型的發(fā)展離不開堅實的保障措施,合規(guī)標(biāo)準(zhǔn)的建立是其發(fā)展的基礎(chǔ)支撐。在推進過程中,數(shù)據(jù)、模型、應(yīng)用的安全保障必須全面到位,同時倫理治理亦不容忽視,只有確保價值對齊,大模型才能實現(xiàn)可持續(xù)發(fā)展。
- 數(shù)據(jù)服務(wù):數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、合成數(shù)據(jù)生成。
- MLOps:幫助企業(yè)高效地開發(fā)、部署、監(jiān)控和維護AI模型生命周期。
- 安全與合規(guī):
- 內(nèi)容安全:識別和過濾有害內(nèi)容。
- 模型對齊(Alignment):使模型行為符合人類價值觀和意圖。
- 審計與評估:對模型的性能、偏見、安全性進行第三方評估。
大模型產(chǎn)業(yè)鏈已形成“基礎(chǔ)資源-模型能力-場景滲透”的完整閉環(huán),2025年競爭焦點從參數(shù)規(guī)模轉(zhuǎn)向場景滲透率與推理成本控制。

四、市場前景
大模型市場發(fā)展前景廣闊,無論是全球企業(yè)在生成式人工智能領(lǐng)域的支出趨勢,還是國內(nèi)大模型解決方案市場規(guī)模的增長態(tài)勢,都展現(xiàn)出強勁的發(fā)展?jié)摿?。?jù) 2024 年C 預(yù)計,到2028年全球人工智能支出將實現(xiàn)翻倍增長,2024-2028年內(nèi)以29.0%的年均復(fù)合增長率(CAGR)攀升至 6320億美元。企業(yè)對生成式人工智能技術(shù)的重視程度不斷提高。據(jù)統(tǒng)計,國內(nèi)大模型解決方案市場規(guī)模持續(xù)上升,預(yù)計到 2028 年 AI大模型解決方案市場規(guī)模將達 211 億元,未來大模型解決方案將為企業(yè)數(shù)智化轉(zhuǎn)型注入新活力。
企業(yè)對大模型的應(yīng)用需求快速升溫,大模型在諸多行業(yè)逐漸落地應(yīng)用,形成了以頭部企業(yè)和頭部場景為引領(lǐng)的頭雁效應(yīng)。根據(jù)2024年公開的大模型中標(biāo)信息統(tǒng)計顯示,中標(biāo)項目數(shù)量和金額是2023年的十倍之多,且項目數(shù)量平均每月以 40%的速率增長。從采購方企業(yè)看,近六成為大型央國企,以運營商、金融和能源三大行業(yè)為主中標(biāo)項目金額超過總金額的一半。從場景分布看,高附加值場景更為集中,大模型應(yīng)用場景呈現(xiàn)微笑曲線分布,“兩端快、中間慢”特征明顯。在研發(fā)設(shè)計、營銷運營等高附加值場景率先發(fā)力,該類場景的應(yīng)用價值更加明確,可有效減少人力投入,實現(xiàn)降本增效,而中部的生產(chǎn)制造等低附加值場景因落地路徑不清晰、投入產(chǎn)出不明確等因素但這也恰恰是大模型落地應(yīng)用的藍海。

圖 / AI 應(yīng)用產(chǎn)業(yè)鏈分布圖
來源:中國信通院
五、競爭格局
全球 AI技術(shù)呈現(xiàn)多極化競爭態(tài)勢,美國、中國、歐洲等國家和地區(qū)通過大型模型研發(fā)與政策扶持爭奪主導(dǎo)權(quán)。如,美國企業(yè) OpenAI、谷歌和 xAI公司持續(xù)推出 GPT、Gemini及 Grok 等系列模型,提升多模態(tài)能力與計算效率;中國企業(yè)月之暗面的 Kimi、字節(jié)的豆包騰訊的混元以及阿里的通義系列等模型表現(xiàn)出顯著競爭力,尤其是深度求索公司 DeepSeek發(fā)布的開源模型以高性價比引發(fā)關(guān)注;法國 Mistral 公司推出高速生成的開源助手 Le Chat成為“歐洲之光”。與此同時,各國政策支持力度持續(xù)加大,如美國"星際之門"項目計劃投資5000 億美元建設(shè) AI基礎(chǔ)設(shè)施,歐盟則通過"投資人工智能"倡議調(diào)動 2000 億歐元推動超級工廠建設(shè)。
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




