AI之用②｜從全能神筆到“一鍵生成”下丟失的人

競菲 Jingfei Li

2025-08-14 10:59

來源：澎湃新聞

? 思想市場 >

我們小時(shí)候可能聽過這樣一個(gè)故事：

從前有個(gè)窮孩子。他非常喜歡畫畫，可是家里太窮，連一支筆都買不起。白天他幫人放牛，晚上就用樹枝在地上畫畫，用煤炭在墻上畫畫。他的畫非常像真的，但他一直沒法擁有一支真正的畫筆。

有一天夜里，他夢見一位白胡子老人送給他一支神奇的毛筆。醒來后，他發(fā)現(xiàn)那支筆真的在自己的床邊。從此，他畫什么，什么就會(huì)變成真的。他畫鳥，鳥就飛走；畫魚，魚就游走。他開始用這支神筆幫助村里窮苦的人們畫吃的、用的、農(nóng)具、耕牛。他從不為富人作畫。

消息傳到了一個(gè)貪婪的皇帝耳中?；实勖藖碜ニ?，逼他用神筆為自己畫金山銀山。窮孩子假意答應(yīng)，卻用神筆畫了一座海島，把金山銀山畫在遠(yuǎn)遠(yuǎn)的島上?；实圩洗Z寶，他卻畫起了狂風(fēng)巨浪，巨浪把皇帝卷走了。

從此，他自由地四處流浪，用神筆幫助更多需要幫助的人。

神筆馬良創(chuàng)作于上個(gè)世紀(jì)50年代，它原本是一個(gè)帶有階級(jí)批判色彩的兒童故事，今天我們引用它，卻是為了談?wù)勥@個(gè)故事中技術(shù)和人的關(guān)系。

馬良是一個(gè)像達(dá)·芬奇一樣的畫家，因?yàn)椤八嬍裁炊枷裾娴摹保@是他與生俱來的本事，不因?yàn)椤皹渲Α?，或者“煤炭”等技術(shù)工具不同而發(fā)生改變。他具有斯蒂格勒所說的識(shí)做（“savoir - faire”，知道怎樣做事的知識(shí)），類似于種地，打獵，制作桌椅，這是一種通過實(shí)踐或勞動(dòng)而獲得的身體知識(shí)。馬良所擁有的是一種經(jīng)驗(yàn)的知識(shí)，而不是形而上的、抽象的，關(guān)于知識(shí)的知識(shí)。此外，盡管畫鳥畫魚沒有什么實(shí)際用途，但我們依然可以想象，畫畫給馬良帶來了很大的快樂，否則，他就不會(huì)寢食俱廢地“白天放牛，晚上畫畫”。

而在馬良獲得了先進(jìn)的技術(shù)工具之后，神筆加持了他原本的能力，帶來令人炫目的結(jié)果。然而，使用超級(jí)技術(shù)的代價(jià)，是讓他原本無目的的精神活動(dòng)，變得必須要服務(wù)于“吃的，用的，農(nóng)具和耕?！钡葘?shí)際生活目標(biāo)。這些未必都是馬良喜歡的，然而，當(dāng)技術(shù)成為主導(dǎo)時(shí)，馬良的主觀好惡，以及繪畫的精神性需要就變得毫不重要。就這樣，他從一個(gè)純粹的業(yè)余愛好者（amateur）變成了功利化的職業(yè)人士（professional）。此時(shí)，他的新身份，新自我，已經(jīng)不由他說了算，而是由技術(shù)工具來定義和指導(dǎo)。對于馬良而言，似乎“是媒介技術(shù)決定了我們能說什么，能思考什么”。

同時(shí)，技術(shù)在奪取了人的一部分主體性之后，要回過頭來修改歷史。最初，馬良只是想要一支普通畫筆，但他得到的卻是“在夢中由一位白胡子老人授予”的神筆，因?yàn)椤吧袷凇钡钠鹪春蜕裨挵愕拈_始，讓人更加無法質(zhì)疑這項(xiàng)技術(shù)的正當(dāng)性和合理性了。

再接下來，馬良使用神筆懲罰了貪婪的皇帝，技術(shù)不僅是強(qiáng)大的，還是善良的，是反抗暴政和階級(jí)壓迫的象征。這樣一來，技術(shù)不再是中性的，而是染上了道德和政治的色彩，是一種必須由正確的人掌握的“好”技術(shù)。

最后，馬良攜帶著這項(xiàng)“好”的技術(shù)繼續(xù)在大地上自由地流浪，幫助他想幫助的人。不過，我們盡可以想象，擁有這種超級(jí)技術(shù)的馬良，是不可能，也沒有辦法再次“自由地四處流浪”的。他可能會(huì)被覬覦技術(shù)的人殺死，被需索無度的人們利用，又或者再次被其他貪婪的皇帝所征召。

我們無意討論故事進(jìn)入現(xiàn)實(shí)主義后的展開。事實(shí)上，對于具備畫畫能力的人來說，“真正的畫筆”不僅是毫不重要的，更是不會(huì)存在的?？扑估囱ㄖ挟嬕芭５娜丝梢杂米约旱氖种缸鳟?，德加用的是色粉筆，顧愷之用同時(shí)是寫字工具的毛筆，布魯蓋爾用碳粉或別的工具，孩子們更是用石塊，樹枝，沙子……一切可以用來留下痕跡的東西來 “畫畫”。他們都不像故事中的馬良那么需要所謂“真正的畫筆”。

為此，我們不禁要問，這個(gè)故事究竟是從誰的視角講述的？它最終又是關(guān)于誰的呢？我們不難發(fā)現(xiàn)，故事的主角是神筆而不是馬良，是技術(shù)而不是人類，甚至連這個(gè)故事本身，也是神筆自己講給我們聽的。就像1956年的動(dòng)畫片的片名里就根本沒有馬良這個(gè)人，而就叫《神筆》。

在故事中，技術(shù)先將自己變成了一個(gè)被欲望的對象，賦予自己真理性（相對于它，樹枝和煤塊怎么能算畫筆呢？），然后，它為自己安排了一個(gè)神圣的起源（白胡子老爺爺），最后，它占據(jù)了一種鮮明的道德和政治立場（用畫筆懲惡揚(yáng)善，劫富濟(jì)貧），如此一來，馬良這個(gè)人類反倒成了被套上了轡頭的馬，再也無法擺脫它了。

20世紀(jì)以來，我們已然意識(shí)到，技術(shù)不僅積極構(gòu)建我們的環(huán)境，還塑造我們的感知和存在方式，甚至構(gòu)造話語，控制社會(huì)，形成與社會(huì)的共構(gòu)。21世紀(jì)的AI，則毫無疑問在自動(dòng)化技術(shù)的程度上走得更為激進(jìn)和深遠(yuǎn)。為此，我們嘗試采納媒介考古（Media Archaeology）的視角，尋找在圖像自動(dòng)化生成這一領(lǐng)域的歷史幽靈，比較它們和今天的AI所處歷史條件的異同，然后我們才能嘗試著去認(rèn)識(shí)，我們今天面對的AI圖像技術(shù)竟能何為？在這樣的條件下，我們又應(yīng)該如何去警惕和反思，去理解和創(chuàng)造。

如果我們把圖像自動(dòng)化技術(shù)想象成一個(gè)會(huì)畫畫的機(jī)器人，那它本就是一個(gè)古老的，文藝復(fù)興式的夢想，在啟蒙時(shí)代，它則代表了技術(shù)理性和模仿人類的機(jī)械的典范——就像馬丁·西科塞斯在《雨果》中所呈現(xiàn)的那樣，一個(gè)黃金般閃閃發(fā)亮的精巧偶像，由發(fā)條和齒輪構(gòu)成，一個(gè)蒸汽時(shí)代的“自我行動(dòng)之物”（ Automaton，a self-moving being），滿足人們對能夠模擬人類精細(xì)行為（繪畫，唱歌，跳舞，作詩）的機(jī)器的全部期待。

然而，對于《雨果》中的機(jī)器人，我們連問都不會(huì)問一句，能夠畫畫和它是否具有自我意識(shí)之間能有什么聯(lián)系？就算它能畫出最細(xì)致，準(zhǔn)確的線條和最準(zhǔn)確的炮彈打在月亮臉上的圖像，這僅僅也是因?yàn)樗挥旯母赣H內(nèi)置了程序。當(dāng)小雨果和伊莎貝爾無意中激發(fā)了這個(gè)程序，它便自動(dòng)開啟了作畫過程。

因此，問題的關(guān)鍵并不在于機(jī)器人是否能夠畫畫，或能否畫得和人類一樣好，甚至比人類更好。而在于機(jī)器作畫的過程始終是一個(gè)程序化，自動(dòng)化的過程。從歷史上看，生成式圖像大規(guī)模出現(xiàn)的時(shí)代，也正是本雅明所說的那個(gè)“機(jī)械復(fù)制的時(shí)代”，那時(shí)，世界上出現(xiàn)了一種我們已經(jīng)非常熟悉的現(xiàn)代圖像生成技術(shù)：膠片攝影。

假如我們比較一下膠片攝影術(shù)和AI生圖的步驟和概念，就會(huì)驚訝地發(fā)現(xiàn)它們是何其相似。

比如，在傳統(tǒng)攝影中，一張空白的底片也被叫作潛影，一種等待被召喚出來的圖像形式，意味著不包含任何信息的“空”，反過來看，在擴(kuò)散模型（stable diffusion，下稱SD）中，圖像的顯現(xiàn)則依賴于潛空間 (Latent space，壓縮圖像特征的向量空間) 的“滿”。所謂包含一切亦意味著一切都不顯現(xiàn)，這兩者在信息層面可以被看作是等價(jià)的。在化學(xué)過程中，我們通過控制進(jìn)光量，在空白底片上加載信息得到圖像；而在SD中，潛空間則需要通過clip的指示，在充滿噪聲的潛空間內(nèi)“去噪”得到圖像。在化學(xué)攝影中，最終還要通過化學(xué)解碼的方式，將圖像在相紙上顯影出來；在SD中，也要通過VAE解碼器來再次將抽象的計(jì)算機(jī)語言向圖像文件還原。兩者都可以看作是從全然混亂的高熵走向穩(wěn)定的，高可讀性的，結(jié)構(gòu)化的低熵圖像的過程。

在這里，“曝光”這一和真實(shí)世界關(guān)聯(lián)的概念對計(jì)算機(jī)沒有任何意義。我們完全可以把一張圖片的“去噪”算法過程，關(guān)聯(lián)為化學(xué)底片的“顯影”，假如你觀察過MidJourney（下稱MJ）或SD生圖時(shí)算法逐漸由模糊轉(zhuǎn)向清晰的過程，可能會(huì)對此更有感觸，連SD所創(chuàng)建的基礎(chǔ)工作流（workflow），都多少和傳統(tǒng)的暗房流程有不少相似之處。

然而，這絕不意味著，AI生圖是攝影技術(shù)迭代后的產(chǎn)物。之所以進(jìn)行這樣的比較，是為了考察攝影術(shù)這一最早的自動(dòng)化圖像技術(shù)出現(xiàn)時(shí)的歷史條件與當(dāng)下時(shí)代的相似之處，以及它的歷史內(nèi)涵，及其造成的全部結(jié)果。

我們看到，最早作為畫家輔助工具而開啟的“暗箱”（camera obsura）已經(jīng)可以被看作是一部內(nèi)生的照相機(jī)，到了1839年8月19日，法國科學(xué)院和研究院正式公布達(dá)蓋爾銀版法照相技術(shù)（Daguerreotype），并將之稱為“來自法國的，贈(zèng)予全人類的禮物”。伴隨著照相機(jī)誕生的，還有英法德的國家級(jí)鐵路網(wǎng)，以及鐵與玻璃的建筑技術(shù)，這些全面化的現(xiàn)代技術(shù)以光和電的形態(tài)，速度，以非常侵略性的姿態(tài)，極為迅速，毫不留情地終結(jié)了傳統(tǒng)的一切。正如攝影術(shù)終結(jié)了繪畫的歷程，剝奪了繪畫作為知識(shí)性存在的價(jià)值，迫使藝術(shù)史發(fā)生了最為深刻的現(xiàn)代化轉(zhuǎn)向，然而這一切所依靠的，正是程序化和自動(dòng)化這兩樣?xùn)|西。

或許不是計(jì)算機(jī)像相機(jī)，而是相機(jī)本身就是計(jì)算機(jī)。列夫·馬諾維奇在他那本《新媒體的語言》中，曾經(jīng)詳述過現(xiàn)代媒體和計(jì)算機(jī)的歷史是如何發(fā)端于同一歷史時(shí)期，最終又如何經(jīng)歷半個(gè)多世紀(jì)相遇融合。從此，計(jì)算機(jī)不僅僅是一臺(tái)“計(jì)算”機(jī)器，它還成為了一臺(tái)媒體機(jī)器。這就是新媒體的起源。

照相機(jī)其實(shí)就是一部讓“人人都可以繪畫”的計(jì)算機(jī)。傳統(tǒng)畫師經(jīng)年累月訓(xùn)練的能力并沒有在一瞬間被攝影技術(shù)的偉力所摧毀，但已經(jīng)變得毫不重要。本雅明所說的“靈光”（aura）的消失，不正是從柯達(dá)公司的廣告詞開始的嗎？——“你所需要做的，就是按下快門”“You press the button, we do the rest.”。這句話給予普羅大眾一個(gè)美妙的承諾：人人都可以成為專業(yè)級(jí)別的圖像生產(chǎn)者。只不過，它的前提是不斷地封裝程序化人們“識(shí)做（savoir-faire）”的能力，并將其推入生產(chǎn)，流通在資本主義鏈條中，為欲望經(jīng)濟(jì)提供源源不斷的圖像動(dòng)力。

且放下攝影是否是一門藝術(shù)的爭論，我們看到在21世紀(jì)，攝影會(huì)異化成為這樣的事件：在杭州曲院荷風(fēng)的一處月亮橋，成千上萬的人，愿意在凌晨四五點(diǎn)，趕火車坐飛機(jī)地到這里來，為了在日出穿過橋洞的時(shí)候，拍到一張“金光穿洞”的風(fēng)景照片。為了滿足“出片”的需要，快到那個(gè)最完美時(shí)刻的時(shí)候，就有人舉起喇叭，對著手持相機(jī)的人們發(fā)出統(tǒng)一的號(hào)令，光圈，ISO，快門的參數(shù)，三，二，一，一起按下快門。

咔嚓。人人都可以畫出最美麗的風(fēng)景畫。而代價(jià)是什么呢？獨(dú)特性消失了，正如通過AI作圖，使用同樣的prompt, 給予同樣的參數(shù)設(shè)定（在MJ中被總結(jié)為幾個(gè)—refs 風(fēng)格代碼），無論是誰，都能毫無困難地復(fù)原出和原圖一模一樣的作品。

我們變得不需要了解圖像具體的生產(chǎn)機(jī)制，也不需要獲取和任何媒材打交道的知識(shí)，僅僅通過預(yù)留的少量接口，就能輕易地跨過個(gè)人經(jīng)驗(yàn)的護(hù)城河。在今天，代替相機(jī)的ISO, Shutter和IRIS的恰是Prompt框，畫幅比，和幾個(gè)少量的變量調(diào)節(jié)滑塊。

何況，AI和照相機(jī)有著更加根本性的不同， AI（大公司們）無一例外都具有更為強(qiáng)烈的驅(qū)力和侵入性。它所欲望的，是封裝打包人類所有的經(jīng)驗(yàn)，知識(shí)和技能，是承諾將一切都標(biāo)準(zhǔn)化，程序化和自動(dòng)化，并以一種前所未有的福特主義通過標(biāo)準(zhǔn)流程分發(fā)給所有人，將其表述為技術(shù)賦權(quán)。在今天，我們可以輕易地把“專業(yè)圖像生產(chǎn)者” 換成導(dǎo)演，攝影師，設(shè)計(jì)師，作曲家，詩人，小說家。代替傻瓜相機(jī)按鈕的，是今天“一鍵生成”所有。我們每多體會(huì)一次機(jī)械按鍵的快感，每多享受一次電子封裝帶來的便捷，我們就更加將自己托管給機(jī)器一些，就更加依賴這個(gè)中介化的環(huán)境。事實(shí)上，GPT-4o的omin一詞就毫不掩飾它自己這種全能的野心。假如這種全能技術(shù)的幻想最終成為現(xiàn)實(shí)，那我們所面臨的，恐怕就是完全喪失不使用它的權(quán)利，而只有必須使用它的義務(wù)了。

特別是，當(dāng)我們下意識(shí)地使用“AI繪畫”來表述AI生圖，似乎已經(jīng)承認(rèn)了AI是具有自生意識(shí)的創(chuàng)作者，就像在《底特律·變?nèi)恕分?，機(jī)器人馬庫斯的父親所犯的錯(cuò)誤——這位笛卡爾式的人類老父，試圖通過指導(dǎo)他的機(jī)器人畫自畫像來獲得“成為人類”的啟蒙。然而，我們常常忘記，沒有靈魂的技術(shù)本身就是一種誘惑和召喚。與其說，是人們在拍照，不如說，是照相機(jī)需要人們在那里為它按下快門。與其說，是人們通過AI來創(chuàng)作，不如說，是AI需要人們?nèi)ジ嗟厥褂盟?/p>

所以，回到神筆馬良的故事里，在經(jīng)歷了漫長的現(xiàn)代技術(shù)的浸染之后，我們是否還要不假思索地相信這個(gè)關(guān)于“神筆”的技術(shù)神話？我們是否要相信，AI在我們今天的社會(huì)和生活里，就應(yīng)該是不可或缺，人人渴望的對象？具有能夠作曲，寫詩，繪畫諸種神奇能力，和神話般的起源？我們是否還堅(jiān)持，只要由正確的人用于正確的目的，AI就一定是能夠帶來福祉的，中性客觀的“好”技術(shù)？

對于AI最普遍的擔(dān)憂，往往會(huì)被引入到AI會(huì)造成大規(guī)模失業(yè)的討論上，這是科幻小說的題材，也是最容易滑入的討論陷阱。然而，“人能夠被替代”本身就是一種資本主義式的思考方式，我們需要小心這個(gè)討論預(yù)設(shè)的前提，不能夠不假思索地接受這樣的條件。

技術(shù)的向上進(jìn)步，同時(shí)帶來的是不間斷的生命下墜，這也迫使我們不能夠再停留在舊有的框架內(nèi)，僅僅去注意AI和人類能力的替換問題。我們必須重新認(rèn)識(shí)在科技神話掩飾下的資源掠奪，注意力剝削和主體性喪失等問題。在此前提下，我們需要重新為自己工作，在一個(gè)被過度中介化的世界里，在一個(gè)大力鼓吹全能技術(shù)的地方，開拓出新的知識(shí)，新的方法，以個(gè)人技術(shù)為出發(fā)點(diǎn)，尋找新的與技術(shù)相關(guān)的共存之道。

責(zé)任編輯：龔思量

圖片編輯：張穎

校對：張艷

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#神筆馬良 #技術(shù)#AI圖像生成