- +1
AI之用②|從全能神筆到“一鍵生成”下丟失的人
我們小時(shí)候可能聽過這樣一個(gè)故事:
從前有個(gè)窮孩子。他非常喜歡畫畫,可是家里太窮,連一支筆都買不起。白天他幫人放牛,晚上就用樹枝在地上畫畫,用煤炭在墻上畫畫。他的畫非常像真的,但他一直沒法擁有一支真正的畫筆。
有一天夜里,他夢見一位白胡子老人送給他一支神奇的毛筆。醒來后,他發(fā)現(xiàn)那支筆真的在自己的床邊。從此,他畫什么,什么就會(huì)變成真的。他畫鳥,鳥就飛走;畫魚,魚就游走。他開始用這支神筆幫助村里窮苦的人們畫吃的、用的、農(nóng)具、耕牛。他從不為富人作畫。
消息傳到了一個(gè)貪婪的皇帝耳中?;实勖藖碜ニ?,逼他用神筆為自己畫金山銀山。窮孩子假意答應(yīng),卻用神筆畫了一座海島,把金山銀山畫在遠(yuǎn)遠(yuǎn)的島上?;实圩洗Z寶,他卻畫起了狂風(fēng)巨浪,巨浪把皇帝卷走了。
從此,他自由地四處流浪,用神筆幫助更多需要幫助的人。
神筆馬良創(chuàng)作于上個(gè)世紀(jì)50年代,它原本是一個(gè)帶有階級(jí)批判色彩的兒童故事,今天我們引用它,卻是為了談?wù)勥@個(gè)故事中技術(shù)和人的關(guān)系。
馬良是一個(gè)像達(dá)·芬奇一樣的畫家,因?yàn)椤八嬍裁炊枷裾娴摹保@是他與生俱來的本事,不因?yàn)椤皹渲Α?,或者“煤炭”等技術(shù)工具不同而發(fā)生改變。他具有斯蒂格勒所說的識(shí)做(“savoir - faire”,知道怎樣做事的知識(shí)),類似于種地,打獵,制作桌椅,這是一種通過實(shí)踐或勞動(dòng)而獲得的身體知識(shí)。馬良所擁有的是一種經(jīng)驗(yàn)的知識(shí),而不是形而上的、抽象的,關(guān)于知識(shí)的知識(shí)。此外,盡管畫鳥畫魚沒有什么實(shí)際用途,但我們依然可以想象,畫畫給馬良帶來了很大的快樂,否則,他就不會(huì)寢食俱廢地“白天放牛,晚上畫畫”。
而在馬良獲得了先進(jìn)的技術(shù)工具之后,神筆加持了他原本的能力,帶來令人炫目的結(jié)果。然而,使用超級(jí)技術(shù)的代價(jià),是讓他原本無目的的精神活動(dòng),變得必須要服務(wù)于“吃的,用的,農(nóng)具和耕?!钡葘?shí)際生活目標(biāo)。這些未必都是馬良喜歡的,然而,當(dāng)技術(shù)成為主導(dǎo)時(shí),馬良的主觀好惡,以及繪畫的精神性需要就變得毫不重要。就這樣,他從一個(gè)純粹的業(yè)余愛好者(amateur)變成了功利化的職業(yè)人士(professional)。此時(shí),他的新身份,新自我,已經(jīng)不由他說了算,而是由技術(shù)工具來定義和指導(dǎo)。對于馬良而言,似乎“是媒介技術(shù)決定了我們能說什么,能思考什么”。
同時(shí),技術(shù)在奪取了人的一部分主體性之后,要回過頭來修改歷史。最初,馬良只是想要一支普通畫筆,但他得到的卻是“在夢中由一位白胡子老人授予”的神筆,因?yàn)椤吧袷凇钡钠鹪春蜕裨挵愕拈_始,讓人更加無法質(zhì)疑這項(xiàng)技術(shù)的正當(dāng)性和合理性了。
再接下來,馬良使用神筆懲罰了貪婪的皇帝,技術(shù)不僅是強(qiáng)大的,還是善良的,是反抗暴政和階級(jí)壓迫的象征。這樣一來,技術(shù)不再是中性的,而是染上了道德和政治的色彩,是一種必須由正確的人掌握的“好”技術(shù)。
最后,馬良攜帶著這項(xiàng)“好”的技術(shù)繼續(xù)在大地上自由地流浪,幫助他想幫助的人。不過,我們盡可以想象,擁有這種超級(jí)技術(shù)的馬良,是不可能,也沒有辦法再次“自由地四處流浪”的。他可能會(huì)被覬覦技術(shù)的人殺死,被需索無度的人們利用,又或者再次被其他貪婪的皇帝所征召。
我們無意討論故事進(jìn)入現(xiàn)實(shí)主義后的展開。事實(shí)上,對于具備畫畫能力的人來說,“真正的畫筆”不僅是毫不重要的,更是不會(huì)存在的??扑估囱ㄖ挟嬕芭5娜丝梢杂米约旱氖种缸鳟?,德加用的是色粉筆,顧愷之用同時(shí)是寫字工具的毛筆,布魯蓋爾用碳粉或別的工具,孩子們更是用石塊,樹枝,沙子……一切可以用來留下痕跡的東西來 “畫畫”。他們都不像故事中的馬良那么需要所謂“真正的畫筆”。
為此,我們不禁要問,這個(gè)故事究竟是從誰的視角講述的?它最終又是關(guān)于誰的呢?我們不難發(fā)現(xiàn),故事的主角是神筆而不是馬良,是技術(shù)而不是人類,甚至連這個(gè)故事本身,也是神筆自己講給我們聽的。就像1956年的動(dòng)畫片的片名里就根本沒有馬良這個(gè)人,而就叫《神筆》。


在故事中,技術(shù)先將自己變成了一個(gè)被欲望的對象,賦予自己真理性(相對于它,樹枝和煤塊怎么能算畫筆呢?),然后,它為自己安排了一個(gè)神圣的起源(白胡子老爺爺),最后,它占據(jù)了一種鮮明的道德和政治立場(用畫筆懲惡揚(yáng)善,劫富濟(jì)貧),如此一來,馬良這個(gè)人類反倒成了被套上了轡頭的馬,再也無法擺脫它了。

20世紀(jì)以來,我們已然意識(shí)到,技術(shù)不僅積極構(gòu)建我們的環(huán)境,還塑造我們的感知和存在方式,甚至構(gòu)造話語,控制社會(huì),形成與社會(huì)的共構(gòu)。21世紀(jì)的AI,則毫無疑問在自動(dòng)化技術(shù)的程度上走得更為激進(jìn)和深遠(yuǎn)。為此,我們嘗試采納媒介考古(Media Archaeology)的視角,尋找在圖像自動(dòng)化生成這一領(lǐng)域的歷史幽靈,比較它們和今天的AI所處歷史條件的異同,然后我們才能嘗試著去認(rèn)識(shí),我們今天面對的AI圖像技術(shù)竟能何為?在這樣的條件下,我們又應(yīng)該如何去警惕和反思,去理解和創(chuàng)造。
如果我們把圖像自動(dòng)化技術(shù)想象成一個(gè)會(huì)畫畫的機(jī)器人,那它本就是一個(gè)古老的,文藝復(fù)興式的夢想,在啟蒙時(shí)代,它則代表了技術(shù)理性和模仿人類的機(jī)械的典范——就像馬丁·西科塞斯在《雨果》中所呈現(xiàn)的那樣,一個(gè)黃金般閃閃發(fā)亮的精巧偶像,由發(fā)條和齒輪構(gòu)成,一個(gè)蒸汽時(shí)代的“自我行動(dòng)之物”( Automaton,a self-moving being),滿足人們對能夠模擬人類精細(xì)行為(繪畫,唱歌,跳舞,作詩)的機(jī)器的全部期待。
然而,對于《雨果》中的機(jī)器人,我們連問都不會(huì)問一句,能夠畫畫和它是否具有自我意識(shí)之間能有什么聯(lián)系?就算它能畫出最細(xì)致,準(zhǔn)確的線條和最準(zhǔn)確的炮彈打在月亮臉上的圖像,這僅僅也是因?yàn)樗挥旯母赣H內(nèi)置了程序。當(dāng)小雨果和伊莎貝爾無意中激發(fā)了這個(gè)程序,它便自動(dòng)開啟了作畫過程。

因此,問題的關(guān)鍵并不在于機(jī)器人是否能夠畫畫,或能否畫得和人類一樣好,甚至比人類更好。而在于機(jī)器作畫的過程始終是一個(gè)程序化,自動(dòng)化的過程。從歷史上看,生成式圖像大規(guī)模出現(xiàn)的時(shí)代,也正是本雅明所說的那個(gè)“機(jī)械復(fù)制的時(shí)代”,那時(shí),世界上出現(xiàn)了一種我們已經(jīng)非常熟悉的現(xiàn)代圖像生成技術(shù):膠片攝影。
假如我們比較一下膠片攝影術(shù)和AI生圖的步驟和概念,就會(huì)驚訝地發(fā)現(xiàn)它們是何其相似。
比如,在傳統(tǒng)攝影中,一張空白的底片也被叫作潛影,一種等待被召喚出來的圖像形式,意味著不包含任何信息的“空”,反過來看,在擴(kuò)散模型(stable diffusion,下稱SD)中,圖像的顯現(xiàn)則依賴于潛空間 (Latent space,壓縮圖像特征的向量空間) 的“滿”。 所謂包含一切亦意味著一切都不顯現(xiàn),這兩者在信息層面可以被看作是等價(jià)的。在化學(xué)過程中,我們通過控制進(jìn)光量,在空白底片上加載信息得到圖像;而在SD中,潛空間則需要通過clip的指示,在充滿噪聲的潛空間內(nèi)“去噪”得到圖像。在化學(xué)攝影中,最終還要通過化學(xué)解碼的方式,將圖像在相紙上顯影出來;在SD中,也要通過VAE解碼器來再次將抽象的計(jì)算機(jī)語言向圖像文件還原。兩者都可以看作是從全然混亂的高熵走向穩(wěn)定的,高可讀性的,結(jié)構(gòu)化的低熵圖像的過程。

在這里,“曝光”這一和真實(shí)世界關(guān)聯(lián)的概念對計(jì)算機(jī)沒有任何意義。我們完全可以把一張圖片的“去噪”算法過程,關(guān)聯(lián)為化學(xué)底片的“顯影”,假如你觀察過MidJourney(下稱MJ)或SD生圖時(shí)算法逐漸由模糊轉(zhuǎn)向清晰的過程,可能會(huì)對此更有感觸,連SD所創(chuàng)建的基礎(chǔ)工作流(workflow),都多少和傳統(tǒng)的暗房流程有不少相似之處。
然而,這絕不意味著,AI生圖是攝影技術(shù)迭代后的產(chǎn)物。之所以進(jìn)行這樣的比較,是為了考察攝影術(shù)這一最早的自動(dòng)化圖像技術(shù)出現(xiàn)時(shí)的歷史條件與當(dāng)下時(shí)代的相似之處,以及它的歷史內(nèi)涵,及其造成的全部結(jié)果。
我們看到,最早作為畫家輔助工具而開啟的“暗箱”(camera obsura)已經(jīng)可以被看作是一部內(nèi)生的照相機(jī),到了1839年8月19日,法國科學(xué)院和研究院正式公布達(dá)蓋爾銀版法照相技術(shù)(Daguerreotype),并將之稱為“來自法國的,贈(zèng)予全人類的禮物”。伴隨著照相機(jī)誕生的,還有英法德的國家級(jí)鐵路網(wǎng),以及鐵與玻璃的建筑技術(shù),這些全面化的現(xiàn)代技術(shù)以光和電的形態(tài),速度,以非常侵略性的姿態(tài),極為迅速,毫不留情地終結(jié)了傳統(tǒng)的一切。正如攝影術(shù)終結(jié)了繪畫的歷程,剝奪了繪畫作為知識(shí)性存在的價(jià)值,迫使藝術(shù)史發(fā)生了最為深刻的現(xiàn)代化轉(zhuǎn)向,然而這一切所依靠的,正是程序化和自動(dòng)化這兩樣?xùn)|西。
或許不是計(jì)算機(jī)像相機(jī),而是相機(jī)本身就是計(jì)算機(jī)。列夫·馬諾維奇在他那本《新媒體的語言》中,曾經(jīng)詳述過現(xiàn)代媒體和計(jì)算機(jī)的歷史是如何發(fā)端于同一歷史時(shí)期,最終又如何經(jīng)歷半個(gè)多世紀(jì)相遇融合。從此,計(jì)算機(jī)不僅僅是一臺(tái)“計(jì)算”機(jī)器,它還成為了一臺(tái)媒體機(jī)器。這就是新媒體的起源。
照相機(jī)其實(shí)就是一部讓“人人都可以繪畫”的計(jì)算機(jī)。傳統(tǒng)畫師經(jīng)年累月訓(xùn)練的能力并沒有在一瞬間被攝影技術(shù)的偉力所摧毀,但已經(jīng)變得毫不重要。本雅明所說的“靈光”(aura)的消失,不正是從柯達(dá)公司的廣告詞開始的嗎?——“你所需要做的,就是按下快門”“You press the button, we do the rest.”。這句話給予普羅大眾一個(gè)美妙的承諾:人人都可以成為專業(yè)級(jí)別的圖像生產(chǎn)者。只不過,它的前提是不斷地封裝程序化人們“識(shí)做 (savoir-faire)”的能力,并將其推入生產(chǎn),流通在資本主義鏈條中,為欲望經(jīng)濟(jì)提供源源不斷的圖像動(dòng)力。
且放下攝影是否是一門藝術(shù)的爭論,我們看到在21世紀(jì),攝影會(huì)異化成為這樣的事件:在杭州曲院荷風(fēng)的一處月亮橋,成千上萬的人,愿意在凌晨四五點(diǎn),趕火車坐飛機(jī)地到這里來,為了在日出穿過橋洞的時(shí)候,拍到一張“金光穿洞”的風(fēng)景照片。為了滿足“出片”的需要,快到那個(gè)最完美時(shí)刻的時(shí)候,就有人舉起喇叭,對著手持相機(jī)的人們發(fā)出統(tǒng)一的號(hào)令,光圈,ISO,快門的參數(shù),三,二,一,一起按下快門。

咔嚓。人人都可以畫出最美麗的風(fēng)景畫。而代價(jià)是什么呢?獨(dú)特性消失了,正如通過AI作圖,使用同樣的prompt, 給予同樣的參數(shù)設(shè)定(在MJ中被總結(jié)為幾個(gè)—refs 風(fēng)格代碼),無論是誰,都能毫無困難地復(fù)原出和原圖一模一樣的作品。
我們變得不需要了解圖像具體的生產(chǎn)機(jī)制,也不需要獲取和任何媒材打交道的知識(shí),僅僅通過預(yù)留的少量接口,就能輕易地跨過個(gè)人經(jīng)驗(yàn)的護(hù)城河。在今天,代替相機(jī)的ISO, Shutter和IRIS的恰是Prompt框,畫幅比,和幾個(gè)少量的變量調(diào)節(jié)滑塊。
何況,AI和照相機(jī)有著更加根本性的不同, AI(大公司們)無一例外都具有更為強(qiáng)烈的驅(qū)力和侵入性。它所欲望的,是封裝打包人類所有的經(jīng)驗(yàn),知識(shí)和技能,是承諾將一切都標(biāo)準(zhǔn)化,程序化和自動(dòng)化,并以一種前所未有的福特主義通過標(biāo)準(zhǔn)流程分發(fā)給所有人,將其表述為技術(shù)賦權(quán)。在今天,我們可以輕易地把“專業(yè)圖像生產(chǎn)者” 換成導(dǎo)演,攝影師,設(shè)計(jì)師,作曲家,詩人,小說家。代替傻瓜相機(jī)按鈕的,是今天“一鍵生成”所有。我們每多體會(huì)一次機(jī)械按鍵的快感,每多享受一次電子封裝帶來的便捷,我們就更加將自己托管給機(jī)器一些,就更加依賴這個(gè)中介化的環(huán)境。事實(shí)上,GPT-4o的omin一詞就毫不掩飾它自己這種全能的野心。假如這種全能技術(shù)的幻想最終成為現(xiàn)實(shí),那我們所面臨的,恐怕就是完全喪失不使用它的權(quán)利,而只有必須使用它的義務(wù)了。
特別是,當(dāng)我們下意識(shí)地使用“AI繪畫”來表述AI生圖,似乎已經(jīng)承認(rèn)了AI是具有自生意識(shí)的創(chuàng)作者, 就像在《底特律·變?nèi)恕分?,機(jī)器人馬庫斯的父親所犯的錯(cuò)誤——這位笛卡爾式的人類老父,試圖通過指導(dǎo)他的機(jī)器人畫自畫像來獲得“成為人類”的啟蒙。然而,我們常常忘記,沒有靈魂的技術(shù)本身就是一種誘惑和召喚。與其說,是人們在拍照,不如說,是照相機(jī)需要人們在那里為它按下快門。與其說,是人們通過AI來創(chuàng)作,不如說,是AI需要人們?nèi)ジ嗟厥褂盟?/p>
所以,回到神筆馬良的故事里,在經(jīng)歷了漫長的現(xiàn)代技術(shù)的浸染之后,我們是否還要不假思索地相信這個(gè)關(guān)于“神筆”的技術(shù)神話?我們是否要相信,AI在我們今天的社會(huì)和生活里,就應(yīng)該是不可或缺,人人渴望的對象?具有能夠作曲,寫詩,繪畫諸種神奇能力,和神話般的起源?我們是否還堅(jiān)持,只要由正確的人用于正確的目的,AI就一定是能夠帶來福祉的,中性客觀的“好”技術(shù)?
對于AI最普遍的擔(dān)憂,往往會(huì)被引入到AI會(huì)造成大規(guī)模失業(yè)的討論上,這是科幻小說的題材,也是最容易滑入的討論陷阱。然而,“人能夠被替代”本身就是一種資本主義式的思考方式,我們需要小心這個(gè)討論預(yù)設(shè)的前提,不能夠不假思索地接受這樣的條件。
技術(shù)的向上進(jìn)步,同時(shí)帶來的是不間斷的生命下墜,這也迫使我們不能夠再停留在舊有的框架內(nèi),僅僅去注意AI和人類能力的替換問題。我們必須重新認(rèn)識(shí)在科技神話掩飾下的資源掠奪,注意力剝削和主體性喪失等問題。在此前提下,我們需要重新為自己工作,在一個(gè)被過度中介化的世界里,在一個(gè)大力鼓吹全能技術(shù)的地方,開拓出新的知識(shí),新的方法,以個(gè)人技術(shù)為出發(fā)點(diǎn),尋找新的與技術(shù)相關(guān)的共存之道。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司