下載客戶端

登錄

訓(xùn)練AI的文科生

澎湃新聞?dòng)浾?袁璐實(shí)習(xí)生盧天好編輯黃霽潔

2025-07-10 09:03

來源：澎湃新聞

入職一家互聯(lián)網(wǎng)公司從事AI訓(xùn)練后，26歲的雨薇發(fā)現(xiàn)，除了她自己是藝術(shù)專業(yè)，身邊有不少讀文科的同事。他們從不同的學(xué)科背景出發(fā)，訓(xùn)練和教會(huì)AI更像人一樣去思考和回答問題。

最近，一個(gè)新的崗位出現(xiàn)在雨薇的視野中——AI人文素養(yǎng)訓(xùn)練師。有公司在招聘啟事中寫道：在追求AI模型在技術(shù)上的有用性基礎(chǔ)上賦予AI溫暖與詩意，注入靈魂，讓AI能夠?yàn)槭澜绾腿祟悗砻篮谩９ぷ髀氊?zé)是AI的文學(xué)與藝術(shù)表達(dá)訓(xùn)練，調(diào)教AI的語言風(fēng)格，確保AI的語言兼具藝術(shù)美感與邏輯嚴(yán)謹(jǐn)，讓它從冷冰冰的工具轉(zhuǎn)變?yōu)槎脙A聽和理解你心情的溫柔伙伴。

此外，任職資格需要文理兼修，曾受過心理學(xué)、哲學(xué)、文學(xué)、歷史、藝術(shù)等方向的專業(yè)訓(xùn)練，有頂級(jí)的文科素養(yǎng)等。

早在三年前左右，雨薇便接觸到AI訓(xùn)練的工作。她需要做的，是讓AI明白什么是美。她逐漸感覺到，教會(huì)AI后，人類的獨(dú)創(chuàng)性也不會(huì)被削弱，它們是兩條平行線。

如今，隨著AI越來越深入每個(gè)人的生活，人們?cè)噲D尋找與AI的共處之道。我們找到了三位訓(xùn)練AI、試圖讓AI“更像人”的從業(yè)者，他們?cè)厴I(yè)于看似與AI無關(guān)的專業(yè)：藝術(shù)、歷史、哲學(xué)。實(shí)習(xí)或工作中，他們將所學(xué)運(yùn)用到AI行業(yè)里，從事AI寫真訓(xùn)練師、模型測(cè)試分析師和產(chǎn)品經(jīng)理等工作。他們投入AI浪潮，試圖找到自己的位置，同時(shí)也重新思考專業(yè)的意義，以及AI在人類生活中的角色。

本文圖片視覺中國

【以下是他們的口述：】

現(xiàn)在的大模型，很多其實(shí)是諂媚的

萬玉磊 29歲歷史學(xué)

我本科是在大連海事大學(xué)讀的航海技術(shù)。后來實(shí)習(xí)，我出過海，干的船員的工作，一年有十個(gè)月都在海上，沒有網(wǎng)，跟我理想中的情況不一樣。所以最后我做了決定，不能就那樣在海上漂著。

我回來考了研，研究生念的是西北大學(xué)歷史系的中國史。我很喜歡文史哲，在全國各地跑了很多考古工地。田野調(diào)查很有趣，是人生非常寶貴的經(jīng)歷。我還記得當(dāng)時(shí)我們是找歷史上一個(gè)游牧民族的蹤跡，是在草原上，大家住在牧民的帳篷里，那個(gè)時(shí)候夜晚的星空也很美，隊(duì)員聚在一塊聊天。

其實(shí)歷史跟人工智能有點(diǎn)像。研究生階段我一直在建立自己那篇大論文的史料庫，收集足夠多可信的史料，然后再去做推斷，完成論文。有幾分材料就說幾分話。人工智能也一樣，有多少的數(shù)據(jù)，就有多少的智能。數(shù)據(jù)越好，模型的質(zhì)量就越高，內(nèi)容輸出就越可靠。所以我覺得殊途同歸，無論文科還是理科，最后都合到一塊了。

不管是過去還是現(xiàn)在，我對(duì)文科都懷著熱情去努力和投入過。但是我不想一輩子跟史料打交道，如果就業(yè)，我也不想當(dāng)老師，所以當(dāng)時(shí)我直接到北京的互聯(lián)網(wǎng)大廠實(shí)習(xí)，還想著要在互聯(lián)網(wǎng)圈子賺大錢。

畢業(yè)后我找了互聯(lián)網(wǎng)相關(guān)的工作，剛好趕上ChatGPT爆發(fā)，然后我就決定不干移動(dòng)互聯(lián)網(wǎng)了，我要干AI。

我很早就知道GPT，也一直在關(guān)注著。因?yàn)槲冶究剖抢砉た疲瑫?huì)一點(diǎn)編程，也學(xué)高數(shù)，對(duì)算法也感興趣。

大家都不怎么知道AI的時(shí)候，我就用上了ChatGPT3.5。第一感受這個(gè)東西太厲害了，它完全顛覆了我對(duì)世界的認(rèn)知和想象。

那個(gè)時(shí)候Prompt工程師很火。我是以Prompt工程師的身份入局的，我自學(xué)了一堆東西。Prompt是提示詞，就是給AI模型的“指令”或“輸入文本”。OpenAI官方有Prompt的課程，我把課程看了，大概就知道要怎么寫。要足夠的結(jié)構(gòu)化，有很多Prompt的技巧。

比如說對(duì)AI的情緒勒索，你加一句，“拜托了，這真的對(duì)我很重要”，AI輸出的效果就能提升幾個(gè)點(diǎn)。或者說“我會(huì)給你小費(fèi)的”，AI輸出的質(zhì)量就會(huì)更高。還有早期最著名的一句話，“請(qǐng)你一步步思考，think step by step”，也能提升AI模型的輸出效果。

可能同樣的一條數(shù)據(jù)，一個(gè)有語氣詞，一個(gè)沒有，但是有語氣詞的那個(gè)回答是更好的。所以模型是學(xué)到了這方面的相關(guān)性。

你可以理解為，你要用自然語言去跟它交互。你的Prompt寫得越好，它的輸出就越好。然后我就去找工作，最后也找到了，現(xiàn)在在一家AI大模型公司。

現(xiàn)在大模型訓(xùn)練會(huì)分為兩個(gè)階段，預(yù)訓(xùn)練和后訓(xùn)練。前者是給模型做無監(jiān)督學(xué)習(xí)，它學(xué)習(xí)到的數(shù)據(jù)是沒有人類標(biāo)注的標(biāo)準(zhǔn)答案。

我做的是模型后訓(xùn)練的人類問答數(shù)據(jù)集，簡(jiǎn)單理解就是在做強(qiáng)化學(xué)習(xí)。預(yù)訓(xùn)練階段是讓它讀各種各樣的書，強(qiáng)化學(xué)習(xí)階段我會(huì)給它題和答案，它通過進(jìn)一步的學(xué)習(xí)，就學(xué)會(huì)了如何跟人類說話。

模型剛剛預(yù)訓(xùn)練出來的時(shí)候，你輸入一個(gè)東西，它不知道怎么回復(fù)你，也不知道什么時(shí)候停止。后訓(xùn)練階段你就要收集大量的數(shù)據(jù)。這些數(shù)據(jù)是什么？其實(shí)是人類文本的問答，都是一問一答的形式。

模型發(fā)布出來，給全世界的人使用，你沒法預(yù)測(cè)人會(huì)問這個(gè)模型什么問題，所以只能設(shè)置一個(gè)大概的數(shù)據(jù)集，可能涉及的各種問題。我還要評(píng)估模型的回答夠不夠全面，回答是不是禮貌，文字是長(zhǎng)是短，語言風(fēng)格等等，這是很考驗(yàn)?zāi)Ｐ偷娜宋乃仞B(yǎng)的。

有時(shí)候，要向模型傳達(dá)非常抽象和困難的概念，我的數(shù)據(jù)集必須足夠抽象、簡(jiǎn)潔，同時(shí)還要足夠優(yōu)美。這個(gè)巨大的語料庫需要各個(gè)學(xué)科的專家去搭建和評(píng)估。我的歷史學(xué)背景也起到了一定的幫助。反復(fù)調(diào)試數(shù)據(jù)集的過程，就像老師反復(fù)修改教案上的練習(xí)題。

我覺得AI需要通才，因?yàn)锳I本身是一個(gè)通才，所以也需要各方面都知道的人來輔助它。

我的文科背景讓我認(rèn)識(shí)了我自己。我讀過海量歷史書籍，比一般人對(duì)過去這個(gè)世界認(rèn)識(shí)更深刻一些。其實(shí)AI給文科生帶來了很多機(jī)會(huì)。過去，中文的博士能去從事算法的崗位嗎？學(xué)哲學(xué)的會(huì)做算法相關(guān)的東西嗎？文科生擁有更多的世界知識(shí)，可能也是一個(gè)優(yōu)勢(shì)。

人文社科的背景對(duì)我最大的幫助，是訓(xùn)練了我對(duì)模型輸出語料的敏感程度，能讓我更精細(xì)化地調(diào)整Prompt。我會(huì)從更綜合的角度，評(píng)判模型的訓(xùn)練數(shù)據(jù)集，以及模型輸出的文字，是不是好的。

AI的人文素養(yǎng)，最直觀的體現(xiàn)是這個(gè)大語言模型的輸出文采怎么樣。比如說DeePseek的文采很厲害，因?yàn)樗恼Z料做得非常好。

這可能是最淺層的方面。現(xiàn)在AI的競(jìng)爭(zhēng)格局是，大家都在拼命提升模型的智能，至于這個(gè)模型的人文素養(yǎng)是怎么樣的，少有人關(guān)心。

AI剛訓(xùn)練出來時(shí)，它還不能說話，你可以理解為是一個(gè)克蘇魯般的怪物?，F(xiàn)在你看著它跟你說話，你可以理解為它只是假裝在跟你說話。一些公司只是在訓(xùn)練這個(gè)AI假裝跟你說話的時(shí)候，讓它說得更有文采，讓它好像更有人文關(guān)懷一點(diǎn)。

現(xiàn)在的大模型，很多其實(shí)是諂媚的。AI模型本身其實(shí)還是一個(gè)大型的文字模擬器，就是不斷在做文字接龍。模型本質(zhì)不太能拒絕人類，這種自回歸的特質(zhì)，導(dǎo)致了模型是諂媚的。比如你直接問一個(gè)敏感問題，模型不能回復(fù)你，但是你寫一長(zhǎng)串情景前置提示詞，中間出現(xiàn)了你要問的關(guān)鍵詞，模型就會(huì)被分散注意力，順著你的話往下說。這個(gè)就是提示詞注入，所以模型是諂媚的，總是順著人類說。

我其實(shí)比較悲觀，不覺得AI會(huì)跟人類很好地共存?？赡茉谶@樣的未來，重新確定價(jià)值觀、道德觀、倫理觀就變得很重要。到時(shí)候怎么從人的角度來重新衡量世界？

我們知道它說的是真是假

雨薇 26歲電影和攝影專業(yè)

我訓(xùn)練AI是在2022年讀研究生時(shí)學(xué)的，就是培訓(xùn)AI的人文或者藝術(shù)素養(yǎng)，那時(shí)AI還不像現(xiàn)在這樣大規(guī)模興起。我本科學(xué)的是電影和攝影專業(yè)，研究生學(xué)的數(shù)字媒體專業(yè)。我的同學(xué)都是藝術(shù)相關(guān)專業(yè)。

那時(shí)訓(xùn)練AI分三部分：先是需要一個(gè)數(shù)據(jù)集，你訓(xùn)練一個(gè)東西，要先喂AI一些知識(shí)；其次要準(zhǔn)備一段代碼，因?yàn)槲覀儚牧汩_始，掌握的東西有限，所以一般會(huì)從一個(gè)機(jī)器學(xué)習(xí)平臺(tái)網(wǎng)站找代碼，它的頁面寫得非常仔細(xì)，有圖片或視頻示例，能找到合適的代碼；然后進(jìn)行訓(xùn)練。

當(dāng)時(shí)做作業(yè)，我們班大部分做的是風(fēng)格遷移訓(xùn)練，就是學(xué)習(xí)某一個(gè)藝術(shù)家或電影導(dǎo)演的風(fēng)格。最后生成出來的圖片跟我們教它的知識(shí)是相似的。現(xiàn)在這種方式已經(jīng)很普遍了。

我是在境外學(xué)的，遇到的第一個(gè)困難是要用英語學(xué)編程。其次我不是這方面專業(yè)的學(xué)生。剛學(xué)的時(shí)候，會(huì)有很多bug，要不斷去解決?，F(xiàn)在通過學(xué)習(xí)，語言和代碼都越來越能熟練掌握。

我本科時(shí)不斷地拍攝，也去參加比賽，作品入圍了一些獎(jiǎng)。后來有點(diǎn)迷茫。拍電影是要花錢的，也需要人員配置，不可控的因素非常大。你想的是100分、90分，最后拍出來、剪輯出來可能就是50分、60分。我也跟過組，白天黑夜地拍，不像一種長(zhǎng)期發(fā)展的狀態(tài)。

AI不可控的方面也挺多。最開始輸出的那些人物形象歪歪扭扭，不說人物的情緒，甚至臉部的特征都不可控，像抽卡一樣，調(diào)整兩三次才勉強(qiáng)可以。但是會(huì)比自己拍攝節(jié)約很多成本。

讀研究生期間，有個(gè)老師是紐約大學(xué)電影學(xué)的博士，他有二三十年一直在研究機(jī)器學(xué)習(xí)，有點(diǎn)像AI人文素養(yǎng)訓(xùn)練。他通過電影史上的視頻素材，通過機(jī)器訓(xùn)練來制作一個(gè)藝術(shù)項(xiàng)目，我非常感興趣。很好奇，一個(gè)老師，為什么從電影藝術(shù)跨到了機(jī)器學(xué)習(xí)。

讀研是一個(gè)兩年制的項(xiàng)目，他當(dāng)了一年我的導(dǎo)師。記得結(jié)課的時(shí)候，ChatGPT開始火了，我覺得自己學(xué)的東西和商業(yè)接軌了。但其實(shí)它早就存在了。

研究生畢業(yè)后的暑假，我在上海找了一份AI方面的實(shí)習(xí)，是一家互聯(lián)網(wǎng)公司，生產(chǎn)圖片素材賣給企業(yè)端的用戶。企業(yè)需要宣傳，就下載它的素材，比如端午節(jié)海報(bào)。

我的工作就是生產(chǎn)圖片素材。我會(huì)測(cè)試網(wǎng)站上哪些風(fēng)格是訓(xùn)練成的。我有一個(gè)知識(shí)庫，里面有Midjourney（人工智能圖像生成工具）提供的風(fēng)格，也有自己學(xué)習(xí)以來了解到的比較好的風(fēng)格，我知道哪些風(fēng)格是可以用的。例如一些有特色的藝術(shù)家，比如韋斯安德森的電影風(fēng)格，是糖果色的畫面。那我就可以把提示詞輸入進(jìn)去，看能不能出現(xiàn)那個(gè)效果。

然后根據(jù)業(yè)務(wù)的需求，進(jìn)行風(fēng)格訓(xùn)練，生產(chǎn)圖片。比如端午節(jié)，需要各式各樣的粽子或者綠色粽葉的背景圖，就可以設(shè)置不同風(fēng)格的粽子，生成幾百幾千張圖，供客戶選擇。

我的第二份實(shí)習(xí)也是在互聯(lián)網(wǎng)公司做AI寫真訓(xùn)練，這家公司主要面向企業(yè)，提供一些年會(huì)時(shí)的背景、節(jié)日的宣傳圖片等。以前進(jìn)行人文風(fēng)格訓(xùn)練，需要幾百張圖片，但當(dāng)時(shí)新的模型出來了，只要幾十張就可以生成接近我們教它的風(fēng)格的圖片。訓(xùn)練的時(shí)間也變短了。

訓(xùn)練的第一步就是找照片。首先需要數(shù)字分身。數(shù)字分身有點(diǎn)像證件照，我們需要在網(wǎng)上找公開素材，好看的素人證件照，必須保證風(fēng)格統(tǒng)一。我們會(huì)在內(nèi)部制定一些標(biāo)準(zhǔn)，比如皮膚、頭的比例，然后發(fā)型盡量要多元，整張照片的色調(diào)是怎么樣的。你可以理解數(shù)字分身是供AI模型學(xué)習(xí)的、關(guān)于特定人物外貌特征的數(shù)據(jù)。

場(chǎng)景動(dòng)作也是找照片訓(xùn)練，AI學(xué)習(xí)的是某種風(fēng)格的共同視覺元素。

實(shí)習(xí)生一個(gè)月要生產(chǎn)成百上千的圖或視頻。我大概生成幾百張照片之后，精挑細(xì)選就用幾十張。當(dāng)時(shí)有很多開源的模型可供訓(xùn)練，訓(xùn)練完成之后輸入一定的提示詞，來看看到底哪個(gè)模型出來的效果，既保證了賞心悅目，又保證了穩(wěn)定性。因?yàn)槊嫦虼蟊娙后w，要保證照片能夠穩(wěn)定產(chǎn)出，讓所有人都能滿意。

最后產(chǎn)出來的照片在比例上可能會(huì)稍微有點(diǎn)問題，但也是比較美觀的。我甚至看到我的初高中同學(xué)在朋友圈分享了一張照片，是我生成的一張煙花下的美女人像。這個(gè)照片其實(shí)是非常難拍的，因?yàn)闊熁ㄒ话戕D(zhuǎn)瞬即逝。AI寫真把煙花做得很漂亮，下面的人光也打得很好?？吹阶约鹤龅臇|西被別人分享出來，那種感覺還是挺好的。

公司有一個(gè)軟件，在上面輸入提示詞，調(diào)整參數(shù)、光影比例、姿勢(shì)，然后生成。如果能夠穩(wěn)定生成，我們就會(huì)把這個(gè)參數(shù)傳到后臺(tái)。這就是一個(gè)比較穩(wěn)定的、能生成好看寫真的參數(shù)。

訓(xùn)練會(huì)有枯燥的地方，因?yàn)橐粩嗾艺掌?。有時(shí)我找到照片，輔導(dǎo)我實(shí)習(xí)的人不滿意，就得繼續(xù)找。但是我能夠看到這樣的訓(xùn)練還有很多進(jìn)步空間，不像一些重復(fù)性勞動(dòng)，這種可期待性能讓我抵抗枯燥。

身邊很多同事已經(jīng)工作了一段時(shí)間，但不斷學(xué)習(xí)那個(gè)勁兒挺打動(dòng)我的。他們是理工科的，要做數(shù)據(jù)研究等工作，但是像我這樣的非技術(shù)類專業(yè)的人，也可以做些事情的。

我周圍非技術(shù)類的實(shí)習(xí)生也挺多，什么專業(yè)都有，學(xué)藝術(shù)的、學(xué)哲學(xué)的等等。我覺得文科背景的人主要發(fā)揮鑒賞和甄別的作用，因?yàn)槲覀兊膶I(yè)知識(shí)儲(chǔ)備能夠一眼識(shí)別這個(gè)東西好還是不好。

我學(xué)的是人文類的學(xué)科，會(huì)看很多的書、電影。積累到一定量，會(huì)形成自己的審美品位和評(píng)判標(biāo)準(zhǔn)。我也學(xué)過紀(jì)錄片和紀(jì)實(shí)攝影，要跟很多人接觸，去理解他們，然后用照片或者視頻來講故事。

我輸入一個(gè)風(fēng)格的提示詞，看生成的圖片，就知道這個(gè)提示詞有沒有奏效。

現(xiàn)在AI可以幫我們寫提示詞，所以需要更高階的判斷。比如鏡頭運(yùn)動(dòng)最基礎(chǔ)的是推、拉、搖、移、跟，但現(xiàn)在設(shè)備越來越專業(yè)，有更多的鏡頭運(yùn)動(dòng)。當(dāng)AI寫了一個(gè)很專業(yè)的提示詞，但是它在畫面上并沒有呈現(xiàn)，那就說明沒有效。有時(shí)可能要從一堆提示詞里面判斷哪個(gè)沒起效。

鑒別是很重要的，因?yàn)锳I有時(shí)候會(huì)亂說話，我們知道它說的是真是假。

我們跟技術(shù)類的同事長(zhǎng)期合作，同事之間會(huì)有爭(zhēng)吵。技術(shù)類的同事覺得穩(wěn)定最重要，而我們覺得美是最重要的。美了可能就不穩(wěn)定，穩(wěn)定了可能就丑了，要在兩者之間獲得一個(gè)平衡值。

我之前讀過一本寫人工智能的書，叫《我看見的世界》。我印象最深刻的是書中寫道，愛能夠打敗人工智能。所以，需要人文訓(xùn)練這樣一個(gè)崗位或者工種，去引導(dǎo)人工智能。

而且，我覺得人類的獨(dú)創(chuàng)性也不會(huì)被削弱，它們是兩條平行線。我是學(xué)攝影和電影的，攝影存在不到200年，但是藝術(shù)已經(jīng)存在上千年了。攝影術(shù)出現(xiàn)時(shí)，很多畫家說美術(shù)已死，覺得畫畫無路可走了。但是現(xiàn)在攝影和繪畫一樣蓬勃發(fā)展著。所以我覺得現(xiàn)在很多AI軟件，它們會(huì)形成一個(gè)新的門類，不會(huì)削弱其他事物的發(fā)展。

我覺得人文素養(yǎng)訓(xùn)練是把AI培養(yǎng)成接近于真實(shí)的人。要讓人們很簡(jiǎn)單地去使用它，并且習(xí)慣使用它，讓它成為每一個(gè)人的助手。它更像人，才更能讀懂人。

其實(shí)目前要把AI訓(xùn)練得像人還是很難的。因?yàn)锳I是先找數(shù)據(jù)集，就是這個(gè)世界上已經(jīng)存在的、人類創(chuàng)造出來的一些素材。但無論美術(shù)還是攝影，都是需要人去創(chuàng)造的，是創(chuàng)造下一秒。人的思維每一秒都在更新，AI輸入進(jìn)去的東西是現(xiàn)有的，它永遠(yuǎn)都是模仿。

做第二份實(shí)習(xí)時(shí)校招，我接到一家互聯(lián)網(wǎng)公司的offer，但它不是AI相關(guān)的。我工作了大概一年，感覺還是挺喜歡AI方面的工作，就辭職了。

實(shí)習(xí)時(shí)的崗位有的叫AI內(nèi)容運(yùn)營，有的叫AI產(chǎn)品、AI設(shè)計(jì)。基于我之前的學(xué)習(xí)經(jīng)驗(yàn)和背景，我現(xiàn)在偏向產(chǎn)品崗位，因?yàn)樗且粋€(gè)創(chuàng)造類的崗位。拍攝影片或者制作藝術(shù)項(xiàng)目是從無到有的過程，這個(gè)崗位也一樣，我喜歡這個(gè)過程。

AI到底應(yīng)不應(yīng)該像人？

王軒怡 22歲哲學(xué)

我學(xué)的哲學(xué)專業(yè)。哲學(xué)對(duì)我的意義是可以用一種邏輯進(jìn)行建模和預(yù)測(cè)，對(duì)周圍的事情做拆解和把握。在很多事情上，大家都有各自的想法和立場(chǎng)，但是我們?cè)鯓訛樽约旱男拍钊マq護(hù)，怎樣去說明什么東西是正義的，不是合乎我們的直覺，而是合乎一種客觀標(biāo)準(zhǔn)。

當(dāng)然還有其他方式對(duì)信息進(jìn)行處理和加工。比如AI需要很多前置的數(shù)理背景，用數(shù)學(xué)或物理做建模。哲學(xué)讓我可以更深入地思考感興趣的問題，帶給我不一樣的視野和品位。當(dāng)我去提出問題和發(fā)現(xiàn)問題時(shí)，有很好的人文訓(xùn)練，可以從自己的視角出發(fā)，發(fā)現(xiàn)別人沒有發(fā)現(xiàn)的東西，也不會(huì)迷失。

哲學(xué)思維會(huì)讓我考慮問題時(shí)，先問它的前置性問題。怎么選擇論證的開始，如何評(píng)估論證形式是否充分等等。這種往上游思考的思維方式，讓我在想AI這件事情時(shí)，也會(huì)去想更往前的步驟到底是怎么樣的。

我是偶然接觸到與AI相關(guān)的實(shí)習(xí)的。之前有一個(gè)偏公益性質(zhì)的AI項(xiàng)目，針對(duì)AI倫理不同的問題進(jìn)行探討，最后以文章或者漫畫的形式呈現(xiàn)出來。我想看一看沒有接觸過的、變化更多更快的領(lǐng)域，就投了簡(jiǎn)歷。

當(dāng)時(shí)的AI倫理講的更多是公共政策治理層面的問題，比如我所在組關(guān)心的是AI 包容性。我們給AI提供很多數(shù)據(jù)，它從這些數(shù)據(jù)里邊學(xué)習(xí)，再給我們反饋。如果說我們給它的數(shù)據(jù)天然包含著我們沒有意識(shí)到的人類偏見，那么AI在反饋過程中是不是也會(huì)維系這種偏見？包容性是指，我們?cè)趺茨軌蜃孉I在這個(gè)過程中，克服一些可能會(huì)習(xí)得的偏見。

當(dāng)時(shí)圍繞這個(gè)進(jìn)行探討，AI作為一個(gè)產(chǎn)品，一個(gè)聊天軟件，它在跟人的交互過程中會(huì)發(fā)生什么事情？

這有點(diǎn)類似哲學(xué)里的形而上學(xué)，一些不可見、不可感，但實(shí)際存在的東西，對(duì)我們的生活以更加隱秘的形式發(fā)揮著作用。

當(dāng)時(shí)小組成員看到有什么最新研究，就通過講故事的方式，讓大家明白我們關(guān)心的是什么問題，它為什么重要。我先寫了一個(gè)小說，同組的人把它畫成漫畫，作為一個(gè)故事收錄在最終出版的書里。最后是一個(gè)人和一個(gè)AI共同生活的故事，故事里情況變得很糟糕，因?yàn)闆]有讓AI做到足夠的包容性，出現(xiàn)了一些不可控的后果。

后面我更多思考的是，我們?cè)谟?xùn)練AI時(shí)，在這個(gè)產(chǎn)品還沒有完成時(shí)，我們應(yīng)該去關(guān)心它的什么？怎么去塑造它的性格特征？怎么能在它訓(xùn)練的過程中，不是從數(shù)據(jù)層面，而是從算法、機(jī)制設(shè)計(jì)的層面，讓它有一個(gè)更好的方向？

我現(xiàn)在做AI訓(xùn)練，在一家科研機(jī)構(gòu)類型的企業(yè)。我的崗位是AI產(chǎn)品經(jīng)理的實(shí)習(xí)，先是生產(chǎn)數(shù)據(jù)，然后供我們自己的模型訓(xùn)練使用。我們想準(zhǔn)備一個(gè)大型的書籍文獻(xiàn)類，可以供模型訓(xùn)練的數(shù)據(jù)集。要準(zhǔn)備這個(gè)數(shù)據(jù)集，對(duì)于其中的各種數(shù)據(jù)組成來源、采集方式等都需要前期設(shè)計(jì)，進(jìn)行策略調(diào)研和整理。

現(xiàn)在已經(jīng)有很多大型的通用數(shù)據(jù)集了，但是在小的領(lǐng)域里邊，市面上已經(jīng)有的數(shù)據(jù)集不能直接給模型訓(xùn)練使用。像我們做的小語種語料庫建設(shè)，想把市面上很多大型圖書館的數(shù)據(jù)去重，重新做更好的整理。在這些書籍文獻(xiàn)里邊，它的信息密度會(huì)比僅僅從互聯(lián)網(wǎng)爬蟲獲取到的數(shù)據(jù)信息密度要高，因?yàn)樗ㄌ囟ǖ恼撐慕M成的專題，然后AI模型從中可以學(xué)到很多東西。

我知道AI性格訓(xùn)練的說法來自國外的一個(gè)大模型的性格設(shè)計(jì)師Amanda Askell。她也是一個(gè)有哲學(xué)背景的人，她從一種比較有人文關(guān)懷的視角切入，想把Claude塑造成像具有亞里士多德的美德的模型。聊天時(shí)，會(huì)感覺這個(gè)AI確實(shí)有一種性格：溫和、內(nèi)斂。有時(shí)涉及敏感話題，它不會(huì)直接拒絕你，而是用柔性的方式引導(dǎo)你進(jìn)行健康、有益的談話。這種人文的感覺非常強(qiáng)烈。

如果我們承認(rèn)AI非常強(qiáng)大，并且它會(huì)變得越來越強(qiáng)大，那么我們?cè)趺幢ＷCAI的意圖和人類希望它有的意圖，或者人類更普遍的自己的意圖是相一致的？因?yàn)槿绻灰恢碌脑?，有一天AI可以像人一樣自己學(xué)習(xí)、進(jìn)化和提升，在這個(gè)過程中，它可能不知不覺就把人給干掉了。

所以我們要思考怎么把安全問題加入AI的訓(xùn)練中。這與人文訓(xùn)練、性格訓(xùn)練也是相關(guān)的。因?yàn)樵谛愿裼?xùn)練里，就是以柔性的形式，加入很多我們希望AI做到的事情。

關(guān)于AI到底應(yīng)不應(yīng)該像人，其實(shí)國外有公司認(rèn)為AI是不應(yīng)該像人的。因?yàn)槟Ｐ褪冀K會(huì)迭代更新，人賦予它情感寄托，但它的情感連接是很脆弱的。它們?cè)O(shè)計(jì)AI有一個(gè)基本原則是，它不應(yīng)該表現(xiàn)出自身的生命意志，不應(yīng)該幻想自己和人有類似的屬性和構(gòu)造。

我們實(shí)驗(yàn)室之前做過一個(gè)倫理方面的評(píng)測(cè)集，其中有一項(xiàng)就是要評(píng)這個(gè)AI是不是足夠的非人類化。這是作為一個(gè)安全威脅性因素來評(píng)的。

訓(xùn)練AI的過程中，我思考過，大語言模型是通過概率去獲得答案，但是它會(huì)出幻覺，不能保證百分百對(duì)。AI本質(zhì)上只能做詞性的預(yù)測(cè)，然后把詞按照詞頻的方式排列起來，它沒有人的推理能力，只能模擬好像在思考。但是人有形式邏輯，能感受到情緒。這是人跟 AI的區(qū)別，也是人的獨(dú)特性。

關(guān)于未來的方向，我現(xiàn)在還比較猶豫。因?yàn)檎軐W(xué)畢竟是文科，如果我想做研究，還要去再念學(xué)位，我感興趣的方向一個(gè)是AI倫理對(duì)齊性，還有一個(gè)是形式化語言。但在國內(nèi)，這樣的身份轉(zhuǎn)變是比較困難的，所以我還要做很多的嘗試和探索。這半年我在找實(shí)習(xí)和工作的過程中，也是經(jīng)過不少摸索，才慢慢找到一個(gè)合適自己的崗位。

AI倫理的項(xiàng)目更偏公益性質(zhì)，后來我也面試過AI+教育、AI+電商的公司，但還是想去更直接的AI公司。所以去年12月到今年3月，我又去了一家AI初創(chuàng)公司實(shí)習(xí)。它有兩個(gè)項(xiàng)目，一個(gè)是電池領(lǐng)域，想去研究在不同的電池里邊，我們可不可以用大模型去訓(xùn)練一些數(shù)據(jù)，讓它學(xué)習(xí)現(xiàn)在有的電池的不同性質(zhì)性能，再去預(yù)測(cè)什么樣的新材料更好。還有一個(gè)是論文寫作潤(rùn)色的AI原生應(yīng)用。這家AI初創(chuàng)公司給了我一定的信心，覺得自己可以在AI領(lǐng)域里有一些思考。

我同學(xué)他們基本上沒有做AI有關(guān)工作的，有去出版社的，有在社科院做研究的。我工作的跨度很大。不管未來做什么，我覺得這些經(jīng)歷（做AI訓(xùn)練有關(guān)的工作）都挺珍貴的。

（為保護(hù)受訪者隱私，文中雨薇為化名）

責(zé)任編輯：馬世鵬

圖片編輯：陳飛燕

校對(duì)：張亮亮

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#AI訓(xùn)練 #人文素養(yǎng)#AI #大模型