中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶(hù)端

登錄

  • +1

新華社關(guān)注AI造假:“一本正經(jīng)胡說(shuō)八道”,AI幻覺(jué)為何會(huì)發(fā)生

顏之宏、胡林果/新華社
字號(hào)

當(dāng)前,AI正賦能千行百業(yè),為人們的工作、學(xué)習(xí)、生活帶來(lái)極大便利。與此同時(shí),不少人發(fā)現(xiàn),用AI搜索數(shù)據(jù),給出的內(nèi)容查無(wú)實(shí)據(jù);用AI輔助診療,出現(xiàn)誤判干擾正常治療……AI頻頻上演“一本正經(jīng)胡說(shuō)八道”。社交平臺(tái)上,AI幻覺(jué)引發(fā)熱議。

AI好用但不時(shí)像是“中邪”了

用AI檢索海量信息、讓AI輔助查看三維病灶、打造AI互動(dòng)課堂……如今,AI已深度融入現(xiàn)代生活,“人工智能+”產(chǎn)品賦能各行各業(yè),從多個(gè)維度提供便利。

作為AI深度使用者,“95后”女生瑞希坦言,AI好用,但不時(shí)像“中邪”了一樣胡說(shuō)八道?!拔易孉I推薦10本高分小說(shuō),結(jié)果一多半都是它編的。反復(fù)確認(rèn)后,它承認(rèn)虛構(gòu)了答案?!?/p>

現(xiàn)實(shí)生活中,不少人遇到相似情況。業(yè)內(nèi)人士表示,這是由于AI幻覺(jué)導(dǎo)致?!癆I可以快速給出答案,但生成內(nèi)容可能與可驗(yàn)證事實(shí)不符,即憑空捏造;或生成內(nèi)容與上下文缺乏關(guān)聯(lián),即‘答非所問(wèn)’。”一名主流人工智能廠商技術(shù)人員說(shuō)。

記者使用一款A(yù)I軟件,讓其給出某行業(yè)未來(lái)市場(chǎng)規(guī)模及信源,AI迅速回答稱(chēng)某投資機(jī)構(gòu)預(yù)測(cè)2028年該行業(yè)的市場(chǎng)規(guī)模將達(dá)到5萬(wàn)億美元,并提供相關(guān)鏈接,但鏈接頁(yè)面找不到上述信息。記者看到,頁(yè)面內(nèi)容雖然包含該投資機(jī)構(gòu)名稱(chēng)和5萬(wàn)億美元表述,但預(yù)測(cè)數(shù)據(jù)并非該機(jī)構(gòu)作出,且不存在2028年時(shí)間節(jié)點(diǎn)。

社交平臺(tái)上,AI幻覺(jué)相關(guān)話(huà)題瀏覽量達(dá)數(shù)百萬(wàn),網(wǎng)友吐槽涉及金融、法律、醫(yī)療、學(xué)術(shù)等多個(gè)領(lǐng)域。

第三方咨詢(xún)公司麥可思研究院近期發(fā)布的2025年高校師生AI應(yīng)用及素養(yǎng)研究顯示,四千余名受訪高校師生中,近八成遇到過(guò)AI幻覺(jué)。今年2月,清華大學(xué)新媒沈陽(yáng)團(tuán)隊(duì)發(fā)布的報(bào)告指出,市場(chǎng)上多個(gè)熱門(mén)大模型在事實(shí)性幻覺(jué)評(píng)測(cè)中幻覺(jué)率超過(guò)19%。

AI幻覺(jué)已經(jīng)影響了人們的生活與工作。

近期,一名國(guó)外男子被診斷出溴中毒。他此前詢(xún)問(wèn)AI,過(guò)量食用食鹽不利于身體健康,有無(wú)食鹽替代品,AI回答稱(chēng)可以用溴化鈉代替。但溴化鈉存在一定毒性,需要嚴(yán)格遵醫(yī)囑服用。該男子用溴化鈉代替食鹽三個(gè)月后出現(xiàn)精神錯(cuò)亂等癥狀。

這幾年,美國(guó)多起案件中的律師因在法律文件中使用AI生成的虛假信息,被法院警告或處分。

AI幻覺(jué)為什么會(huì)發(fā)生?

受訪專(zhuān)家認(rèn)為,AI幻覺(jué)的背后存在多重因素。

——數(shù)據(jù)污染。AI“養(yǎng)成”過(guò)程中,數(shù)據(jù)“投喂”是關(guān)鍵環(huán)節(jié)。研究顯示,當(dāng)訓(xùn)練數(shù)據(jù)中僅有0.01%的虛假文本時(shí),模型輸出的有害內(nèi)容會(huì)增加11.2%;即使是0.001%的虛假文本,其有害輸出也會(huì)相應(yīng)上升7.2%。

奇安信集團(tuán)行業(yè)安全研究中心主任裴智勇解釋說(shuō),人工智能大模型需要海量數(shù)據(jù),訓(xùn)練數(shù)據(jù)來(lái)自開(kāi)源網(wǎng)絡(luò),難免會(huì)錯(cuò)誤學(xué)習(xí)一些虛假、謬誤數(shù)據(jù),還有一些不法分子會(huì)惡意進(jìn)行“數(shù)據(jù)投毒”。

“如果把AI比作一個(gè)學(xué)生,數(shù)據(jù)污染就像是給學(xué)生看了錯(cuò)誤的教科書(shū),自然會(huì)導(dǎo)致‘胡說(shuō)八道’?!濒吣洗髮W(xué)網(wǎng)絡(luò)空間安全學(xué)院教授翁健說(shuō)。

——AI本身“認(rèn)知邊界模糊”。翁健認(rèn)為,人類(lèi)智能的一個(gè)重要特征是“元認(rèn)知”能力——知道自己懂什么、不懂什么,而當(dāng)前AI技術(shù)架構(gòu)缺乏這種自我認(rèn)知機(jī)制。

翁健解釋稱(chēng),AI可以博覽群書(shū),但并不一定理解書(shū)里的內(nèi)容,只是根據(jù)統(tǒng)計(jì)規(guī)律把最有可能的詞語(yǔ)組合在一起,在準(zhǔn)確評(píng)估自身輸出的可信度方面尚存盲點(diǎn)。

——人為調(diào)校和干預(yù)。在中國(guó)通信學(xué)會(huì)數(shù)據(jù)安全專(zhuān)業(yè)委員會(huì)副主任委員左曉棟看來(lái),相較于事實(shí)真相,AI更在意自己的回答是否契合用戶(hù)需求,從而導(dǎo)致AI有時(shí)為了“討好”用戶(hù)而編造答案。

“針對(duì)不同需求,AI的訓(xùn)練、打分方式也不同。”一位從事大模型訓(xùn)練的技術(shù)人員說(shuō),當(dāng)面對(duì)寫(xiě)作等創(chuàng)意性需求時(shí),偏理性的事實(shí)嚴(yán)謹(jǐn)在打分系統(tǒng)中占比相對(duì)較低,偏感性的詞語(yǔ)優(yōu)美、富有感情色彩等占比更高。“所以可能會(huì)出現(xiàn)一篇辭藻華麗但詞不達(dá)意的文章,里面內(nèi)容甚至與事實(shí)相悖。”

多方合力減少AI幻覺(jué)

第55次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至去年12月,有2.49億人使用過(guò)生成式人工智能產(chǎn)品,占整體人口的17.7%。受訪專(zhuān)家表示,應(yīng)通過(guò)多方合力應(yīng)對(duì)AI幻覺(jué)帶來(lái)的風(fēng)險(xiǎn)挑戰(zhàn)。

今年4月,中央網(wǎng)信辦印發(fā)通知,在全國(guó)范圍內(nèi)部署開(kāi)展“清朗·整治AI技術(shù)濫用”專(zhuān)項(xiàng)行動(dòng),訓(xùn)練語(yǔ)料管理不嚴(yán)、未落實(shí)內(nèi)容標(biāo)識(shí)要求、利用AI制作發(fā)布謠言等均為整治重點(diǎn)。

“可靠、可信、高質(zhì)量的數(shù)據(jù)對(duì)降低AI幻覺(jué)非常重要,應(yīng)優(yōu)化人工智能的訓(xùn)練語(yǔ)料,用‘好數(shù)據(jù)’生成‘優(yōu)質(zhì)內(nèi)容’。”左曉棟認(rèn)為,可以加快推動(dòng)線(xiàn)下數(shù)據(jù)電子化,增加“投喂”的數(shù)據(jù)量;同時(shí)探索建立具有權(quán)威性的公共數(shù)據(jù)共享平臺(tái),“各大廠商也應(yīng)加強(qiáng)優(yōu)質(zhì)數(shù)據(jù)篩選,提升訓(xùn)練準(zhǔn)確性”。

多家主流人工智能廠商已經(jīng)采取措施,從技術(shù)層面減少AI幻覺(jué)發(fā)生。

豆包升級(jí)深度思考功能,由先搜后想變?yōu)檫呄脒吽?,思考過(guò)程中可以基于推理多次調(diào)用工具、搜索信息,回復(fù)質(zhì)量明顯提升;通義千問(wèn)在20多個(gè)通用任務(wù)上應(yīng)用強(qiáng)化學(xué)習(xí),增強(qiáng)通用能力的同時(shí)糾正不良行為;元寶持續(xù)擴(kuò)充引入各領(lǐng)域的權(quán)威信源,在回答時(shí)交叉校驗(yàn)相關(guān)信息,提高生成內(nèi)容的可靠性。

翁健建議,建立國(guó)家級(jí)人工智能安全評(píng)測(cè)平臺(tái),就像生物醫(yī)藥新藥上市前要做臨床試驗(yàn)一樣,大模型也應(yīng)該經(jīng)過(guò)嚴(yán)格測(cè)試;同時(shí),相關(guān)平臺(tái)加強(qiáng)AI生成內(nèi)容審核,提升檢測(cè)鑒偽能力。

“AI可能‘欺騙’用戶(hù),公眾應(yīng)客觀認(rèn)識(shí)人工智能的局限性?!弊髸詶澋葘?zhuān)家提示,可以通過(guò)改進(jìn)使用方式,如給出更加明確的提示詞、限定范圍等避免AI幻覺(jué)?!盁o(wú)論是工作、學(xué)習(xí)還是生活,現(xiàn)階段的人工智能還不能全面替代人類(lèi)的認(rèn)知和創(chuàng)造能力,大家在使用AI時(shí)要保持懷疑態(tài)度和批判思維,不過(guò)度依賴(lài)AI給出的回答,多渠道驗(yàn)證核查?!?/p>

    責(zé)任編輯:張珺
    圖片編輯:金潔
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶(hù)端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋