最近,四歲的女兒向我“匯報(bào)”幼兒園生活時(shí),繪聲繪色地描述她與一只霸王龍交朋友的故事:她們一起抓小恐龍,因?yàn)檐E蹺板鬧翻,又交換零食和好……邏輯嚴(yán)密,細(xì)節(jié)豐富——盡管她的幼兒園里連只倉(cāng)鼠都沒(méi)有。細(xì)究之下才知,這孩子原來(lái)把繪本、動(dòng)畫(huà)和現(xiàn)實(shí)糅合在一起,用童言童語(yǔ)編織出一個(gè)“合理”的故事。
此情此景,也讓我想到當(dāng)下人工智能(AI)的“幻覺(jué)”現(xiàn)象:它能將虛構(gòu)與真實(shí)無(wú)縫拼接,生成看似嚴(yán)謹(jǐn)實(shí)則荒誕的答案,仿佛一個(gè)捧著百科全書(shū)滿(mǎn)嘴跑火車(chē)的天才兒童。
從前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可見(jiàn)的速度重塑生活。它既能幫中學(xué)生秒解幾何題,也能替小說(shuō)家生成纏綿的劇情。而若拋出一些不著邊際的問(wèn)題,譬如“從化學(xué)視角解析孫悟空火眼金睛是怎樣煉成的”,它也能像模像樣地編造出一大篇學(xué)術(shù)分析,甚至煞有介事地標(biāo)注出參考文獻(xiàn)。更令人啼笑皆非的是,當(dāng)遭到質(zhì)疑時(shí),它會(huì)杜撰更多論據(jù)來(lái)自圓其說(shuō)。這種真假難辨的“知識(shí)幻覺(jué)”一如沙上樓閣,看似氣勢(shì)如虹,實(shí)則千瘡百孔。而在AI狂飆突進(jìn)的當(dāng)下,類(lèi)似的“幻覺(jué)”還在被大批量生產(chǎn)出來(lái)。
要理解AI為何謊話(huà)連篇,得從它的學(xué)習(xí)方式說(shuō)起。今天的AI普遍基于大語(yǔ)言模型(LLM)。在它問(wèn)世之前,傳統(tǒng)AI就像循規(guī)蹈矩的優(yōu)等生,全靠死記硬背語(yǔ)法規(guī)則來(lái)答題解疑;而大語(yǔ)言模型更像煉丹術(shù)士,將龐大的語(yǔ)料放入“丹鼎”以期煉得“金丹”。哲學(xué)家維特根斯坦曾說(shuō),語(yǔ)言的意義不在預(yù)設(shè)的本質(zhì)中,而在于日常的使用——就像孩子學(xué)說(shuō)話(huà),沒(méi)人教“主謂賓”,全靠觀(guān)察大人如何在飯桌上說(shuō)“吃”,在踢足球時(shí)喊“跑”——維特根斯坦稱(chēng)之為“語(yǔ)言游戲”。大語(yǔ)言模型正是對(duì)這種游戲的算法化:它被拋入一個(gè)虛擬的語(yǔ)料世界中,吞下海量的文本材料,沒(méi)有人告訴它該怎么出去,它只能自己從中摸索出一條道路來(lái)。
最終,涅槃重生的AI開(kāi)口說(shuō)話(huà)了——一面是口若懸河,一鳴驚人;另一面卻是信口雌黃,“鬼話(huà)”連篇。
人們不吝贊美著AI的橫空出世,卻也正絞盡腦汁要給胡言亂語(yǔ)的AI“治病”。比如,為了防止AI幻覺(jué)泛濫,工程師們加裝了“知識(shí)導(dǎo)航”(檢索增強(qiáng)技術(shù)RAG)來(lái)引導(dǎo)它查證事實(shí),鋪設(shè)了“軌道護(hù)欄”(提示詞約束)以防止答案跑偏,甚至請(qǐng)人類(lèi)老師當(dāng)“監(jiān)考”(人類(lèi)反饋強(qiáng)化學(xué)習(xí)RLHF)給胡謅打紅叉。但即便如此嚴(yán)加管教,AI仍會(huì)冷不丁變成“脫韁野馬”。就像班上總有幾個(gè)聰明又調(diào)皮的學(xué)生,能把考場(chǎng)作文寫(xiě)成科幻史詩(shī)——你明知道他在編,卻還得佩服其想象的不羈。
但或許問(wèn)題不止于技術(shù)層面:究其本質(zhì),語(yǔ)言就是真?zhèn)谓豢椀挠螒颉_h(yuǎn)古人類(lèi)圍著篝火編神話(huà),中世紀(jì)的吟游詩(shī)人即興歌唱,網(wǎng)友們?cè)谂笥讶θ氯隆拔矣幸粋€(gè)朋友”——虛構(gòu)從未遠(yuǎn)離我們。AI不過(guò)是把這一本質(zhì)端上了桌面。當(dāng)它用《紅樓夢(mèng)》的文風(fēng)改編科普文章,或用學(xué)術(shù)腔調(diào)分析“黛玉倒拔垂楊柳”,我們是該大呼造假之離譜,還是驚嘆創(chuàng)新之乖奇?這又讓我想起女兒的另一則“杰作”:她把動(dòng)畫(huà)片里的冰雪魔法,挪到了小區(qū)游樂(lè)場(chǎng)上,硬說(shuō)滑梯的另一頭連著艾莎公主的城堡。只不過(guò),孩童的幻想至多令人莞爾,AI的幻覺(jué)卻可能引發(fā)真實(shí)的麻煩——可不是所有人都能一眼識(shí)破那些“一本正經(jīng)的胡說(shuō)八道”。
但話(huà)說(shuō)回來(lái),當(dāng)前條件下,要完全消除AI幻覺(jué),就像苛求孩子永遠(yuǎn)不說(shuō)童話(huà)——既不可能,亦無(wú)必要。關(guān)鍵是如何給“凌空蹈虛”劃定賽道:譬如寫(xiě)小說(shuō)時(shí),自可天馬行空;做學(xué)術(shù)時(shí),便須腳踏實(shí)地。目前的主流解法是給AI裝上“場(chǎng)景識(shí)別器”:當(dāng)檢測(cè)到用戶(hù)需要嚴(yán)謹(jǐn)答案時(shí),自動(dòng)調(diào)用知識(shí)庫(kù)交叉驗(yàn)證;若遇到創(chuàng)意寫(xiě)作,則無(wú)妨放飛自我。而要更進(jìn)一步,就得考慮如何讓AI“活”在更真實(shí)的語(yǔ)言游戲?qū)嵺`中了。如今的AI看似滿(mǎn)口金句,實(shí)則是黑箱里的“書(shū)呆子”。倘能走出黑箱,交到“朋友”——比如在虛擬社區(qū)充當(dāng)模擬成員,在學(xué)術(shù)論壇接受“同行”評(píng)議,甚至通過(guò)腦機(jī)接口感受具身經(jīng)驗(yàn)——或許它能逐漸領(lǐng)悟:語(yǔ)言不僅是符號(hào)的概率游戲,而且是生活形式的一部分。
想象某一天,當(dāng)AI能“感受”小吃攤主吆喝的肢體語(yǔ)言,或程序員代碼錯(cuò)誤時(shí)的尷尬表情,或許它再不會(huì)把火眼金睛說(shuō)成是二氧化硅的高溫玻璃化了。
技術(shù)狂飆的時(shí)代,人們總渴望用算法解決一切問(wèn)題。但AI幻覺(jué)始終在當(dāng)頭棒喝:對(duì)理性正確的追求,和對(duì)生活世界的回歸,需要建立一種動(dòng)態(tài)平衡。如同孩子總會(huì)長(zhǎng)大,總會(huì)學(xué)著區(qū)分基本的幻想與現(xiàn)實(shí),在人類(lèi)的引導(dǎo)下,AI的“成長(zhǎng)”終將水到渠成。所以面對(duì)AI幻覺(jué),與其杞人憂(yōu)天,倒不如放手讓它游戲,只要能不斷進(jìn)入更豐富的場(chǎng)景,領(lǐng)悟更多樣的規(guī)則,書(shū)呆子也學(xué)得會(huì)“人情練達(dá)”。
來(lái)源:《光明日?qǐng)?bào)》