來(lái)源:人民日?qǐng)?bào) 發(fā)布時(shí)間:2025-6-23 10:46
在科幻電影中,人工智能常被塑造成全知全能的“超級(jí)大腦”,但現(xiàn)實(shí)中,AI卻時(shí)常表現(xiàn)為“自信的謊言家”。比如,請(qǐng)AI描述“關(guān)公戰(zhàn)秦瓊”,它不僅能“敘述”虛構(gòu)的故事情節(jié),還會(huì)“猜測(cè)”用戶喜好,煞有介事地編造不存在的文獻(xiàn)檔案。這種現(xiàn)象被稱為“AI幻覺(jué)”,已經(jīng)成為困擾許多人工智能企業(yè)和使用者的現(xiàn)實(shí)難題。
AI為什么會(huì)一本正經(jīng)地胡說(shuō)八道?根源在于其思維方式與人類存在本質(zhì)不同。今天人們?nèi)粘J褂煤徒佑|最多的AI大模型本質(zhì)上是一個(gè)龐大的語(yǔ)言概率預(yù)測(cè)和生成模型。它通過(guò)分析互聯(lián)網(wǎng)上數(shù)以萬(wàn)億計(jì)的文本,學(xué)習(xí)詞語(yǔ)之間的關(guān)聯(lián)規(guī)律,再像玩猜詞游戲一樣,逐字逐句生成看似合理的回答。這種機(jī)制使AI擅于模仿人類的語(yǔ)言風(fēng)格,但有時(shí)缺乏辨別真?zhèn)蔚哪芰Α?/p>
AI幻覺(jué)的產(chǎn)生與大模型訓(xùn)練的過(guò)程密不可分。AI的知識(shí)體系基本來(lái)源于訓(xùn)練時(shí)“吞下”的數(shù)據(jù)源。來(lái)自互聯(lián)網(wǎng)的各類信息魚(yú)龍混雜,其中不乏虛假信息、虛構(gòu)故事和偏見(jiàn)性觀點(diǎn)。這些信息一旦成為AI訓(xùn)練的數(shù)據(jù)源,就會(huì)出現(xiàn)數(shù)據(jù)源污染。當(dāng)某個(gè)領(lǐng)域?qū)I(yè)數(shù)據(jù)不足時(shí),AI便可能通過(guò)模糊性的統(tǒng)計(jì)規(guī)律來(lái)“填補(bǔ)空白”。比如,將科幻小說(shuō)中的“黑科技”描述為真實(shí)存在的技術(shù)。在AI被越來(lái)越多地用于信息生產(chǎn)的背景下,AI生成的海量虛構(gòu)內(nèi)容和錯(cuò)誤信息正在進(jìn)入訓(xùn)練下一代AI的內(nèi)容池,這種“套娃”生態(tài)將進(jìn)一步加劇AI幻覺(jué)的產(chǎn)生。
在大模型訓(xùn)練過(guò)程中,為了使AI生成滿足用戶需求的內(nèi)容,訓(xùn)練者會(huì)設(shè)置一定的獎(jiǎng)勵(lì)機(jī)制——對(duì)于數(shù)學(xué)題等需要邏輯推理的問(wèn)題,往往通過(guò)確認(rèn)答案的正確與否給予獎(jiǎng)勵(lì);對(duì)于寫(xiě)作等開(kāi)放式命題,則需要判斷其生成的內(nèi)容是否符合人類寫(xiě)作習(xí)慣。為了訓(xùn)練效率,這種判斷更多關(guān)注AI語(yǔ)言的邏輯性和內(nèi)容格式等指標(biāo),卻忽略了事實(shí)的核查。
此外,訓(xùn)練過(guò)程的缺陷也會(huì)導(dǎo)致AI存在“討好”用戶的傾向,明知道答案不符合事實(shí),也愿意遵照指令生成迎合用戶的內(nèi)容,并編造一些虛假的例證或看似科學(xué)的術(shù)語(yǔ)來(lái)支撐自己的“假說(shuō)”。這種“角色扮演式”的表達(dá)讓許多普通用戶難以分辨AI幻覺(jué)。上海交通大學(xué)媒體與傳播學(xué)院進(jìn)行的一項(xiàng)全國(guó)抽樣調(diào)查顯示,約七成受訪者對(duì)大模型生成虛假或錯(cuò)誤信息的風(fēng)險(xiǎn)缺乏清晰認(rèn)知。
如何破解AI幻覺(jué)?開(kāi)發(fā)者嘗試通過(guò)技術(shù)手段為AI“糾偏”。比如“檢索增強(qiáng)生成”技術(shù),這意味著AI在回答前需要從最新的數(shù)據(jù)庫(kù)檢索相關(guān)信息,降低“信口開(kāi)河”概率;一些模型被要求在不確定答案時(shí)主動(dòng)承認(rèn)“不知道”,而非強(qiáng)行編造答案。不過(guò),由于目前的AI無(wú)法像人類那樣理解語(yǔ)言背后的真實(shí)世界,因此這些方法難以從根本上解決AI幻覺(jué)問(wèn)題。
應(yīng)對(duì)AI幻覺(jué),不僅需要技術(shù)規(guī)制,也需要從公民AI素養(yǎng)普及、平臺(tái)責(zé)任、公共傳播等維度構(gòu)建系統(tǒng)性的“幻覺(jué)免疫力”。AI素養(yǎng)不僅包含使用AI的基本技能,更重要的是對(duì)AI幻覺(jué)要有基本的認(rèn)知能力。明確技術(shù)平臺(tái)的責(zé)任邊界同樣重要,AI產(chǎn)品在設(shè)計(jì)時(shí)就應(yīng)嵌入風(fēng)險(xiǎn)提示機(jī)制,自動(dòng)標(biāo)記“可能存在事實(shí)性錯(cuò)誤”等警示內(nèi)容,并提供方便用戶進(jìn)行事實(shí)核查和交叉驗(yàn)證的功能。媒體可以通過(guò)定期發(fā)布AI偽造事實(shí)的典型案例,進(jìn)一步培養(yǎng)公眾的識(shí)別能力。通過(guò)多方聯(lián)手,智能時(shí)代的認(rèn)知迷霧才能被真正破除。
(作者徐 劍 為上海交通大學(xué)媒體與傳播學(xué)院特聘教授,本報(bào)記者黃曉慧采訪整理)
《 人民日?qǐng)?bào) 》( 2025年06月21日 06 版)