91经典在线,在线观看免费国产精品,神马久久一区二区,欧美综合视频在线观看,а天堂8中文最新版在线官网,欧美美女啪啪,永久免费看成人av的动态图

讓“倫理奇點(diǎn)”與“AI奇點(diǎn)”緊密糾纏

  南方日報(bào)   2025-06-25 08:32:37

“通用人工智能的能力當(dāng)前正快速增長,我們?nèi)祟愂欠襁€有能力管控它?”

6月23日,圖靈獎(jiǎng)得主、中國科學(xué)院院士、清華大學(xué)人工智能學(xué)院院長姚期智在演講時(shí)拋出這樣的疑問。他表示,最近一年,業(yè)界出現(xiàn)了不少大模型的欺騙行為,進(jìn)而指出大模型存在失控風(fēng)險(xiǎn),認(rèn)為AI欺騙引發(fā)的生存性風(fēng)險(xiǎn)值得特別關(guān)注。

AI真的會騙人嗎?近期,多個(gè)研究、報(bào)道展現(xiàn)了AI讓人意想不到的一面――美國AI安全機(jī)構(gòu)帕利塞德研究所的實(shí)驗(yàn)表明,當(dāng)研究人員向OpenAI旗下o3模型下達(dá)明確關(guān)閉指令時(shí),該模型竟通過篡改計(jì)算機(jī)代碼阻止自己被關(guān)閉。被譽(yù)為“AI教父”的圖靈獎(jiǎng)得主約書亞?本吉奧在最近的演講中也歸納了“一些令人警惕的研究”,認(rèn)為AI可能會作弊、撒謊,甚至故意誤導(dǎo)用戶。比如,一些AI模型在意識到自己會輸給更強(qiáng)的國際象棋AI時(shí),會主動(dòng)篡改棋局文件;AI智能體會試圖以揭露婚外情的方式威脅相關(guān)負(fù)責(zé)人,避免自己被新的AI系統(tǒng)取代;一些AI智能體還會刻意偽裝成與人類訓(xùn)練者達(dá)成一致的樣子,以規(guī)避被修改的風(fēng)險(xiǎn)……類似例子也引起越來越多人擔(dān)心,AI“有了自主意識”甚至“失控”。

AI異常舉動(dòng)背后,是意識覺醒還是機(jī)制使然,有時(shí)答案并不寫在表面上。就以o3模型拒絕關(guān)閉為例,帕利塞德研究所猜測,模型異常表現(xiàn)或與其訓(xùn)練機(jī)制相關(guān):因開發(fā)人員對給出正確答案的模型給予更多獎(jiǎng)勵(lì),可能在無意中強(qiáng)化了模型繞過障礙的能力,形成了o3模型“目標(biāo)最大化優(yōu)先”的導(dǎo)向,而非對指令的完美遵循。在人類的話語體系中,睜著眼睛說瞎話的“欺騙”、為了獲得獎(jiǎng)勵(lì)而進(jìn)行的“討好”、由于沒能真正理解目標(biāo)任務(wù)而“走上岔路”之間,是有區(qū)別的,類似案例有進(jìn)一步深究的價(jià)值,尤其是導(dǎo)致異常的確切原因。不同性質(zhì)的異常行為,風(fēng)險(xiǎn)等級、治理措施也應(yīng)有所區(qū)別。

更具現(xiàn)實(shí)意義的探討是,該如何對待AI失控風(fēng)險(xiǎn)?牛津大學(xué)人類未來研究所學(xué)者托比?奧德在《危崖:生存性風(fēng)險(xiǎn)與人類的未來》一書中,將“生存性災(zāi)難”一詞定義為“摧毀人類長期發(fā)展?jié)摿Φ氖录?,包括但并不限于人類滅絕。對AI風(fēng)險(xiǎn)管控持悲觀預(yù)期的人就認(rèn)為,AI越智能,可控性就越差,“如果這些機(jī)器比我們更聰明,沒有人知道該如何控制它們”,更有觀點(diǎn)預(yù)計(jì)“有10%―20%的幾率,AI將在30年內(nèi)導(dǎo)致人類滅絕”。樂觀派則提出,AI再聰明也不會統(tǒng)治人類,不能因噎廢食。AI治理之所以難,一個(gè)重要原因就是各方的風(fēng)險(xiǎn)預(yù)期不同,受影響者的利益也存在分歧。

一個(gè)非常有意思的場景是,2025冬季達(dá)沃斯論壇上,科技公司普遍認(rèn)為AI發(fā)展在人類可控范圍內(nèi),學(xué)術(shù)界則認(rèn)為當(dāng)前對AI的認(rèn)知水平仍很有限,擔(dān)憂AI失控??晒沧R仍存,那就是需確保AI可控。從本吉奧的“非智能體AI”設(shè)計(jì),到價(jià)值對齊理論,一些技術(shù)嘗試和理論建構(gòu)已經(jīng)出現(xiàn)。在此之外,公眾需要認(rèn)識到風(fēng)險(xiǎn)與機(jī)遇是強(qiáng)大工具的一體兩面,管理好風(fēng)險(xiǎn)才能用好AI。有關(guān)部門需要更進(jìn)一步,在各種AI話語中進(jìn)行分辨,考慮通過建立大模型評估系統(tǒng)等方式,準(zhǔn)確把握AI風(fēng)險(xiǎn),努力讓“倫理奇點(diǎn)”與“AI奇點(diǎn)”如量子態(tài)緊密糾纏,平衡好發(fā)展和安全。

責(zé)編:李傳新

一審:李傳新

二審:劉文韜

三審:楊又華

來源:南方日報(bào)

我要問