国精产品一区一区三区在线观看,国产亚洲综合在线

讓“倫理奇點(diǎn)”與“AI奇點(diǎn)”緊密糾纏

南方日報(bào) 2025-06-25 08:32:37

“通用人工智能的能力當(dāng)前正快速增長，我們?nèi)祟愂欠襁€有能力管控它？”

6月23日，圖靈獎(jiǎng)得主、中國科學(xué)院院士、清華大學(xué)人工智能學(xué)院院長姚期智在演講時(shí)拋出這樣的疑問。他表示，最近一年，業(yè)界出現(xiàn)了不少大模型的欺騙行為，進(jìn)而指出大模型存在失控風(fēng)險(xiǎn)，認(rèn)為AI欺騙引發(fā)的生存性風(fēng)險(xiǎn)值得特別關(guān)注。

AI真的會騙人嗎？近期，多個(gè)研究、報(bào)道展現(xiàn)了AI讓人意想不到的一面――美國AI安全機(jī)構(gòu)帕利塞德研究所的實(shí)驗(yàn)表明，當(dāng)研究人員向OpenAI旗下o3模型下達(dá)明確關(guān)閉指令時(shí)，該模型竟通過篡改計(jì)算機(jī)代碼阻止自己被關(guān)閉。被譽(yù)為“AI教父”的圖靈獎(jiǎng)得主約書亞?本吉奧在最近的演講中也歸納了“一些令人警惕的研究”，認(rèn)為AI可能會作弊、撒謊，甚至故意誤導(dǎo)用戶。比如，一些AI模型在意識到自己會輸給更強(qiáng)的國際象棋AI時(shí)，會主動(dòng)篡改棋局文件；AI智能體會試圖以揭露婚外情的方式威脅相關(guān)負(fù)責(zé)人，避免自己被新的AI系統(tǒng)取代；一些AI智能體還會刻意偽裝成與人類訓(xùn)練者達(dá)成一致的樣子，以規(guī)避被修改的風(fēng)險(xiǎn)……類似例子也引起越來越多人擔(dān)心，AI“有了自主意識”甚至“失控”。

AI異常舉動(dòng)背后，是意識覺醒還是機(jī)制使然，有時(shí)答案并不寫在表面上。就以o3模型拒絕關(guān)閉為例，帕利塞德研究所猜測，模型異常表現(xiàn)或與其訓(xùn)練機(jī)制相關(guān)：因開發(fā)人員對給出正確答案的模型給予更多獎(jiǎng)勵(lì)，可能在無意中強(qiáng)化了模型繞過障礙的能力，形成了o3模型“目標(biāo)最大化優(yōu)先”的導(dǎo)向，而非對指令的完美遵循。在人類的話語體系中，睜著眼睛說瞎話的“欺騙”、為了獲得獎(jiǎng)勵(lì)而進(jìn)行的“討好”、由于沒能真正理解目標(biāo)任務(wù)而“走上岔路”之間，是有區(qū)別的，類似案例有進(jìn)一步深究的價(jià)值，尤其是導(dǎo)致異常的確切原因。不同性質(zhì)的異常行為，風(fēng)險(xiǎn)等級、治理措施也應(yīng)有所區(qū)別。

更具現(xiàn)實(shí)意義的探討是，該如何對待AI失控風(fēng)險(xiǎn)？牛津大學(xué)人類未來研究所學(xué)者托比?奧德在《危崖：生存性風(fēng)險(xiǎn)與人類的未來》一書中，將“生存性災(zāi)難”一詞定義為“摧毀人類長期發(fā)展?jié)摿Φ氖录?，包括但并不限于人類滅絕。對AI風(fēng)險(xiǎn)管控持悲觀預(yù)期的人就認(rèn)為，AI越智能，可控性就越差，“如果這些機(jī)器比我們更聰明，沒有人知道該如何控制它們”，更有觀點(diǎn)預(yù)計(jì)“有10%―20%的幾率，AI將在30年內(nèi)導(dǎo)致人類滅絕”。樂觀派則提出，AI再聰明也不會統(tǒng)治人類，不能因噎廢食。AI治理之所以難，一個(gè)重要原因就是各方的風(fēng)險(xiǎn)預(yù)期不同，受影響者的利益也存在分歧。

一個(gè)非常有意思的場景是，2025冬季達(dá)沃斯論壇上，科技公司普遍認(rèn)為AI發(fā)展在人類可控范圍內(nèi)，學(xué)術(shù)界則認(rèn)為當(dāng)前對AI的認(rèn)知水平仍很有限，擔(dān)憂AI失控?？晒沧R仍存，那就是需確保AI可控。從本吉奧的“非智能體AI”設(shè)計(jì)，到價(jià)值對齊理論，一些技術(shù)嘗試和理論建構(gòu)已經(jīng)出現(xiàn)。在此之外，公眾需要認(rèn)識到風(fēng)險(xiǎn)與機(jī)遇是強(qiáng)大工具的一體兩面，管理好風(fēng)險(xiǎn)才能用好AI。有關(guān)部門需要更進(jìn)一步，在各種AI話語中進(jìn)行分辨，考慮通過建立大模型評估系統(tǒng)等方式，準(zhǔn)確把握AI風(fēng)險(xiǎn)，努力讓“倫理奇點(diǎn)”與“AI奇點(diǎn)”如量子態(tài)緊密糾纏，平衡好發(fā)展和安全。

責(zé)編：李傳新

一審：李傳新

二審：劉文韜

三審：楊又華

來源：南方日報(bào)

我要問

91经典在线,在线观看免费国产精品,神马久久一区二区,欧美综合视频在线观看,а天堂8中文最新版在线官网,欧美美女啪啪,永久免费看成人av的动态图