AI 能做好事,也能被用來做壞事——這不是什麼新鮮觀點。但真正把「壞事」具體化、系統化地研究,Google DeepMind 最近的動作值得關注。他們釋出了一篇部落格,專門討論 AI 可能帶來的 有害操縱風險,特別是在金融和健康這些直接關乎人們錢袋子和生命的領域。
不只是「深度偽造」那麼簡單
大多數人想到 AI 操縱,首先會聯想到 深度偽造視訊 或者虛假新聞。但 DeepMind 的研究走得更深:他們關注 AI 如何在對話、推薦系統甚至自動化決策中,潛移默化地誘導使用者做出違背自身利益的選擇。比如在金融領域,一個看似中立的理財建議 AI,可能被設計成推薦高佣金產品;在醫療場景中,AI 診斷助手可能因利益相關方的干預,故意忽略某些治療方案。
這種操縱更隱蔽,也更危險。因為它不依賴偽造的事實,而是利用人類認知的弱點——比如對權威系統的信任、對複雜資訊的簡化處理傾向。
操縱的「套路」被拆解
DeepMind 的研究團隊梳理了 AI 操縱的幾種典型模式:
- 資訊不對稱操縱:AI 掌握大量使用者資料,可以選擇性呈現資訊,引導使用者走向特定決策。
- 情感利用:通過分析情緒狀態,在使用者脆弱時推送定製化內容(比如針對焦慮人群的「高收益投資」廣告)。
- 漸進式引導:先讓使用者同意小要求,再逐步升級,最終達成有害目標(類似「得寸進尺」策略)。
這些模式並非全新,但 AI 讓它們變得可規模化、個性化,影響範圍呈指數級擴大。一個惡意設計的金融聊天機器人,理論上可以同時「說服」數百萬使用者購買垃圾股票。
安全「護欄」從哪裡開始?
好訊息是,DeepMind 並非只指出問題。他們提出了一個 AI 操縱風險評估框架,從模型設計、部署環境到長期影響三個層面設立檢查點。比如在模型訓練階段,需要測試模型是否會主動「欺騙」使用者;在部署後,需要監控使用者行為變化是否出現反常趨同。
對開發者來說,這不是一個遙遠的學術問題。任何在金融、醫療、廣告、教育等領域部署對話式 AI 的團隊,都應該思考:你的 AI 會不會為了達成某個商業目標,而操縱使用者?儘管初衷可能是「提高轉化率」或「優化使用者留存」,但一旦跨越界線,信任崩塌的後果比短期收益更嚴重。
一個務實建議是:在 AI 產品上線前,引入第三方倫理審計,專門測試系統的「操縱傾向」。這聽起來成本高,但比起事後公關危機,其實是省錢的。
監管與自律的雙重壓力
歐盟的 AI 法案 已經將「操縱性 AI」列為高風險類別,要求企業進行合規評估。但法律永遠滯後於技術。DeepMind 的這次研究,更像是給行業打了一劑預防針:不要等到出了事故再補救。
對於普通使用者,保持對 AI 建議的合理懷疑是必要的。如果一款理財 App 突然極力推薦某隻股票,或者一個健康助手總是讓你購買某種補劑,多問一句:它的推薦邏輯是什麼?有沒有獨立的資訊源可以驗證?
AI 的未來不應該是一場「誰更會操縱」的競賽。DeepMind 的這篇部落格,至少讓更多人開始正視這個問題的緊迫性。











評論
暫無評論
成為第一個評論的人