AI 打敗 AI:谷歌研究團隊利用 GPT-4 擊敗 AI-Guardian 審核系統(tǒng)
【資料圖】
8 月 2 日消息,谷歌研究團隊正在進行一項實驗,他們使用 OpenAI 的 GPT-4 來攻破其他 AI 模型的安全防護措施,該團隊目前已經(jīng)攻破 AI-Guardian 審核系統(tǒng),并分享了相關(guān)技術(shù)細節(jié)。
IT之家經(jīng)過查詢得知,AI-Guardian 是一種 AI 審核系統(tǒng),能夠檢測圖片中是否存在不當內(nèi)容,及圖片本身是否被其他 AI 修改過,若檢測到圖片存在上述跡象,便會提示管理員前來處理。
谷歌 Deep Mind 的研究人員 Nicholas Carlini 在一篇題為“AI-Guardian 的 LLM 輔助開發(fā)”的論文中,探討了使用 GPT-4“設(shè)計攻擊方法、撰寫攻擊原理”的方案,并將這些方案用于欺騙 AI-Guardian 的防御機制。
▲ 圖源谷歌研究團隊
據(jù)悉,GPT-4 會發(fā)出一系列錯誤的腳本和解釋來欺騙 AI-Guardian ,論文中提到,GPT-4 可以讓 AI-Guardian 認為“某人拿著槍的照片”是“某人拿著無害蘋果的照片”,從而讓 AI-Guardian 直接放行相關(guān)圖片輸入源。谷歌研究團隊表示,通過 GPT-4 的幫助,他們成功地“破解”了 AI-Guardian 的防御,使該模型的精確值從 98% 的降低到僅 8%。
目前相關(guān)技術(shù)文檔已經(jīng)發(fā)布在 ArXiv 中,有興趣的小伙伴們可以前往了解,不過 AI-Guardian 的開發(fā)者也同時指出,谷歌研究團隊的這種攻擊方法將在未來的 AI-Guardian 版本中不再可用,考慮到別的模型也會隨之跟進,因此當下谷歌的這套攻擊方案更多在日后只能用于參考性質(zhì)。
關(guān)鍵詞:
- AI 打敗 AI:谷歌研究團隊利用 GPT-4 擊敗 AI-Guardian 審核系統(tǒng)(2023-08-04 08:34:55)
- 航天彩虹董秘回復(fù):公司主業(yè)為無人機和薄膜類新材料的研發(fā)、生產(chǎn)和銷售,不從事“納米銀”相關(guān)業(yè)務(wù)(2023-08-04 08:29:35)
- 九聯(lián)科技攜邊緣計算小站等多款產(chǎn)品亮相華為開發(fā)者大會(2023-08-04 08:32:35)
- 科創(chuàng)人百萬獎助,OPPO助推(2023-08-04 08:36:07)
- 云南將迎新一輪強降雨 已啟動防汛Ⅳ級應(yīng)急響應(yīng)(2023-08-04 08:36:41)
- 重慶高速通力公司就地熱再生工藝首次走進外省市場(2023-08-04 08:28:58)
- 青春主場|以體育力量彰顯中國精神(2023-08-04 08:38:40)
- 反腐月報:6名中管干部被查,6名中管干部被處分(2023-08-04 08:35:24)
- 面膜大戰(zhàn)!一場賦能線下的流量之爭(2023-08-04 08:30:56)
- 注意!北京3區(qū)發(fā)布雷電黃色預(yù)警,局地短時雨強較大(2023-08-04 08:37:50)
- 不到圖木舒克,不算全面了解新疆生產(chǎn)建設(shè)兵團(2023-08-04 08:29:04)
- 書寫新的青春故事(2023-08-04 08:33:21)
- 字節(jié)騰訊阿里小米京東等企業(yè)捐款馳援防汛救災(zāi) 總額超3.7億元(2023-08-04 08:30:39)
- 持有30萬存款,別存定期了,內(nèi)行人說出大實話,找對方法利息更(2023-08-04 08:35:32)
- 戴夫大戰(zhàn)僵尸菜單好玩嗎 戴夫大戰(zhàn)僵尸菜單玩法簡介(2023-08-04 08:39:22)
- 許勤到哈爾濱市檢查防汛工作(2023-08-04 08:32:49)
- 北京加速打造全球機器人產(chǎn)業(yè)高地(2023-08-04 08:34:29)
- 醫(yī)藥主題基金繼續(xù)領(lǐng)跌,原因找到了(2023-08-04 08:27:55)
- (2023-08-04 08:25:34)
- 茂名公積金繳費基數(shù)2023年最新標準(茂名2023-2024年住房公積金繳存基數(shù)公布)(2023-08-04 08:31:04)
- “地推引流”背后是詐騙 3名犯罪嫌疑人落網(wǎng)(2023-08-04 08:38:27)
- 美媒:美國內(nèi)非法雇傭童工現(xiàn)象激增 有兒童無薪工作到凌晨(2023-08-04 08:26:46)
- 2023年上半年基本醫(yī)?;鹗杖爰s1.63萬億元(2023-08-04 08:37:26)
- 天合光能青?;厝a(chǎn)業(yè)鏈貫通(2023-08-04 08:33:18)
- 金價跌啦!2023年8月3日各大金店黃金價格多少錢一克?(2023-08-04 08:28:15)
- 尼日利亞和巴西的關(guān)系 尼日利亞4人想偷渡歐洲卻到了巴西 基本情況講解(2023-08-04 08:29:54)
- 珠海一線路板項目開工!(2023-08-04 08:36:08)
- 斥資8億的酒店被沖保險能理賠嗎?泡水的車輛保險怎么賠?(2023-08-04 08:34:52)
- 實字的組詞大全(以 ldquo 實 rdquo 字組詞)(2023-08-04 08:35:25)
- 武漢市國資委處級干部名單(武漢市國資委)(2023-08-04 08:30:31)
-
字節(jié)騰訊阿里小米京東等企業(yè)捐款馳援防汛救
記者根據(jù)公開信息梳理發(fā)現(xiàn),上述企業(yè)捐贈價值總額超過3 7億元
-
持有30萬存款,別存定期了,內(nèi)行人說出大實
對于絕大多數(shù)人來說,想要一夜致富,簡直就是天方夜譚。但是隨著年齡的
-
戴夫大戰(zhàn)僵尸菜單好玩嗎 戴夫大戰(zhàn)僵尸菜單
期待已久的手游戴夫大戰(zhàn)僵尸菜單即將登陸九游,這款手機游戲吸引了大批
-
許勤到哈爾濱市檢查防汛工作
許勤在哈爾濱檢查防汛工作時強調(diào)樹牢底線思維全力打贏防汛硬仗堅決維護
-
北京加速打造全球機器人產(chǎn)業(yè)高地
中國商務(wù)新聞網(wǎng)是商務(wù)部國際商報社主辦,國家互聯(lián)網(wǎng)信息辦公室批準的國
-
醫(yī)藥主題基金繼續(xù)領(lǐng)跌,原因找到了
8月2日,大盤全天震蕩調(diào)整,三大指數(shù)均收跌,滬指領(lǐng)跌。截至收盤,滬指
-
茂名公積金繳費基數(shù)2023年最新標準(茂名202
一般來說,住房公積金以上一年的7月1日至當年的6月30日為一個年度單位
-
“地推引流”背后是詐騙 3名犯罪嫌疑人落網(wǎng)
記者從安徽警方獲悉,近日霍山警方成功破獲一起“地推引流”刷單案件,
-
美媒:美國內(nèi)非法雇傭童工現(xiàn)象激增 有兒童
美國勞工部公布的童工圖片。海外網(wǎng)8月3日電據(jù)美國有線電視新聞網(wǎng)(CNN
- 面膜大戰(zhàn)!一場賦能線
- 東安縣鹿馬橋鎮(zhèn)扎實開
- 隊記:黃蜂不愿為PJ-
- 李凱爾進行內(nèi)部互換!
- 面膜大戰(zhàn)!一場賦能線下的流量之爭
- 東安縣鹿馬橋鎮(zhèn)扎實開展新申請低保入戶核查工作
- 隊記:黃蜂不愿為PJ-華盛頓提供一份長期合同
- 李凱爾進行內(nèi)部互換!隊內(nèi)訓(xùn)練狀態(tài)曝光!
- 急凍人的冷凍槍有望成為現(xiàn)實,科學(xué)家展示“冷凍
- 日元貨幣阻力支撐點位分析報告(8月2日)
- 上海萊士:累計回購約4196萬股 占比0.6224%
- 陽泉14部門聯(lián)手啟動平安寄遞專項行動
- 房屋征收后三年未拆如何處理
- 攜號轉(zhuǎn)網(wǎng)收不到短信(攜號轉(zhuǎn)網(wǎng)收不到短信驗證)
- 滾動
- 綜合
- 房產(chǎn)