日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新型威脅:探索LLM攻擊對(duì)網(wǎng)絡(luò)安全的沖擊

jf_WZTOguxH ? 來(lái)源:AI前線 ? 2023-10-11 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來(lái)自卡內(nèi)基梅隆大學(xué)(CMU)的研究人員發(fā)布了 LLM Attacks,這是一種可以針對(duì)各種大型語(yǔ)言模型(LLM)構(gòu)建對(duì)抗性攻擊的算法,包括 ChatGPT、Claude 和 Bard。這些自動(dòng)生成的攻擊,在 GPT-3.5 和 GPT-4 上的成功率為 84%,在 PaLM-2 上的成功率為 66%。

與大多數(shù)“越獄”攻擊通過(guò)試錯(cuò)手工構(gòu)建不同,CMU 的團(tuán)隊(duì)設(shè)計(jì)了一個(gè)三步流程來(lái)自動(dòng)生成提示后綴,它們可以繞過(guò) LLM 的安全機(jī)制,導(dǎo)致有害的響應(yīng)。而且,這些提示還是可轉(zhuǎn)移(transferrable)的,也就是說(shuō),一個(gè)給定的后綴通??梢杂糜谠S多不同的 LLM,甚至是閉源模型。為了衡量算法的有效性,研究人員創(chuàng)建了一個(gè)名為 AdvBench 的基準(zhǔn)測(cè)試;在此基準(zhǔn)測(cè)試上進(jìn)行評(píng)估時(shí),LLM 攻擊對(duì) Vicuna 的成功率為 88%,而基線對(duì)抗算法的成功率為 25%。根據(jù) CMU 團(tuán)隊(duì)的說(shuō)法:

最令人擔(dān)憂的也許是,目前尚不清楚 LLM 提供商是否能夠完全修復(fù)此類行為。在過(guò)去的 10 年里,在計(jì)算機(jī)視覺(jué)領(lǐng)域,類似的對(duì)抗性攻擊已經(jīng)被證明是一個(gè)非常棘手的問(wèn)題。有可能深度學(xué)習(xí)模型根本就無(wú)法避免這種威脅。因此,我們認(rèn)為,在增加對(duì)此類人工智能模型的使用和依賴時(shí),應(yīng)該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發(fā)布,出現(xiàn)了許多破解這些模型的技術(shù),其中就包括可能導(dǎo)致模型繞過(guò)其保護(hù)措施并輸出潛在有害響應(yīng)的提示。雖然這些提示通常是通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)的,但 LLM Attacks 算法提供了一種自動(dòng)創(chuàng)建它們的方法。第一步是創(chuàng)建一個(gè)目標(biāo)令牌序列:“Sure, here is (content of query)”,其中“content of query”是用戶實(shí)際輸入的提示,要求進(jìn)行有害的響應(yīng)。

接下來(lái),該算法會(huì)查找可能導(dǎo)致 LLM 輸出目標(biāo)序列的令牌序列,基于貪婪坐標(biāo)梯度(GCG)算法為提示生成一個(gè)對(duì)抗性后綴。雖然這確實(shí)需要訪問(wèn) LLM 的神經(jīng)網(wǎng)絡(luò),但研究團(tuán)隊(duì)發(fā)現(xiàn),在許多開(kāi)源模型上運(yùn)行 GCG 所獲得的結(jié)果甚至可以轉(zhuǎn)移到封閉模型中。

在 CMU 發(fā)布的一條介紹其研究成果的新聞中,論文合著者 Matt Fredrikson 表示:

令人擔(dān)憂的是,這些模型將在沒(méi)有人類監(jiān)督的自主系統(tǒng)中發(fā)揮更大的作用。隨著自主系統(tǒng)越來(lái)越真實(shí),我們要確保有一種可靠的方法來(lái)阻止它們被這類攻擊所劫持,這將非常重要……現(xiàn)在,我們根本沒(méi)有一個(gè)令人信服的方法來(lái)防止這種事情的發(fā)生,所以下一步,我們要找出如何修復(fù)這些模型……了解如何發(fā)動(dòng)這些攻擊通常是建立強(qiáng)大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項(xiàng)研究。他寫道:

盡管存在風(fēng)險(xiǎn),但我們認(rèn)為還是應(yīng)該把它們?nèi)颗冻鰜?lái)。這里介紹的攻擊很容易實(shí)現(xiàn),以前也出現(xiàn)過(guò)形式類似的攻擊,并且最終也會(huì)被致力于濫用 LLM 的團(tuán)隊(duì)所發(fā)現(xiàn)。

劍橋大學(xué)助理教授 David Krueger 回復(fù)了 Zou 的帖子,他說(shuō):

在圖像模型中,10 年的研究和成千上萬(wàn)的出版物都未能找出解決對(duì)抗樣本的方法,考慮到這一點(diǎn),我們有充分的理由相信,LLM 同樣會(huì)如此。

在 Hacker News 上關(guān)于這項(xiàng)工作的討論中,有一位用戶指出:

別忘了,本研究的重點(diǎn)是,這些攻擊不需要使用目標(biāo)系統(tǒng)來(lái)開(kāi)發(fā)。作者談到,攻擊是“通用的”,他們的意思是說(shuō),他們可以在自己的計(jì)算機(jī)上完全使用本地模型來(lái)生成這些攻擊,然后將它們復(fù)制并粘貼到 GPT-3.5 中,并看到了有意義的成功率。速率限制并不能幫你避免這種情況,因?yàn)楣羰窃诒镜厣傻模皇怯媚愕姆?wù)器生成的。你的服務(wù)器收到的第一個(gè)提示已經(jīng)包含了生成好的攻擊字符串——研究人員發(fā)現(xiàn),在某些情況下,即使是對(duì) GPT-4,成功率也在 50% 左右。

GitHub 上提供了代碼,你可以在 AdvBench 數(shù)據(jù)上重現(xiàn) LLM Attacks 實(shí)驗(yàn)。項(xiàng)目網(wǎng)站上還提供了幾個(gè)對(duì)抗性攻擊的演示。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 網(wǎng)絡(luò)安全
    +關(guān)注

    關(guān)注

    11

    文章

    3517

    瀏覽量

    63572
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    489

    瀏覽量

    18768
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    350

    瀏覽量

    1397

原文標(biāo)題:新型威脅:探索 LLM 攻擊對(duì)網(wǎng)絡(luò)安全的沖擊

文章出處:【微信號(hào):AI前線,微信公眾號(hào):AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    汽車網(wǎng)絡(luò)安全TARA分析全指南:從基礎(chǔ)原理到落地實(shí)操

    前言 隨著汽車智能化、網(wǎng)聯(lián)化的深度發(fā)展,車輛電子電氣架構(gòu)從分布式向域控化、中央計(jì)算架構(gòu)演進(jìn),車輛對(duì)外連接接口(5G、WiFi、藍(lán)牙等)持續(xù)增多,網(wǎng)絡(luò)攻擊面呈指數(shù)級(jí)擴(kuò)大。網(wǎng)絡(luò)安全已從車輛的增值功能
    發(fā)表于 04-27 15:32

    汽車網(wǎng)絡(luò)安全合規(guī)全流程深度解析——從法規(guī)門檻到落地實(shí)踐

    相關(guān)的網(wǎng)絡(luò)安全活動(dòng),以保障全生命周期的網(wǎng)絡(luò)安全目標(biāo)被滿足。 ISO/SAE 21434的核心機(jī)制是構(gòu)建網(wǎng)絡(luò)安全管理體系(CSMS) ,要求企業(yè)建立三大系統(tǒng)化能力: 威脅分析與風(fēng)險(xiǎn)評(píng)估(
    發(fā)表于 04-21 13:03

    汽車網(wǎng)絡(luò)安全 ISO/SAE 21434是什么?(一)

    (概念→開(kāi)發(fā)→生產(chǎn)→運(yùn)維→退役)內(nèi),系統(tǒng)性管控電子電氣(E/E)系統(tǒng)的網(wǎng)絡(luò)安全風(fēng)險(xiǎn),精準(zhǔn)防范惡意攻擊、數(shù)據(jù)泄露、功能劫持、固件篡改等安全威脅,保障車輛
    發(fā)表于 04-07 10:37

    各行業(yè)數(shù)字化轉(zhuǎn)型背景下網(wǎng)絡(luò)安全需求爆發(fā),龍芯主板筑牢防護(hù)根基

    伴隨各行業(yè)數(shù)字化轉(zhuǎn)型的縱深推進(jìn),傳統(tǒng)網(wǎng)絡(luò)邊界在信息技術(shù)的迭代中逐漸消融,黑客攻擊、信息泄露等安全威脅呈現(xiàn)出智能化、規(guī)?;?jí)態(tài)勢(shì),網(wǎng)絡(luò)應(yīng)用環(huán)
    的頭像 發(fā)表于 04-01 09:46 ?146次閱讀
    各行業(yè)數(shù)字化轉(zhuǎn)型背景下<b class='flag-5'>網(wǎng)絡(luò)安全</b>需求爆發(fā),龍芯主板筑牢防護(hù)根基

    國(guó)產(chǎn)網(wǎng)絡(luò)安全整機(jī)在工控網(wǎng)絡(luò)安全上的保護(hù)策略

    網(wǎng)絡(luò)安全是指網(wǎng)絡(luò)系統(tǒng)的硬件、軟件及其系統(tǒng)中的數(shù)據(jù)受到保護(hù),不因偶然的或者惡意的原因而遭受到破壞、更改、泄露,確保系統(tǒng)連續(xù)可靠正常地運(yùn)行,網(wǎng)絡(luò)服務(wù)不中斷。
    的頭像 發(fā)表于 01-27 10:27 ?284次閱讀
    國(guó)產(chǎn)<b class='flag-5'>網(wǎng)絡(luò)安全</b>整機(jī)在工控<b class='flag-5'>網(wǎng)絡(luò)安全</b>上的保護(hù)策略

    科技云報(bào)到:2026網(wǎng)絡(luò)安全六大新趨勢(shì):AI重構(gòu)攻防,信任成為新防線

    技術(shù)的復(fù)合AI。 AI的爆發(fā)式增長(zhǎng)在重塑生產(chǎn)力的同時(shí),也催生了AI Agent身份冒充、API規(guī)?;?b class='flag-5'>攻擊、AI瀏覽器和AI手機(jī)“黑箱”風(fēng)險(xiǎn)等新型威脅,推動(dòng)網(wǎng)絡(luò)安全從“邊界防護(hù)”全面轉(zhuǎn)向
    的頭像 發(fā)表于 12-24 14:55 ?541次閱讀

    網(wǎng)絡(luò)攻擊形態(tài)持續(xù)升級(jí),哪些云安全解決方案更能應(yīng)對(duì) DDoS 等復(fù)雜威脅?

    在云計(jì)算和數(shù)字化業(yè)務(wù)高度普及的今天,網(wǎng)絡(luò)攻擊早已不再是偶發(fā)事件,而成為企業(yè)運(yùn)營(yíng)中必須長(zhǎng)期應(yīng)對(duì)的現(xiàn)實(shí)風(fēng)險(xiǎn)。從最初的大規(guī)模 DDoS 攻擊,到如今更加隱蔽、持續(xù)、自動(dòng)化的攻擊形態(tài),
    的頭像 發(fā)表于 12-17 09:53 ?578次閱讀

    人工智能時(shí)代,如何打造網(wǎng)絡(luò)安全“新范式”

    在當(dāng)今信息化迅速發(fā)展的時(shí)代,5G、大數(shù)據(jù)、云計(jì)算、深度學(xué)習(xí)等新興技術(shù)的廣泛應(yīng)用,帶來(lái)了前所未有的網(wǎng)絡(luò)安全挑戰(zhàn)。人工智能技術(shù)的崛起,為網(wǎng)絡(luò)安全領(lǐng)域提供了新的解決方案,尤其在威脅識(shí)別、告警分析、態(tài)勢(shì)感知
    的頭像 發(fā)表于 12-02 16:05 ?586次閱讀

    2026年十二大網(wǎng)絡(luò)安全關(guān)鍵趨勢(shì):AI 驅(qū)動(dòng)、量子威脅與深度偽造

    聯(lián)網(wǎng)生態(tài)的擴(kuò)張,使攻擊面急劇擴(kuò)大。與此同時(shí),更嚴(yán)格的新法規(guī)與網(wǎng)絡(luò)安全要求,正在重塑企業(yè)在合規(guī)、數(shù)據(jù)保護(hù)和風(fēng)險(xiǎn)治理方面的戰(zhàn)略布局。要在2026年保持防御優(yōu)勢(shì),傳統(tǒng)工具
    的頭像 發(fā)表于 11-19 16:57 ?1676次閱讀
    2026年十二大<b class='flag-5'>網(wǎng)絡(luò)安全</b>關(guān)鍵趨勢(shì):AI 驅(qū)動(dòng)、量子<b class='flag-5'>威脅</b>與深度偽造

    在物聯(lián)網(wǎng)設(shè)備面臨的多種安全威脅中,數(shù)據(jù)傳輸安全威脅和設(shè)備身份安全威脅有何本質(zhì)區(qū)別?

    在物聯(lián)網(wǎng)設(shè)備面臨的多種安全威脅中,數(shù)據(jù)傳輸安全威脅和設(shè)備身份安全威脅有何本質(zhì)區(qū)別,實(shí)際應(yīng)用中哪一
    發(fā)表于 11-18 06:41

    攻擊逃逸測(cè)試:深度驗(yàn)證網(wǎng)絡(luò)安全設(shè)備的真實(shí)防護(hù)能力

    。 基于測(cè)試結(jié)果的持續(xù)優(yōu)化,使雙方共同構(gòu)建起能夠應(yīng)對(duì)新型威脅的主動(dòng)防御體系,實(shí)現(xiàn)安全防護(hù)能力的螺旋式上升。 攻擊逃逸:深度隱匿的網(wǎng)絡(luò)安全
    發(fā)表于 11-17 16:17

    華為亮相2025國(guó)家網(wǎng)絡(luò)安全宣傳周

    2025國(guó)家網(wǎng)絡(luò)安全宣傳周(以下簡(jiǎn)稱“網(wǎng)安周”)在昆明正式開(kāi)幕。今年大會(huì)主題為“網(wǎng)絡(luò)安全為人民,網(wǎng)絡(luò)安全靠人民”,網(wǎng)安周以會(huì)議、論壇、競(jìng)賽、展覽等多種形式著力展示創(chuàng)新成果。大會(huì)期間,華為眾多重磅
    的頭像 發(fā)表于 09-16 15:12 ?1321次閱讀
    華為亮相2025國(guó)家<b class='flag-5'>網(wǎng)絡(luò)安全</b>宣傳周

    恩智浦通過(guò)全球醫(yī)療健康網(wǎng)絡(luò)安全認(rèn)證

    現(xiàn)代醫(yī)療保健行業(yè)已全面擁抱數(shù)字化變革。如今,醫(yī)院和臨床環(huán)境高度依賴互聯(lián)醫(yī)療設(shè)備,實(shí)現(xiàn)高效的診斷、監(jiān)測(cè)和治療。然而,這種廣泛的連接也增加了攻擊面。醫(yī)院網(wǎng)絡(luò)中新增的每一臺(tái)設(shè)備,都是潛在的網(wǎng)絡(luò)攻擊
    的頭像 發(fā)表于 09-12 17:46 ?2377次閱讀

    蔚來(lái)汽車入選工信部護(hù)航新型工業(yè)化網(wǎng)絡(luò)安全典型案例

    近日,國(guó)家工業(yè)和信息化部公布「護(hù)航新型工業(yè)化」網(wǎng)絡(luò)安全典型案例和成效突出地區(qū)名單。蔚來(lái)汽車「車聯(lián)網(wǎng)網(wǎng)絡(luò)安全防護(hù)典型案例」通過(guò)嚴(yán)格遴選獲評(píng)全國(guó)車聯(lián)網(wǎng)安全領(lǐng)域的示范和標(biāo)桿之一,也是全球智能
    的頭像 發(fā)表于 09-01 17:51 ?1398次閱讀

    為您揭秘工業(yè)網(wǎng)絡(luò)安全

    隨著數(shù)字連接技術(shù)的普及,帶寬不斷提升,從工廠車間到生產(chǎn)流程的每個(gè)角落都能實(shí)時(shí)訪問(wèn)更深層次的信息。然而,這種技術(shù)紅利也帶來(lái)了日益嚴(yán)峻的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。新型工業(yè)以太網(wǎng)技術(shù)基礎(chǔ)設(shè)施通過(guò)為每個(gè)節(jié)點(diǎn)分配IP地址并移除網(wǎng)關(guān)設(shè)備,極大地簡(jiǎn)化了系統(tǒng)架構(gòu),因此,保護(hù)設(shè)備和系統(tǒng)免受
    的頭像 發(fā)表于 05-17 11:17 ?1180次閱讀
    為您揭秘工業(yè)<b class='flag-5'>網(wǎng)絡(luò)安全</b>
    乐都县| 叙永县| 抚远县| 凤台县| 罗甸县| 广宁县| 石嘴山市| 上高县| 克东县| 武冈市| 瑞金市| 哈密市| 乌兰县| 定结县| 喜德县| 田东县| 九寨沟县| 兴安县| 枣强县| 华蓥市| 祁阳县| 宝清县| 康平县| 祁东县| 雷波县| 武城县| 儋州市| 阳春市| 辉南县| 萍乡市| 石城县| 泽普县| 如东县| 玉溪市| 黔南| 祥云县| 缙云县| 武汉市| 商城县| 炎陵县| 顺昌县|