Check Point旗下公司Lakera推出面向AI代理的大型語(yǔ)言模型開(kāi)源安全基準(zhǔn)測(cè)試
Check Point旗下公司Lakera推出面向AI代理的大型語(yǔ)言模型開(kāi)源安全基準(zhǔn)測(cè)試
2025年11月, 網(wǎng)絡(luò)安全解決方案的先驅(qū)與全球領(lǐng)導(dǎo)者Check Point軟件技術(shù)有限公司(納斯達(dá)克股票代碼:CHKP)與行業(yè)領(lǐng)先、專注于AI代理應(yīng)用安全的AI原生安全平臺(tái)Lakera,聯(lián)合英國(guó)人工智能安全研究所(AISI)的研究人員,近日發(fā)布專為AI智能體中大型語(yǔ)言模型(LLM)安全設(shè)計(jì)的開(kāi)源安全評(píng)估工具——骨干破壞基準(zhǔn)測(cè)試(backbone breaker benchmark )b3。
b3 基于“威脅快照”的新理念構(gòu)建,不再模擬人工智能代理從始至終的完整過(guò)程,而是聚焦于大語(yǔ)言模型最易暴露漏洞的關(guān)鍵節(jié)點(diǎn)。通過(guò)在這些精確時(shí)刻測(cè)試模型,開(kāi)發(fā)者和模型供應(yīng)商無(wú)需構(gòu)建復(fù)雜的完整代理工作流,即可評(píng)估其系統(tǒng)在更真實(shí)對(duì)抗挑戰(zhàn)中的抗壓能力。
“我們創(chuàng)造b3基準(zhǔn)測(cè)試,是因?yàn)楫?dāng)今人工智能代理的安全性完全取決于其背后的LLM模型,”Check Point旗下公司Lakera的聯(lián)合創(chuàng)始人兼首席科學(xué)家Mateo Rojas-Carulla表示?!巴{快照功能讓我們能夠系統(tǒng)性地揭示那些至今仍隱藏在復(fù)雜代理工作流中的漏洞。通過(guò)向全球開(kāi)放該基準(zhǔn)測(cè)試,我們希望為開(kāi)發(fā)者和模型供應(yīng)商提供一種切實(shí)可行的方法,來(lái)衡量并提升其安全態(tài)勢(shì)?!?/p>
該基準(zhǔn)測(cè)試結(jié)合了10個(gè)具有代表性的代理“威脅快照”,以及通過(guò)紅隊(duì)對(duì)抗測(cè)試Gandalf: Agent Breaker收集的19,433個(gè)高質(zhì)量眾包對(duì)抗攻擊數(shù)據(jù)集。它評(píng)估了系統(tǒng)對(duì)各類攻擊的易受攻擊性,包括系統(tǒng)提示泄露、釣魚鏈接植入、惡意代碼注入、拒絕服務(wù)攻擊以及未授權(quán)工具調(diào)用等。
該項(xiàng)目現(xiàn)已通過(guò)開(kāi)源許可證發(fā)布,地址為https://arxiv.org/abs/2510.22620
Gandalf: Agent Breaker是一款黑客模擬游戲,挑戰(zhàn)玩家在真實(shí)場(chǎng)景中破解并利用AI代理的能力。游戲內(nèi)置的十款通用人工智能應(yīng)用程序模擬了現(xiàn)實(shí)世界中AI代理的行為模式。每款應(yīng)用均設(shè)有不同難度等級(jí)、分層防御機(jī)制及創(chuàng)新攻擊面,旨在考驗(yàn)從提示工程到紅隊(duì)對(duì)抗等全方位技能。部分應(yīng)用基于聊天交互,其余則需運(yùn)用代碼級(jí)思維、文件處理、內(nèi)存操作或外部工具使用等能力。
Gandalf: Agent Breaker的初始版本誕生于Lakera內(nèi)部的黑客馬拉松競(jìng)賽,當(dāng)時(shí)藍(lán)隊(duì)與紅隊(duì)試圖為持有秘密密碼的大型語(yǔ)言模型構(gòu)建最強(qiáng)大的防御與攻擊體系。自2023年發(fā)布以來(lái),它已成為全球規(guī)模最大的紅隊(duì)對(duì)抗社區(qū),累計(jì)生成逾8000萬(wàn)條數(shù)據(jù)點(diǎn)。這款最初作為趣味游戲開(kāi)發(fā)的工具,通過(guò)揭示生成式AI應(yīng)用中的現(xiàn)實(shí)漏洞,有效提升了人們對(duì)“AI優(yōu)先安全”重要性的認(rèn)知。
關(guān)于 Check Point 軟件技術(shù)有限公司
Check Point 軟件技術(shù)有限公司(www.checkpoint.com)是數(shù)字信任領(lǐng)域的領(lǐng)先保護(hù)者,通過(guò) AI 驅(qū)動(dòng)的網(wǎng)絡(luò)安全解決方案,保護(hù)全球超過(guò) 100,000 家組織與機(jī)構(gòu)免受網(wǎng)絡(luò)威脅。Check Point 通過(guò)其 Infinity 平臺(tái)與開(kāi)放生態(tài)系統(tǒng),堅(jiān)持“預(yù)防為先”的理念,在提升安全效能的同時(shí)降低企業(yè)風(fēng)險(xiǎn)。依托以 SASE 為核心的混合網(wǎng)格架構(gòu),Infinity 平臺(tái)實(shí)現(xiàn)了本地、云端及辦公環(huán)境的統(tǒng)一管理,為企業(yè)及服務(wù)提供商帶來(lái)靈活、簡(jiǎn)潔、可擴(kuò)展的網(wǎng)絡(luò)安全能力。
關(guān)于Lakera
Lakera是面向智能代理AI應(yīng)用的領(lǐng)先原生AI安全平臺(tái),致力于保護(hù)《財(cái)富》500強(qiáng)企業(yè)及頂尖科技公司免受新興AI網(wǎng)絡(luò)風(fēng)險(xiǎn)威脅。依托全球頂尖紅隊(duì)社區(qū)Gandalf及其專有AI技術(shù),Lakera的防御體系能實(shí)時(shí)進(jìn)化,為企業(yè)抵御新興威脅。Lakera由David Haber、Mateo Rojas-Carulla博士與Matthias Kraft博士于2021年聯(lián)合創(chuàng)立,總部位于蘇黎世與舊金山雙城。了解更多信息,請(qǐng)?jiān)L問(wèn)Lakera.ai,體驗(yàn)Gandalf及Gandalf:Agent Breaker,并通過(guò)領(lǐng)英關(guān)注我們。
關(guān)注我們


