隨著大語言模型 (LLM) 在各行業(yè)得到更廣泛的應(yīng)用,確保這些強(qiáng)大 AI 工具的安全性已成為一個(gè)日益增長的關(guān)切。本周在新加坡舉行的 Black Hat Asia 2025 大會(huì)上,一組專家深入探討了 LLM 防火墻是否是 AI 安全的解決方案,還是僅僅是整個(gè)安全體系中的一部分。
網(wǎng)絡(luò)安全公司 CloudsineAI 的創(chuàng)始人 Matthias Chin 首先指出了防護(hù)機(jī)制和防火墻之間的區(qū)別:"防護(hù)機(jī)制是一種保護(hù)機(jī)制,而防火墻是一個(gè)具有更多功能的安全概念 - 例如,它是一個(gè)控制點(diǎn),包含防護(hù)機(jī)制,擁有威脅向量數(shù)據(jù)庫,并可以與 SIEM (安全信息和事件管理) 工作流程集成。"
新加坡內(nèi)政團(tuán)隊(duì)科技局 (HTX) 首席創(chuàng)新官兼首席云工程師 Pan Yong Ng 指出,將 AI 安全整合到組織 IT 基礎(chǔ)設(shè)施的基礎(chǔ)中非常重要,盡管對于安全控制應(yīng)該放在哪里仍存在不確定性。他建議在各個(gè)層面實(shí)施組合控制,從推理服務(wù)模型到 Web 應(yīng)用程序安全,甚至擴(kuò)展到 AI 代理。
AI Singapore 的 AI 創(chuàng)新總監(jiān) Laurence Liew 表示,開發(fā)人員對 AI 代理和大語言模型的使用日益增加,這將需要使用 LLM 防火墻來執(zhí)行防護(hù)機(jī)制和企業(yè)政策。他說:"我們告訴年輕工程師要確保設(shè)置某些防護(hù)機(jī)制,他們會(huì)去做,但他們經(jīng)常忙于編碼,以至于防護(hù)機(jī)制可能沒有得到更新。"
新加坡南洋理工大學(xué)研究員 Xiaojun Jia 指出了傳統(tǒng)防火墻在解決 LLM 特定安全問題方面的局限性。他說:"傳統(tǒng)防火墻專注于網(wǎng)絡(luò)安全,這使得它們在防御利用 LLM 邏輯流程的越獄攻擊方面效果不佳。"
Chin 補(bǔ)充說,LLM 防火墻不僅僅是為了確保 AI 安全 - 它們也用于 AI 安全性,以防止模型幻覺和產(chǎn)生有偏見和有害的輸出。它們還可以防范通過人類語言和提示而不是代碼執(zhí)行的新一代攻擊。
專家組還探討了通用 LLM 防火墻是否能夠在所有行業(yè)中有效運(yùn)作,還是需要定制化的問題。
Liew 特別提到了 AI Singapore 與政府機(jī)構(gòu)的轉(zhuǎn)錄項(xiàng)目,其中語音轉(zhuǎn)文本引擎根據(jù)每個(gè)機(jī)構(gòu)的需求進(jìn)行了微調(diào)。他說,同樣地,LLM 防火墻應(yīng)該經(jīng)過精心設(shè)計(jì),以處理醫(yī)療保健和金融服務(wù)等特定場景。
在實(shí)施 LLM 防火墻方面,Jia 提倡采用包括輸入檢測、模型調(diào)優(yōu)和輸出過濾的多層次方法。
"輸入檢測在提示輸入模型之前檢測惡意輸入,模型調(diào)優(yōu)確保輸出與人類價(jià)值觀一致,輸出過濾檢測有害輸出,"Jia 說,同時(shí)他也承認(rèn)在安全性和可用性之間取得平衡是一個(gè)挑戰(zhàn),呼吁采用能夠應(yīng)對不斷演變的攻擊的自適應(yīng)防御措施。
測試和基準(zhǔn)測試對于確保 LLM 及其防火墻按預(yù)期工作至關(guān)重要。Chin 表示這個(gè)領(lǐng)域仍在發(fā)展中,需要完成的工作將取決于測試用例,并與防火墻將部署的行業(yè)(無論是銀行還是醫(yī)療保健)保持一致。他指出 Meta 的 CyberSecEval 和新加坡的 AI Verify 是可以幫助支持測試和基準(zhǔn)測試工作的示例。
Liew 強(qiáng)調(diào)了在構(gòu)建和測試 LLM 時(shí)擁有多元化團(tuán)隊(duì)的重要性。他說:"擁有跨不同學(xué)科的人才非常重要。確保團(tuán)隊(duì)中有了解領(lǐng)域的人。你會(huì)驚訝地發(fā)現(xiàn),他們提出的問題是網(wǎng)絡(luò)安全工程師從未想到的。"
關(guān)于 LLM 防火墻是否會(huì)阻礙 AI 創(chuàng)新,Chin 表示,隨著模型上下文協(xié)議 (MCP) 等新興技術(shù)的采用 - 這是 Anthropic 開發(fā)的一個(gè)開放標(biāo)準(zhǔn),允許 AI 代理與其他應(yīng)用程序和數(shù)據(jù)源通信 - AI 代理可能會(huì)繞過 LLM 防火墻并開始與其他代理通信。他補(bǔ)充說:"我們必須讓創(chuàng)新蓬勃發(fā)展,并繼續(xù)建立應(yīng)對挑戰(zhàn)的敏捷性。"
Chin 表示,LLM 防火墻將繼續(xù)發(fā)展,這是由代理式 AI 框架的興起推動(dòng)的,組織,特別是大型企業(yè)和政府,將需要某種形式的防護(hù)機(jī)制或防火墻。就像網(wǎng)絡(luò)防火墻現(xiàn)在包括 Web 應(yīng)用防火墻和終端防火墻一樣,他指出 LLM 防火墻可以采用部署在安全控制點(diǎn)和終端的硬件或軟件形式。