大語言模型防火墻是 AI 安全的未來嗎？

發(fā)布于：2025-04-11 點(diǎn)擊量：903 來源：至頂網(wǎng)

隨著大語言模型 (LLM) 在各行業(yè)得到更廣泛的應(yīng)用，確保這些強(qiáng)大 AI 工具的安全性已成為一個(gè)日益增長的關(guān)切。本周在新加坡舉行的 Black Hat Asia 2025 大會(huì)上，一組專家深入探討了 LLM 防火墻是否是 AI 安全的解決方案，還是僅僅是整個(gè)安全體系中的一部分。

網(wǎng)絡(luò)安全公司 CloudsineAI 的創(chuàng)始人 Matthias Chin 首先指出了防護(hù)機(jī)制和防火墻之間的區(qū)別："防護(hù)機(jī)制是一種保護(hù)機(jī)制，而防火墻是一個(gè)具有更多功能的安全概念 - 例如，它是一個(gè)控制點(diǎn)，包含防護(hù)機(jī)制，擁有威脅向量數(shù)據(jù)庫，并可以與 SIEM (安全信息和事件管理) 工作流程集成。"

新加坡內(nèi)政團(tuán)隊(duì)科技局 (HTX) 首席創(chuàng)新官兼首席云工程師 Pan Yong Ng 指出，將 AI 安全整合到組織 IT 基礎(chǔ)設(shè)施的基礎(chǔ)中非常重要，盡管對于安全控制應(yīng)該放在哪里仍存在不確定性。他建議在各個(gè)層面實(shí)施組合控制，從推理服務(wù)模型到 Web 應(yīng)用程序安全，甚至擴(kuò)展到 AI 代理。

AI Singapore 的 AI 創(chuàng)新總監(jiān) Laurence Liew 表示，開發(fā)人員對 AI 代理和大語言模型的使用日益增加，這將需要使用 LLM 防火墻來執(zhí)行防護(hù)機(jī)制和企業(yè)政策。他說："我們告訴年輕工程師要確保設(shè)置某些防護(hù)機(jī)制，他們會(huì)去做，但他們經(jīng)常忙于編碼，以至于防護(hù)機(jī)制可能沒有得到更新。"

新加坡南洋理工大學(xué)研究員 Xiaojun Jia 指出了傳統(tǒng)防火墻在解決 LLM 特定安全問題方面的局限性。他說："傳統(tǒng)防火墻專注于網(wǎng)絡(luò)安全，這使得它們在防御利用 LLM 邏輯流程的越獄攻擊方面效果不佳。"

Chin 補(bǔ)充說，LLM 防火墻不僅僅是為了確保 AI 安全 - 它們也用于 AI 安全性，以防止模型幻覺和產(chǎn)生有偏見和有害的輸出。它們還可以防范通過人類語言和提示而不是代碼執(zhí)行的新一代攻擊。

專家組還探討了通用 LLM 防火墻是否能夠在所有行業(yè)中有效運(yùn)作，還是需要定制化的問題。

Liew 特別提到了 AI Singapore 與政府機(jī)構(gòu)的轉(zhuǎn)錄項(xiàng)目，其中語音轉(zhuǎn)文本引擎根據(jù)每個(gè)機(jī)構(gòu)的需求進(jìn)行了微調(diào)。他說，同樣地，LLM 防火墻應(yīng)該經(jīng)過精心設(shè)計(jì)，以處理醫(yī)療保健和金融服務(wù)等特定場景。

在實(shí)施 LLM 防火墻方面，Jia 提倡采用包括輸入檢測、模型調(diào)優(yōu)和輸出過濾的多層次方法。

"輸入檢測在提示輸入模型之前檢測惡意輸入，模型調(diào)優(yōu)確保輸出與人類價(jià)值觀一致，輸出過濾檢測有害輸出，"Jia 說，同時(shí)他也承認(rèn)在安全性和可用性之間取得平衡是一個(gè)挑戰(zhàn)，呼吁采用能夠應(yīng)對不斷演變的攻擊的自適應(yīng)防御措施。

測試和基準(zhǔn)測試對于確保 LLM 及其防火墻按預(yù)期工作至關(guān)重要。Chin 表示這個(gè)領(lǐng)域仍在發(fā)展中，需要完成的工作將取決于測試用例，并與防火墻將部署的行業(yè)(無論是銀行還是醫(yī)療保健)保持一致。他指出 Meta 的 CyberSecEval 和新加坡的 AI Verify 是可以幫助支持測試和基準(zhǔn)測試工作的示例。

Liew 強(qiáng)調(diào)了在構(gòu)建和測試 LLM 時(shí)擁有多元化團(tuán)隊(duì)的重要性。他說："擁有跨不同學(xué)科的人才非常重要。確保團(tuán)隊(duì)中有了解領(lǐng)域的人。你會(huì)驚訝地發(fā)現(xiàn)，他們提出的問題是網(wǎng)絡(luò)安全工程師從未想到的。"

關(guān)于 LLM 防火墻是否會(huì)阻礙 AI 創(chuàng)新，Chin 表示，隨著模型上下文協(xié)議 (MCP) 等新興技術(shù)的采用 - 這是 Anthropic 開發(fā)的一個(gè)開放標(biāo)準(zhǔn)，允許 AI 代理與其他應(yīng)用程序和數(shù)據(jù)源通信 - AI 代理可能會(huì)繞過 LLM 防火墻并開始與其他代理通信。他補(bǔ)充說："我們必須讓創(chuàng)新蓬勃發(fā)展，并繼續(xù)建立應(yīng)對挑戰(zhàn)的敏捷性。"

Chin 表示，LLM 防火墻將繼續(xù)發(fā)展，這是由代理式 AI 框架的興起推動(dòng)的，組織，特別是大型企業(yè)和政府，將需要某種形式的防護(hù)機(jī)制或防火墻。就像網(wǎng)絡(luò)防火墻現(xiàn)在包括 Web 應(yīng)用防火墻和終端防火墻一樣，他指出 LLM 防火墻可以采用部署在安全控制點(diǎn)和終端的硬件或軟件形式。

【版權(quán)聲明】:本站內(nèi)容來自于與互聯(lián)網(wǎng)(注明原創(chuàng)稿件除外），如文章或圖像侵犯到您的權(quán)益，請及時(shí)告知，我們第一時(shí)間刪除處理！

上一篇：AI 和 Net5.5G：實(shí)現(xiàn)下一代寬帶網(wǎng)絡(luò)的關(guān)鍵

下一篇：約會(huì)應(yīng)用 Raw 泄露用戶位置信息及個(gè)人資料

大語言模型防火墻是 AI 安全的未來嗎？

大語言模型防火墻是 AI 安全的未來嗎？