當大模型加速涌入金融、政務、能源等關鍵領域,其“越智能,越危險”的安全悖論正引發(fā)行業(yè)警覺。在2025年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上,360數(shù)字安全集團正式發(fā)布國內(nèi)首份《大模型安全白皮書》,系統(tǒng)性揭示大模型全生命周期中的五大核心風險,并首次提出“外掛式安全 + 平臺原生安全”雙軌治理框架,為高危AI時代拉起一道縱深防御屏障。
白皮書指出,大模型的安全威脅已形成跨層級、強耦合的復雜矩陣,涵蓋五大維度:
基礎設施層:算力集群、訓練平臺遭攻擊可能導致模型被投毒或竊取;
內(nèi)容層:生成虛假信息、違規(guī)內(nèi)容或“AI幻覺”引發(fā)社會風險;
數(shù)據(jù)與知識庫層:訓練數(shù)據(jù)泄露、知識庫被污染將動搖模型可信根基;
智能體層(Agent):自主決策的AI代理若被操控,可能執(zhí)行惡意任務;
用戶端層:提示注入、越權訪問等攻擊可繞過防護直接操控模型行為。
面對這一多維威脅,360提出雙軌并行的安全策略:
“外掛式安全”:在模型外部部署監(jiān)測、過濾與審計系統(tǒng),如內(nèi)容合規(guī)網(wǎng)關、異常行為檢測;
“平臺原生安全”:將安全能力內(nèi)嵌至大模型研發(fā)、訓練、部署、推理各環(huán)節(jié),實現(xiàn)“安全即代碼”。
基于該理念,360已構建覆蓋數(shù)據(jù)脫敏、模型加固、內(nèi)容過濾、Agent行為審計、API防護、紅藍對抗、安全合規(guī)等七大核心能力的全鏈路解決方案,并在金融、制造、政務等多個行業(yè)落地實踐。
360強調(diào),單靠企業(yè)防護遠遠不夠。未來將聯(lián)合產(chǎn)學研各方,推動大模型安全標準制定、威脅情報共享與開源安全工具共建,打造開放、協(xié)同、可信的AI安全生態(tài)。
AIbase認為,在大模型從“技術秀場”邁向“生產(chǎn)基礎設施”的關鍵節(jié)點,360的白皮書不僅是一份風險預警,更是一張AI安全新基建的路線圖。當智能成為生產(chǎn)力,安全必須成為底線——這場由360發(fā)起的防御戰(zhàn),關乎的不只是技術,更是AI能否被社會真正信任與托付的未來。


產(chǎn)品與服務
聯(lián)系站長
關于我們