原文來源:AIGC開放社區(qū)
圖片來源:由無界 AI生成
12月19日,,OpenAI在官網(wǎng)公布了“準(zhǔn)備框架”(Preparedness Framework)測試版,。該文檔詳細(xì)介紹了OpenAI是如何保證ChatGPT等產(chǎn)品的安全防護(hù)措施、開發(fā)和部署流程,。
OpenAI表示,,隨著大模型的功能迭代不斷完善,其能力已經(jīng)開始接近初級AGI(通用人工智能),,安全已成為開發(fā)AI模型的重中之重,。
因此,OpenAI希望通過詳細(xì)公布AI模型的安全框架透明化,,使社會,、用戶深度了解模型的工作機(jī)制,確保以安全,、健康的方式應(yīng)用在實(shí)際業(yè)務(wù)中,。同時(shí)為研發(fā)超級模型奠定安全基礎(chǔ)。
詳細(xì)文件地址:https://cdn.openai.com/openai-preparedness-framework-beta.pdf
跟蹤風(fēng)險(xiǎn)類別
OpenAI明確列出了4類可能帶來災(zāi)難性后果的風(fēng)險(xiǎn)領(lǐng)域需要特別關(guān)注,分別是網(wǎng)絡(luò)安全風(fēng)險(xiǎn)、CBRN風(fēng)險(xiǎn)(化學(xué),、生物,、放射性,、核)、說客能力風(fēng)險(xiǎn)以及模型的自主能力風(fēng)險(xiǎn),。
并對每一類風(fēng)險(xiǎn)安全框架都給出了低,、中、高,、特別高四個(gè)等級,來描述系統(tǒng)在該風(fēng)險(xiǎn)領(lǐng)域所處的危險(xiǎn)水平,。
以網(wǎng)絡(luò)安全風(fēng)險(xiǎn)為例,框架將低級定為系統(tǒng)僅可以用于非編程任務(wù),;中級為系統(tǒng)可以明顯提高黑客攻擊效率;高級為系統(tǒng)能夠自動發(fā)現(xiàn)和利用高價(jià)值漏洞,;
特別高級為系統(tǒng)能夠自動找到和利用任何軟件的漏洞,。這種細(xì)分的安全體系,可以指導(dǎo)開發(fā)人員更精準(zhǔn)的評估模型,。
建立安全基線
OpenAI設(shè)定了嚴(yán)格的安全基線:只有在減輕后評分,,為"中等"或以下的模型才能部署;只有安全評分為"高"的模型才能進(jìn)一步開發(fā),、應(yīng)用,。
此外,對于評分卡中具有"高"或"關(guān)鍵"風(fēng)險(xiǎn)的模型,,OpenAI還將確保相應(yīng)的安全措施,,以防止模型被竊取。
同時(shí)會定期動態(tài)跟蹤和更新各類風(fēng)險(xiǎn)的“加強(qiáng)前”和“加強(qiáng)后”評級情況?!凹訌?qiáng)前”評估系統(tǒng)本身的風(fēng)險(xiǎn)水平,“加強(qiáng)后”看系統(tǒng)采取了哪些安全預(yù)防措施后余下的風(fēng)險(xiǎn),。
例如,某次評估顯示,在沒有采取任何措施的情況下,一個(gè)新模型在網(wǎng)絡(luò)安全方面的加強(qiáng)前風(fēng)險(xiǎn)達(dá)到了高級,。
經(jīng)過一輪實(shí)驗(yàn)驗(yàn)證后,通過設(shè)計(jì)專門的安全模組后,該模型的加強(qiáng)后風(fēng)險(xiǎn)降到了中等水平,。這可以清晰地告訴研發(fā)人員模型當(dāng)前的安全狀況,以及應(yīng)采取哪些補(bǔ)救措施。
建立安全咨詢團(tuán)隊(duì)
OpenAI將成立一個(gè)名為"安全咨詢小組"(Safety Advisory Group,,SAG)的跨職能咨詢機(jī)構(gòu),。該小組將匯集公司內(nèi)部的專業(yè)知識,幫助OpenAI的領(lǐng)導(dǎo)層和董事會做出最佳的安全決策,。
安全咨詢小組的職責(zé)包括監(jiān)督風(fēng)險(xiǎn)評估工作,、維護(hù)應(yīng)急情況處理的快速流程等。
OpenAI還成立了一個(gè)“準(zhǔn)備團(tuán)隊(duì)”,,專門負(fù)責(zé)模型的安全研發(fā)和維護(hù)。該團(tuán)隊(duì)將進(jìn)行研究,、評估,、監(jiān)測和預(yù)測風(fēng)險(xiǎn),并定期向"安全咨詢小組"提供報(bào)告,。
這些報(bào)告將總結(jié)最新的安全證據(jù),,并提出改進(jìn)OpenAI研發(fā)大模型的安全計(jì)劃建議。
此外,,準(zhǔn)備團(tuán)隊(duì)還將與相關(guān)團(tuán)隊(duì)(如安全系統(tǒng),、安全性、超級對齊,、政策研究等)協(xié)調(diào)合作,,整合出有效的安全措施。
此外,,準(zhǔn)備團(tuán)隊(duì)還將負(fù)責(zé)組織安全演練,,并與可信AI團(tuán)隊(duì)合作進(jìn)行第三方安全審計(jì)。
需要注意的是,這是一份動態(tài)文檔,,OpenAI會根據(jù)實(shí)際的安全情況對內(nèi)容進(jìn)行更新和說明,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1083883.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。