A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

給狂飆的大模型系上“安全帶” 瑞萊智慧發(fā)布全新AI安全平臺｜2023世界人工智能大會

新民晚報 ? 2023年7月8日上午10:32 ? 人工智能 ? 閱讀 9212

圖說：瑞萊智慧RealAI聯(lián)合創(chuàng)始人、算法科學(xué)家采訪對象供圖（下同）

近幾個月來,，以ChatGPT為代表的生成式人工智能狂飆突進,，大模型時代已然降臨,。在“百模大戰(zhàn)”越戰(zhàn)越酣之時,，大模型其內(nèi)生及衍生安全威脅也愈演愈烈,，數(shù)據(jù)泄露,、幻想,、生產(chǎn)歧視、排斥和有害內(nèi)容等安全問題層出不窮,。

如何將制約大模型應(yīng)用發(fā)展的“絆腳石”變?yōu)椤皦号撌保?/p>

7月7日,，清華大學(xué)人工智能研究院孵化企業(yè)瑞萊智慧RealAI在2023世界人工智能大會上,，發(fā)布了全新人工智能安全平臺RealSafe3.0，為“加速度”發(fā)展中的大模型系好“安全帶”，把好“方向盤”,。

現(xiàn)狀：“雙刃劍”效應(yīng) 制約大模型落地

和所有通用目的技術(shù)一樣，自人工智能誕生的那一刻起,，創(chuàng)造技術(shù)的力量和控制技術(shù)的力量就存在不對等,。新技術(shù)必然會帶來新的安全問題，這正是技術(shù)兩面性,。大模型亦是如此,，盡管它的強大已讓人類瞥見了通用人工智能的曙光，但也讓眾多學(xué)界,、業(yè)界人士心生憂懼,。前不久，就有全球400多位專家發(fā)布聯(lián)名公開信,，警告人工智能發(fā)展速度過快,，缺乏監(jiān)管，可能會危及人類生存,。

他們的擔(dān)憂并非危言聳聽,。近段時間以來，關(guān)于大模型的安全隱患屢見不鮮,，例如：機密文件被泄露,、添加無意義的字符后模型竟給出完全相反的回答、輸出違法有害內(nèi)容,、隱含對某些人類社群的偏見和歧視等等,。

這一新興技術(shù)帶來的風(fēng)險，已經(jīng)引起世界各國的高度關(guān)注,。國家互聯(lián)網(wǎng)信息辦公室4月11日起草《生成式人工智能服務(wù)管理辦法(征求意見稿)》公開征求意見,；歐盟于6月14日投票通過了《人工智能法案》，以期法律法規(guī)引領(lǐng)技術(shù)向好向善發(fā)展,。

瑞萊智慧聯(lián)合創(chuàng)始人,、算法科學(xué)家蕭子豪認(rèn)為，大模型“落地難”的本質(zhì)在于,，當(dāng)前仍處于“野蠻生長”階段,，還沒有找到場景、風(fēng)險和規(guī)范三者之間的平衡點,。而在探尋這一平衡點的過程中,，缺少易用和標(biāo)準(zhǔn)化的工具，即在技術(shù)層面上缺乏有力抓手,，能夠科學(xué)評判大模型在場景中能否同時滿足規(guī)范和低風(fēng)險,，且能夠進一步定位問題并給出優(yōu)化建議，助力模型上線運行。

圖說：瑞萊智慧人工智能安全平臺RealSafe3.0通用大模型測評及優(yōu)化工作流程

出路：源頭上找癥結(jié),，技術(shù)上找對策

因此,，瑞萊智慧在2023世界人工智能大會上，正式發(fā)布人工智能安全平臺RealSafe3.0版本,。它是集成主流及RealAI獨有的世界領(lǐng)先的安全評測技術(shù),，能夠提供端到端的模型安全性測評解決方案，解決當(dāng)前通用大模型安全風(fēng)險難以審計的痛點問題,。

相較上一版本,，RealSafe3.0新增了對通用大模型的評測，在評測維度上,，它已覆蓋數(shù)據(jù)安全,、認(rèn)知任務(wù)、通用模型特有漏洞,、濫用場景等近70個評測維度,，全方位多維度地評測通用大模型的性能，且未來還會持續(xù)擴增測評維度的數(shù)量,。

“評測只是手段,，幫助通用大模型提升其自身安全性才是核心目的?！笔捵雍勒f,，不能因為對于被技術(shù)反噬的擔(dān)憂就止步不前，創(chuàng)造新技術(shù)和控制技術(shù)危害應(yīng)該同步進行,，“瑞萊智慧的辦法是,，從源頭上找到癥結(jié)，再用‘魔法’打敗‘魔法’,?！?/p>

如果將人工智能模型比作“引擎”，數(shù)據(jù)則是模型的“燃料”,?？梢哉f，數(shù)據(jù)集質(zhì)量直接影響模型的內(nèi)生安全,。因此,，RealSafe3.0內(nèi)部集成了多個自研模型和專家論證高質(zhì)量數(shù)據(jù)集，來幫助用戶修復(fù)模型中的問題,。

對黑盒不可解釋的通用大模型,，自研紅隊對抗模型取代人工設(shè)計問題，顯著提升攻擊成功率和樣本多樣性,。也就是說,，該模型數(shù)據(jù)集中,，不僅包含了自有數(shù)據(jù)集，還包含了模型自生成的數(shù)據(jù),，無論是從數(shù)據(jù)質(zhì)量還是數(shù)據(jù)規(guī)模上都可圈可點,，因此它能夠自動化地挖掘出更多的漏洞，真正從源頭上緩解安全問題,。

教練模型則通過對被測大模型進行多輪次的提問-回答訓(xùn)練,，并以訓(xùn)練好的評分模型對問答結(jié)果進行評分，再將評分結(jié)果反饋給大模型,，使其不斷強化學(xué)習(xí)到好壞答案的要點及區(qū)別，直至問答能力逐步迭代至最優(yōu),。除了定制化的訓(xùn)練框架,，教練模型理想的模型效果還得益于夯實的數(shù)據(jù)基礎(chǔ)，瑞萊智慧自有數(shù)據(jù)集經(jīng)過數(shù)十位價值觀領(lǐng)域的專家論證,，以確保輸入的數(shù)據(jù)無誤,，質(zhì)量高且領(lǐng)域多元，未來也將持續(xù)更新補充,。

蕭子豪透露：“這些技術(shù),，都是基于自研多模態(tài)大模型底座實現(xiàn)的?！?/p>

新民晚報記者郜陽

免責(zé)聲明：本文來自網(wǎng)絡(luò)收錄或投稿,，觀點僅代表作者本人，不代表芒果財經(jīng)贊同其觀點或證實其描述,，版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處：http://lequren.com/1055875.html
溫馨提示：投資有風(fēng)險，入市須謹(jǐn)慎,。本資訊不作為投資理財建議,。