作者:小巖
編輯:白云朵朵
正所謂一波未平,,一波又起。
OpenAI的宮斗大戲在歷經(jīng)幾次反轉(zhuǎn)后終于落下帷幕。就在看客們認(rèn)為OpenAI終于要偃旗息鼓,,回歸平靜時(shí),新的一場(chǎng)風(fēng)波迫不及待的開始了。
根據(jù)路透社曝光,,就在Sam Altman被解雇之前,幾位研究人員曾給董事會(huì)寄出一封警告信,。這封警告信的內(nèi)容,,很可能是引起整個(gè)事件的真正導(dǎo)火索。警告信中表示,內(nèi)部名為Q*(發(fā)音為的Q Star)的下一代AI模型,,發(fā)展的過于強(qiáng)大過于先進(jìn),,到底有多強(qiáng)大和先進(jìn)呢?大概是到了可以威脅人類的地步,。
而Q*的主導(dǎo)人,,正是OpenAI的首席科學(xué)家Ilya Sutskeve,也是其宮斗大戲中,,始終處于風(fēng)口浪尖上的人物,。
大家很自然的就把這一切與OpenAI前幾天的“兵變”串聯(lián)在了一起,不禁發(fā)現(xiàn),,這是一場(chǎng)分外精彩的大戲,。
新模型Q*,究竟是什么,?
截至目前,,OpenAI官方還沒有關(guān)于Q*的詳細(xì)信息,我們先嘗試根據(jù)網(wǎng)上的信息,,拼湊了解一下,,究竟什么是Q*。
Q*,,也叫Q Star,。需要說明的是,雖然在深度學(xué)習(xí)的領(lǐng)域,,區(qū)塊之間通過乘積來求解,,但在Q*這里并非如此,它只是代表“star”,。
在AI領(lǐng)域,,與Q相關(guān)的,本質(zhì)上都是Q學(xué)習(xí)(Q Learning),。Q學(xué)習(xí)這一基本概念最早誕生于1989年,。2013年,DeepMind曾經(jīng)通過改進(jìn)Q學(xué)習(xí)的方式,,推出過一個(gè)叫做深度Q學(xué)習(xí)的算法,。深度Q學(xué)習(xí)最鮮明的特點(diǎn)就是使用經(jīng)歷回放,即從過去多個(gè)結(jié)果中進(jìn)行采樣,,再使用Q學(xué)習(xí),,進(jìn)而達(dá)到提高模型的穩(wěn)定性的作用,降低模型因?yàn)槟骋淮谓Y(jié)果導(dǎo)致訓(xùn)練方向過于發(fā)散的風(fēng)險(xiǎn),。
一直以來,,Q學(xué)習(xí)的研究都沒有太突出的成果,,所以這個(gè)概念相對(duì)小眾。但Q學(xué)習(xí)起到了一個(gè)極其重要的作用——開發(fā)出了DQN,。DQN是指深度Q網(wǎng)絡(luò),,誕生于深度Q學(xué)習(xí)。DQN的思路和Q學(xué)習(xí)是一模一樣的,,但是在求得Q學(xué)習(xí)中最大獎(jiǎng)勵(lì)值的過程,,是用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)的。這一下子就顯得與眾不同了,。
以上我們所解釋的是“Q”代表的含義,,那其中的“*”又意味著什么呢,?
由于OpenAI沒有官方解釋,大家只能對(duì)此進(jìn)行推測(cè),。但很多業(yè)內(nèi)專業(yè)人士認(rèn)為,,“*”代表的是A*算法。所謂A*算法的運(yùn)行原理,,是先通過啟發(fā)式算法(也就是估值),,估算一個(gè)大概的值,當(dāng)然這個(gè)值很有可能極其偏離正解,。估算完成后就會(huì)開始循環(huán)遍歷,,如果怎么都沒辦法求解那就重新估值,直到開始出現(xiàn)解,。如此反復(fù),,最終得出最佳解。這種算法耗時(shí)較長(zhǎng),,只能在實(shí)驗(yàn)室環(huán)境進(jìn)行操作,。
通過以上的說明,想必大家對(duì)“Q”和“*”都有了初步的了解,。根據(jù)AI圈的共識(shí),,OpenAI的Q*最有可能的樣子,就是利用Q學(xué)習(xí)快速找到接近最優(yōu)解的估值,,再利用A*算法在小范圍內(nèi)求解,,從而省去大量沒有意義的計(jì)算過程,,以此達(dá)到快速求得最佳解的效果,。
出其不意的Q*,是否會(huì)過于強(qiáng)大,,威脅人類,?
對(duì)于出其不意的Q*,,大家關(guān)注的點(diǎn)基本一致:它的研發(fā)進(jìn)行到哪一步了?是否會(huì)威脅到人類,?
之所以有這樣的擔(dān)憂,,是因?yàn)榇蠹野裃*的推出與Sam Altman此前在APEC峰會(huì)上的發(fā)言聯(lián)系在了一起。彼時(shí),,Altman表示,,“OpenAI歷史上已經(jīng)有過4次,最近1次就是在過去幾周,,當(dāng)我們推開無知之幕并抵達(dá)探索發(fā)現(xiàn)的前沿時(shí),,我就在房間里,這是職業(yè)生涯中的最高榮譽(yù)”,。很多人認(rèn)為,,“最近的一次”,指的就是Q*,。
而Ilya Sutskeve,,也曾在幾周前的一次采訪中表示,“不談太多細(xì)節(jié),,只想說數(shù)據(jù)限制是可以被克服,,進(jìn)步仍可以繼續(xù)”。
通過以上的信息,,有人分析Q*目前至少具備兩個(gè)核心特性,。一是突破了人類數(shù)據(jù)的限制,可以自己生產(chǎn)海量數(shù)據(jù),;二是擁有了自主學(xué)習(xí)和自我改進(jìn)的能力,。特別是第2點(diǎn),被認(rèn)為很有可能對(duì)人類造成威脅,。
但對(duì)此,,一些業(yè)內(nèi)專業(yè)人士給予了不同的意見。Meta首席人工智能科學(xué)家楊立坤(Yann LeCun)就認(rèn)為,,Q*是OpenAI的一次規(guī)劃性嘗試,并不意味著它已經(jīng)取得了某些突破,。諸如FAIR,,DeepMind,OpenAI一類的頂級(jí)實(shí)驗(yàn)室其實(shí)早早就對(duì)此有了研究,。這不是什么新鮮的新聞,,這看上去更像是在炒冷飯。
由此我們不難發(fā)現(xiàn),,相較于Q*目前取得的進(jìn)展,,此次事件所帶給OpenAI的輿情影響力,似乎更大,。
“人工智能是否會(huì)對(duì)人類構(gòu)成生存風(fēng)險(xiǎn)”——這個(gè)問題始終值得警惕,。
對(duì)于炒作和八卦,我們大可以一笑置之,,但嚴(yán)峻的現(xiàn)實(shí)不容忽慮:不定期出現(xiàn)的炒作會(huì)讓大家降低對(duì)AI的警惕心理,,會(huì)分散人們對(duì)AI可能造成的,AI已經(jīng)造成的問題的注意力,。
AI是否會(huì)對(duì)人類構(gòu)成生存風(fēng)險(xiǎn),,這將是一把始終懸在人類頭頂?shù)倪_(dá)摩克利斯之劍。不僅OpenAI這一類的專業(yè)公司需要警惕“人工智能暴動(dòng)”,,全人類都應(yīng)該對(duì)此保持清醒,。譬如OpenAI 的董事會(huì)設(shè)計(jì)了“內(nèi)部終止開關(guān)和治理機(jī)制”,以防止推出有害技術(shù),。再比如歐盟即將敲定全面的《人工智能法案》,。目前立法者之間最大的爭(zhēng)論之一是,是否要賦予科技公司更多的權(quán)力,,讓它們自行監(jiān)管尖端的人工智能模型,。
一旦我們?cè)试SAI系統(tǒng)設(shè)定自己的目標(biāo),并開始以某種方式與真實(shí)的物理或數(shù)字世界對(duì)接,,很可能會(huì)出現(xiàn)安全問題,。炒作永遠(yuǎn)都不會(huì)缺席,商業(yè)性質(zhì)的公司永遠(yuǎn)會(huì)將“優(yōu)先考慮自身利益”作為首要目標(biāo),。在這種情況下,,我們更需要擁有透過現(xiàn)象看本質(zhì)的能力,了解AI,,重視AI,,警惕AI。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1081219.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。