誕生于1946年的電子計算機,,把人類帶入了“智能紀元”,。它是一種“意識工具”,,不同于人類以往所有的“物質工具”,。2010年以來,,算力資源的量變帶來質變,,到了2023年,,這一變化終于使更多普通人得以感知,,也帶來了巨大的治理挑戰(zhàn),。
這方面,中國已經(jīng)開始行動,。4月11日,,國家互聯(lián)網(wǎng)信息辦公室起草的《生成式人工智能服務管理辦法(征求意見稿)》向社會公開征求意見,意見反饋截止時間為2023年5月10日,。觀察者網(wǎng)就相關話題采訪清華大學電子工程系博士,、中科院工程序列任職資格評審委員會主任、北京東方通科技股份有限公司首席科學家謝耘,,實錄如下:
觀察者網(wǎng):3月份以來,,基于OpenAI自然語言大模型GPT3.5的ChatGPT成為焦點。它不但引爆輿論,、席卷國內(nèi)資本市場,,而且讓國家互聯(lián)網(wǎng)信息辦公室迅速起草《生成式人工智能服務管理辦法(征求意見稿)》并公開征求意見,。我們也想請您就這個話題做一些討論,您認為,,從社會治理角度來說,,挑戰(zhàn)主要來自哪里,?
謝耘:這是一個比較大也比較深刻的話題,。我此前在不同場合說過,,信息技術為人類帶來了一種“意識工具”,它不同于人類以往所有的“物質工具”,,因此,,誕生于1946年的電子計算機把人類帶入了“智能紀元”。只不過,,它之前的能力還比較弱小,,很多人沒有意識到這種變化的重要性,但是2010年以來,,算力資源的量變帶來質變,,到了2023年,這一變化終于使更多普通人得以感知,。
為了便于理解,,我想稍微展開一下,先從信息技術的本質說起?,F(xiàn)在主流的科技界認為,,信息是構成世界的三大要素之一,一是物質,,一是能量,,一是信息。雖然這個說法寫進了標準的教科書,,但我認為這是錯的,,至少“信息技術”涉及的信息不是客觀的。舉個例子,,人類曾經(jīng)擁有的儲藏知識信息最集中的地方是什么,?是圖書館。那么,,假設人類消失了,,圖書館里所有的藏品還具有任何“信息”的意義嗎?那些紙上印的也罷,,數(shù)字化的也罷,,它還會和客觀世界的任何東西發(fā)生互動嗎?所以,,信息是人的意識層面的東西,。
再來談計算機,,計算機本質上是用于對數(shù)字化的信息做可編程的邏輯數(shù)值計算與處理,,其中有兩個要素,,第一,是數(shù)字化的信息,;第二,,對邏輯數(shù)值計算與處理。
信息,,它既是人的意識活動的產(chǎn)物,,也是人的意識活動的最核心要素,,信息本質上是意識范疇的存在,,而與信息相關的活動,本質上都是意識性的活動,。
程序,,是人們對邏輯數(shù)值的計算與處理的操作,把這些操作排成序列,,用它來處理信息,。這個過程屬于物質性過程還是意識性過程?顯然是意識性的過程,,它把原來在大腦里進行的意識過程外化,,變成一段程序,交給計算機去做,。
這是我基本的分析邏輯,。第一,信息屬于意識范疇,;第二,,與信息相關的過程本質上都是意識過程;第三,,計算機程序是人的意識的一種外化,,計算機運行的過程,其實是一種意識性的過程,。
原先,,所有的意識都局限在人類每個人的腦袋里,計算機的出現(xiàn)讓意識從我們的大腦里蹦出來,,從而脫離了我們的大腦,,可以由計算機的CPU去做,所以,,信息技術應用本質上就是人的內(nèi)意識的外化,,我管它叫“外意識”。這就是計算機的“意識性工具”的本質,。
我們國家有一個部委的名稱是“工業(yè)和信息化部”,,大家有沒有注意過,這個名字很奇怪,?我的看法是,,它意味著信息化這個概念是沒法包含在工業(yè)范疇內(nèi)的?;赝祟惪茖W技術發(fā)展的總過程,,科技是第一生產(chǎn)力,人類文明的發(fā)展是由工具的不斷進步來推動的,,直到電子計算機出現(xiàn)之前,,我們工具的主線是作用于物質對象。人類演化幾十萬年以來,,我們所有的工具都是物質性的工具,,這不是說工具本身是物質,而是說這個工具的作用是物質性的作用,,概無例外,。
直到1946年,計算機出現(xiàn),,人類第一次有了一個意識性的工具,。這個工具作用的對象不是物質,而是作用在意識對象上,。從此開始,,主線發(fā)生了分叉,人類擁有了兩種工具,,一種是物質性的工具,,一種是意識性的工具。這兩種工具不是割裂開的,,意識性的工具是建立在物質科學基礎之上的,,但反過來,意識性的工具,,又可以植入到物質性的工具里,,比如讓汽車變成智能汽車。
所以我認為,,人類文明從1946年開始進入了一個全新的紀元。
但是,,人類創(chuàng)造計算機的時候,,沒有完全意識到這件事情,一是由于思維慣性,,因為我們之前所有的工具都是物質性的工具,;二是計算機誕生之初還很弱,,沒有展現(xiàn)出那么強的顛覆性。直到2010年,,計算機的算力從量變積累到了質變,。1976年,美國制造了第一臺超級計算機,,運算速度是每秒1億次浮點運算,,中國1983年造了第一臺超級計算機,也是每秒1億次浮點運算,。這都是當年的國之重器,,這樣的算力,只能勉強處理圖片,,但我們今天的每部手機都能處理視頻,,這不是一個數(shù)量級的進步。
在2010年前,信息產(chǎn)業(yè)業(yè)界最大的事情往往是英特爾發(fā)布了新的處理器,,今天,,沒有人再關心處理器的問題,因為算力極大豐富了,。也就是在2010年前后,,大數(shù)據(jù)應用涌現(xiàn)了,因為算力能夠支撐了,;人工智能熱起來了,,因為人工智能本質上是一個數(shù)據(jù)統(tǒng)計技術,也需要大量算力,。2010年之后,,計算機硬件的能力不再制約軟件的發(fā)展,信息技術產(chǎn)業(yè)“意識性”的特質,,自此才逐步顯現(xiàn)出來,,無論是區(qū)塊鏈,還是深度學習的人工神經(jīng)網(wǎng)絡,,這些創(chuàng)新都是不受物理規(guī)律限制的,,因為它是一種意識范疇的創(chuàng)新。
回到你的問題,,“生成式人工智能”帶來的挑戰(zhàn),,實際上起始于1946年“智能紀元”的開端,它是人類社會共同面臨的一次變革,,只不過現(xiàn)在才顯現(xiàn)出來,。
計算機是一個意識工具,這是一個非常本質的事情,,帶來的挑戰(zhàn)非常大,,要治理“生成式人工智能”,相當于要管人的思想,。幾千年來,,人類對于怎么管理物質還是積累了足夠多的經(jīng)驗,一旦涉及到精神意識層面,,其實就有點亂,。從倫理、道德,、宗教,、意識形態(tài)、各路學說等等,,都是這樣,,這不光是中國的問題,美國對互聯(lián)網(wǎng)的治理同樣亂象叢生,,因為人類沒有對意識領域的治理積累足夠的經(jīng)驗,。
觀察者網(wǎng):我插一個小問題,您剛才舉的一個例子說,,圖書館是人類信息的集中地,,如果我們順著這個思路,那么在人類發(fā)展的歷史中,,其實已經(jīng)有若干次這樣的信息爆炸,,也伴隨著時代變化的挑戰(zhàn),首先是出現(xiàn)文字,,然后是紙的發(fā)明,,接著是印刷術,然后是活字印刷術,那么計算機或者人工智能帶來最新的一次信息爆炸,,一是必然帶來社會變革,,二是只是一系列挑戰(zhàn)之一,能否這樣理解,?
謝耘:我們可以說,,這些某種意義上也是信息的革命,比如出現(xiàn)文字,,但它只是“信息”的記錄和傳播,,也就是說記錄和傳播“意識的產(chǎn)物”,比如報紙上的文章,,它已經(jīng)是靜態(tài)的東西了,。但信息技術處理的是意識的活動,它是“活的”,,在這個意義上,,它完全上了一個檔次。
觀察者網(wǎng):能不能認為這是生產(chǎn)力發(fā)展對生產(chǎn)關系的一個挑戰(zhàn),?
謝耘:我覺得這要從兩方面看,,首先,它是生產(chǎn)力的一種發(fā)展,,傳統(tǒng)的生產(chǎn)力指的是通過物質性工具創(chuàng)造物質財富的手段,,那么,信息技術作為意識性工具,,它能賦能物質性工具,提高其創(chuàng)造物質財富的能力,。
信息技術的發(fā)展已經(jīng)讓所有人受益,。幾年前施瓦布提出“第四次工業(yè)革命”,新材料,、新能源等等領域的新發(fā)展,,背后真正的推動力都是信息技術。
近年來,,材料科學發(fā)展突飛猛進,,因為計算機可以做大量模擬,不像傳統(tǒng)那樣需要做大量物理,、化學實驗,,節(jié)省大量時間和資源成本。
再比如說醫(yī)療,,現(xiàn)在的影像醫(yī)學與人工智能的結合速度非??欤瑯O大提升了診斷效率,。
信息技術解決了工業(yè)社會一直無法解決的一對矛盾,,就是大規(guī)模生產(chǎn)與個性化無法統(tǒng)一的問題,。信息技術賦能產(chǎn)業(yè)鏈之后,大規(guī)模的個性化生產(chǎn)成為可能,。而且,,定制化生產(chǎn)的衣服比標準化生產(chǎn)的衣服還要便宜。因為在標準化生產(chǎn)中,,產(chǎn)能的安排遠落后于市場需求變化,,往往導致大量的庫存積壓,這些成本最后仍然要平攤到消費者頭上,,但是實現(xiàn)定制化柔性制造以后,,按需生產(chǎn)就成為可能。
所以在以后的社會里,,即使一個人不懂信息技術,,他仍然非常可能受益于信息技術,,實現(xiàn)很多個人的發(fā)展和追求,。因為信息技術會成為社會的一個公共基礎,讓所有人受益,。
同時,,信息技術的另外一個屬性并不促進物質生產(chǎn),而是直接介入了意識形態(tài),,比如電子游戲,、AIGC等等,雖然沒有產(chǎn)生物質財富,,但也能產(chǎn)生經(jīng)濟活動,。
觀察者網(wǎng):這是否會產(chǎn)生一個“空轉”的問題呢,?因為雖然我們進入了“暴力計算”時代,,算力極大豐富,但是算力仍然要消耗物質世界大量的能源和資源,。這就在全人類社會的層面上產(chǎn)生了一個效率問題,,如果不能提升社會的生產(chǎn)力,而只是產(chǎn)生一個夢境在“空轉”的話,,這在資本邏輯上是成立的,,但是會在物質層面帶來大量的“浪費”。
謝耘:這是一個風險,,人類的意識借助計算機擴展到社會各個領域,,而且空前地被加強了,這可能會讓人類更加脫離物質層面,沉浸在意識世界里,,顛來倒去地搞一些東西,,也就是你說的“空轉”。
在農(nóng)業(yè)社會,,我們的生存空間基本上就是一個自然世界,;在工業(yè)社會,絕大多數(shù)人生活在城市,,城市是一個人工世界,,這個時候人類和自然是一種對立的關系,人類要征服自然,,要剝奪自然,;到智能紀元之后,我們的生存空間變得更復雜,,出現(xiàn)了一個虛擬的網(wǎng)絡空間,,所以人類今天的生存空間是自然空間、人工物質空間和虛擬網(wǎng)絡空間,,這三個空間的復合?,F(xiàn)在,很多人試圖把網(wǎng)絡空間獨立化,,也就是“元宇宙”,,在這個虛擬空間里我們確實可以不受物理規(guī)律限制,完全自由地暢行,。
但這還是會遇到物質的制約,“暴力計算”需要消耗大量能源,,制造芯片也需要現(xiàn)實產(chǎn)能,,人對算力的追求幾乎可以是無限的,現(xiàn)有資源是不可能匹配無限的,。
同時,還出現(xiàn)了一個非常嚴重的問題:人與自然分離的傾向,。我們看到過新聞,,有的孩子沉迷電子游戲產(chǎn)生各種各樣的問題,實際上不僅是孩子,,這是一個關于生命意義的非常深刻的哲學層面的問題,。
物質世界和虛擬世界是什么關系?人類和虛擬世界是什么關系,?我們要不要離物質世界越來越遠,,進入到由思維創(chuàng)造的意識世界里面去?
觀察者網(wǎng):這是不是跟“物質第一性”還是“意識第一性”有關的話題,我會聯(lián)想到馬克思當時對資本主義的批判,,因為資本主義的生產(chǎn)方式就是資本家的意志強加于物質生產(chǎn)之上,,所謂“木腦袋倒立在地上自己跳舞”,不管這個物質世界的“實然”是怎樣的,,它就是追求一個意識的“應然”的資本增殖,。
謝耘:對,按照馬克思的說法,,資本最后追求的是資本無限增殖這么一個虛無縹緲的目的,。所謂資本增殖,其實就是脫離實質的物質生產(chǎn),,就活在意識世界里面,。如果按照這個邏輯,我們面臨的挑戰(zhàn)非常大,、非?,F(xiàn)實、而且非常本質,,甚至觸及到人類生存的價值問題,。
比如“數(shù)字孿生”,是人類又創(chuàng)造出另外一個和現(xiàn)實世界一樣的世界嗎,?不是的,。物質世界和虛擬世界之間是一個映像的關系,而不是孿生的關系,。
什么叫孿生?是指兩個世界是對等的關系,。你的照片和你是對等的關系嗎,?不是,它是映像的關系,。所以,,當我們把物質世界信息化,放到虛擬世界里之后,,它只是物質世界里的一個映像,,而絕不是一個孿生。
第二,,兩者也不是同一關系,。同一關系是兩者密不可分,但現(xiàn)實世界與虛擬世界不是密不可分,。舉個例子,,區(qū)塊鏈產(chǎn)業(yè)化的謊言之一就是物品溯源,,區(qū)塊鏈的系統(tǒng)的數(shù)據(jù)是高度可信任、可追溯,、不可篡改的,,但這三個屬性僅僅是指向區(qū)塊鏈中的數(shù)據(jù),而我們要溯源的是物質世界中的商品,,區(qū)塊鏈中的數(shù)據(jù)能和物質世界中的商品在時空上牢牢綁在一起嗎,?做不到。
所以,,對信息技術要辯證地看,,它是人類意識性的工具,意識可以反作用于物質,,但意識世界不是物質世界,。
觀察者網(wǎng):很有趣,,能不能再談一下“生成式人工智能”相對于信息技術的一般性和特殊性在哪里,?為什么這次突然讓大眾對它產(chǎn)生了強烈的感知?
謝耘:我覺得這一次引起大眾的強烈反應,,就在于大家發(fā)現(xiàn)機器確實能和你說話,。給大眾的震撼更多是一種感性體驗帶來的。
從技術本質上來講,,人工智能這一輪進步并不是因為我們對智能原理有了新的認識,,包括大模型等等的技術核心主要還是依賴于大量的數(shù)據(jù)統(tǒng)計,在這一點上,,目前大家是有共識的,。假設這個結論是正確的話,那就要說一下數(shù)據(jù)統(tǒng)計的技術能做到什么和不能做到什么,。
從信息論的角度來講,,數(shù)據(jù)統(tǒng)計作為一種信息處理方式,它輸出的信息量一定小于輸入的信息量,,也就是說,,它不可能產(chǎn)生更多的信息。
第二,,它輸出的信息本質上都包含在輸入的信息當中,。這句話非常重要,只不過它把輸入的某些信息做了進行了篩選,、過濾、組合,,或者以新的方式展示,。
換句話說,,它只是在輸入的集合當中做事情,其產(chǎn)出也沒超出這個集合,。但是,,因為模型的信息量非常大,所以對于一個人類個體來講,,他會覺得很新鮮,。但是相對于向機器輸入的大量數(shù)據(jù)來講,這些信息在本質層面不是什么新鮮的東西,,沒有增加新的東西給這個世界,,這一點非常重要。
觀察者網(wǎng):我們原來去訓練人工智能,,期望的一個方向是它能夠給我們確定性的結果,,告訴我們一個精確的東西,從而推動產(chǎn)業(yè)應用,。但ChatGPT不是,,它正是犧牲了精確性,來使大眾感覺它是一個“真人”,。
謝耘:其實人類在用到人工智能這種統(tǒng)計方法之前,,我們都希望工具給出一個確定性的結果,包括用計算機做計算,。
但現(xiàn)在基于統(tǒng)計的這些人工智能的方法,,給出的是概率性的結果,所以,,我們不能把它和以前的工具和方法等量齊觀地去看待,。
觀察者網(wǎng):既然它是一個意識的工具,我們是不是需要擔心來自少數(shù)人的意識,,尤其是可能來自境外的意識,,通過信息技術的賦能,來影響多數(shù)人的思維和行為的方式,?
謝耘:確實非常危險,,這不僅是社會問題,首先還是個體問題,,如果一個人沒有很強的獨立意識的話,,是很容易被別人左右的。
信息技術的發(fā)展讓影響他人的意識這件事變得更加高效,,甚至更加隱蔽,。機器學習或者機器搜索出來的結果,不是中立的,,它是被人訓練出來的,,它有人的“外意識”的本質,。
觀察者網(wǎng):但是像傳統(tǒng)的教育,其實也是這樣的一個過程,,只是現(xiàn)在它產(chǎn)生了一個效率上的提升,,是不是能夠這樣理解?
謝耘:它影響的規(guī)??涨?,借助網(wǎng)絡,可以輕易實現(xiàn)復制,、傳播等等,,在一件事情規(guī)模有限的時候,社會對它進行管理是比較容易的,,如果規(guī)模巨大之后,,管理是非常困難的。
觀察者網(wǎng):那么如果站在政府立場要去治理它,,可以有哪些抓手呢,?
謝耘:我確實沒有站在政府的角度仔細考慮過到底該怎么治理的問題,
但是虛擬空間有其賴以存在的一個基礎和兩個錨點,。這是否能作為治理的抓手,?我們可以討論。
首先,,構建虛擬空間的基礎就是邏輯數(shù)值計算。
其次,,它有兩個錨點,,一個錨點是人,人類在創(chuàng)造這個空間,,空間中的東西最終又被人所利用,;第二個錨點是物質世界,人的意識不能獨立于物質世界而存在,,虛擬世界作為“外意識”,,其信息同樣來源于物質世界,信息從物質世界進入虛擬空間,,在虛擬空間被處理完之后,,又回到物質世界,應用在物質世界之上,。
所以整個虛擬世界有一個基本的內(nèi)在的基礎,,有兩個外部的錨點,不論它怎么發(fā)展,,這三個要素是不會變的,。
觀察者網(wǎng):能不能從“兩個錨點”的視角來看這次的《生成式人工智能服務管理辦法(征求意見稿)》,?
謝耘:不論利用信息技術做什么,終歸應當是服務于人,,也就是服務于我們真實社會的,這是一個基本的出發(fā)點,。
要治理“生成式人工智能”,,一個抓手當然是“人”,也就是現(xiàn)有的社會秩序,。所以《征求意見稿》開宗明義,,其依據(jù)是一系列現(xiàn)有法律和行政法規(guī)制定;其次,,“研發(fā),、利用生成式人工智能產(chǎn)品,面向中華人民共和國境內(nèi)公眾提供服務的,,適用本辦法”,,這就是說,不但本土相關企業(yè)要守規(guī)矩,,境外的公司的相關產(chǎn)品或服務如果要進來,,也要守規(guī)矩。
在《征求意見稿》中非常強調技術提供者的責任,,把技術提供者作為主要管理目標,。因為意識性工具和物質性工具不一樣,物質性工具的生產(chǎn)者,,一般生產(chǎn)一個靜態(tài)的東西,,只要產(chǎn)品符合標準,就完成了主體責任,;而意識性工具提供者的產(chǎn)品很難界定,,它是一個“活的”東西,所以必須持續(xù)強調技術提供者的責任,。另外,,如果針對技術使用者,可能執(zhí)法成本太高,,因為那是面對不特定的多數(shù)人,,而技術提供者由于受物質條件限制,必然是少數(shù)“中心化”的大型企業(yè),,擁有龐大的資產(chǎn)和能力,,也依賴其他組織的能源和資源供給,把它們作為治理抓手,,也等于抓住了“物質世界”這個錨點,。
我認為值得商榷的是第四條第四款,,“利用生成式人工智能生成的內(nèi)容應當真實準確,采取措施防止生成虛假信息”,,可能征求意見稿的起草者還沒有明確理解“意識性工具”的特點,,要求意識確保“正確”是不具有可操作性的,。
觀察者網(wǎng):最后一個問題,,在這樣的一個大趨勢當中,個人應該做怎樣的努力,?對于學生或者年輕人,,你有什么建議?
謝耘:我有三個建議,,第一,,如果真的要想查準確的資料,建議不要放棄傳統(tǒng)的搜索工具,,那樣能直接查到原始的資料,,可以看到原始資料到底它講了什么,而不是通過生成人工智能組合出來的一個答案,,
因為組合就有信息的損失,。如果真的做嚴肅工作,查原始資料還是非常重要的,,找到原汁原味第一手的東西,,就不至于受有意或者無意的誤導。
第二,,在使用生成式人工智能工具的時候,,一定要記住,得到的答案不一定對,,要堅持存疑,,我建議使用時還是要用其他的渠道加以印證,防止自己被數(shù)據(jù)統(tǒng)計導致的概率性或算法本身固有的其他局限給誤導,。
第三,,即使生成式人工智能可以幫你干很多事,但不要依賴它,。對于人的智能來說,,用進廢退是一個規(guī)律,只有通過不斷實踐,,對問題的認識才會不斷深化,。即使是一些基礎的事情,也應該把它當做一種必要的鍛煉,才能避免智力的退化,,我發(fā)現(xiàn)在互聯(lián)網(wǎng)時代,,智力退化是一種比較普遍的現(xiàn)象。
附1:《生成式人工智能服務管理辦法(征求意見稿)》
附2:《從凡夫到“上帝”:信息技術的意識本質與未來發(fā)展》線下研討會視頻
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1026379.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。