A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

人民網(wǎng)

中國文化元宇宙 AIGC 發(fā)展研究報告

中國文化產(chǎn)業(yè)協(xié)會文化元宇宙專業(yè)委員會組織舉辦的“AIGC:開啟文化元宇宙新紀(jì)元”系列專題研討會專家演講稿整理匯編而成了《中國文化元宇宙 AIGC 發(fā)展研究報告》,。

  ChatGPT 對文化元宇宙的啟示

  一、破題——從生產(chǎn)的角度探索文化元宇宙

  目前這個階段我們談到“元宇宙”的時候,,還是在消費層面,,但是不管是過去的 PGC 還是 UGC 一直到現(xiàn)在的 AIGC,都是從不同的生產(chǎn)方式來講的,,這一點 是非常有啟發(fā)性的,。國家文化數(shù)字化戰(zhàn)略就是從供給側(cè)入手的,我們叫發(fā)力供給側(cè),,激活文化資源,,推動文化生產(chǎn)體系現(xiàn)代化。

  就目前來說,,在元宇宙的初級階段,,主要還是從消費層面做,,也應(yīng)是數(shù)字化 文化消費的新場景,,而且是數(shù)字化文化體驗的一種形式。但再往前走,,實際上已 經(jīng)進入到一個比較高的階段,,由實現(xiàn)生產(chǎn)和消費統(tǒng)一來推動文化元宇宙的發(fā)展會更好。

中國文化元宇宙 AIGC 發(fā)展研究報告

  二,、數(shù)據(jù)——數(shù)字化時代的生產(chǎn)要素

 ?。ㄒ唬?數(shù)據(jù)保真:下一步人工智能發(fā)展的充分必要條件

  從目前非?;鸬?ChatGPT 談起,,ChatGPT 帶來的啟示有兩點,一個是數(shù)據(jù)如何保真,,這個可能是大家非常關(guān)心的問題,。數(shù)據(jù)的保真可能是下一步人工智能發(fā)展一個非常重要的充分必要條件。如果說數(shù)據(jù)不能做到保真,,人工智能發(fā)展的方向可能就會出現(xiàn)一些不應(yīng)有的失誤,。

  目前 ChatGPT 訓(xùn)練的數(shù)據(jù)集來源大體上分為六類,包括維基百科,、書籍,、期 刊、互聯(lián)網(wǎng)的網(wǎng)站等等,,訓(xùn)練的數(shù)據(jù)集在 GPT-3 里面實際上總量應(yīng)該有 3000 億的詞匯,,有 1750 億的參數(shù),如果沒有這樣一個數(shù)據(jù)量訓(xùn)練的話,,人工智能發(fā)展確實有很大制約,。

中國文化元宇宙 AIGC 發(fā)展研究報告

  在大家測試聊天機器人水平的過程中,有些人已經(jīng)提出了一些問題,。第一個 大家比較關(guān)心的問題是互聯(lián)網(wǎng)上的數(shù)據(jù)并不都是準(zhǔn)確的,,當(dāng)錯誤的數(shù)據(jù)量足夠大 的時候,就會導(dǎo)致得出的結(jié)論也是錯誤的,。有一個案例是基于 GPT-3 的醫(yī)療聊天,,機器人曾經(jīng)建議病人自殺。這可能是個案,,但如果個案過多,,就成了普遍性的問題,歸根結(jié)底就是數(shù)據(jù)的保真問題,。而且現(xiàn)在所有的人工智能模型的學(xué)習(xí)都是基于一些歷史數(shù)據(jù),,還有一些社會學(xué)學(xué)者也在研究,有可能這些數(shù)據(jù)當(dāng)中存在不必要的偏見,這種偏見也會導(dǎo)致社會的排斥和歧視,。所以,,扣好文化元宇宙第一??圩臃浅V匾?,這是 AIGC 的充分必要條件,,也是開發(fā)人工智能非常重要的條件,。

  這方面,,跟現(xiàn)在正在推動實施的國家文化數(shù)字化戰(zhàn)略有相通的地方,。也就是 這些數(shù)據(jù)集到底從哪里來,。在中文互聯(lián)網(wǎng)的數(shù)據(jù)質(zhì)量堪憂的情況下,數(shù)據(jù)到底應(yīng)該從哪里來,?我們認(rèn)為應(yīng)該從中華民族積淀了五千多年的文化資源中轉(zhuǎn)化而來,,這可能是我們下一步應(yīng)該重點考慮的。

  我國是文明古國,,也是文化資源大國,,這些年我們在推動文化數(shù)字化過程中, 特別是文化資源數(shù)字化過程中,,積攢了大量的文化資源數(shù)據(jù),,這些數(shù)據(jù)大多數(shù)都 集中在公共文化機構(gòu)。這次中國共產(chǎn)黨中央委員會辦公廳,、中華人民共和國國務(wù)院辦公廳文件當(dāng)中明確提出公共文化機構(gòu)要向社會釋放數(shù)據(jù),,依法向社會公眾開放,讓大家從這些數(shù)據(jù)當(dāng)中提取具有歷史傳承價值的中華文化元素,、符號和標(biāo)識,,并把它們轉(zhuǎn)化為文化生產(chǎn)要素,從而成為文化元宇宙以及文化創(chuàng)新和創(chuàng)造的文化素材,。

  具體來說,,我們現(xiàn)在數(shù)據(jù)量是非常大的,包括文化館,、圖書館,、美術(shù)館、博 物館,。我們尤其關(guān)注的一個點是地方志,,地方志的數(shù)據(jù)也是非常珍貴的。根據(jù)中國地方志指導(dǎo)小組統(tǒng)計,,到 2020 年,我們省,、市,、縣三級的地方志志書已經(jīng)完成了有 5000 多部,到 2020 年底公開出版的已經(jīng)有 4900 多部,,同時現(xiàn)在又增加了一些部門志,、行業(yè)志和專題志,,這個數(shù)量就更大了,有 25000 多部,。

  地方志是中華民族積淀 5000 年文化資源的底部,。像鄉(xiāng)鎮(zhèn)志、村志,,還有過 去的舊志,,這個量是非常大的。更重要的是這些年地方志的數(shù)字化已經(jīng)有了一個長足的進展,,截至 2019 年年底,,省、市,、縣三級光建成的數(shù)字方志館 (數(shù)據(jù)庫) 就有 100 多個,。

中國文化元宇宙 AIGC 發(fā)展研究報告

  文化旅游部民族民間文藝發(fā)展中心,業(yè)內(nèi)人認(rèn)為這是一個文藝長城工程,,大 概是從“六五”時期開始做的,,用了三十年時間,動員了三十多萬人的力量,,最 后收集到總量在 50 億左右的民族,、民間的文藝資料,包括民歌,、民間故事等等?,F(xiàn)在已經(jīng)出了很多書,也在推動進一步的數(shù)字化,。一些中央新聞單位的數(shù)據(jù)量也是非常大的,,例如《人民日報》、新華社,、中央電視臺,、中央人民廣播電臺、國際臺,。出版業(yè)的數(shù)據(jù)也非常多,,期刊里面有知網(wǎng)、萬方,、維普等,,圖書領(lǐng)域綜合性的有國家數(shù)字圖書館,還有一些專業(yè)專題性的數(shù)據(jù)庫也非常多,。

  同時,,我們民間的數(shù)據(jù)量也非常大。從 1983 年,、1984 年開始,,錢鐘書老先 生曾經(jīng)開辟了一項事業(yè),,就是對中國古典文獻做數(shù)字化,他在世的時候做了 17 年,,去世以后這項工程又持續(xù)了二十多年,,他們的公司——“掃葉”,現(xiàn)在積累 的漢字?jǐn)?shù)總量在 20 億左右,,其中漢字庫是目前我們看到的最全的,。《康熙字典》 最多是 4 萬多字,,據(jù)說他們已經(jīng)達到了將近 8 萬個漢字,,收錄了 36 萬人,比《中 國人名大辭典》多出 5 倍,,這里面有作品庫,、地名庫、工具庫,、圖片庫,、地圖庫等等。

中國文化元宇宙 AIGC 發(fā)展研究報告

  有些地級市也在做大量的數(shù)據(jù)庫,,如陜西渭南“兩河一山”文化數(shù)字記憶項目積攢的數(shù)據(jù)庫有十個,,包括重點文物保護、古代的書院,、民間傳說,、詩詞歌賦、 歷史文化名城,、名鎮(zhèn),、名村、名人數(shù)據(jù)庫,、非遺數(shù)據(jù)庫,、古籍目錄數(shù)據(jù)庫、傳統(tǒng)戲曲劇目劇本數(shù)據(jù)庫和紅色文化資源數(shù)據(jù)庫,,量是非常大的,。所以說,我們現(xiàn)在在推動實施國家文化數(shù)字化戰(zhàn)略過程中的一項重要任務(wù),,就是關(guān)聯(lián)形成中華文化數(shù)據(jù)庫,,這對整個人工智能的發(fā)展,通過人工智能創(chuàng)造生產(chǎn)更多面向大眾的文化數(shù)字內(nèi)容而言,,是一個基礎(chǔ)性的工程,。

  我們現(xiàn)在講數(shù)據(jù)驅(qū)動,這個數(shù)據(jù)應(yīng)該是具有文化內(nèi)涵的數(shù)據(jù),,現(xiàn)在數(shù)據(jù)量非 常大,,但還沒有做標(biāo)注、標(biāo)引,,這樣文化內(nèi)涵是體現(xiàn)不出來的,。我們過去經(jīng)常說一句話“基礎(chǔ)不牢,地動山搖”,,現(xiàn)在許多產(chǎn)業(yè)項目,、在推廣的很多東西以及互聯(lián)網(wǎng)大廠在做的一些事,總的感覺是在沙漠上蓋高樓,,地基不穩(wěn),,什么事都做不大。所以為什么說 ChatGPT 沒有在中國產(chǎn)生,,我覺得這就是因為我們基礎(chǔ)不牢,。

  (二) 數(shù)據(jù)標(biāo)注:把數(shù)據(jù)的采集、加工和數(shù)據(jù)服務(wù)變成一種經(jīng)常性的工作

  第二個啟示,,就是數(shù)據(jù)的標(biāo)注,。有專家向ChatGPT 提出:“請模仿杜甫寫一 首詩”,結(jié)果并不是很理想,。有的專家分析,,在它的語料庫中沒有對漢語的韻律、字節(jié)做標(biāo)注和訓(xùn)練,,這可能是非常重要的原因,。我們有了數(shù)據(jù)但不去做標(biāo)注,那人工智能也發(fā)展不起來,。對于數(shù)據(jù)的標(biāo)注,,在國家文化數(shù)字化戰(zhàn)略當(dāng)中有了一個明確的要求,就是希望各級各類文化機構(gòu),,要把數(shù)據(jù)的采集,、加工和數(shù)據(jù)服務(wù)變成一種經(jīng)常性的工作。

  數(shù)據(jù)的標(biāo)注主要是從三個方面著手,,第一要對數(shù)據(jù)進行分類,,我們現(xiàn)在按照 聯(lián)合國教科文組織分的六大類別,包括自然和文化遺產(chǎn),、表演和慶?;顒印⒁曈X藝術(shù)和手工藝,、圖書和出版,、視聽和互動傳媒、設(shè)計與創(chuàng)意服務(wù)六大類別,在這個基礎(chǔ)上,,每個類別里都有一些專題的知識圖譜,,我們就可以依據(jù)它來做編目。分類和編目,,實際上對數(shù)據(jù)定下坐標(biāo)了,,最后我們還要對數(shù)據(jù)的特征進行描述,即數(shù)據(jù)的標(biāo)簽化,。

  在這方面,,我們國家這幾年有了長足的進展,例如百度在全國有七個已經(jīng)建 成的數(shù)據(jù)標(biāo)注基地,,如山西太原的基地,,這個基地是入駐在山西的綜改示范區(qū),到 2022 年的 5 月份,,辦公面積已經(jīng)超過 19000 平方米,,有 5000 名數(shù)據(jù)標(biāo)注師,有 53 家代理商入駐,,從 2018 年進駐到 2020 年 5 月份,,累計的產(chǎn)值已經(jīng)超過 5 個億,累計培育孵化了 41 家的數(shù)據(jù)標(biāo)注企業(yè),。

  文化領(lǐng)域里中國知網(wǎng)在太原的數(shù)據(jù)加工基地,,是對期刊和報紙,包括一些論 文做標(biāo)注,,這個量也是非常大的,。太原的百度基地,每年的營收應(yīng)該在 1 個億左右,,中國知網(wǎng)的太原數(shù)字出版數(shù)據(jù)加工基地營收也是在一年 1 個億左右,,這個量也是非常大。因此我們今年計劃在全國建設(shè)國家文化大數(shù)據(jù)標(biāo)識基地,,在標(biāo)注的基礎(chǔ)上再賦標(biāo)識符(ISLI碼),,使具有文化內(nèi)涵的數(shù)據(jù),真正能夠在國家文化專網(wǎng)互聯(lián)互通,,這是一項基礎(chǔ)性工作,。

  我們用的標(biāo)識是我國提案創(chuàng)建的國際標(biāo)準(zhǔn),叫 ISLI,,就是國際信息和文獻領(lǐng)域關(guān)聯(lián)標(biāo)識符的國際標(biāo)準(zhǔn),。我們現(xiàn)在文化數(shù)字化采用的是標(biāo)識解析,這跟互聯(lián) 網(wǎng)的域名解析有很大的區(qū)別,。我們的域名解析是把域名變成了 IP 地址,,用 IP 尋址的方式來解析,。文化數(shù)字化用標(biāo)識解析,用我們國家提案并創(chuàng)建的國際標(biāo)準(zhǔn),,為每一個數(shù)據(jù)賦標(biāo)識碼,,然后我們自己有一套解析系統(tǒng)。它跟域名解析最大的區(qū)別是,,我們標(biāo)注的標(biāo)識碼后面都包含兩個主要內(nèi)容,,一個是數(shù)據(jù)的元數(shù)據(jù)信息,, 一個是數(shù)據(jù)的訪問地址,。

中國文化元宇宙 AIGC 發(fā)展研究報告

  國際標(biāo)準(zhǔn)發(fā)揮它的四大功能:第一是標(biāo)識,標(biāo)識編碼由十進制的數(shù)字和三個 字段構(gòu)成的,;第二是用這個碼構(gòu)建數(shù)據(jù)和數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,,這一點非常重要,這也是國際信息和文獻領(lǐng)域當(dāng)中唯一一個具有關(guān)聯(lián)功能的國際標(biāo)準(zhǔn),;第三是解析功能,;第四是鑒權(quán)功能,驗證用戶是不是擁有訪問系統(tǒng)的權(quán)利,,即版權(quán)的認(rèn)證,。 如果這些問題全解決了,在數(shù)字化時代,,所有數(shù)據(jù)涉及的版權(quán)問題,,用標(biāo)識解析就可以解決。

中國文化元宇宙 AIGC 發(fā)展研究報告

  這樣就達到了三個目的:第一是數(shù)據(jù)的互聯(lián)互通,,因為它有地址和元數(shù)據(jù),; 第二是數(shù)據(jù)的分布式存儲,現(xiàn)在的文化機構(gòu)最大的問題是擔(dān)心自己的數(shù)據(jù)被別人 盜取,,所以我們一方面先用了國家文化專網(wǎng),,跟互聯(lián)網(wǎng)是物理隔離的,同時我們也采用了標(biāo)識解析,,可以實現(xiàn)物理分布,、邏輯關(guān)聯(lián),即誰的數(shù)據(jù)還是在誰的服務(wù)器里,,或者數(shù)據(jù)中心里面,,但是由于它可以互聯(lián)互通,別人知道你有數(shù)據(jù),,然后可以進行交易,,通過授權(quán)使用這個數(shù)據(jù)來做加工;最后一個是數(shù)據(jù)的確權(quán),,每個數(shù)據(jù)都有唯一的身份證,,而且是伴隨著這個數(shù)據(jù)的全生命周期,從采集、加工,、 生產(chǎn),、交易到最后數(shù)據(jù)的呈現(xiàn)全過程,以及它和其他的數(shù)據(jù)融為一體之后所產(chǎn)生 的新的文化數(shù)字內(nèi)容,,這個過程中每個數(shù)據(jù)都可溯源,,這是標(biāo)識解析解決的非常重要的問題。

  這樣一個標(biāo)識解析,,對于文化元宇宙下一步的發(fā)展很有啟發(fā)意義,。我們認(rèn)為 文化元宇宙的核心要素有三個:第一是數(shù)字身份,第二是數(shù)字貨幣,,第三是數(shù)字資產(chǎn),。在這個過程中,如果把電視機作為元宇宙的入口,,把電視機的機頂盒變成元宇宙的發(fā)射器,,用國際標(biāo)準(zhǔn)的標(biāo)識符作為數(shù)字身份,ISLI 的 DRA 扮演元宇宙 “戶籍警”的角色,。

中國文化元宇宙 AIGC 發(fā)展研究報告

  數(shù)據(jù)身份認(rèn)定之后,,給個人機構(gòu)以及對數(shù)據(jù)和內(nèi)容都可以做標(biāo)識,這樣整個 元宇宙發(fā)展的“底座”就有了,,不會像過去那樣先發(fā)展后治理的模式,。在這個基 礎(chǔ)上,我們就可以發(fā)展一種主權(quán)鏈,。在中辦國辦文件里面明確提出推動標(biāo)識解析與區(qū)塊鏈、大數(shù)據(jù)等技術(shù)融合發(fā)展,,在這個基礎(chǔ)上依托我國主導(dǎo)的國際標(biāo)準(zhǔn),,它的手段就是依托國家文化大數(shù)據(jù)標(biāo)識注冊中心,實現(xiàn)這個標(biāo)識解析體系和當(dāng)下在發(fā)展的各種聯(lián)盟鏈對接,。用這樣一套系統(tǒng),,給各個基于區(qū)塊鏈的聯(lián)盟鏈做背書,,也就是說我們可以扮演一種公鏈的角色,從而推動整個區(qū)塊鏈技術(shù)向前一步,。

中國文化元宇宙 AIGC 發(fā)展研究報告

免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1051761.html
溫馨提示:投資有風(fēng)險,入市須謹(jǐn)慎,。本資訊不作為投資理財建議,。

(0)
新浪VR的頭像新浪VR
上一篇 2023年6月28日 下午5:46
下一篇 2023年6月28日 下午5:56
198搶自鏈數(shù)字人

相關(guān)推薦