A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

人民網(wǎng)

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

中國文化產(chǎn)業(yè)協(xié)會(huì)文化元宇宙專業(yè)委員會(huì)組織舉辦的“AIGC:開啟文化元宇宙新紀(jì)元”系列專題研討會(huì)專家演講稿整理匯編而成了《中國文化元宇宙 AIGC 發(fā)展研究報(bào)告》。

  ChatGPT 對(duì)文化元宇宙的啟示

  一,、破題——從生產(chǎn)的角度探索文化元宇宙

  目前這個(gè)階段我們談到“元宇宙”的時(shí)候,,還是在消費(fèi)層面,但是不管是過去的 PGC 還是 UGC 一直到現(xiàn)在的 AIGC,,都是從不同的生產(chǎn)方式來講的,,這一點(diǎn) 是非常有啟發(fā)性的。國家文化數(shù)字化戰(zhàn)略就是從供給側(cè)入手的,,我們叫發(fā)力供給側(cè),,激活文化資源,推動(dòng)文化生產(chǎn)體系現(xiàn)代化,。

  就目前來說,,在元宇宙的初級(jí)階段,主要還是從消費(fèi)層面做,,也應(yīng)是數(shù)字化 文化消費(fèi)的新場景,,而且是數(shù)字化文化體驗(yàn)的一種形式。但再往前走,,實(shí)際上已 經(jīng)進(jìn)入到一個(gè)比較高的階段,,由實(shí)現(xiàn)生產(chǎn)和消費(fèi)統(tǒng)一來推動(dòng)文化元宇宙的發(fā)展會(huì)更好。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  二,、數(shù)據(jù)——數(shù)字化時(shí)代的生產(chǎn)要素

 ?。ㄒ唬?數(shù)據(jù)保真:下一步人工智能發(fā)展的充分必要條件

  從目前非?;鸬?ChatGPT 談起,,ChatGPT 帶來的啟示有兩點(diǎn),一個(gè)是數(shù)據(jù)如何保真,,這個(gè)可能是大家非常關(guān)心的問題,。數(shù)據(jù)的保真可能是下一步人工智能發(fā)展一個(gè)非常重要的充分必要條件。如果說數(shù)據(jù)不能做到保真,,人工智能發(fā)展的方向可能就會(huì)出現(xiàn)一些不應(yīng)有的失誤,。

  目前 ChatGPT 訓(xùn)練的數(shù)據(jù)集來源大體上分為六類,包括維基百科,、書籍,、期 刊、互聯(lián)網(wǎng)的網(wǎng)站等等,,訓(xùn)練的數(shù)據(jù)集在 GPT-3 里面實(shí)際上總量應(yīng)該有 3000 億的詞匯,,有 1750 億的參數(shù),如果沒有這樣一個(gè)數(shù)據(jù)量訓(xùn)練的話,,人工智能發(fā)展確實(shí)有很大制約,。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  在大家測試聊天機(jī)器人水平的過程中,有些人已經(jīng)提出了一些問題,。第一個(gè) 大家比較關(guān)心的問題是互聯(lián)網(wǎng)上的數(shù)據(jù)并不都是準(zhǔn)確的,,當(dāng)錯(cuò)誤的數(shù)據(jù)量足夠大 的時(shí)候,就會(huì)導(dǎo)致得出的結(jié)論也是錯(cuò)誤的,。有一個(gè)案例是基于 GPT-3 的醫(yī)療聊天,,機(jī)器人曾經(jīng)建議病人自殺。這可能是個(gè)案,,但如果個(gè)案過多,,就成了普遍性的問題,歸根結(jié)底就是數(shù)據(jù)的保真問題,。而且現(xiàn)在所有的人工智能模型的學(xué)習(xí)都是基于一些歷史數(shù)據(jù),還有一些社會(huì)學(xué)學(xué)者也在研究,,有可能這些數(shù)據(jù)當(dāng)中存在不必要的偏見,,這種偏見也會(huì)導(dǎo)致社會(huì)的排斥和歧視。所以,,扣好文化元宇宙第一??圩臃浅V匾?,這是 AIGC 的充分必要條件,也是開發(fā)人工智能非常重要的條件,。

  這方面,,跟現(xiàn)在正在推動(dòng)實(shí)施的國家文化數(shù)字化戰(zhàn)略有相通的地方。也就是 這些數(shù)據(jù)集到底從哪里來,。在中文互聯(lián)網(wǎng)的數(shù)據(jù)質(zhì)量堪憂的情況下,,數(shù)據(jù)到底應(yīng)該從哪里來?我們認(rèn)為應(yīng)該從中華民族積淀了五千多年的文化資源中轉(zhuǎn)化而來,,這可能是我們下一步應(yīng)該重點(diǎn)考慮的,。

  我國是文明古國,也是文化資源大國,,這些年我們在推動(dòng)文化數(shù)字化過程中,, 特別是文化資源數(shù)字化過程中,積攢了大量的文化資源數(shù)據(jù),,這些數(shù)據(jù)大多數(shù)都 集中在公共文化機(jī)構(gòu),。這次中國共產(chǎn)黨中央委員會(huì)辦公廳、中華人民共和國國務(wù)院辦公廳文件當(dāng)中明確提出公共文化機(jī)構(gòu)要向社會(huì)釋放數(shù)據(jù),,依法向社會(huì)公眾開放,,讓大家從這些數(shù)據(jù)當(dāng)中提取具有歷史傳承價(jià)值的中華文化元素、符號(hào)和標(biāo)識(shí),,并把它們轉(zhuǎn)化為文化生產(chǎn)要素,,從而成為文化元宇宙以及文化創(chuàng)新和創(chuàng)造的文化素材。

  具體來說,,我們現(xiàn)在數(shù)據(jù)量是非常大的,,包括文化館、圖書館,、美術(shù)館,、博 物館。我們尤其關(guān)注的一個(gè)點(diǎn)是地方志,,地方志的數(shù)據(jù)也是非常珍貴的,。根據(jù)中國地方志指導(dǎo)小組統(tǒng)計(jì),到 2020 年,,我們省,、市、縣三級(jí)的地方志志書已經(jīng)完成了有 5000 多部,,到 2020 年底公開出版的已經(jīng)有 4900 多部,,同時(shí)現(xiàn)在又增加了一些部門志、行業(yè)志和專題志,,這個(gè)數(shù)量就更大了,,有 25000 多部,。

  地方志是中華民族積淀 5000 年文化資源的底部。像鄉(xiāng)鎮(zhèn)志,、村志,,還有過 去的舊志,這個(gè)量是非常大的,。更重要的是這些年地方志的數(shù)字化已經(jīng)有了一個(gè)長足的進(jìn)展,,截至 2019 年年底,省,、市,、縣三級(jí)光建成的數(shù)字方志館 (數(shù)據(jù)庫) 就有 100 多個(gè)。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  文化旅游部民族民間文藝發(fā)展中心,,業(yè)內(nèi)人認(rèn)為這是一個(gè)文藝長城工程,,大 概是從“六五”時(shí)期開始做的,用了三十年時(shí)間,,動(dòng)員了三十多萬人的力量,,最 后收集到總量在 50 億左右的民族、民間的文藝資料,,包括民歌,、民間故事等等。現(xiàn)在已經(jīng)出了很多書,,也在推動(dòng)進(jìn)一步的數(shù)字化,。一些中央新聞單位的數(shù)據(jù)量也是非常大的,例如《人民日?qǐng)?bào)》,、新華社,、中央電視臺(tái)、中央人民廣播電臺(tái),、國際臺(tái),。出版業(yè)的數(shù)據(jù)也非常多,期刊里面有知網(wǎng),、萬方,、維普等,圖書領(lǐng)域綜合性的有國家數(shù)字圖書館,,還有一些專業(yè)專題性的數(shù)據(jù)庫也非常多,。

  同時(shí),我們民間的數(shù)據(jù)量也非常大,。從 1983 年,、1984 年開始,錢鐘書老先 生曾經(jīng)開辟了一項(xiàng)事業(yè),,就是對(duì)中國古典文獻(xiàn)做數(shù)字化,,他在世的時(shí)候做了 17 年,去世以后這項(xiàng)工程又持續(xù)了二十多年,,他們的公司——“掃葉”,,現(xiàn)在積累 的漢字?jǐn)?shù)總量在 20 億左右,其中漢字庫是目前我們看到的最全的,?!犊滴踝值洹?最多是 4 萬多字,據(jù)說他們已經(jīng)達(dá)到了將近 8 萬個(gè)漢字,,收錄了 36 萬人,,比《中 國人名大辭典》多出 5 倍,這里面有作品庫,、地名庫,、工具庫、圖片庫,、地圖庫等等,。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  有些地級(jí)市也在做大量的數(shù)據(jù)庫,如陜西渭南“兩河一山”文化數(shù)字記憶項(xiàng)目積攢的數(shù)據(jù)庫有十個(gè),,包括重點(diǎn)文物保護(hù),、古代的書院、民間傳說,、詩詞歌賦,、 歷史文化名城、名鎮(zhèn),、名村,、名人數(shù)據(jù)庫、非遺數(shù)據(jù)庫,、古籍目錄數(shù)據(jù)庫,、傳統(tǒng)戲曲劇目劇本數(shù)據(jù)庫和紅色文化資源數(shù)據(jù)庫,量是非常大的,。所以說,,我們現(xiàn)在在推動(dòng)實(shí)施國家文化數(shù)字化戰(zhàn)略過程中的一項(xiàng)重要任務(wù),就是關(guān)聯(lián)形成中華文化數(shù)據(jù)庫,,這對(duì)整個(gè)人工智能的發(fā)展,,通過人工智能創(chuàng)造生產(chǎn)更多面向大眾的文化數(shù)字內(nèi)容而言,是一個(gè)基礎(chǔ)性的工程,。

  我們現(xiàn)在講數(shù)據(jù)驅(qū)動(dòng),,這個(gè)數(shù)據(jù)應(yīng)該是具有文化內(nèi)涵的數(shù)據(jù),現(xiàn)在數(shù)據(jù)量非 常大,但還沒有做標(biāo)注,、標(biāo)引,,這樣文化內(nèi)涵是體現(xiàn)不出來的。我們過去經(jīng)常說一句話“基礎(chǔ)不牢,,地動(dòng)山搖”,,現(xiàn)在許多產(chǎn)業(yè)項(xiàng)目、在推廣的很多東西以及互聯(lián)網(wǎng)大廠在做的一些事,,總的感覺是在沙漠上蓋高樓,,地基不穩(wěn),什么事都做不大,。所以為什么說 ChatGPT 沒有在中國產(chǎn)生,,我覺得這就是因?yàn)槲覀兓A(chǔ)不牢。

  (二) 數(shù)據(jù)標(biāo)注:把數(shù)據(jù)的采集,、加工和數(shù)據(jù)服務(wù)變成一種經(jīng)常性的工作

  第二個(gè)啟示,,就是數(shù)據(jù)的標(biāo)注。有專家向ChatGPT 提出:“請(qǐng)模仿杜甫寫一 首詩”,,結(jié)果并不是很理想,。有的專家分析,在它的語料庫中沒有對(duì)漢語的韻律,、字節(jié)做標(biāo)注和訓(xùn)練,,這可能是非常重要的原因。我們有了數(shù)據(jù)但不去做標(biāo)注,,那人工智能也發(fā)展不起來,。對(duì)于數(shù)據(jù)的標(biāo)注,在國家文化數(shù)字化戰(zhàn)略當(dāng)中有了一個(gè)明確的要求,,就是希望各級(jí)各類文化機(jī)構(gòu),,要把數(shù)據(jù)的采集、加工和數(shù)據(jù)服務(wù)變成一種經(jīng)常性的工作,。

  數(shù)據(jù)的標(biāo)注主要是從三個(gè)方面著手,,第一要對(duì)數(shù)據(jù)進(jìn)行分類,我們現(xiàn)在按照 聯(lián)合國教科文組織分的六大類別,,包括自然和文化遺產(chǎn),、表演和慶祝活動(dòng),、視覺藝術(shù)和手工藝,、圖書和出版、視聽和互動(dòng)傳媒,、設(shè)計(jì)與創(chuàng)意服務(wù)六大類別,,在這個(gè)基礎(chǔ)上,每個(gè)類別里都有一些專題的知識(shí)圖譜,我們就可以依據(jù)它來做編目,。分類和編目,,實(shí)際上對(duì)數(shù)據(jù)定下坐標(biāo)了,最后我們還要對(duì)數(shù)據(jù)的特征進(jìn)行描述,,即數(shù)據(jù)的標(biāo)簽化,。

  在這方面,我們國家這幾年有了長足的進(jìn)展,,例如百度在全國有七個(gè)已經(jīng)建 成的數(shù)據(jù)標(biāo)注基地,如山西太原的基地,,這個(gè)基地是入駐在山西的綜改示范區(qū),,到 2022 年的 5 月份,辦公面積已經(jīng)超過 19000 平方米,,有 5000 名數(shù)據(jù)標(biāo)注師,,有 53 家代理商入駐,從 2018 年進(jìn)駐到 2020 年 5 月份,,累計(jì)的產(chǎn)值已經(jīng)超過 5 個(gè)億,,累計(jì)培育孵化了 41 家的數(shù)據(jù)標(biāo)注企業(yè)。

  文化領(lǐng)域里中國知網(wǎng)在太原的數(shù)據(jù)加工基地,,是對(duì)期刊和報(bào)紙,,包括一些論 文做標(biāo)注,這個(gè)量也是非常大的,。太原的百度基地,,每年的營收應(yīng)該在 1 個(gè)億左右,中國知網(wǎng)的太原數(shù)字出版數(shù)據(jù)加工基地營收也是在一年 1 個(gè)億左右,,這個(gè)量也是非常大,。因此我們今年計(jì)劃在全國建設(shè)國家文化大數(shù)據(jù)標(biāo)識(shí)基地,在標(biāo)注的基礎(chǔ)上再賦標(biāo)識(shí)符(ISLI碼),,使具有文化內(nèi)涵的數(shù)據(jù),,真正能夠在國家文化專網(wǎng)互聯(lián)互通,這是一項(xiàng)基礎(chǔ)性工作,。

  我們用的標(biāo)識(shí)是我國提案創(chuàng)建的國際標(biāo)準(zhǔn),,叫 ISLI,就是國際信息和文獻(xiàn)領(lǐng)域關(guān)聯(lián)標(biāo)識(shí)符的國際標(biāo)準(zhǔn),。我們現(xiàn)在文化數(shù)字化采用的是標(biāo)識(shí)解析,,這跟互聯(lián) 網(wǎng)的域名解析有很大的區(qū)別。我們的域名解析是把域名變成了 IP 地址,,用 IP 尋址的方式來解析,。文化數(shù)字化用標(biāo)識(shí)解析,用我們國家提案并創(chuàng)建的國際標(biāo)準(zhǔn),為每一個(gè)數(shù)據(jù)賦標(biāo)識(shí)碼,,然后我們自己有一套解析系統(tǒng),。它跟域名解析最大的區(qū)別是,我們標(biāo)注的標(biāo)識(shí)碼后面都包含兩個(gè)主要內(nèi)容,,一個(gè)是數(shù)據(jù)的元數(shù)據(jù)信息,, 一個(gè)是數(shù)據(jù)的訪問地址。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  國際標(biāo)準(zhǔn)發(fā)揮它的四大功能:第一是標(biāo)識(shí),,標(biāo)識(shí)編碼由十進(jìn)制的數(shù)字和三個(gè) 字段構(gòu)成的,;第二是用這個(gè)碼構(gòu)建數(shù)據(jù)和數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,這一點(diǎn)非常重要,,這也是國際信息和文獻(xiàn)領(lǐng)域當(dāng)中唯一一個(gè)具有關(guān)聯(lián)功能的國際標(biāo)準(zhǔn),;第三是解析功能;第四是鑒權(quán)功能,,驗(yàn)證用戶是不是擁有訪問系統(tǒng)的權(quán)利,,即版權(quán)的認(rèn)證。 如果這些問題全解決了,,在數(shù)字化時(shí)代,,所有數(shù)據(jù)涉及的版權(quán)問題,用標(biāo)識(shí)解析就可以解決,。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  這樣就達(dá)到了三個(gè)目的:第一是數(shù)據(jù)的互聯(lián)互通,,因?yàn)樗械刂泛驮獢?shù)據(jù); 第二是數(shù)據(jù)的分布式存儲(chǔ),,現(xiàn)在的文化機(jī)構(gòu)最大的問題是擔(dān)心自己的數(shù)據(jù)被別人 盜取,,所以我們一方面先用了國家文化專網(wǎng),跟互聯(lián)網(wǎng)是物理隔離的,,同時(shí)我們也采用了標(biāo)識(shí)解析,,可以實(shí)現(xiàn)物理分布、邏輯關(guān)聯(lián),,即誰的數(shù)據(jù)還是在誰的服務(wù)器里,,或者數(shù)據(jù)中心里面,但是由于它可以互聯(lián)互通,,別人知道你有數(shù)據(jù),,然后可以進(jìn)行交易,通過授權(quán)使用這個(gè)數(shù)據(jù)來做加工,;最后一個(gè)是數(shù)據(jù)的確權(quán),,每個(gè)數(shù)據(jù)都有唯一的身份證,而且是伴隨著這個(gè)數(shù)據(jù)的全生命周期,,從采集,、加工,、 生產(chǎn)、交易到最后數(shù)據(jù)的呈現(xiàn)全過程,,以及它和其他的數(shù)據(jù)融為一體之后所產(chǎn)生 的新的文化數(shù)字內(nèi)容,,這個(gè)過程中每個(gè)數(shù)據(jù)都可溯源,這是標(biāo)識(shí)解析解決的非常重要的問題,。

  這樣一個(gè)標(biāo)識(shí)解析,,對(duì)于文化元宇宙下一步的發(fā)展很有啟發(fā)意義。我們認(rèn)為 文化元宇宙的核心要素有三個(gè):第一是數(shù)字身份,,第二是數(shù)字貨幣,,第三是數(shù)字資產(chǎn)。在這個(gè)過程中,,如果把電視機(jī)作為元宇宙的入口,,把電視機(jī)的機(jī)頂盒變成元宇宙的發(fā)射器,用國際標(biāo)準(zhǔn)的標(biāo)識(shí)符作為數(shù)字身份,,ISLI 的 DRA 扮演元宇宙 “戶籍警”的角色。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

  數(shù)據(jù)身份認(rèn)定之后,,給個(gè)人機(jī)構(gòu)以及對(duì)數(shù)據(jù)和內(nèi)容都可以做標(biāo)識(shí),,這樣整個(gè) 元宇宙發(fā)展的“底座”就有了,不會(huì)像過去那樣先發(fā)展后治理的模式,。在這個(gè)基 礎(chǔ)上,,我們就可以發(fā)展一種主權(quán)鏈。在中辦國辦文件里面明確提出推動(dòng)標(biāo)識(shí)解析與區(qū)塊鏈,、大數(shù)據(jù)等技術(shù)融合發(fā)展,在這個(gè)基礎(chǔ)上依托我國主導(dǎo)的國際標(biāo)準(zhǔn),,它的手段就是依托國家文化大數(shù)據(jù)標(biāo)識(shí)注冊中心,,實(shí)現(xiàn)這個(gè)標(biāo)識(shí)解析體系和當(dāng)下在發(fā)展的各種聯(lián)盟鏈對(duì)接。用這樣一套系統(tǒng),,給各個(gè)基于區(qū)塊鏈的聯(lián)盟鏈做背書,,也就是說我們可以扮演一種公鏈的角色,,從而推動(dòng)整個(gè)區(qū)塊鏈技術(shù)向前一步。

中國文化元宇宙 AIGC 發(fā)展研究報(bào)告

免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1051761.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。

(0)
新浪VR的頭像新浪VR
上一篇 2023年6月28日 下午5:46
下一篇 2023年6月28日 下午5:56
198搶自鏈數(shù)字人

相關(guān)推薦