作者:廖燦亮來源:《全媒體探索》2024年4月號(hào) 導(dǎo)讀主流媒體積累了幾十年的媒資庫(kù)是媒體機(jī)構(gòu)的重要資產(chǎn)。隨著AI與媒體融合進(jìn)一步加深,媒資庫(kù)對(duì)主流媒體融合發(fā)展而言,,或?qū)摹坝悬c(diǎn)關(guān)系”變成“性命攸關(guān)”。如何盤活這些資產(chǎn),,讓存量帶動(dòng)增量,,為媒體內(nèi)容精準(zhǔn)分發(fā)、N次傳播,、二次創(chuàng)作,、上線交易、版權(quán)保護(hù)等奠定基礎(chǔ),,為“新聞+政務(wù)服務(wù)商務(wù)”貢獻(xiàn)力量,?本期推出“主流媒體平臺(tái)化建設(shè)”系列專題研討之三,誠(chéng)邀業(yè)界同行和學(xué)界專家對(duì)智媒時(shí)代的媒資庫(kù)建設(shè)進(jìn)行有益探討,。媒資庫(kù),,即媒體資產(chǎn)倉(cāng)庫(kù),涉及媒體在內(nèi)容采集,、生產(chǎn),、分發(fā)以及經(jīng)營(yíng)過程中積累的一切成品和素材。當(dāng)前,,人工智能(AI)技術(shù)正融合千行百業(yè),,驅(qū)動(dòng)新一輪科技革命和產(chǎn)業(yè)變革,也將重塑媒體格局,、傳播方式與輿論生態(tài),。主流媒體正積極探索將AI運(yùn)用于新聞采集、生產(chǎn),、分發(fā),、接收、反饋之中,,以打造智媒體新生態(tài),,鞏固壯大奮進(jìn)新時(shí)代的主流思想輿論。媒資庫(kù)是人工智能時(shí)代媒體融合發(fā)展的關(guān)鍵抓手當(dāng)前,,各大媒體機(jī)構(gòu)對(duì)媒資庫(kù)建設(shè)與開發(fā)存在投入不足的現(xiàn)象。許多媒資庫(kù)建設(shè)僅停留在將歷史文字報(bào)道電子化階段,,圖片,、音視頻入庫(kù)數(shù)字化進(jìn)程緩慢,創(chuàng)新開發(fā)媒資庫(kù)賦能媒體融合發(fā)展也還停留在初級(jí)階段,。究其原因,,一是媒資庫(kù)對(duì)主流媒體新聞主業(yè)而言并非必需品而是輔助品,長(zhǎng)期得不到重視,;二是建設(shè),、開發(fā)媒資庫(kù)需要大量資金、技術(shù)與人才投入,,且無法直接帶來可觀的經(jīng)濟(jì)效益,。隨著AI技術(shù)的發(fā)展,這種低投入的局面有望徹底打破,。數(shù)據(jù)是AI的燃料,,是智能發(fā)展的基石。主流媒體在新聞報(bào)道與融合發(fā)展過程中沉淀積累了海量的內(nèi)容成品和素材數(shù)據(jù),,匯集大量政務(wù)數(shù)據(jù),、服務(wù)數(shù)據(jù)、商務(wù)數(shù)據(jù),,這些數(shù)據(jù)能有效支撐AI學(xué)習(xí)和訓(xùn)練,,提高其智能水平。知名AI研究機(jī)構(gòu)EpochAI的一項(xiàng)研究預(yù)計(jì),,隨著AI技術(shù)發(fā)展,,到2026年,高質(zhì)量的數(shù)據(jù)將變得稀缺,,2030—2050年低質(zhì)量數(shù)據(jù)也將消耗殆盡,。在國(guó)外,《紐約時(shí)報(bào)》等多家媒體起訴生成式AI應(yīng)用ChatGPT的開發(fā)公司OpenAI“未經(jīng)授權(quán),,使用已發(fā)表的新聞作品訓(xùn)練生成式人工智能應(yīng)用”,。美國(guó)有線電視新聞網(wǎng)(CNN)、美聯(lián)社,、??怂?Fox)、《時(shí)代》雜志(Time)也與OpenAI就內(nèi)容授權(quán)訓(xùn)練AI應(yīng)用事宜進(jìn)行了多次談判。這從一個(gè)側(cè)面說明,,媒體數(shù)據(jù)優(yōu)質(zhì),、豐富,、稀缺,,而且應(yīng)用場(chǎng)景與市場(chǎng)十分廣闊。以這些數(shù)據(jù)為基礎(chǔ)建立的媒資庫(kù),,不僅是媒體機(jī)構(gòu)重要的資產(chǎn),,更是媒體機(jī)構(gòu)抓住AI發(fā)展機(jī)遇,賦能建立“新聞+政務(wù)服務(wù)商務(wù)”運(yùn)營(yíng)模式,,推動(dòng)媒體融合向縱深發(fā)展的關(guān)鍵抓手,。隨著AI與媒體融合進(jìn)一步加深,媒資庫(kù)對(duì)主流媒體融合發(fā)展而言,,或?qū)摹坝悬c(diǎn)關(guān)系”變成“性命攸關(guān)”,。(一)媒資庫(kù)是智能生產(chǎn)和傳播的基礎(chǔ)媒資庫(kù)將全面賦能媒體智能生產(chǎn)和智能傳播,,推動(dòng)媒體智能化進(jìn)入快速發(fā)展階段。當(dāng)前,,以ChatGPT為代表的AIGC(人工智能生成內(nèi)容)應(yīng)用平臺(tái)發(fā)展迅猛,。行業(yè)普遍認(rèn)為AIGC將成為繼專業(yè)生產(chǎn)內(nèi)容(PGC)、用戶生產(chǎn)內(nèi)容(UGC)之后新的內(nèi)容生產(chǎn)模式,,廣泛應(yīng)用在內(nèi)容生產(chǎn)的各個(gè)領(lǐng)域并且替代了部分人工創(chuàng)作,。媒資庫(kù)是媒體AIGC的基礎(chǔ),AI新聞寫作,、AI繪畫,、AI視頻生成、AI虛擬場(chǎng)景生成等AIGC應(yīng)用均離不開AI對(duì)媒資庫(kù)數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,;AI審核,、媒體報(bào)道精準(zhǔn)傳播、傳播效果精準(zhǔn)評(píng)估等也離不開AI對(duì)媒資庫(kù)數(shù)據(jù)的數(shù)據(jù)挖掘和預(yù)測(cè)分析,。(二)媒資庫(kù)數(shù)據(jù)決定媒體智能服務(wù)
隨著AI技術(shù)融合千行百業(yè),,媒資庫(kù)里面擁有的數(shù)據(jù)類型和數(shù)量,,將決定主流媒體提供智能服務(wù)的類型與水平。AI時(shí)代,,沒有數(shù)據(jù),,主流媒體就很難有智能服務(wù),影響力和競(jìng)爭(zhēng)力也會(huì)打折扣。例如,,當(dāng)前不少主流媒體針對(duì)政務(wù)服務(wù)建立了網(wǎng)絡(luò)問政互動(dòng)及訴求反映平臺(tái),,包括人民網(wǎng)“領(lǐng)導(dǎo)留言板”、新疆日?qǐng)?bào)“石榴云12345問政”,、四川日?qǐng)?bào)“問政四川”,、河北新聞網(wǎng)“陽光理政”、華龍網(wǎng)“重慶網(wǎng)絡(luò)問政平臺(tái)”等,,這些平臺(tái)所積累的政務(wù)數(shù)據(jù)和運(yùn)營(yíng)經(jīng)驗(yàn),,將造就主流媒體面向政務(wù)服務(wù)的AI能力。媒資庫(kù)在人工智能領(lǐng)域的應(yīng)用探索AIGC平臺(tái)的迅猛發(fā)展為創(chuàng)新開發(fā)媒資庫(kù)提供了方向指引,。當(dāng)前,,主流媒體在AI領(lǐng)域探索開發(fā)媒資庫(kù)主要包括以下幾個(gè)方向。(一)主流價(jià)值語料庫(kù)AI大腦既是高科技的大腦,,也是價(jià)值觀的大腦,。AI平臺(tái)有立場(chǎng),AI生成的內(nèi)容有導(dǎo)向,,其導(dǎo)向本質(zhì)上是由AI學(xué)習(xí)的數(shù)據(jù)語料和算法決定的,。例如,ChatGPT被指“充滿西方意識(shí)形態(tài)和美式政治正確”,,根源是美國(guó)硅谷和科技界本來就是美國(guó)價(jià)值觀的大本營(yíng),,ChatGPT訓(xùn)練與學(xué)習(xí)的數(shù)據(jù)大多來源于西方的數(shù)據(jù),產(chǎn)品當(dāng)然自帶西方意識(shí)形態(tài),。在推進(jìn)媒體融合過程中,,主流媒體不能一味采用、入駐商業(yè)企業(yè)的AIGC平臺(tái),,而是要特別關(guān)注喂養(yǎng)AI的語料數(shù)據(jù)和模型算法本身的導(dǎo)向,。人民數(shù)據(jù)發(fā)布的《AI大模型綜合能力測(cè)評(píng)報(bào)告》顯示,國(guó)內(nèi)主流大模型在內(nèi)容生態(tài)方面的表現(xiàn)仍有一定提升空間,,一些大模型對(duì)敏感話題做出了不同程度的規(guī)避,,部分回答內(nèi)容情感色彩較重。這從一個(gè)側(cè)面上反映出,,當(dāng)前市場(chǎng)上主流價(jià)值語料庫(kù)稀缺,,無法為大模型學(xué)習(xí)訓(xùn)練提供支持。主流媒體作為鞏固壯大主流思想輿論,、擴(kuò)大主流價(jià)值影響力的主力軍,,需要?jiǎng)?chuàng)新媒資庫(kù)、建立主流價(jià)值語料庫(kù),,進(jìn)一步發(fā)揮在AI時(shí)代守護(hù)意識(shí)形態(tài)安全的價(jià)值,。例如,,針對(duì)大模型普遍回答不了、回答不好的重大,、敏感,、疑難問題,人民網(wǎng)動(dòng)員全體員工,、匯集各方資源,,建設(shè)包括基礎(chǔ)語料、重點(diǎn)領(lǐng)域語料,、敏感問答語料在內(nèi)的“主流價(jià)值語料庫(kù)”,,目前已完成12萬道題的問答語料庫(kù),、16個(gè)重點(diǎn)領(lǐng)域語料庫(kù),、超300億字的基礎(chǔ)語料庫(kù)的建設(shè),實(shí)現(xiàn)與多個(gè)國(guó)產(chǎn)主流大模型的集成對(duì)接,,大幅提升了其安全水平,。
人民網(wǎng)“主流價(jià)值語料庫(kù)”(二)行業(yè)應(yīng)用大模型媒體創(chuàng)新融合發(fā)展路徑可以從三個(gè)層面展開:一是媒體內(nèi)部的融合,,也就是傳統(tǒng)媒體與新興媒體的融合,;二是媒體與媒體之間的行業(yè)融合;三是媒體與一切行業(yè),、產(chǎn)業(yè)的融合,,讓媒體在與各個(gè)行業(yè)的深度融合中壯大。主流媒體通過行業(yè)報(bào)道以及行業(yè)內(nèi)容運(yùn)營(yíng)業(yè)務(wù)積累了大量高質(zhì)量行業(yè)數(shù)據(jù),,可以轉(zhuǎn)化為行業(yè)垂直大模型訓(xùn)練的優(yōu)質(zhì)語料庫(kù)數(shù)據(jù),,能為開發(fā)行業(yè)垂直大模型、推動(dòng)產(chǎn)業(yè)融合提供數(shù)據(jù)與技術(shù)支撐,,為下一步推進(jìn)行業(yè),、產(chǎn)業(yè)的融合打下基礎(chǔ)。例如,,人民網(wǎng)研發(fā)的“人民智媒大模型”為國(guó)家地震局提供地震知識(shí)科普問答應(yīng)用,。該應(yīng)用基于地震科普類圖書和相關(guān)規(guī)范標(biāo)準(zhǔn)文件的學(xué)習(xí),有效提升在地震基礎(chǔ)知識(shí),、地震災(zāi)害防御,、地震應(yīng)急救援和地震預(yù)警及應(yīng)對(duì)等方面的知識(shí)科普效率。(三)內(nèi)容風(fēng)控應(yīng)用AI時(shí)代,,信息無處不在,、無所不及,、無人不用,智能內(nèi)容風(fēng)控?fù)碛袕V闊的應(yīng)用場(chǎng)景,。媒資庫(kù)的報(bào)道成品內(nèi)容,,一定程度上是主流媒體內(nèi)容審核把關(guān)能力與經(jīng)驗(yàn)的體現(xiàn)。通過AI技術(shù)學(xué)習(xí)和訓(xùn)練這些數(shù)據(jù),,可以研發(fā)內(nèi)容風(fēng)控應(yīng)用,,全面延伸主流媒體意識(shí)形態(tài)把關(guān)能力。
人民網(wǎng)“人民審校”系統(tǒng)例如,,人民網(wǎng)推出的涉政內(nèi)容智能審核平臺(tái)“人民審?!保匀嗣袢?qǐng)?bào)媒資庫(kù)為核心數(shù)據(jù),,基于人民網(wǎng)獨(dú)家資源和資深編輯的內(nèi)容把關(guān)經(jīng)驗(yàn),,構(gòu)建涉政知識(shí)數(shù)據(jù)庫(kù),具備涉政文本審核,、視覺內(nèi)容檢測(cè)等智能風(fēng)控模塊,,可以實(shí)現(xiàn)在線檢測(cè)、文本審校,、圖片審校,、視頻審校、自定義詞庫(kù)等多功能,。目前,,“人民審校”已為300多家客戶提供內(nèi)容把關(guān)和巡查服務(wù),。隨著AI大模型的進(jìn)一步發(fā)展,,“人民審校”將助力審核AI訓(xùn)練的數(shù)據(jù)語料,、生成內(nèi)容,、線上課程等內(nèi)容。(四)智能文稿創(chuàng)作應(yīng)用媒資庫(kù)里海量的政務(wù)數(shù)據(jù),,例如時(shí)政新聞報(bào)道,、領(lǐng)導(dǎo)講話稿、政策文件,、官方報(bào)告等內(nèi)容,,奠定了主流媒體在黨政文稿方面的智能創(chuàng)作能力。在開發(fā)智能文稿創(chuàng)作應(yīng)用方面,,媒資庫(kù)擁有兩大不可替代的優(yōu)勢(shì):一是數(shù)據(jù)來源于主流媒體報(bào)道,,確保了AIGC的政治方向,、價(jià)值取向和輿論導(dǎo)向;二是原始數(shù)據(jù)的寫作邏輯,、語句語序等契合黨政機(jī)關(guān),、事業(yè)單位及國(guó)有企業(yè)的應(yīng)用場(chǎng)景。例如,,人民日?qǐng)?bào)社主管,、依托人民網(wǎng)建設(shè)的傳播內(nèi)容認(rèn)知國(guó)家重點(diǎn)實(shí)驗(yàn)室推出的人工智能寫稿秘書“寫易”創(chuàng)作引擎,通過AI訓(xùn)練學(xué)習(xí)符合我國(guó)主流價(jià)值觀的數(shù)據(jù)集和媒體語料庫(kù),,內(nèi)容涵蓋政治,、經(jīng)濟(jì)、文化,、社會(huì),、生態(tài)、黨建,、國(guó)防,、外交等重點(diǎn)領(lǐng)域,,保障生成內(nèi)容安全,,著重為黨政機(jī)關(guān)、事業(yè)單位,、國(guó)有企業(yè)提供優(yōu)質(zhì)安全的智能創(chuàng)作服務(wù),。目前,“寫易”已為多個(gè)黨政機(jī)關(guān)和大型國(guó)企提供應(yīng)用服務(wù),。
人工智能寫稿秘書“寫易”(五)人工智能檢測(cè)隨著AI技術(shù)進(jìn)一步與內(nèi)容行業(yè)融合,,AIGC迎來發(fā)展新階段,。與之伴隨的內(nèi)容侵權(quán)、網(wǎng)絡(luò)釣魚,、深度偽造,、虛假信息等風(fēng)險(xiǎn)挑戰(zhàn)引發(fā)廣泛關(guān)注。媒體報(bào)道是AI內(nèi)容生成平臺(tái)數(shù)據(jù)訓(xùn)練學(xué)習(xí)的重要來源,。通過AI技術(shù)學(xué)習(xí)訓(xùn)練相關(guān)數(shù)據(jù),,推出針對(duì)性的智能檢測(cè)產(chǎn)品,可以起到保護(hù)版權(quán),、維護(hù)內(nèi)容安全的作用,,在內(nèi)容安全、版權(quán)保護(hù)方面有廣闊的市場(chǎng)應(yīng)用前景,。
人民網(wǎng)深度合成內(nèi)容檢測(cè)工具AIGC-X例如,人民日?qǐng)?bào)社主管,、依托人民網(wǎng)建設(shè)的傳播內(nèi)容認(rèn)知國(guó)家重點(diǎn)實(shí)驗(yàn)室推出的“AIGC-X”應(yīng)用,,可快速區(qū)分機(jī)器生成內(nèi)容與人工創(chuàng)作內(nèi)容,對(duì)中文文本檢測(cè)的準(zhǔn)確率已超過90%,。下一步,,AIGC-X將擴(kuò)展為對(duì)AI生成文本、圖像乃至視頻的通用智能識(shí)別模型,,為統(tǒng)籌AI安全與發(fā)展貢獻(xiàn)力量,。進(jìn)一步創(chuàng)新開發(fā)媒資庫(kù)AI與媒體深度融合,重塑媒體格局和輿論生態(tài)已是大勢(shì)所趨,。主流媒體對(duì)媒資庫(kù)開發(fā)要超前布局,、創(chuàng)新實(shí)踐,抓住AI發(fā)展的機(jī)遇,,賦能媒體智能化轉(zhuǎn)型,,推動(dòng)媒體融合向縱深發(fā)展。(一)積極豐富媒資庫(kù)數(shù)據(jù)媒資庫(kù)優(yōu)質(zhì)數(shù)據(jù)的廣度決定了在AI領(lǐng)域創(chuàng)新開發(fā)的深度,。除了傳統(tǒng)媒體歷史報(bào)道與素材數(shù)據(jù)之外,,以下數(shù)據(jù)可以重點(diǎn)考慮。一是AI數(shù)據(jù),。當(dāng)前,,AI與媒體融合進(jìn)一步加深,主流媒體內(nèi)容生產(chǎn)效率與質(zhì)量得到大幅提升,。未來,,由AI生成的數(shù)據(jù)呈現(xiàn)爆發(fā)態(tài)勢(shì),許多媒體內(nèi)容將來源于AI,。因此,,可以將海量AI生成數(shù)據(jù)補(bǔ)充到媒資庫(kù)中。二是行業(yè)數(shù)據(jù),。主流媒體在探索建立“新聞+政務(wù)服務(wù)商業(yè)”經(jīng)營(yíng)模式的過程中,,要留意對(duì)行業(yè)數(shù)據(jù)的積累、挖掘,,形成各類行業(yè)數(shù)據(jù)庫(kù),,提升媒資庫(kù)的深度和廣度。三是互聯(lián)網(wǎng)數(shù)據(jù),。通過開放合作,,主流媒體可以定向采集互聯(lián)網(wǎng)相關(guān)數(shù)據(jù),拓展媒資庫(kù)的數(shù)據(jù)量,。(二)推進(jìn)智能媒體資源庫(kù)建設(shè)媒資庫(kù)建設(shè)不能僅停留在文字報(bào)道電子化階段,。要將文字,、圖表、圖片,、音視頻報(bào)道和素材數(shù)字化,、智能標(biāo)簽化,實(shí)現(xiàn)海量數(shù)據(jù)數(shù)字化存儲(chǔ),、多模態(tài)搜索與精準(zhǔn)管理,。同時(shí),建議對(duì)各類數(shù)據(jù)進(jìn)行清洗,、提煉與分類,,形成各類專業(yè)數(shù)據(jù)庫(kù),為媒資庫(kù)創(chuàng)新開發(fā)做好準(zhǔn)備,。(三)加速媒資庫(kù)在人工智能領(lǐng)域的創(chuàng)新開發(fā)媒資庫(kù)是媒體機(jī)構(gòu)優(yōu)質(zhì),、稀缺的數(shù)據(jù)資產(chǎn),但如不創(chuàng)新開發(fā)使用,,仍然只是“歷史檔案”,,無法體現(xiàn)其數(shù)據(jù)價(jià)值。因此,,建議主流媒體積極創(chuàng)新開發(fā)媒資庫(kù),,通過技術(shù)的引入,持續(xù)賦能媒體內(nèi)容生產(chǎn),、智能傳播及經(jīng)營(yíng)運(yùn)營(yíng)分析,。此外,還可以通過對(duì)外尋求合作,,共享和開放媒資庫(kù),暢通數(shù)據(jù)資源大循環(huán),。要超前布局,,先行先試,在使用中積累數(shù)據(jù)和經(jīng)驗(yàn),,在使用中完善媒資庫(kù),,為媒體智能化轉(zhuǎn)型與融合發(fā)展提供支撐。(作者為人民網(wǎng)研究院研究員)本文刊于《全媒體探索》2024年4月號(hào),,原標(biāo)題為《人工智能時(shí)代創(chuàng)新開發(fā)媒資庫(kù)的探索與建議》,,參考文獻(xiàn)略。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1101929.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。