A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

人民網(wǎng)

構(gòu)建多元化的人工智能訓(xùn)練數(shù)據(jù)供給體系

【析理論道】作者:趙精武(北京航空航天大學(xué)法學(xué)院副教授,、北京科技創(chuàng)新中心研究基地副主任)數(shù)據(jù)作為數(shù)字時(shí)代的“新石油”,不僅是傳統(tǒng)產(chǎn)業(yè),、新興產(chǎn)業(yè)發(fā)展的重要支撐,,同時(shí)也是人工智能科技創(chuàng)新的關(guān)鍵創(chuàng)新資源。現(xiàn)階段,,人工智能產(chǎn)業(yè)發(fā)展面臨的最突出,、最迫切的困境,,便是訓(xùn)練數(shù)據(jù)供給不足。隨著網(wǎng)絡(luò)空間已公開(kāi)數(shù)據(jù)資源趨于“消耗殆盡”,,人工智能產(chǎn)業(yè)愈發(fā)需要專(zhuān)業(yè)化程度高,、領(lǐng)域?qū)傩詮?qiáng)的高質(zhì)量數(shù)據(jù)來(lái)提升算法模型性能。因此,,建構(gòu)我國(guó)人工智能法治保障體系的一項(xiàng)核心目標(biāo),,便是形成多元化的訓(xùn)練數(shù)據(jù)供給體系,以滿(mǎn)足不同規(guī)模企業(yè)的訓(xùn)練數(shù)據(jù)使用需求,,推動(dòng)算法模型性能朝著專(zhuān)業(yè)化方向升級(jí),。而構(gòu)建多元化的人工智能訓(xùn)練數(shù)據(jù)供給體系是一項(xiàng)系統(tǒng)性工程,只有通過(guò)持續(xù)拓寬數(shù)據(jù)采集渠道,、擴(kuò)大數(shù)據(jù)流動(dòng)范圍,、提高數(shù)據(jù)質(zhì)量要求,才能為人工智能產(chǎn)業(yè)注入源源不斷的創(chuàng)新動(dòng)力,,實(shí)現(xiàn)高質(zhì)量發(fā)展,。健全多源頭數(shù)據(jù)采集機(jī)制,拓展數(shù)據(jù)廣度,。在實(shí)踐中,,人工智能企業(yè)獲取訓(xùn)練數(shù)據(jù)的方式主要包括網(wǎng)絡(luò)爬蟲(chóng)抓取已公開(kāi)數(shù)據(jù)、使用開(kāi)源數(shù)據(jù)集,、購(gòu)買(mǎi)數(shù)據(jù)產(chǎn)品等,。整體而言,數(shù)據(jù)采集方式較為單一,,難以滿(mǎn)足相關(guān)產(chǎn)業(yè)對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量的基本需求,。若想擴(kuò)展訓(xùn)練數(shù)據(jù)獲取廣度,需要在以下兩個(gè)層面實(shí)現(xiàn)數(shù)據(jù)采集機(jī)制的延伸:一是在數(shù)據(jù)采集行為合法性方面,,以類(lèi)型化列舉,、監(jiān)管實(shí)踐指南等方式明確訓(xùn)練數(shù)據(jù)來(lái)源合法性的常見(jiàn)類(lèi)型,以消除企業(yè)業(yè)務(wù)合規(guī)擔(dān)憂(yōu),;二是在數(shù)據(jù)市場(chǎng)供給形式方面,,深入探索公共數(shù)據(jù)的開(kāi)放利用模式,降低中小企業(yè)獲取高質(zhì)量訓(xùn)練數(shù)據(jù)的市場(chǎng)門(mén)檻,,整合數(shù)據(jù)交易基礎(chǔ)制度,,拓展可交易數(shù)據(jù)產(chǎn)品的質(zhì)量和類(lèi)型。具體而言,,公共服務(wù)部門(mén)在長(zhǎng)期社會(huì)公共服務(wù)過(guò)程中積累了海量高質(zhì)量數(shù)據(jù),,但由于數(shù)據(jù)安全和數(shù)據(jù)使用收益歸屬不明等現(xiàn)實(shí)因素,此類(lèi)公共數(shù)據(jù)面向人工智能產(chǎn)業(yè)的開(kāi)放使用制度還需進(jìn)一步深入探索。以交通部門(mén)為例,,實(shí)時(shí)路況數(shù)據(jù)不僅可以提供實(shí)時(shí)交通擁堵情況報(bào)告,,在人工智能技術(shù)加持下,還可以預(yù)測(cè)性地分析未來(lái)時(shí)間段交通流量情況,、交通事故發(fā)生概率等,。科研機(jī)構(gòu)也積累了大量專(zhuān)業(yè)性較強(qiáng)的科學(xué)數(shù)據(jù),,如醫(yī)學(xué)研究機(jī)構(gòu)的臨床病例數(shù)據(jù),,經(jīng)由科學(xué)化整理和標(biāo)準(zhǔn)化處理,能夠在醫(yī)療影像診斷,、傳染病防控等領(lǐng)域發(fā)揮重要作用,。這些潛在的數(shù)據(jù)“富礦”,仍有待配套的法律制度予以松綁和深挖,,進(jìn)而形成層次化的數(shù)據(jù)采集渠道,。建構(gòu)高質(zhì)量數(shù)據(jù)標(biāo)注機(jī)制,挖掘數(shù)據(jù)深度,。對(duì)于訓(xùn)練數(shù)據(jù),,既有數(shù)量上的要求,更有質(zhì)量上的要求,。訓(xùn)練數(shù)據(jù)的精確性,、一致性、時(shí)效性等技術(shù)指標(biāo),,直接影響著人工智能性能能否提升,。以醫(yī)療影像識(shí)別為例,,若是存在訓(xùn)練數(shù)據(jù)將正常細(xì)胞標(biāo)識(shí)為癌變細(xì)胞,、同一細(xì)胞多次標(biāo)注為不同信息內(nèi)容等情況,,那么這些質(zhì)量堪憂(yōu)的訓(xùn)練數(shù)據(jù)只會(huì)“污染”人工智能性能,,進(jìn)而嚴(yán)重危害患者生命健康。國(guó)家網(wǎng)信辦等七部門(mén)2023年發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》也專(zhuān)門(mén)要求在人工智能技術(shù)研發(fā)過(guò)程中,,服務(wù)提供者應(yīng)當(dāng)制定符合本法要求的“清晰、具體,、可操作的標(biāo)注規(guī)則”,。因此,,合理科學(xué)的數(shù)據(jù)標(biāo)注規(guī)則是保障訓(xùn)練數(shù)據(jù)質(zhì)量和避免算法歧視的重要環(huán)節(jié)。在數(shù)據(jù)標(biāo)注方式上,,應(yīng)當(dāng)以“人機(jī)協(xié)作標(biāo)注”為主要方式,。技術(shù)研發(fā)者和服務(wù)提供者雖然可以通過(guò)批量自動(dòng)化處理系統(tǒng)對(duì)各類(lèi)數(shù)據(jù)資源進(jìn)行高效批注,,但潛在誤差標(biāo)注風(fēng)險(xiǎn)難以有效控制。相對(duì)地,,采用人工批注模式,,除了成本高昂之外,還可能在不經(jīng)意間滲透標(biāo)注人員的個(gè)人倫理觀(guān),,產(chǎn)生潛在科技倫理風(fēng)險(xiǎn),。因此,理想的數(shù)據(jù)標(biāo)注方式應(yīng)是人機(jī)協(xié)作,,以此填補(bǔ)上述數(shù)據(jù)標(biāo)注方式的短板,,提升數(shù)據(jù)標(biāo)注結(jié)果的準(zhǔn)確性、完整性和中立性,。完善數(shù)據(jù)跨境傳輸機(jī)制,,豐富數(shù)據(jù)類(lèi)型。人工智能訓(xùn)練數(shù)據(jù)的高質(zhì)量供給,,離不開(kāi)數(shù)據(jù)跨境傳輸制度的支撐,。不同國(guó)家、不同地區(qū)的數(shù)據(jù)資源具有多元化的本地特征,,這類(lèi)數(shù)據(jù)資源能夠優(yōu)化人工智能算法模型,,提升人工智能產(chǎn)品和服務(wù)的通用性。近年來(lái),,我國(guó)數(shù)據(jù)跨境傳輸?shù)姆煞ㄒ?guī)相繼出臺(tái),,確立了以“安全評(píng)估、個(gè)人信息出境標(biāo)準(zhǔn)合同,、個(gè)人信息保護(hù)認(rèn)證以及特殊機(jī)制”為內(nèi)容的數(shù)據(jù)跨境傳輸治理框架,。同時(shí),《促進(jìn)和規(guī)范數(shù)據(jù)跨境流動(dòng)規(guī)定》進(jìn)一步解綁了基于學(xué)術(shù)合作,、跨國(guó)生產(chǎn)制造,、市場(chǎng)營(yíng)銷(xiāo)等活動(dòng)進(jìn)行數(shù)據(jù)跨境傳輸?shù)南拗茥l件。為了更好推動(dòng)訓(xùn)練數(shù)據(jù)的跨境流動(dòng),,需要遵循發(fā)展與安全并重的治理邏輯,。從長(zhǎng)遠(yuǎn)來(lái)看,數(shù)據(jù)資源本地化不利于人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展,,也不利于數(shù)據(jù)要素的市場(chǎng)化配置,。數(shù)據(jù)跨境傳輸制度的建構(gòu)是為了實(shí)現(xiàn)又好又快的跨境傳輸數(shù)據(jù),在數(shù)據(jù)資源的“一進(jìn)一出”中,,充分獲取全球范圍內(nèi)的高質(zhì)量訓(xùn)練數(shù)據(jù)資源,。在促進(jìn)產(chǎn)業(yè)發(fā)展的同時(shí),還需要確保數(shù)據(jù)出境安全,積極探索多邊,、雙邊數(shù)據(jù)跨境合作機(jī)制,,提升我國(guó)在數(shù)據(jù)跨境傳輸國(guó)際規(guī)則制定中的話(huà)語(yǔ)權(quán),以構(gòu)建網(wǎng)絡(luò)空間命運(yùn)共同體為導(dǎo)向,,實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)安全有序流動(dòng),。出臺(tái)數(shù)據(jù)供給配套政策,暢通數(shù)據(jù)流動(dòng),。在財(cái)政支持政策方面,,不同規(guī)模的科技企業(yè)獲取訓(xùn)練數(shù)據(jù)的能力并不相同,為了降低人工智能產(chǎn)業(yè)的市場(chǎng)門(mén)檻,,有必要通過(guò)設(shè)立專(zhuān)項(xiàng)資金,、實(shí)施稅收優(yōu)惠政策等手段降低中小企業(yè)獲取高質(zhì)量訓(xùn)練數(shù)據(jù)的實(shí)際難度。針對(duì)在特定領(lǐng)域具有卓越表現(xiàn)的中小企業(yè),、科研機(jī)構(gòu)予以專(zhuān)項(xiàng)扶持,,特別是涉及先進(jìn)標(biāo)注算法、數(shù)據(jù)整合技術(shù)等事項(xiàng),,可以通過(guò)專(zhuān)項(xiàng)資金助力企業(yè)購(gòu)置更先進(jìn)的設(shè)備,、擴(kuò)充專(zhuān)業(yè)人才隊(duì)伍。在技術(shù)標(biāo)準(zhǔn)體系方面,,統(tǒng)一的技術(shù)標(biāo)準(zhǔn)是確保訓(xùn)練數(shù)據(jù)質(zhì)量,、規(guī)范數(shù)據(jù)供給的重要工具。在訓(xùn)練數(shù)據(jù)采集,、標(biāo)注環(huán)節(jié),,設(shè)置統(tǒng)一的技術(shù)標(biāo)準(zhǔn)體系能夠有效降低后續(xù)數(shù)據(jù)分析、數(shù)據(jù)挖掘等環(huán)節(jié)的研發(fā)成本,。同時(shí),,科學(xué)客觀(guān)的技術(shù)標(biāo)準(zhǔn)也能針對(duì)科技倫理事項(xiàng)輔助確立更為統(tǒng)一的標(biāo)注規(guī)則。在基礎(chǔ)設(shè)施平臺(tái)建設(shè)方面,,為了緩解各行業(yè),、各領(lǐng)域數(shù)據(jù)流動(dòng)范圍狹窄、流動(dòng)類(lèi)型有限等“數(shù)據(jù)孤島”現(xiàn)象,,需要政府部門(mén)推動(dòng)建設(shè)面向訓(xùn)練數(shù)據(jù)供給的數(shù)字基礎(chǔ)設(shè)施以及公共算法訓(xùn)練平臺(tái),。通過(guò)這些基礎(chǔ)設(shè)施和公共平臺(tái),將涵蓋經(jīng)濟(jì),、地理,、交通等各個(gè)領(lǐng)域的數(shù)據(jù)資源進(jìn)行匯總,從而有效提高訓(xùn)練數(shù)據(jù)的總體數(shù)量和質(zhì)量,?!豆饷魅?qǐng)?bào)》(2025年01月17日 11版)來(lái)源:光明網(wǎng)-《光明日?qǐng)?bào)》

免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀(guān)點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀(guān)點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1128562.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。

(0)
光明網(wǎng)的頭像光明網(wǎng)
上一篇 6天前
下一篇 6天前
198搶自鏈數(shù)字人

相關(guān)推薦