A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

人民網(wǎng)

“識典古籍”邂逅人工智能 古籍走入“尋常百姓家”

應該如何閱讀古籍,?人們通常認為,閱讀古籍要選擇合適的版本,,了解歷史背景知識,,借助注釋和工具書,對照其他相關文獻,才能更好地體會古籍的獨特之處,。然而,,事實上,“找不到,、不會用,、讀不懂”是人們閱讀古籍時面臨的常見情況。隨著人工智能技術的發(fā)展,,這些問題正在慢慢解決,。近日,在字節(jié)跳動研發(fā)的“識典古籍”數(shù)字化平臺上,,讀者多了“古籍智能助手”的選項——選中讀不懂的古文原文點擊“問AI”,,就可以看到這句話的翻譯,并可以用日常說話的方式,,讓智能助手總結文本內(nèi)容,,提出可供參考的研究問題??梢钥吹?,古籍智能助手降低了古籍的閱讀門檻,讓流傳千百年的寶貴文獻走入尋常百姓家,。事實上,,以古籍智能助手為代表的人工智能工具還有更長遠的價值——在讓更多讀者親近古籍的同時,,為古籍數(shù)字化工作帶來了機遇,“我們所處的新時代,,有可能實現(xiàn)文化典籍永久保護和傳承,?!睒I(yè)內(nèi)人士表示。“識典古籍”邂逅人工智能 古籍走入“尋常百姓家”識典古籍相關海報讓大模型更會檢索在字節(jié)跳動看來,,古籍智慧助手上線有賴于近年來人工智能技術的爆發(fā)式發(fā)展,。2022年3月,字節(jié)跳動向北大教育基金會提供捐贈,,全面支持“北京大學-字節(jié)跳動數(shù)字人文開放實驗室”的工作,。彼時,字節(jié)跳動計劃研發(fā)古籍數(shù)字化平臺,,利用智能技術加速中華古籍資源的數(shù)字化建設,,向全社會提供公益化服務。如今,,“識典古籍”數(shù)字化平臺已上線,,免費開放古籍超過2900部。目前“識典古籍”平臺為方便用戶的檢索和閱讀,,已上線了全文和分類檢索,、字典、古籍譯文,、命名實體查閱百科等功能,。然而,“識典古籍”數(shù)字化平臺研發(fā)團隊發(fā)現(xiàn),,雖然平臺內(nèi)輔助工具繁多,,但是用戶的需求依然沒有被精準滿足——“找不到,、不會用”成為用戶使用古籍閱讀工具時的一大難關,。“大模型技術發(fā)展以后,,我們開始自然而然地思考,,對于用戶來說,利用人工智能,,以對答的方式和數(shù)字化平臺進行交互,會不會是更好的體驗,?”“識典古籍”數(shù)字化平臺產(chǎn)品經(jīng)理汪晴表示,,“我們希望為研究和檢索古籍提供便利,。”基于在OCR(文字識別技術),、自然語言處理,、知識圖譜等技術領域的積累,以及互聯(lián)網(wǎng)產(chǎn)品設計與研發(fā)優(yōu)勢,,研發(fā)團隊很快對古籍智能助手有了初步的設想:打造一款能夠幫助用戶檢索,、閱讀,甚至深入挖掘古籍知識的工具,。然而,,古籍智能助手只是一個具有實驗性的新事物,當初的期待想要落地還需要長久地摸索,。研發(fā)團隊首先想到的是利用大模型為用戶帶來額外的驚喜。于是,,經(jīng)過了多輪的磨合和探索,字節(jié)跳動研發(fā)團隊決定將研發(fā)的重點放在檢索增強生成技術上,?!白R典古籍”數(shù)字化平臺產(chǎn)品負責人王宇介紹,檢索增強生成技術是通過檢索不同資料來源,,獲得所需上下文,,來“增強”大模型生成答案的質量。比如從古籍數(shù)據(jù)庫里檢索古籍資料,,讓獲得的上下文更加相關,。在關鍵詞檢索之外,研發(fā)團隊還開發(fā)了語義檢索,,讓智能助手在回答時能參考到雖然文字不一樣,、但含義相關的相關古籍段落。這也讓古籍智能助手和市場中已有的通用大模型形成了差異,?!肮偶悄苤植⒉皇强壳捌谟柧殨r使用的數(shù)據(jù)和知識進行解答,,而是實時調動較新的專業(yè)數(shù)據(jù)庫,,這是通用大模型難以做到的?!蓖羟缯f,,“我們希望古籍智能助手是具備專業(yè)度的?!痹鰪妴柎饻蚀_性古籍智能助手的研發(fā)也并非一帆風順,。對于字節(jié)跳動研發(fā)團隊來說,最大的難點莫過于大模型會產(chǎn)生錯誤和“幻覺”,。產(chǎn)生“幻覺”幾乎是大語言模型的“通病”,。有學者曾指出,,這種“幻覺”是指人工智能會生成貌似合理連貫,但同輸入問題意圖不一致,、同世界知識不一致,、與現(xiàn)實或已知數(shù)據(jù)不符合或無法驗證的內(nèi)容。有專家認為,,從技術原理上看,,人工智能“幻覺”多由于人工智能對知識的記憶不足、理解能力不足,、訓練方式固有的弊端及模型本身技術的局限性導致,。而現(xiàn)階段,大模型產(chǎn)生錯誤“幻覺”的情況難以完全消除,。然而,,在古籍領域,基于文言文可能出現(xiàn)的閱讀障礙,,由大模型產(chǎn)生的錯誤和“幻覺”讓用戶更加難以分辨,。但是即便如此,字節(jié)跳動研發(fā)團隊依然希望能盡可能減少“幻覺”,,并讓用戶在希望追求準確性的時候,,能夠進行查證。相關負責人表示,,為了減少大模型產(chǎn)生的“幻覺”,,團隊付出了巨大的努力:一方面,古籍智能助手使用了檢索增強生成技術,,這樣就要求大模型根據(jù)從數(shù)據(jù)庫和字典中檢索到的,、有一定可靠性的資料作答,在一定程度上限制了大模型產(chǎn)生“幻覺”,;另一方面,,研發(fā)團隊正在嘗試在生成的答案后附加原文鏈接,這樣對于寫作等場合,,用戶就可以方便地去原文查證并且做出自己的判斷,。不僅如此,在古籍智能助手的界面,,研發(fā)團隊還設置了“回答由人工智能生成,,請注意查證”的提示詞?!肮偶悄苤值淖饔檬翘嵘殚喒偶男省K娌涣藢I(yè)的學術判斷和閱讀積累,,但我們希望它能為使用古籍的人節(jié)約時間,、開拓新的思路,。”王宇表示,。在減少大模型“幻覺”的基礎上,,古籍智能助手最終還是上線與用戶見面。在“識典古籍”數(shù)字化平臺,,當用戶選中古籍中的文字并點擊“問AI”,,或者輸入問題時,古籍智能助手首先會對用戶提出的問題進行意圖判斷,,如果回答這個問題需要利用字典中的條目或者古籍數(shù)據(jù)庫搜索結果作為上下文,,智能助手會獲取相關的上下文,然后通過大語言模型綜合總結并給出回復,。汪晴稱,,古籍智能助手上線幾周后得到了較好的反饋?!昂芏嘤脩敉ㄟ^智能助手去理解句子含義,,幫助用戶實現(xiàn)了從‘不懂’到‘懂’的跨越。不僅如此,,展示參考引用的功能也受到了用戶的好評,。雖然目前古籍智能助手還無法將參考引用完全展示,但依然有用戶表示對發(fā)現(xiàn)之前忽略的知識有幫助,?!弊尮爬辖?jīng)典“活”起來、傳下去雖然古籍智能助手已經(jīng)上線運行,,但是研發(fā)團隊并沒有停下探索的腳步,。汪晴表示,在功能方面,,正在計劃逐步為古籍助手提供更多的工具,,比如是否能從百科資料中檢索答案,是否能和一些更加專業(yè)的數(shù)據(jù)庫進行合作,?!拔覀円蚕M脩裟軌蚨嗍褂煤头答仯瑸楹罄m(xù)優(yōu)化提供建議,,通過實踐和應用來打磨出好的產(chǎn)品,。”在汪晴看來,,這種探索為閱讀古籍的用戶提供了便利,,也拉近了公眾和古籍之間的距離,讓經(jīng)典更加觸手可及,?!斑@也是古籍智能助手給‘識典古籍’數(shù)字化平臺帶來的較為突出的價值,。”業(yè)內(nèi)普遍認為,,將大模型和人工智能引入古籍保護領域是時代帶來的便利,。今年全國兩會期間,有委員表示,,中國是全球擁有古籍最多的國家,,國內(nèi)現(xiàn)存漢文古籍300萬部,散落在海外的古籍超過40萬部,,已完成數(shù)字化的古籍7.4萬部,。可以看到,,還有大量的古籍被束之高閣,。不僅如此,對于古籍來說,,修復的速度遠遠趕不上老化的速度,,古籍數(shù)字化迫在眉睫。對此,,王宇認為,,大規(guī)模解決古籍數(shù)字化的問題只能等待技術進步,而近十年,,大模型和人工智能的飛速發(fā)展剛好為加速實現(xiàn)全部古籍數(shù)字化帶來了技術條件,。“如果現(xiàn)存古籍全部數(shù)字化,,那么我國古籍保護就邁上了一個新臺階,,古籍滅失的可能性就大幅降低了。這對于賡續(xù)中華文脈,,將是一個了不起的貢獻,。”有學者表示,。文/李濛“識典古籍”邂逅人工智能 古籍走入“尋常百姓家”古籍智能助手寬屏模式頁面截圖(來源:北京日報)

免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1092423.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。

(0)
中國青年網(wǎng)的頭像中國青年網(wǎng)
上一篇 2024年3月15日 下午2:02
下一篇 2024年3月15日 下午2:10
198搶自鏈數(shù)字人

相關推薦