來源:新知悅生活
短視頻平臺上層出不窮的數(shù)字人主播,,文旅宣傳片中的“智能向?qū)T”和“數(shù)字代言人”,在B站爆火的“冷門歌手AI孫燕姿”,,在各種舞臺上以逼真形象和互動能力吸引著觀眾目光的虛擬偶像……數(shù)字人正以多樣化的形象和創(chuàng)新的互動方式,,悄然走進大眾視野。
作為由計算機圖形學,、動作捕捉,、深度學習、語音合成等計算機手段創(chuàng)造及使用,,并具有多重人類特征(如外貌特征、人類表演能力,、人類交互能力等)的綜合產(chǎn)物,,數(shù)字人是新一代信息技術(shù)集成創(chuàng)新和應(yīng)用的未來產(chǎn)業(yè),也是數(shù)字經(jīng)濟與實體經(jīng)濟融合的高級形態(tài),。
隨著技術(shù)的不斷進步,,數(shù)字人在各個領(lǐng)域得到廣泛應(yīng)用,并有望形成千億級新賽道,。近兩年,,越來越多的企業(yè)與資本布局數(shù)字人領(lǐng)域。
捕捉市場風口 走進元宇宙
今年以來,,世優(yōu)科技因為數(shù)字人頻繁“出圈”:
1月與北京大學共同成立“數(shù)字人訓練聯(lián)合實驗室”,,2月在央視及地方臺眾多春晚節(jié)目中露面,5月一舉拿下虎嘯獎元宇宙營銷類金獎,,6月發(fā)布新一代AI數(shù)字人多模態(tài)交互系統(tǒng)“世優(yōu)波塔”,,7月深度參與2024全球數(shù)字經(jīng)濟大會成為“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”第三批成員并登錄央視新聞聯(lián)播……
世優(yōu)科技是如何進軍數(shù)字人元宇宙賽道的,?背后又有哪些布局,?
2015年世優(yōu)科技成立,當時市場上還沒有明確提出“數(shù)字人”的概念,,但捕捉到元宇宙,、虛擬場景風口的世優(yōu)科技創(chuàng)始人&CEO紀智輝,已經(jīng)開始專項研究圖形圖像算法,、工作流引擎,、實時動捕技術(shù)等虛擬數(shù)字技術(shù),在打通關(guān)鍵技術(shù)節(jié)點后,,世優(yōu)科技正式以數(shù)字人為核心業(yè)務(wù)方向,。
“創(chuàng)業(yè)摸索的過程中,我們意識到,,在元宇宙中的交互界面不可能再依賴于文字,,而必然要回歸人與人之間的交流,虛擬數(shù)字人便承擔了元宇宙虛實共生世界的主體,?!笔纼?yōu)科技積極投身技術(shù)研發(fā)和應(yīng)用場景的探索,在行業(yè)內(nèi)率先突圍出一條創(chuàng)新之路,,這也在一定程度上促進了國內(nèi)虛擬數(shù)字人商業(yè)化應(yīng)用的整體進程,。
世優(yōu)科技逐步攻克了數(shù)字人在品牌傳播、服務(wù)升級和營銷轉(zhuǎn)化等領(lǐng)域的難題,,成功構(gòu)建起一套標準化的數(shù)字人及虛擬場景制作流程,,為市場、行業(yè),、企業(yè)以及用戶之間創(chuàng)造了新的價值紐帶和連接方式,,不僅協(xié)助品牌的IP打造及宣傳,,達到營銷轉(zhuǎn)化的目的,還通過數(shù)字人的功能化,、真人復(fù)刻等2.5D數(shù)字人業(yè)務(wù)實現(xiàn)服務(wù)升級,,幫助企業(yè)降本增效;在大型活動及賽事中,,為虛擬演播室解決方案提供技術(shù)支持,,為觀眾帶來更好的體驗;隨著AI技術(shù)的發(fā)展,,世優(yōu)科技還把AI與數(shù)字人相結(jié)合,,實現(xiàn)更好的交互產(chǎn)品解決方案;更是通過創(chuàng)新體驗定制化解決方案,,為年輕人帶來了更沉浸式的交互體驗,。
目前,世優(yōu)科技已經(jīng)為央視,、中國移動,、華為、阿里巴巴,、海爾集團等世界500強在內(nèi)的近千家客戶,,提供數(shù)字化、智能化的產(chǎn)品及服務(wù),,累積打造數(shù)字人超過1200個,,參與交付杭州亞運會開閉幕式項目、央視春晚劉德華“牛起來”,、第十四屆冬奧會,、成都交子大道元宇宙跨年夜等多個國家級重大項目,同時生態(tài)建設(shè)面向全國伙伴,、全球市場,,已經(jīng)在多個城市及國家建立子公司或合作伙伴。
(杭州亞運會閉幕式上世優(yōu)科技支持的數(shù)字人虛擬演播)
如今,,數(shù)字人技術(shù)的應(yīng)用正助力人們以創(chuàng)新的方式解決問題,,開啟無限可能。
艾媒咨詢《2023年中國虛擬人產(chǎn)業(yè)發(fā)展與商業(yè)趨勢研究報告》顯示,,2022年中國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1866.1億元和120.8億元,,預(yù)計2025年分別達到6402.7億元和480.6億元。根據(jù)Gartner預(yù)測,,到2035年全球數(shù)字人市場將增至1,250億美元,,并呈現(xiàn)持續(xù)增長趨勢,。
今年8月3日,北京市經(jīng)濟和信息化局發(fā)布的《北京市促進數(shù)字人產(chǎn)業(yè)創(chuàng)新發(fā)展行動計劃(2022—2025年)》指出,,到2025年,,北京市數(shù)字人產(chǎn)業(yè)規(guī)模將突破500億元,初步形成具有互聯(lián)網(wǎng)3.0特征的技術(shù)體系,、商業(yè)模式和治理機制,,成為全國數(shù)字人產(chǎn)業(yè)創(chuàng)新高地。
從資本市場看,,數(shù)字人行業(yè)也吸引了大量風險投資和私募股權(quán)投資,,世優(yōu)科技李曦介紹,公司在成立近十年時間里,,已經(jīng)完成六輪近3億元融資,,推進數(shù)字人產(chǎn)品的研發(fā)及業(yè)務(wù)拓展,打造數(shù)字人標桿產(chǎn)品和品牌,。
此外,,數(shù)字人還將帶來龐大的衍生產(chǎn)業(yè)鏈,比如虛擬空間,、虛擬現(xiàn)實,、元宇宙社交、電子商務(wù)等等,,由此可見,,數(shù)字人及其衍生產(chǎn)業(yè)的規(guī)模及發(fā)展前景是巨大的。
“確切來說,,虛擬數(shù)字人不是移動互聯(lián)網(wǎng)衍生的,,而是為元宇宙準備的?!笔纼?yōu)科技紀智輝表示,,目前公司正在推進的VR大空間技術(shù)與數(shù)字人結(jié)合的應(yīng)用,在虛實共生的元宇宙世界中,,人“人”共生不再是科幻電影里的想象,,現(xiàn)實中的人與數(shù)字人可以深度互動、分享記憶,、建立情感紐帶,。
虛擬數(shù)字人需要“情智兼?zhèn)洹?/strong>
數(shù)字化浪潮席卷而來,其中,,人工智能應(yīng)用場景的構(gòu)建成為新的科技焦點,,AI驅(qū)動數(shù)字人的應(yīng)用場景正在加速落地,逐步向互聯(lián)網(wǎng),、文旅,、金融,、快消、汽車等領(lǐng)域加速滲透,。
同時,,國內(nèi)也上演了“百模大戰(zhàn)”,各種各樣的數(shù)字人進入市場,,百元級別的數(shù)字分身迅速被炒成一本萬利的“財富經(jīng)”,。
打開視頻平臺,有大量數(shù)字人堅守在直播間,,但隨之而來的,,是針對數(shù)字人的質(zhì)疑,比如,,市場混亂,、效果太假、冰冷無情,、已讀亂回等等,,用戶體驗不佳,是大眾反饋的主要問題,。
在當下這個挑戰(zhàn)與機遇并存的時期,,世優(yōu)科技韓光明表示:“在運用數(shù)字人去解決問題之路上,世優(yōu)正試圖讓數(shù)字人情智兼?zhèn)涞刈灾鹘鉀Q問題,?!?/p>
為此,世優(yōu)科技將原先所沉淀的技術(shù)底座,,升級為可呈現(xiàn)和可交互的窗口,,2023年,世優(yōu)科技推出了讓AI從聊天窗口升級成人與“人”的直接交流的“世優(yōu)BOTA”產(chǎn)品,,使得AI數(shù)字人在制作效率,、多模態(tài)交互以及使用場景層面迎來新的突破窗口。
在醫(yī)療就醫(yī)指引,、自動化帶貨主播,、氣象數(shù)字主持人等眾多項目的實踐中,世優(yōu)科技通過不斷迭代優(yōu)化模型算法,,實現(xiàn)了波塔更加流暢自然的語言交流,、自動化識別與響應(yīng)能力。
在經(jīng)過技術(shù)的不斷積累和大量的市場檢驗后,,2024年6月6日,世優(yōu)科技發(fā)布了新一代AI數(shù)字人多模態(tài)交互系統(tǒng)“世優(yōu)波塔(BOTA3.0)”,,深化了對AI驅(qū)動的交互式數(shù)字人解決方案的應(yīng)用方式,,使數(shù)字人能夠更好地理解用戶的復(fù)雜需求和情感,,提供更智能、個性化和精準的交互體驗,,打造了人工智能時代有溫度的多模態(tài)人機交互界面,。
(世優(yōu)波塔)
為了能夠幫用戶實現(xiàn)AI數(shù)字人的端到端應(yīng)用場景融合,,在模型部署、性能優(yōu)化及用戶體驗上,,世優(yōu)科技做了很多優(yōu)化迭代,,例如對3D表情生成的算法結(jié)構(gòu)和算法工程,進行總體優(yōu)化提升,,讓單個數(shù)字人頭部擁有182個精細控制點,,促進了面部動畫的真實感與表現(xiàn)力,特別是在微妙表情的傳達上,。
同時,,進一步提升效率與響應(yīng)速度,目前可以達到1:20的推理效率,,這一成果不僅保證了AI數(shù)字人在實時交互應(yīng)用中所需的高速反饋,,還降低了資源消耗的低成本。
為了彌補大模型在特定應(yīng)用場景下的能力不足,,世優(yōu)波塔打造了多個大模型基座,,多agent協(xié)作的數(shù)字人大腦,充分發(fā)揮不同大模型的優(yōu)勢,,讓數(shù)字人有目標,、可協(xié)作、更專業(yè),、更細膩,,以更輕量化和更高效的能力,快速實現(xiàn)業(yè)務(wù)流程的搭建,。
“我們希望世優(yōu)科技的AI數(shù)字人都能夠具備有趣的靈魂和解決問題的能力,。”世優(yōu)科技韓光明表示,。
虛擬數(shù)字人行業(yè)需要走向“標準化”
數(shù)字人行業(yè)作為元宇宙的重要組成部分,,其發(fā)展前景無疑是廣闊的。
隨著人工智能,、計算機圖形學等技術(shù)的不斷進步,,數(shù)字人將變得更加逼真、高效,,能夠在更多的場景中實現(xiàn)交互應(yīng)用,,虛擬數(shù)字人產(chǎn)業(yè)的商業(yè)化前景也展現(xiàn)出了鼓舞人心的潛力,。
但也毋庸置疑的是,該領(lǐng)域在未來的探索道路上仍需克服一系列挑戰(zhàn)與瓶頸,。
比如,,技術(shù)層面仍需突破,創(chuàng)建逼真的數(shù)字人仍然面臨技術(shù)挑戰(zhàn),,各行業(yè)之間也缺乏統(tǒng)一的技術(shù)標準,,導(dǎo)致數(shù)字人行業(yè)面臨兼容性問題,從而限制了行業(yè)的發(fā)展,;
其次,,倫理與隱私問題不容忽視。數(shù)字人的發(fā)展可能引發(fā)虛擬身份的混淆,、隱私侵犯,、數(shù)據(jù)安全等倫理問題,需要制定相應(yīng)的法律法規(guī)來規(guī)范數(shù)字人的使用和管理,。
此外,,社會接受度也是數(shù)字人行業(yè)需要面對的問題之一。雖然數(shù)字人在某些領(lǐng)域已經(jīng)得到了應(yīng)用,,但公眾對于數(shù)字人的接受度仍然存在差異,,未來數(shù)字人也可能會取代一些門檻和技能要求低的崗位,形成人與技術(shù)之間的競爭關(guān)系,。
在紀智輝看來,,數(shù)字人的標準化、規(guī)?;涞睾腿诤线M產(chǎn)業(yè),,是一個復(fù)雜而長期的過程,涉及技術(shù),、市場,、政策等多個方面的因素。不過隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,,數(shù)字人的規(guī)?;涞睾彤a(chǎn)業(yè)化應(yīng)用已經(jīng)初具雛形,并有望在未來幾年內(nèi)取得更大進展,。
(做有溫度的AI數(shù)字人)
世優(yōu)科技憑借其深厚的技術(shù)積累和前瞻性的戰(zhàn)略眼光,,在推動數(shù)字人技術(shù)發(fā)展的過程中也在發(fā)揮領(lǐng)頭羊作用,,不僅積極參與行業(yè)內(nèi)生態(tài)建設(shè),也為拓展數(shù)字人在公共服務(wù)領(lǐng)域的應(yīng)用場景,推動數(shù)字人技術(shù)合規(guī)及行業(yè)的有序發(fā)展,,貢獻自身力量,。
展望未來,世優(yōu)科技仍對虛擬數(shù)字人行業(yè)的發(fā)展保持高度的期待,,隨著AI技術(shù)的快速發(fā)展,虛擬數(shù)字人的功能指向?qū)⒅饾u擴展,,從普適化向個性化滲透,,并將發(fā)展全新故事內(nèi)核,最終成為元宇宙時代用戶的交互方式,。
未來,,數(shù)字人作為“元宇宙+”中一種關(guān)鍵的數(shù)字工具,是否也將廣泛滲透到傳統(tǒng)產(chǎn)業(yè)中,,實現(xiàn)產(chǎn)業(yè)的向外擴展,,成為繼互聯(lián)網(wǎng)之后的又一重要推動力?讓我們拭目以待,。
免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1119336.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。