來源:火訊財經
文章轉載來源:東尋
AI 新智界訊,,1 月 5 日,,“智求共贏?中國 AIGC 產業(yè)應用峰會暨無界 AI 生態(tài)合作伙伴大會”在杭州未來科技城召開。大會由杭州未來科技城管委會,、余杭區(qū)科技局和余杭區(qū)企業(yè)(人才)綜合服務中心聯(lián)合指導,,時戳科技主辦,AI 新智界提供媒體特別支持,。大會上,,無界 AI 市場總監(jiān)李本漲發(fā)表“AIGC 結合數(shù)字化身的產業(yè)化應用與落地”主題演講。
他表示,曾經的 AI 繪畫色彩單一,、線條粗獷,、畫面混亂、人像非常不像,,而如今的 AI 繪畫色彩豐富,、線條細膩、結構清晰,、人像變得真像,。由于 AI 繪畫在人像層面的快速發(fā)展,AIGC 數(shù)字化身的時刻基本已經到來,。此外,,針對 AIGC 數(shù)字化身的未來方向,李本漲表示,,AIGC 的數(shù)字化身未來必然要跟多模態(tài)大模型做深度結合,,即多模態(tài)數(shù)字化身。這類化身擁有具體形象,、人格特征,、存在多種身份,并且可以做到人機交互,。
以下是 AI 新智界整理的演講內容,,為方便閱讀已進行部分刪減:
今天我很榮幸跟大家分享下無界 AI 在數(shù)字化身領域的一些探索和落地的案例,以及我們對于未來方向的思考,。
AI 人像繪畫從“不像”到“真像”
目前大家看到了非常多的新穎的優(yōu)秀作品,,我特別想做的一件事情就是想讓大家看一下 AI 繪畫在兩年前是什么樣的。
這些畫就是兩年前 AI 繪畫呈現(xiàn)的樣子,。因為我在 2021 年底開始接觸 AI 繪畫,,當時玩的就是 Disco Diffusion,它給我?guī)淼臎_擊非常大,。在我看來,,可能有些人認為 2022 年是 AI 繪畫的元年,但是我作為一個相對比較早期接觸 AI 繪畫的藝術家,,我認為在 2021 年 10 月,,AI 繪畫的元年就已經展開了,就是由 Disco Diffusion 為代表的擴散模型帶來的,。
為什么當時我們沒有考慮做 AIGC 的數(shù)字人或者 AI 化身,?因為我們嘗試用當時的技術畫了一下,可以看到人像層面的表現(xiàn)(下圖所示),,它可能在場景層面因為整體效果顯得恢宏大氣,,具有一定藝術價值,但在人像層面卻不盡如人意。
所以我們認為早期的 AI 繪畫(早期階段可能是在最初 2021 年下半年或是 2022 年初),,它的繪畫色彩可能比較鮮艷,,但線條非常粗獷,畫面邏輯比較混亂,,人像完全不像人,。
因此,無界 AI 在探索行業(yè)發(fā)展的時候,,也在不斷等待,,等待技術本身的自我迭代和進化。在等待的過程中,,我們逐漸發(fā)現(xiàn) AI 開始畫得有點像了,,或者說它在人體結構或是人體表現(xiàn)力上逐漸變得更加優(yōu)秀。到最后,,它在整個面部細節(jié)上,,會讓你認為它確實畫的是一個人,而不是一個非人,。
直到 AI 人像繪畫“奇點”的出現(xiàn),。
上圖也是用 AI 繪畫繪制的一幅人像作品,但大家一眼就能認出來 AI 畫的是鋼鐵俠,。
我們發(fā)現(xiàn)可以用 AI 繪畫這樣更逼真的三維人物,,以及無界 AI 推出的真人模型,能夠把抽象的 AI 人物畫得更像了,。
然后,,就是我們今天發(fā)布的影像模型,,你會發(fā)現(xiàn)已經不能說是一眼 AI,,你甚至已經難辨真假了。
從這樣的技術發(fā)展路徑來看,,我們認為 AI 已經可以開始去做人像相關賽道的業(yè)務發(fā)展了,。正如我剛才提到的,曾經的 AI 繪畫是色彩鮮艷,、線條粗獷,,但是畫面混亂、人像不像,,現(xiàn)在已經變成了色彩豐富,、線條細膩、結構清晰,、人像變得真像,。
這是因為 AI 繪畫在人像層面的快速發(fā)展。所以,我們認為它進入 AIGC 數(shù)字化身的時刻基本上已經到來了,。
AIGC 數(shù)字化身應用實例
在開展業(yè)務過程當中,,我們也逐漸發(fā)現(xiàn)怎么樣能夠讓 AI 人像賽道做起來更加不一樣?對此,,我們引入了數(shù)字化身的 LoRA 模型訓練,,加上底層的基底人像模型,最后生成對應的 AIGC 數(shù)字化身,。
跟大家分享一下我們做的幾個應用實例,。
如上圖所示,這是我們跟 vivo 手機的 vivo 短視頻內置應用合作的 AIGC 化身產品,,叫寫真大片,。通過無界 AI 數(shù)字化身技術,vivo 在短視頻應用中引入了 AI 寫真大片的功能,。
這是無界 AI 最近與另一個合作方《神隱》一同制作的關于 AIGC 數(shù)字化身的項目,。這幾張圖的妝造都是這部劇里面的妝造,但最后生成的效果,,中間人物的臉都變成用戶本身替換的人臉,。
從這個案例切入,我們認為當 AIGC AI 數(shù)字化身結合 IP,,它就能創(chuàng)造一個新的粉絲經濟,。因為過往粉絲群體非常喜歡這個電視劇,但是他們對這部劇的支持形式有限,。而現(xiàn)在有了 AIGC AI 化身之后,,他們除了一些表象的支持之外,還可以更加深入地參與進去體驗,,包括可以用 AI 繪畫的能力來參與共同創(chuàng)作中,。
第三個案例來自與無界 AI 有著深度合作的企業(yè)“匠韻智能”。由深圳匠韻智能研發(fā)的一體機,,接入無界 AI 提供的數(shù)字化身模型效果,,共同打造出一款適用于景區(qū)、商場等線下場景的 AIGC 數(shù)字化身一體機,。
簡單來說,,這個案例是通過一個真人,加上一個實體的 AI 機器,。就是用戶上傳自己的照片,,最后生成 AI 化身的人物形象。這個模式類似于以前的大頭照,。你可以生成各種各樣的風格,,比如你在不同的景區(qū),,你可以通過實體的機器打卡,變成景區(qū)的 AI 形象,。
AIGC 數(shù)字化身未來展望
在分享幾個關于 AI 數(shù)字化身的案例之后,,無界 AI 也在思考關于 AI 數(shù)字化身的未來方向,它的展望應該是怎樣的,?
最近有一個概念非?;穑褪嵌嗄B(tài)大模型,。在我們看來,,AIGC 數(shù)字化身未來必然要跟多模態(tài)大模型做深度結合,對此我稱之為“多模態(tài)數(shù)字化身”,。
簡單解釋一下多模態(tài)大模型,,其實就是能夠讓 AI 更貼近真實世界,通過并非單一的一種模型能力,,去實現(xiàn)跟真實世界的輸入和輸出,。通過這樣的形式,我們認為 AI 才具有更強的人的屬性,,而不是說單純只能解決一個特定的問題,。
同時,我們也對多模態(tài)數(shù)字化身的特點做了分析和定義:
- 擁有具體形象,。因為是數(shù)字化身,,它需要一個具體的形象,它可以是人類,,也可以是類人,。它不一定是一個真實的人類形象,也可能是卡通的形象,,或者是一些動物的擬人形象,。通過具體的形象,來表現(xiàn)它的外在形式,。
- 具有人格特征,。作為一個數(shù)字人,它需要有一個性格特征,。以最近這一年比較火的 I 人和 E 人為例,我覺得未來 16 人格也能夠套用到對于 AI 人格的解析,。
- 存在多種身份,。可能現(xiàn)在有一些虛擬伴侶,、虛擬偶像,,像在游戲當中也逐漸運用到 AI 在里面做 NPC,,或者訓練自己的虛擬寵物。AI 未來會有大量不同的身份,,但它會在特定場景下表現(xiàn)出對應的身份,,可能它今天是你的偶像,明天就變成了你的對象,。
- 可以人機交互,。這跟硬件、軟件相關,,除了頭顯之外,,未來肯定也會有更多的交互方式。
從這幾個維度出發(fā),,因為它是一個多模態(tài)大模型,,所以不同的模型是解決不同的問題。比如說“像不像”的問題,,可以通過 Midjourney,、無界 AI、SD,、Dall-E 等生成外觀形象,,因為現(xiàn)在已經進入到能夠解決“像不像”問題的階段。關于人格特征和多種身份,,其實這是 AI 的自我認知,,這一塊更多跟大語言模型相關,就是 ChatGPT,。最終的人機交互,,不管是手機、平板還是頭顯,,它都有多種交互形式,,最終能夠產生不同的交互效果。
結合多模態(tài)數(shù)字化身的概念,,我覺得它會帶來一個哲學思考,。像著名哲學家笛卡兒說的“我思故我在”,人類也在思考我為什么是我,,包括莊周夢蝶也是一樣,,我是不是在別人的夢境當中。從這個角度來講,,多模態(tài)的數(shù)字化身要思考的問題就是“我像故我存”,,這個“像”不再是表面長得像不像的形象問題,它更多是在多模態(tài)大模型下的行為模式是不是跟人類足夠相像,。我覺得在未來發(fā)展當中,,通過多模態(tài)大模型的引入,,“像不像”的問題會逐步得到解決。同時,,可能有更加深度的人工智能思想去考慮這個問題,。
所以,無界 AI 在數(shù)字化身上的探索,,從早期的“畫得像”,,然后慢慢地變成現(xiàn)在的“長得像”,這個數(shù)字化身長得像,,未來引入多模態(tài)之后,,整個行為模式更像。這就是我們對于數(shù)字化身未來發(fā)展相對而言比較完整的思考路徑,。
最后,,還是用這句話:“我思故我在,我像故我存,?!庇枚嗄B(tài)數(shù)字化身,去探索更真的 AI 數(shù)字生命,。
免責聲明:本文來自網絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1086577.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。