不要溫和地走進AIGC
1811年11月,,英國,,諾丁漢市西北一處小鎮(zhèn)里,,一群憤怒的紡織工人揮舞著錘頭與斧子,,一窩蜂地沖進車間里,將幾臺機器砸得粉碎。
后來,這場運動的大火熊熊燃燒到整個英格蘭大陸,這些反抗工業(yè)化的人們被稱為“盧德主義者”,。
他們是被工業(yè)革命滅絕的最后一只恐龍。
01.“尋求一種解放”
一直以來,,內(nèi)容創(chuàng)作世界里,,都存在著大量的重復動作,它們繁冗,、耗時,,卻又本質(zhì)上與創(chuàng)作無關(guān)。
比如,,文稿校對者為了找出錯別字,,一次又一次地重復閱讀一篇文章,讀得眼睛都發(fā)酸,、發(fā)脹,。
再比如,畫家靈感迸發(fā),,在畫布上揮毫而就一幅巨作,,然后花上十倍的時間對整幅畫面的每一處細節(jié)重復勾線、加陰影,、卡閉塞,、勾線、加陰影,、卡閉塞……
視頻制作則更是重災區(qū),。視頻拍攝的原始素材動輒長達幾十、甚至幾百小時,,后期剪輯師不僅要用肉眼逐一觀看,,還要一而再再而三地對其進行重復識別、篩選,、剪輯切割,在AI出現(xiàn)之前還要用耳朵一遍遍聽原片內(nèi)容,,手動添加字幕,。
這些過程既無趣,又冗長,,而且與真正的人類創(chuàng)造力幾乎毫無關(guān)系,。創(chuàng)作者們的大量精力都被分散到了這些重復環(huán)節(jié),真正用來創(chuàng)作的部分少之又少。
AIGC對于內(nèi)容創(chuàng)作者的意義,,正是將他們解放出來,,讓創(chuàng)作者的精力更好地用于探索創(chuàng)意極限,而重復,、冗雜的工作交給AIGC,,讓創(chuàng)作者的產(chǎn)能不再受到制約,讓優(yōu)質(zhì)內(nèi)容能夠爆炸式增長,。
聽起來這一天似乎很遙遠,,但實際上,由AI輔助生成的視頻創(chuàng)意內(nèi)容已經(jīng)來到了我們身邊,。
去年冬奧期間,,央視體育新媒體和總臺技術(shù)團隊聯(lián)合阿里云視頻云、阿里巴巴達摩院聯(lián)合打造了“AI云智剪”智能視頻剪輯工具,。
基于阿里AI視頻理解技術(shù)EMC2與阿里云強大的流媒體處理能力,,AI云智剪能夠?qū)崟r解析并提取賽事視頻中的運動員信息、精彩動作,、鏡頭類型,、賽程信息、運動員特點等,,并自動生成多種類型的集錦視頻,,大規(guī)模解放剪輯師壓力。
去年整個冬奧期間,,阿里AI云智剪共生產(chǎn)出39878段素材,,時長超過200小時,覆蓋超200場比賽,。
AI視頻生成之外,,通過和云計算結(jié)合,AIGC還能夠從根源上顛覆電視臺與演播室的工作流程,,將原本龐大,、復雜、昂貴的演播環(huán)節(jié),,全部集成在一臺普通的手機上,。
比如,在連續(xù)多屆的全國兩會期間,,人民日報新媒體記者的手機里就裝進了一款內(nèi)容創(chuàng)作增效“神器”:兩會“AI編輯部”移動版,。
這是基于阿里云視頻云的“AI編輯部”衍生而來的定制化智能媒體生產(chǎn)產(chǎn)品。通過“AI編輯部”,,記者所拍攝的現(xiàn)場視頻素材既能由5G網(wǎng)絡同步回傳后方,,也能由記者在前方即時剪輯。從發(fā)現(xiàn)線索、獲取素材,,到拍攝制作,、審核簽發(fā),以及發(fā)起直播,、連麥訪談等系列動作,,都能通過一部手機實時完成。
曾經(jīng)有人認為,,文字與圖片都是高度結(jié)構(gòu)化的信息,,能夠被AI輕易替代無可厚非,但是,,視頻內(nèi)容信息量大,、非結(jié)構(gòu)性數(shù)據(jù)多,是AI尚未攻克的堅固堡壘,。然而,,事實不攻自破。
02.“未來是屬于AI的,?”
去年9月,,一幅由AI創(chuàng)作的繪畫作品《太空歌劇院》獲得美國科羅拉多州藝術(shù)博覽會數(shù)字藝術(shù)類別冠軍,幾乎標志著AI作畫的“AlphaGo時刻”,。
《太空歌劇院》(Théatre D’opéra Spatial)
這幅作品是基于AI生成的畫作加上人類畫師的后期繪制,,這一點被業(yè)內(nèi)人士大為詬病,指責作者以AI為噱頭,,實際上依舊需要人類加工,。這些質(zhì)疑AI作畫能力的人忽略了一個重要因素——進化。
是的,,我們浸在AI風潮里卻不太經(jīng)意,,往往低估了AI大模型的學習與進步能力。
僅僅在幾年之前,,人工智能還是被戲稱為“人工智障”的存在,。人們時常拿間或出現(xiàn)的“翻車”案例證明AI與人類的差距,卻忽略了這項技術(shù)在最近數(shù)年間突飛猛進的進化能力,。
在當前的AIGC領(lǐng)域,,AI全自動生成的文字與圖片,在不少時刻都幾乎能達到“以假亂真”的效果,。
在視頻制作領(lǐng)域,,對比文字、圖片,,視頻的信息量最大、非結(jié)構(gòu)化數(shù)據(jù)最多,AI需要對于視頻內(nèi)人物,、物品,、場景、關(guān)系等高階信息進行理解,,加之視頻制作本身對于審美,、節(jié)奏、畫面,、BGM的極高要求……
AI全自動生成過程雖然略顯漫長,,但并不是那么天方夜譚的未來。
冬奧會的AI云智剪,,面向特定的賽事場景,,限定了素材集的范圍,套用成熟的編排模式,,由AI負責素材的預處理,,并按預設模版進行編排,這是AIGC的序曲,,實現(xiàn)了視頻全智能生產(chǎn)的第一個階段,。
AIGC的第二個階段,AI除了負責素材的預處理,,還能完成本屬于視頻創(chuàng)意環(huán)節(jié)的編排工作,,從而實現(xiàn)智能批量混剪。
第三階段,,面向特定場景和特定要求的成品,,由AI根據(jù)已有成片反向解構(gòu)分鏡頭,負責素材的搜索,、篩選,、處理、編排,,并最終制作合成,。
第四階段,面向特定場景,,AI負責理解場景的要求,,包括素材的搜索、篩選(以及部分素材生成),、處理,、編排,并最終制作合成,。
AIGC視頻生成的終極階段,,由AI挖掘視頻制作的興趣點及創(chuàng)意點,,并完成相應的制作。
當然,,在此之前,,AI視頻制作依舊面臨著一個迫在眉睫的調(diào)整——算力。
一段文字,、一張圖片,、一段視頻,處理它們所需要的算力級別呈指數(shù)型爆炸上升,。
這道題,,云計算成了唯一的答案。
目前,,云計算和人工智能的結(jié)合正處于技術(shù)突破和發(fā)展的關(guān)鍵時期,,生成式AI正在發(fā)生顛覆性突破,,阿里巴巴將全力構(gòu)建自己的AI預訓練大模型,并為市場上風起云涌的模型和應用提供好算力的支撐,,阿里董事會主席兼首席執(zhí)行官張勇在今年2月的財報會上表示,。
03.“盲目崇拜”與“盲目恐懼”
就像歷史上,其他讓人懷疑自我存在意義的時刻一樣,,在工業(yè)革命之后,,電視、計算機,、手機,、互聯(lián)網(wǎng)、云計算,,這種種新興科技產(chǎn)品都曾在不同時間段引發(fā)過人們的恐慌,。
人工智能也不例外,。早在1997年,IBM的深藍計算機就已在國際象棋比賽中打敗了世界冠軍卡斯帕羅夫,。全球在深藍贏得比賽之后陷入了興奮與恐慌,,“機器將會在未來取代人類,占領(lǐng)地球”的言論層出不窮,。
可21世紀的今天,機器占領(lǐng)人類文明的事件不但沒有發(fā)生,,科技,、工業(yè)、自動化的進步反而讓邊遠山區(qū)通水通電,,讓大規(guī)模消費日用品的價格低到人人可享,,讓每一個人的生活都比我們兩個世紀以前最優(yōu)渥的祖先都要更便捷、更豐腴,、更自由,。
即便是如今引發(fā)大量恐慌的ChatGPT類AIGC技術(shù),也在不斷被運用于普惠人類,、降低服務門檻的地方,。
比如,基于人口統(tǒng)計學,、相關(guān)的病史或流行病學風險因素,,Glass.health AI能夠輔助醫(yī)生更快速、更準確地診斷病人,;
而基于AI文檔分析技術(shù),,Humata.ai能夠快速幫助用戶提取文檔中的有價值信息,降低技術(shù)文檔,、法律文檔等專業(yè)文件的閱讀難度,,讓缺乏相關(guān)訓練的普羅大眾能夠更好地保護自身利益;
基于AI文本摘要和TTS技術(shù)生成的口播文案,,AI繪畫生成的特效不斷應用在短視頻生產(chǎn)領(lǐng)域,,進一步降低了短視頻生產(chǎn)門檻,越來越多的內(nèi)容創(chuàng)作者搭上了短視頻的“快車”,。
其他關(guān)于AI寫作,、AI繪畫、AI視頻等的AI創(chuàng)作工具則更是層出不窮,。小到腳本錯別字檢查,,大到分鏡設計與畫面排版,再到藝術(shù)靈感的創(chuàng)作,,曾經(jīng)困難重重的內(nèi)容創(chuàng)作環(huán)節(jié)被不斷拆解重構(gòu),,降低入門門檻,。
而AI與AI使用者的關(guān)系,也在這一次次的工具迭代之中,,被時代所不斷解構(gòu),、重組、賦予了新的內(nèi)涵,。
04.結(jié)語
早在1956年,,以約翰·麥卡錫、馬文·明斯基,、克勞德·香農(nóng)等為代表的科學家們就在美國達特茅斯組織了一場為期兩個月的人工智能夏季研討會,,開啟了人工智能技術(shù)的探索之路。
半個多世紀后的今天,,在云計算,、深度學習、萬億級參數(shù)大模型等相關(guān)技術(shù)的發(fā)展之下,,AIGC才第一次真正走進我們的生活,,它在繪畫、作曲,、視頻等創(chuàng)作領(lǐng)域幾乎完美地替代了重復人工,,進而將成為革命性意義的新時代生產(chǎn)力工具。
回望那場發(fā)源于英國的盧德運動,,它曾轟轟烈烈地盛極一時,,卻不曾阻止英國在第一次工業(yè)革命中迅速崛起,不斷發(fā)展工業(yè)化技術(shù),,生產(chǎn)效率迎來跨時代的大爆發(fā),,終成一代霸主。
不可否認,,我們與人工智能的真正融合,,已越來越近。
請不要做這個時代的最后一只恐龍,。
當人類優(yōu)渥于一種狀態(tài),,總有想象力來沖破平衡。Cloud Imagine《云想之力》是阿里云聯(lián)合36氪共同打造的系列報道,,旨在探索云計算大背景下爆發(fā)的應用場景和新興技術(shù),,以想象的高維碰撞之力,窺探“云”上的無限空間,。從蒸汽機到人工智能,,一切生產(chǎn)力工具都是為了將人類從繁冗的勞動中解放出來,將時間與精力留給創(chuàng)意與想象的破界,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1007197.html
溫馨提示:投資有風險,,入市須謹慎。本資訊不作為投資理財建議,。