欧美一级毛片免费视频_一级毛片在线播放_欧美一级毛片免费播放_亚洲国产精品一区二区在线观看 ,永久免费看无码国产精品视频

自2023年以Stable Diffusion為主的開源圖像生成AI以來,，AI在圖像和視頻兩個方向均有了質的突破,。從語音AI到成為創(chuàng)新前沿的AI視頻大模型,，經歷了六十年風雨的人工智能逐漸迎來了產業(yè)化的臨界點。季嘯白目前在全球頭部互聯網社交媒體公司工作,，同時也是長期的圖像生成AI方向創(chuàng)業(yè)者。從全球頂級名校碩士畢業(yè)后，季嘯白一直投身于圖像生成AI產品化的研究和創(chuàng)業(yè),，作品也多次獲獎。AI如何轉化為新質生產力,？紫牛新聞記者采訪了人機交互專家季嘯白,。揚子晚報/紫牛新聞記者王塞塞圖源：視覺中國一紫牛新聞：無論是蘋果手機的Siri,，還是小愛同學,、天貓精靈，語音助手從一出生開始就被人們視作AI技術的落地產品,，但它為何沒被多數用戶高頻使用,？季嘯白：我覺得主要有兩大原因：使用場景有限和效率不高。語音AI最早可以追溯到20世紀50年代,，很長的時間段里,，它是依賴人類維護來回答問題。近幾年語音AI實現了質的飛躍,，比如ChatGPT所提供的語音AI不僅能夠回答用戶的問題,，還能引導對話向更有價值的方向發(fā)展,。但作為信息傳遞的載體，語音的信息密度常常低于圖像,，在很多場景下,，單憑語音很難完整表達復雜的信息。此外,，語音AI個性化能力有著先天不足,，它很難從你的語氣和用詞中感知你的喜好，無法獲得你的使用數據,，也無法高效向你推薦內容,。圖形化界面的先天優(yōu)勢在于，無論是淘寶還是抖音,，你點進去看了多久,，查看哪一類商品比較多，這些數據都能作為推薦給你視頻和商品的依據,。紫牛新聞：但語音AI仍然是人工智能競逐的重要戰(zhàn)場,，比如2024北京車展,，車內AI語音交互便是很多新能源車的亮點。語音AI還有哪些發(fā)展方向,？季嘯白：如今基于大模型智駕技術的企業(yè)非常多,，但即便是業(yè)界領先的語音識別算法，在嘈雜環(huán)境,、口音差異,、速度變化等情況下，轉錄準確率很難達到100%,。但人類在機器時代已養(yǎng)成了這樣的慣性：對人類犯錯習以為常,，但不能接受機器犯錯,，這正是車內AI語音交互發(fā)展的限制。此外,，在車內場景下,，用戶對語音AI的訴求不算高頻需求,，變現方式也頗為單一,，大多打包在車機訂閱服務中。對于普通AI創(chuàng)業(yè)者來說,，成功的機會很小,。相比之下，語音AI在情感陪伴方面,，賽道更寬,。獨居老人常常缺乏人際交流，情感陪伴型語音助手可以通過自然對話,，為老人提供情感支持,；陪伴兒童時，語音助手可以與孩子進行有趣的互動游戲,；有些年輕人希望和喜歡的動漫角色談戀愛,，和自己崇拜的偶像交流，和喜歡的虛擬角色交流,，這些都是語音AI可能應用的空間,。二紫牛新聞：去年底英國《自然》雜志刊文預測的2024年十大科學進展中，人工智能的進步和ChatGPT人工智能占據前兩位,。人類如何對待可能擁有意識的人工智能,，也成了關注的話題。季嘯白：有研究者預測,，人工智能產生意識將在5-20年內實現,。但我知道的是，2023年沒有一項資助是用于“研究人工智能產生意識”的,。我認為,，AI的發(fā)展仍然在早期。在當下,，人們仿佛對AI有些不切實際的幻想,，總認為AI已經進化出了人類的思維，有感情,、有思考,，能代替人類寫論文，甚至能和人類談戀愛,。這有些一廂情愿了,。紫牛新聞：2023年1月,，美國多名藝術家集體起訴三家生成式AI商業(yè)應用公司作圖軟件以他們作品的風格生成圖像，法院審理認為AI生成后的圖片本來就不享有著作權,，并不違反著作權法,。今年，谷歌又面臨著三位漫畫家和一位攝影師提出的集體訴訟,。你如何看待這些訴訟,？季嘯白：這也印證了當下AI是沒有人類思維的。目前,，你讓AI寫生物醫(yī)藥論文,、畫一幅抽象主義繪畫，而AI本質上只是學習過去人們寫過的論文,、畫過的繪畫,，然后按照人類當下的需求重新雜糅并輸出。AI是沒有創(chuàng)造性的,，特別是圖像領域,。圖像生成AI經常出現的版權糾紛，是因為人類對AI的輸出結果不能很好地控制,。由此可見,，探索更有效的人機交互方式，空間很大,。紫牛新聞：當下,，越來越多的創(chuàng)業(yè)者涌入AI領域，在圖像生成方面,，可謂是老中青三代齊上陣,，但進去后卻發(fā)現并不輕松。你如何看待,？季嘯白：當前圖像生成AI的人機交互方式,，從渠道上來說分為用文字生成圖像、用“文字+圖像”生成圖像,、用“文字+圖像+風格傾向”生成圖像,、用“文字+圖像+標注重點部位”生成圖像；從輪次上來說也分為單次和多次,。設計合理且簡化的人機交互,，更能幫助面向普通用戶的C端產品獲得成功。如何幫圖像生成式AI做好人機交互體驗,，幫助人們合理準確表達訴求的同時,，降低上手難度和門檻，是創(chuàng)業(yè)者和普通用戶的需求,，也是我重點研究的方向,。紫牛新聞：很多創(chuàng)業(yè)者認為,，C端（個人用戶端）需求大，尋求C端擴張更容易成功,。季嘯白：美國硅谷早期的一些圖像生成AI都是面向普通消費者的,，用戶按次付費，或通過訂閱制包月使用,。大部分消費者抱著嘗鮮的目的而來,，用戶增長很快，但留存和付費轉化很低,，本質上是因為通用型圖像生成AI的天花板太低,。當下,，圖像生成AI的重點正在從 C端向著面向企業(yè)的B端轉移,。紫牛新聞：面向B端的產品，和面向C端的產品,，有什么明顯不同,？季嘯白：B端消費者不喜歡隨機，無法接受太高的自由度,。B端用戶是要生成圖片拿來干活的,，不能天馬行空的任由AI發(fā)揮。因此,，對B端產品需要深入淺出地提供更豐富的多輪生成調優(yōu)能力,，這一點在人機交互的設計上一定要考慮到。紫牛新聞：那C端產品的落地方向在哪,？季嘯白：C端產品的商業(yè)空間肯定存在,。短期內圖像生成AI在C端產品的落地方向，是低客單價的普遍需求,。千萬不能陷入追求高客單價,，AI的本質是替代人類的重復勞動和昂貴勞動力，追求高客單價是個誤區(qū),。AI無法創(chuàng)造奢侈品,，也很難觸及高頻需求，我們的日常生活中,，出門吃飯買菜,，回家刷短視頻睡覺，很少需要創(chuàng)造圖像,，因此傳統(tǒng)商業(yè)意義的高客單價和高頻都是不可取的,。C端創(chuàng)業(yè)者，一定要著眼普遍的多個需求,，比如做AI圖像集成工具,，連帶AI美妝,，AI一鍵換背景，AI一鍵改光線,，AI生成證件照,、藝術照，雖然對單個用戶而言不算高頻需求,，但對于整個社會而言,，累計使用次數會相當可觀。紫牛新聞：B端用戶中,，電商是龐大的群體,，也是普通AI創(chuàng)業(yè)者重點關注的對象。面向電商的AI創(chuàng)業(yè),，你有什么建議,？季嘯白：電商行業(yè)其實是最早開始接觸圖片生成AI技術的行業(yè)，因為行業(yè)本身信息敏感度高,，也有大量圖片處理需求,。我們工作中也經常有電商行業(yè)的從業(yè)者來聊，他們的需求太大了,，無論是圖像生成,、圖像批量后期處理，還是一鍵換衣等需求,，本質上就是用AI的低成本去換重拍圖片的成本,。但是，他們的需求非常雜,，相當定制化,，具體到每一類需求量，其實不大,，所以圖片生成AI反而服務不好這個行業(yè),。之前有個老板來找我們，希望把帽子,、圍巾,、手套等物品的平鋪圖能直接生成到模特的身上。從技術角度,，我們要對物品做定制化的開發(fā),，有一定人工成本。電商核算后,，發(fā)現找模特快速拍一下效率更高,，成本更低。這一個項目最終沒有成功，但能管中窺豹一個行業(yè),。三紫牛新聞：2月15日,， OpenAI發(fā)布了“文生視頻”大模型Sora，并附帶發(fā)布了由它生成的48段視頻,，引發(fā)了社會高度關注,。從中長期看，圖像生成AI的發(fā)展方向是什么,？季嘯白：我認為視頻生成正處于破曉時分,。視頻的商業(yè)前景比圖片大得多，這也是抖音,、TikTok等產品成功的原因,。經過互聯網20年的發(fā)展，人們對消費視頻已經習以為常,，使用習慣也從閱讀靜態(tài)媒體向消費動態(tài)內容轉變,。視頻生成大約在2025年達到可商用的成熟度。視頻生成技術一旦成熟,，OpenAI可能會建立自己的視頻平臺,，和抖音,、TikTok直接競爭視頻消費者,，同時給影視行業(yè)帶來變革。影視行業(yè)不一定喜歡從0開始生成視頻,，但會對修復拍攝的穿幫細節(jié),、虛擬布景AI生成宏大背景、生成無法拍攝的視覺效果等感興趣,。影視行業(yè)的付費意愿高,，和影視行業(yè)緊密合作，會是這個10年下半場的重要機會,。紫牛新聞：AI會取代人類的攝影和圖像創(chuàng)作嗎,？季嘯白：從長期來說，圖像生成AI一定是和人類大腦協(xié)作,，而不是取代人類的攝影和圖像創(chuàng)作,。攝影是對客觀事物的捕捉，也是拍攝者情緒和思考的表達,。我很喜歡畫畫和攝影,，AI技術雖然在不斷演進，但人類主動創(chuàng)作的主觀表達是永遠無法替代的,。

免責聲明：本文來自網絡收錄或投稿,，觀點僅代表作者本人，不代表芒果財經贊同其觀點或證實其描述，版權歸原作者所有,。轉載請注明出處：http://lequren.com/1104042.html
溫馨提示：投資有風險,，入市須謹慎。本資訊不作為投資理財建議,。

AI創(chuàng)業(yè)，追逐風口但別輕信“紅利”——專訪AI人機交互專家季嘯白

相關推薦