伦理片免费观在线看,91精品麻豆人妻一区二区

文｜陳斯達

編輯｜鄧詠儀

一周縱覽

本周大模型頻頻出新。馬斯克官宣Grok-1.5大模型,，推理能力大升級,。人工智能公司Databricks宣布開源通用混合專家（MoE）大語言模型DBRX，最強開源大模型就此易主,。以色列AI初創(chuàng)公司AI21 Labs推出SSM-Transformer模型Jamba,，據(jù)稱是世界上首個基于Mamba的量產(chǎn)級模型。

更多消息依然來自O(shè)penAI,。OpenAI本周新發(fā)布了語音生成模型Voice Engine，以及藝術(shù)家的Sora最新作品實例,。圍繞GPT商店困境,，本周OpenAI宣布，將挑選少量美國開發(fā)者測試GPT商店收入分成模式,。周末又有消息稱,，微軟OpenAI將斥資千億美元打造“Stargate”先進人工智能超級計算機,。

其他科技巨頭動作不斷,。亞馬遜宣布將向Anthropic追加投資 27.5 億美元，以完成去年承諾的投資協(xié)議,。而包括高通,、谷歌和英特爾在內(nèi)的科技公司聯(lián)盟，則準備從軟件入手,，與英偉達芯片“脫鉤”,。

Key Points

OpenAI發(fā)布語音模型Voice Engine
馬斯克官宣Grok-1.5
DBRX成當(dāng)前最強大開源模型
AI21 Labs首推基于Mamba架構(gòu)的量產(chǎn)級模型
微軟和OpenAI制定千億美金AI超算計劃
OpenAI與開發(fā)者聯(lián)合測試GPT創(chuàng)收
OpenAI發(fā)布Sora首批藝術(shù)家作品實例
高通、谷歌,、英特爾等聯(lián)合開發(fā)AI軟件
Transformer作者公開承認參與保密項目Q*
百度或為國行iPhone16提供AI功能
字節(jié)跳動推出AI角色互動App“話爐”
亞馬遜追投Anthropic 27.5億美元
AI視頻生成創(chuàng)企HeyGen正進行6000萬美元融資
90后天才少年稚暉君再獲融資
Heygen發(fā)布Avatar in Motion 1.0
騰訊開源“照片說話”視頻生成框架
谷歌推出AI圖像插入新“神器”

大模型第一線

OpenAI發(fā)布語音模型Voice Engine

據(jù)界面新聞,，3月30日，OpenAI在官網(wǎng)上公開了其最新的研究成果——“Voice Engine”,。這項技術(shù)可通過簡短的15秒音頻樣本和文本輸入,，生成與原始說話者極為相似的自然語音。

公告中,，OpenAI給出了Voice Engine的一些早期應(yīng)用場景,。如通過自然、富有情感的聲音輔助兒童閱讀,、翻譯視頻和播客等內(nèi)容,、改善偏遠地區(qū)的社區(qū)服務(wù)、幫助患有突發(fā)性或退化性言語病癥的患者恢復(fù)聲音等,。

馬斯克官宣Grok-1.5

當(dāng)?shù)貢r間 3 月 28 日,，馬斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。相比一周前開源的Grok-1.0,，Grok-1.5上下文長度飆升,，從8192增長到128k，和GPT-4齊平,。二是推理性能大幅提升,，數(shù)學(xué)能力直接漲點50%之多、HumanEval數(shù)據(jù)集上得分超過GPT-4,。Grok-1.5預(yù)計將在未來幾天向早期測試者和 X 平臺的現(xiàn)有用戶開放,。

圖源：X

DBRX成當(dāng)前最強大開源模型

當(dāng)?shù)貢r間3月27日,，AI初創(chuàng)公司Databricks宣布旗下Mosaic Research團隊開發(fā)的通用大語言模型DBRX將開源,。DBRX的表現(xiàn)都優(yōu)于現(xiàn)有的一切開源模型。根據(jù)DBRX在MMLU,、HumanEval和 GSM8K公布的測試數(shù)據(jù)顯示,，DBRX不僅性能超過了LLaMA2-70B和馬斯克最近開源的Grok-1，推理效率比LLaMA2-70B快2倍,，總參數(shù)卻只有Grok-1的三分之一,，是一款功能強算力消耗低的大模型。

AI21 Labs首推基于Mamba架構(gòu)的量產(chǎn)級模型

智東西3月29日消息,，以色列AI初創(chuàng)公司AI21 Labs昨日在官網(wǎng)推出SSM-Transformer模型Jamba,，據(jù)稱是世界上第一個基于Mamba的量產(chǎn)級模型。通過利用傳統(tǒng)Transformer架構(gòu)的元素增強Mamba結(jié)構(gòu)化狀態(tài)空間模型,，Jamba彌補了純SSM模型的固有局限性,。它提供了256k上下文窗口，在吞吐量和效率方面展現(xiàn)了顯著的進步,。

大事件

微軟和OpenAI制定千億美金AI超算計劃

3月30日消息,，據(jù)The Information獨家報道，消息人士稱,，微軟和OpenAI的高管們在為一個可能花費高達1000億美元的數(shù)據(jù)中心項目制定計劃,。該項目將包含1臺擁有數(shù)百萬個專用服務(wù)器芯片的AI超級計算機Stargate，為OpenAI的AI提供動力,。項目成本是當(dāng)今一些最大的數(shù)據(jù)中心的100倍,，微軟可能會負責(zé)為該項目提供資金。高管們已經(jīng)討論了最快在2028年啟動Stargate,，并將其擴建至2030年,。

OpenAI與開發(fā)者聯(lián)合測試GPT創(chuàng)收

3月28日消息，根據(jù)X平臺,，OpenAI宣布其正與一小部分美國開發(fā)者合作,，測試基于使用量的GPT收費。OpenAI表示：“我們的目標是創(chuàng)建一個充滿活力的生態(tài)系統(tǒng),，讓開發(fā)者因其創(chuàng)造力和影響力而獲得獎勵,，我們期待與建設(shè)者合作,，找到實現(xiàn)這一目標的最佳方法,。”

圖源：X

OpenAI發(fā)布Sora首批藝術(shù)家作品實例

3月26日凌晨,，OpenAI 發(fā)布七個最新 Sora 作品實例，意在展示藝術(shù)家,、設(shè)計師,、創(chuàng)意工作者和電影人等業(yè)內(nèi)人士對于 Sora 融入自身工作與業(yè)務(wù)的看法。

高通,、谷歌,、英特爾等聯(lián)合開發(fā)AI軟件

3月26日，由高通,、谷歌,、英特爾等科技巨頭聯(lián)合參與的UXL基金會宣布，將啟動一項開源軟件開發(fā)計劃,，旨在為多種AI加速器芯片提供跨平臺支持,。該項目旨在實現(xiàn)計算機代碼在不同芯片和硬件平臺上的無縫運行。高通AI與機器學(xué)習(xí)主管Vinesh Sukumar表示,，此舉將幫助開發(fā)者從英偉達平臺順利遷移,。

Transformer作者公開承認參與保密項目Q*

據(jù)Wired雜志，Transformer作者現(xiàn)身英偉達GTC大會后,，接受Wired雜志采訪,，揭示了許多鮮為人知的研發(fā)細節(jié)。其中一位作者Lukasz Kaiser公開承認自己參與了OpenAI的一項高度保密項目——Q,，引發(fā)了廣泛關(guān)注,。當(dāng)記者試圖進一步探究Q項目時，OpenAI的公關(guān)人員迅速介入,，阻止了Kaiser的發(fā)言,。

百度或為國行iPhone16提供AI功能

3月25日，一位百度內(nèi)部人士向時代周報記者透露,，百度將為蘋果今年即將發(fā)布的iPhone16,、Mac系統(tǒng)和ios18提供AI功能。但《中國日報》后援引接近蘋果公司的知情人士稱,，到目前為止,，蘋果尚未與百度就AI合作達成協(xié)議。

字節(jié)跳動推出AI角色互動App“話爐”

據(jù)新浪科技,，3月25日下午消息,，近日，字節(jié)跳動推出AI角色互動App“話爐”,。據(jù)了解,，“話爐”由字節(jié)跳動的Flow部門打造。而Flow部門隸屬于字節(jié)跳動的產(chǎn)品研發(fā)與工程部（內(nèi)部簡稱“PDI”）,，目前下設(shè)四大業(yè)務(wù)線,，包括AI教育,、國際化、社區(qū)和豆包,，“話爐”則屬于社區(qū)業(yè)務(wù)線旗下,。

融資動態(tài)

亞馬遜追投Anthropic 27.5億美元

當(dāng)?shù)貢r間 3 月 27 日，亞馬遜宣布將向 AI 公司 Anthropic 追加投資 27.5 億美元（約 198.8 億人民幣）,，以完成去年承諾的投資協(xié)議,，并將擴大兩家公司之間的合作關(guān)系。追加投資之后,，亞馬遜對 Anthropic 的總投資額將達到 40 億美元,，這也是亞馬遜 30 年歷史上最大的一筆外部投資。通過投資,，亞馬遜將獲取 Anthropic 的少數(shù)股份,，但不會在 Anthropic 的董事會占有席位。

AI視頻生成創(chuàng)企HeyGen正進行6000萬美元融資

當(dāng)?shù)貢r間3月23日,，據(jù)The Information援引知情人士消息,，HeyGen目前正在進行一輪 6000 萬美元的融資，完成融資后總估值將達到 4.4 億美元,，是四個月前估值的六倍,，本輪融資由Benchmark領(lǐng)投，它是 Snap 和 Uber 的早期投資者之一,。HeyGen 的上一輪融資則是去年 11 月的560萬美元融資,，由知名投資人Sarah Guo創(chuàng)立的Conviction Partners領(lǐng)投。

90后天才少年稚暉君再獲融資

據(jù)投資界,，智元機器人關(guān)聯(lián)公司上海智元新創(chuàng)技術(shù)有限公司新增股東紅杉中國,、M31資本、上汽投資,。此前消息流出,，智元機器人投前估值達70億。公司背后的90后創(chuàng)始人曾是華為“天才少年”稚暉君彭志輝,，同時在B站坐擁250萬粉絲,。公開資料顯示，上海智元新創(chuàng)技術(shù)有限公司法定代表人為舒遠春,，使命為“以智能機器創(chuàng)造無限生產(chǎn)力”,，致力于以Al+機器人的融合創(chuàng)新，打造世界級領(lǐng)先的具身智能機器人產(chǎn)品及應(yīng)用生態(tài),。

新玩意

Heygen發(fā)布Avatar in Motion 1.0

Heygen近期發(fā)布了其Avatar in Motion1.0新功能,，這一技術(shù)革新在虛擬角色動作捕捉和聲音克隆方面取得了重大突破。該功能可以精確地保持口型同步,，并克隆用戶的語音語調(diào),，甚至能保留背景聲，使得虛擬角色的語音表達更為生動真實,。

功能演示,，圖源：X

產(chǎn)品入口：

https://top.aibase.com/tool/heygen

論文

騰訊開源“照片說話”視頻生成框架

智東西3月28日消息,，根據(jù)arXiv，騰訊團隊在3月26日發(fā)表的論文中開源了音頻和照片驅(qū)動的視頻生成框架AniPortrait,。該方法分為兩個階段,，最初，團隊從音頻中提取3D中間表示并將其投影到一系列2D面部標識中,。隨后,，團隊采用魯棒的擴散模型，結(jié)合運動模塊,，將標識序列轉(zhuǎn)換為逼真且時間一致的肖像動畫,。實驗結(jié)果證明了AniPortrait在面部自然度、姿勢多樣性和視覺質(zhì)量方面表現(xiàn)優(yōu)異,，從而增強了感知體驗,。

圖源：論文

論文地址：

https://arxiv.org/abs/2403.17694

GitHub地址：

https://github.com/Zejun-Yang/AniPortrait

谷歌推出AI圖像插入新“神器”

智東西3月28日消息,，根據(jù)arXiv網(wǎng)站，谷歌研究人員在3月27日上線的論文中推出了用于真實感對象移除和插入的ObjectDrop Bootstrapping Counterfactuals方法,。面對擴散模型經(jīng)常生成違反物理定律的圖像,，這種方法可以支持逼真的對象插入，遮擋,、陰影和反射等效果更真實,。