文|趙煒嘉
編輯|鄧詠儀
大佬言論
李彥宏:開源模型將會(huì)越來越落后
4月16日,,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在Create 2024百度AI開發(fā)者大會(huì)上表示,,未來,,自然語言將成為新的通用編程語言,每個(gè)人都可以成為一名開發(fā)者,,用自己的創(chuàng)造力改變世界,。李彥宏還指出,“大家以前用開源覺得開源便宜,,其實(shí)在大模型場景下,,開源是最貴的。所以,,開源模型會(huì)越來越落后,。”
扎克伯格:80億的Llama 3還不夠小,大模型需要提升訓(xùn)練質(zhì)量
4月18日,,Llama 3正式發(fā)布后,,扎克伯格在知名主持人Dwarkesh Patel的播客中,談及Meta AI的技術(shù)路線,、未來規(guī)劃和開源哲學(xué),。扎克伯格表示:Llama 3最小版本的80億參數(shù)模型“還不夠小”,無法滿足大量使用場景,。他更傾向于將模型蒸餾到5億,、10億級別,看看能用來做什么,。
李飛飛報(bào)告:中國大模型世界第二,,但專利數(shù)、機(jī)器人全球第一
4月15日,,由華裔女科學(xué)家,、“人工智能教母”李飛飛聯(lián)合領(lǐng)導(dǎo)的HAI研究所(Stanford HAI)近日發(fā)布了《2024 年人工智能指數(shù)報(bào)告》,。報(bào)告中指出,2023 年,,61 個(gè)著名的人工智能模型源自美國的機(jī)構(gòu),超過歐盟的 21 個(gè)和中國的 15 個(gè),。 然而,,中國依然是美國最大的競爭對手,中國的機(jī)器人安裝量居世界首位,;同樣,,世界上大多數(shù)人工智能專利(61%)都來自中國。
△圖源:HAI
另外,,4月18日,,李飛飛在拜登的國情咨文演講中呼吁,希望拜登政府出資建設(shè)一個(gè)國家計(jì)算能力和數(shù)據(jù)集倉庫,。她指出,,當(dāng)前AI學(xué)術(shù)界明星人才正大量流失,大公司正在以高薪挖掘?qū)W術(shù)界人才資源,。而研究大模型的高昂成本正在將研究人員排除在該領(lǐng)域之外,,從而損害了學(xué)術(shù)界的獨(dú)立研究。
大事件
Meta 開源新一代模型 Llama 3
當(dāng)?shù)貢r(shí)間4月18日,,Meta 公司宣布最新開源推出新一代大型語言模型Llama 3,,包含 8B 和 70B 兩種參數(shù)規(guī)模。Llama 3在由24000塊GPU組成的定制集群上,,使用15萬億個(gè)token訓(xùn)練的,,上下文長度實(shí)現(xiàn)8K,推理編碼大幅提升,,代碼和權(quán)重全開源,。Llama 3現(xiàn)可在網(wǎng)頁版Meta AI免登錄使用。
Stable Diffusion 3 API發(fā)布
4月17日,,Stability AI正式發(fā)布Stable Diffusion 3 API,,新的SD3在文字位置、提示詞的遵循程度上大幅提升,,超過DALL-E 3和Midjourney v6等行業(yè)領(lǐng)先模型,。目前SD3技術(shù)還未完全開源,但Stability AI承諾,,對于普通用戶,,SD3模型不會(huì)收費(fèi)。
Reka Core登場,,比肩GPT-4,、Claude 3
4月16日,由前DeepMind,、Google Brain和FAIR成員組成的AI初創(chuàng)公司Reka推出與GPT-4匹敵的多模態(tài)大模型Reka Core,,具備理解圖像、音頻和視頻的能力,,支持32種語言,,性能可與GPT-4和Claude 3 Opus匹敵。不過,,Reka沒有計(jì)劃開源此模型,。
AI界前線
OpenAI在東京開設(shè)亞洲首個(gè)辦事處
4月15日,OpenAI宣布在日本東京設(shè)立亞洲首個(gè)辦事處,承諾與政府,、當(dāng)?shù)仄髽I(yè)及研究機(jī)構(gòu)合作,,開發(fā)安全的AI工具滿足本地需求。同時(shí),,OpenAI還宣布推出一款專為日本語言優(yōu)化的GPT-4定制模型,,其在翻譯和總結(jié)日語文本方面表現(xiàn)出色,性能和速度都有顯著提升,,成本效率更高,,速度提升至原來的三倍。
波士頓動(dòng)力推出電動(dòng)版Atlas機(jī)器人
當(dāng)?shù)貢r(shí)間4月17日,,在宣布原液壓版Atlas人形機(jī)器人退役的一天后,,波士頓動(dòng)力推出全電動(dòng)版本的 Atlas機(jī)器人。電動(dòng)Atlas動(dòng)作的自由度和靈活性遠(yuǎn)超人類,。它繼承了液壓版的三指設(shè)計(jì),,采用比其前身更加流線型的設(shè)計(jì),有著更靈活的機(jī)械骨架,,具有類似環(huán)形燈的頭部,,沒有任何電纜外露。
△圖源:波士頓動(dòng)力
英特爾推出全球最大神經(jīng)擬態(tài)系統(tǒng),,比人腦快200倍
當(dāng)?shù)貢r(shí)間4月17日,美國芯片巨頭英特爾(Intel)公司宣布,,其已經(jīng)建立了世界上最大的神經(jīng)擬態(tài)系統(tǒng)Hala Point,,擁有11.5 億個(gè)神經(jīng)元和1280億個(gè)突觸,速度最高可達(dá)人腦的200倍,。該系統(tǒng)系統(tǒng)最初部署在桑迪亞國家實(shí)驗(yàn)室,,采用英特爾Loihi 2處理器,旨在支持未來類腦AI的研究,。
文心一言4.0工具版上新,,還發(fā)了三大AI開發(fā)工具
4 月 16 日,在2024百度Create AI開發(fā)者大會(huì)上,,百度正式宣布基礎(chǔ)模型全面更新,,并推出文心一言4.0工具版,包括智能體開發(fā)工具 AgentBuilder,、AI 原生應(yīng)用開發(fā)工具 AppBuilder和模型定制工具M(jìn)odelBuilder,,以對應(yīng)不同的開發(fā)場景。
賈佳亞團(tuán)隊(duì)Mini-Gemini全開源
香港中文大學(xué)終身教授賈佳亞團(tuán)隊(duì)提出多模態(tài)模型Mini-Gemini,,提供從2B到34B的模型大小范圍,融合ChatGPT+DALL·E 3,具備更高清圖像的精確理解,、更高質(zhì)量的訓(xùn)練數(shù)據(jù),、更強(qiáng)的圖像解析推理能力,還能結(jié)合圖像推理和生成,。目前,,Mini-Gemini從代碼、模型到數(shù)據(jù)已全部開源,,線上Demo也已發(fā)布,。
聯(lián)想官宣5款A(yù)I PC
4月18日,聯(lián)想TechWorld 2024在上海開幕,。聯(lián)想發(fā)布了內(nèi)嵌個(gè)性化AI智能體“聯(lián)想小天”的AI PC系列產(chǎn)品,。用戶可基于自然語言與“小天”交互,“小天”在交互中也能不斷完善,。官方演示中,,“小天”具備可實(shí)現(xiàn)通過自然語言找到照片、AI跨端生圖等本地化AI能力,。
融資動(dòng)態(tài)
芯片初創(chuàng)公司 Rivos 融資 2.5 億美元
4月17日消息,,RISC-V芯片初創(chuàng)公司Rivos宣布在 A-3 輪融資中籌集了超過 2.5 億美元,該筆資金將專項(xiàng)用于研發(fā)其首款針對生成式AI()和數(shù)據(jù)分析工作負(fù)載的加速器產(chǎn)品,。Matrix Capital為本輪最大投資者管理層,,英特爾資本、聯(lián)發(fā)科(MTK),、Cambium Capital,、CIDC、Capital TEN以及Hotung Venture Group等投資機(jī)構(gòu)也積極參與了此次融資,。
微軟將向阿聯(lián)酋AI公司G42投資15億美元
4月16日,,微軟表示將向總部位于阿聯(lián)酋的人工智能公司G42投資15億美元,讓這家美國科技巨頭獲得G42的少數(shù)股權(quán)和董事會(huì)席位,。G42將在微軟的云計(jì)算平臺(tái)Azure上運(yùn)行,,為全球公共部門客戶和大型企業(yè)提供先進(jìn)的人工智能解決方案。
新玩意
Rewind宣布更名Limitless,,推出可穿戴AI掛墜
4月17日,,Rewind更名為Limitless,推出用于會(huì)議場景的可穿戴 AI 掛墜,,具備提供實(shí)時(shí)筆記,、會(huì)議轉(zhuǎn)錄和會(huì)議摘要等功能,預(yù)計(jì)將在8月發(fā)售,,售價(jià)99美元,。Limitless為用戶配備“同意模式”,,以確保隱私保護(hù)和加密云服務(wù)確保數(shù)據(jù)私密性,用戶可控制數(shù)據(jù)解密,。
△圖源:Limitless
前沿研究
Meta實(shí)現(xiàn)無限上下文長度的新算法
Meta聯(lián)合南加州大學(xué)、CMU,、UCSD的研究人員近期發(fā)布了論文,,提出一種名為Megalodon的算法。這是一種新型神經(jīng)網(wǎng)絡(luò)架構(gòu),,能夠高效處理具有無限上下文長度的文本,。Megalodon引入了多項(xiàng)創(chuàng)新組件,顯著提高了模型的能力,、穩(wěn)定性,,以及訓(xùn)練的性價(jià)比,并在多個(gè)基準(zhǔn)測試中表現(xiàn)出優(yōu)于Llama2的性能,。
微軟推出單圖生數(shù)字人技術(shù)VASA-1
4月18日,,微軟發(fā)布VASA-1技術(shù),能通過單張圖片和音頻生成逼真的數(shù)字人視頻,。VASA-1利用面部動(dòng)態(tài)統(tǒng)一編碼和Diffusion Transformer技術(shù),,實(shí)現(xiàn)精準(zhǔn)的唇語同步和自然的表情動(dòng)作,并支持實(shí)時(shí)生成,。
△圖源:微軟
歡迎交流
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1098601.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。