摘要:OpenAI 宣布,,ChatGPT 的語音功能現(xiàn)已面向所有免費用戶開放。意味著無需支付任何費用,,就能與 ChatGPT 進行自然的對話,,體驗猶如與真人交流一般的奇妙互動;Meta 最新發(fā)布了一系列 AI 翻譯大模型,,實現(xiàn)實時語音轉換延遲不超過 2 秒,,支持多種語言翻譯,并具備模仿語氣,、語速,、情感等特征的能力,。
圖片來源:由無界 AI生成
熱門新聞:
Adobe 首席戰(zhàn)略官:人工智能將推動更多招聘,而非減少
12 月 22 日報道,,Adobe 首席戰(zhàn)略官 Scott Belsky 表示,,人工智能將使每個人更具創(chuàng)造力,激發(fā)公司擴張和增加招聘的需求,。
Belsky 認為,,人工智能提高了設計師的效率,但并未導致對創(chuàng)意人才的需求減少,,相反,,公司希望雇傭更多人以實現(xiàn)更多創(chuàng)新。他預測,,隨著公司變得更加高效,,尤其是借助新的人工智能能力,它們將擴大業(yè)務范圍,,為小公司提供更多競爭機會,。
恒信東方:AI 互動劇情游戲《山海之道》預計 12 月底上線正式版本
12 月 21 日報道,恒信東方在互動平臺表示,,公司 AI 互動劇情游戲《山海之道》的 AI 對話系統(tǒng)是公司自研的,,目前應用的是百度文心大模型 4.0。后續(xù)會更新上線正式版本,,將增加視頻特效,,并根據(jù)用戶反饋持續(xù)優(yōu)化,目前該版本在測試中,,預計于 12 月底上線,。
智源研究院發(fā)布 370 億參數(shù)多模態(tài)大模型 Emu2
12 月 21 日,,北京智源研究院宣布發(fā)布具有 370 億參數(shù)的多模態(tài)大模型 Emu2。
據(jù)介紹,,Emu2 在少樣本多模態(tài)理解任務上大幅超越 Flamingo-80B,、IDEFICS-80B 等主流多模態(tài)預訓練大模型,在包括 VQAv2,、OKVQA,、MSVD、MM-Vet,、TouchStone 在內(nèi)的多項少樣本理解,、視覺問答、主體驅動圖像生成等任務上取得最優(yōu)性能,。
Emu2 表現(xiàn)出強大的多模態(tài)上下文學習能力,,甚至可以解決需要即時推理的任務,例如視覺提示和基于對象的生成,?;?Emu2 微調(diào)的 Emu2-Chat 可以精準理解圖文指令,實現(xiàn)更好的信息感知,、意圖理解和決策規(guī)劃,。Emu2-Gen 則可接受圖像、文本,、位置交錯的序列作為輸入,,實現(xiàn)靈活、可控,、高質量的圖像和視頻生成,。研究團隊還表示,Emu2 可以作為各種多模態(tài)任務的基礎模型和通用接口,。
埃森哲 CEO:AI 有望在 3-5 年內(nèi)成為埃森哲業(yè)務重要的一環(huán)
埃森哲首席執(zhí)行官 Julie Sweet 近日受訪時表示,,大多數(shù)企業(yè)都還沒有做好大規(guī)模部署生成式人工智能(generative AI)的準備、目前仍處于實驗階段,,因為他們?nèi)狈姶蟮男畔⒒A設施或確保 AI 可以安全使用所需的控制措施,。Sweet 指出,大多數(shù)公司沒有成熟的數(shù)據(jù)能力,,多數(shù)企業(yè)運行長還不知道 AI 可以應用在哪個地方,、存在哪些風險以及如何降低風險。盡管如此,,Sweet 仍預期 AI 有望在 3-5 年內(nèi)成為埃森哲業(yè)務重要的一環(huán),。
Meta 發(fā)布全新 AI 翻譯大模型,實時語音轉換不超 2 秒
12 月 22 日報道,,Meta 最新發(fā)布了一系列 AI 翻譯大模型,,實現(xiàn)實時語音轉換延遲不超過 2 秒,,支持多種語言翻譯,并具備模仿語氣,、語速,、情感等特征的能力。這一系列模型名為 Seamless Communication,,包括 SeamlessExpressive,、SeamlessStreaming、SeamlessM4T v2 和 Seamless,,其中前三個已經(jīng)在 GitHub 上開源,。
為確保翻譯準確性和避免濫用,Meta 采用了毒性緩解技術,,在訓練前過濾“有毒內(nèi)容”并在翻譯生成過程中自動檢測和調(diào)整生成的有毒單詞,,同時為音頻添加了水印以追蹤來源,。為了防止濫用風險,,Meta 還為音頻添加了水印,通過在音頻中嵌入不可察覺的信號,,可以準確追蹤音頻的來源,,并對抗各種攻擊手段。
ChatGPT 語音功能現(xiàn)已面向所有免費用戶開放
12 月 21 日報道,,OpenAI 宣布,,ChatGPT 的語音功能現(xiàn)已面向所有免費用戶開放。意味著無需支付任何費用,,就能與 ChatGPT 進行自然的對話,,體驗猶如與真人交流一般的奇妙互動。
報告:Gemini-Pro 在多模態(tài)領域的表現(xiàn)和 GPT-4V 不相上下
12 月 22 日報道,,近期的 Gemini-Pro 評測報告顯示其在多模態(tài)領域取得了顯著的進展,,與 GPT-4V 不相上下,甚至在某些方面表現(xiàn)更為出色,。首先,,在多模態(tài)專有基準 MME 上的綜合表現(xiàn)中,Gemini-Pro 以 1933.4 的高分超越了 GPT-4V,,展現(xiàn)出在感知和認知方面的全面優(yōu)勢,。
投融資:
法律 AI 初創(chuàng)公司 Harvey 獲 8000 萬美元 B 輪融資,估值達 7.15 億美元
12 月 22 日報道,,法律人工智能初創(chuàng)公司 Harvey 宣布獲得 8000 萬美元 B 輪融資,,估值達 7.15 億美元,由凱鵬華盈,、紅杉資本,、OpenAI 初創(chuàng)基金等投資,。
據(jù)了解,Harvey 基于 OpenAI 的 GPT-4 系列模型,,結合專有法律數(shù)據(jù)進行預訓練和微調(diào),,為律師提供了深度定制的 ChatGPT 助手。此外,,Harvey 的產(chǎn)品廣泛應用于法律服務機構,、律師事務所和咨詢公司。
Harvey 成立于 2022 年 1 月,,總部位于美國舊金山,,OpenAI 初創(chuàng)基金曾在種子輪和 A 輪融資中連續(xù)參投 2600 萬美元。產(chǎn)品方面,,Harvey 的專業(yè)法律 ChatGPT 助手涵蓋了多個方面,,包括起草法律文件、輔助法律研究,、法律合同審核以及解釋法律術語等,。
好文薦讀:
《Midjourney V6神圖炸出!生圖效果碾壓DALL·E3,,逼真畫面光影細節(jié)登峰造極》
兵貴神速,,Midjourney V6昨天上午說要來,下午就真來了,。神圖紛紛炸出,,光影效果登峰造極,主打一個「你能說我就能畫」,,擅長寫Prompt的朋友,,你們有福了!
https://www.aixinzhijie.com/article/6841782
《AI 時代,,你的公司怎樣才能活,?》
未來已來,甚至將更為流行開來,。在歷經(jīng)多年的實驗室研究以及科幻電影的銀幕呈現(xiàn)之后,,人工智能終于從夢想照進現(xiàn)實,準備閃亮登場了,。
如果繼續(xù)抱定它并不能改變一切的想法,,那只能說,你太缺乏想象力了,。不過,,人工智能究竟會如何影響我們的工作、生活乃至世界,?我們又該如何利用它來取得積極成果,?
https://www.aixinzhijie.com/article/6841714?
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1084622.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。