來源:私募排排網(wǎng)
2023年以來,,人工智能行業(yè)發(fā)生了質的改變,,AI成為了人類第4次產業(yè)革命,,已經成為共識,。AI正在改變著我們的生產生活,,由于AI依然處于發(fā)展初期,,巨大的發(fā)展空間,,給產業(yè)鏈上下游公司都帶來了較大的“躍升”機會,。如AI算力龍頭英偉達在一年多的時間里股價翻了7倍,總市值接近蘋果公司。
AI產業(yè)鏈上游為算力,、語料,,中游為AI大模型,下游為AIGC等AI應用,。在發(fā)展初期,,由于大模型需要不斷地經過大量訓練,實現(xiàn)迭代升級,,因此,,在產業(yè)早期,作為行業(yè)“賣鏟人”往往是最先受益的,,主要包括AI算力和AI語料,。
正是基于以上邏輯,AI產業(yè)鏈“賣鏟人”誕生了諸多的牛股,,如AI算力方向的高新發(fā)展,、鴻博股份、工業(yè)富聯(lián),、中際旭創(chuàng)等等,;AI語料方面的中國科傳、華策影視,、中文在線等等,。
AI語料公司多數(shù)來自文化傳媒行業(yè),相比算力,,他們在AI產業(yè)鏈中不僅僅充當“賣鏟人”,,不少還是AI應用的主體。不少公司在AI產業(yè)鏈中,,既扮演著大模型的上游供應商,,也同時是下游應用商,如影視公司既提供AI語料,,也利用AI技術進行創(chuàng)作,,可以實現(xiàn)降本增效。
AI語料的質量直接影響到AI模型的性能,!
AI語料就是人工智能系統(tǒng)所需的各種類型的數(shù)據(jù)資料,這些數(shù)據(jù)資料可以是文字,、圖片,、語音、視頻等多種形式,。它們?yōu)锳I模型提供了學習和推理的基礎,,使模型能夠模擬人類的思考和行為。
AI語料的組成豐富多樣,,其中最常見的是文本數(shù)據(jù),。這些文本數(shù)據(jù)可以來源于書籍、文章,、論壇帖子,、社交媒體內容等,它們?yōu)锳I模型提供了豐富的語言信息和知識,。此外,,圖片、語音,、視頻等多媒體數(shù)據(jù)也是AI語料的重要組成部分,。這些多媒體數(shù)據(jù)為AI模型提供了更加直觀、生動的學習材料,,有助于模型更好地理解和處理復雜的信息,。
AI語料在AI應用中發(fā)揮著至關重要的作用。以自然語言處理為例,,AI模型需要學習大量的文本數(shù)據(jù),,才能理解人類語言的含義和規(guī)則,從而實現(xiàn)自動翻譯,、文本摘要,、對話生成等功能。在語音識別和語音助手領域,,AI模型需要分析大量的語音數(shù)據(jù),,以識別不同的聲音和語調,從而實現(xiàn)準確的語音識別和自然的語音交互,。
AI語料的質量直接影響到AI模型的性能,,因此,構建高質量,、多樣化的語料庫對于AI的發(fā)展至關重要,。
國產大模型加速迭代升級,AI語料公司有望受益,!
近期,,國內AI大模型相繼取得突破。3月18日,,月之暗面宣布Kimi智能助手啟動200萬字無損上下文內測,,Kimi智能助手憑借突出的長文本無損處理能力,獲得了良好的用戶口碑和用戶量的快速增長,。七麥數(shù)據(jù)顯示Kimi智能助手在iPhone效率類免費榜排名從1月14日的第436名提升至3月24日的第1名,。
3月22日,阿里通義千問宣布向所有人免費開放1000萬字的長文檔處理功能,,科研,、法律、教育等領域的專業(yè)人士,,都可通過通義千問網(wǎng)站和APP快速研讀科研論文,、解讀法律條文、分析考試成績等,。
3月22日據(jù)《科創(chuàng)板日報》報道,,百度文心一言下個月將進行版本升級,屆時將開放長文本能力,,文字范圍在200萬-500萬,。
3月23日,國內初創(chuàng)大模型公司階躍星辰正式發(fā)布Step系列通用大模型(包括Step-2萬億參數(shù)MoE語言大模型的預覽版),。
3月23日,,360智腦官方發(fā)布消息稱,360智腦正內測500萬字長文本處理功能,,該功能也即將入駐360AI瀏覽器,。
隨著Kimi等國產上下文長文本大模型快速破圈,大語言模型的涌現(xiàn)能力更是讓AIGC應用體驗得到大幅提升,,有望加速催動國內大模型廠商進行產品迭代發(fā)布,。大模型的進化依賴于大量多樣化的訓練數(shù)據(jù)持續(xù)投喂,將拉動對AI語料的需求,。
此外,,3月20日,法國競爭管理局裁定對谷歌罰款2.5億歐元,,主因谷歌未經通知使用了法國媒體出版商和新聞機構的內容訓練聊天機器人,,違反歐盟知識產權規(guī)則,。隨著大模型發(fā)展優(yōu)化,語料的價值有望放大,。
筆者根據(jù)行業(yè)研究報告,、上市公司資訊與公告等內容梳理發(fā)現(xiàn),A股中有多家公司屬于AI語料概念股,。其中,,截至2月27日收盤,華策影視,、掌閱科技,、中廣天擇等多家公司股價在今年來已經大漲30%以上。
如在AI預料方面,,華策影視是國內影視制作龍頭企業(yè),,影視劇版權數(shù)量超5萬小時,構建了中國最大的影視素材運營平臺,。
風險揭示:本文所涉及的內容不保證數(shù)據(jù)完整性與準確性,,分析結論僅供參考,,所涉及品種均不構成實際投資操作建議。股市有風險,,投資需謹慎,。
版權聲明:未經許可,任何個人或機構不得進行任何形式的修改或將其用于商業(yè)用途,。轉載,、引用、翻譯,、二次創(chuàng)作(包括但不限于以影音等其他形式展現(xiàn)作品內容)或以任何商業(yè)目的進行使用的,,必須取得我司許可并注明作品來源為私募排排網(wǎng),同時載明內容域名出處,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1118134.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。