來源:私募排排網(wǎng)
2023年以來,,人工智能行業(yè)發(fā)生了質(zhì)的改變,AI成為了人類第4次產(chǎn)業(yè)革命,,已經(jīng)成為共識,。AI正在改變著我們的生產(chǎn)生活,由于AI依然處于發(fā)展初期,,巨大的發(fā)展空間,,給產(chǎn)業(yè)鏈上下游公司都帶來了較大的“躍升”機會。如AI算力龍頭英偉達在一年多的時間里股價翻了7倍,,總市值接近蘋果公司,。
AI產(chǎn)業(yè)鏈上游為算力、語料,,中游為AI大模型,,下游為AIGC等AI應用。在發(fā)展初期,,由于大模型需要不斷地經(jīng)過大量訓練,,實現(xiàn)迭代升級,因此,,在產(chǎn)業(yè)早期,,作為行業(yè)“賣鏟人”往往是最先受益的,主要包括AI算力和AI語料,。
正是基于以上邏輯,,AI產(chǎn)業(yè)鏈“賣鏟人”誕生了諸多的牛股,如AI算力方向的高新發(fā)展,、鴻博股份,、工業(yè)富聯(lián),、中際旭創(chuàng)等等;AI語料方面的中國科傳,、華策影視,、中文在線等等。
AI語料公司多數(shù)來自文化傳媒行業(yè),,相比算力,,他們在AI產(chǎn)業(yè)鏈中不僅僅充當“賣鏟人”,不少還是AI應用的主體,。不少公司在AI產(chǎn)業(yè)鏈中,,既扮演著大模型的上游供應商,也同時是下游應用商,,如影視公司既提供AI語料,,也利用AI技術進行創(chuàng)作,可以實現(xiàn)降本增效,。
AI語料的質(zhì)量直接影響到AI模型的性能,!
AI語料就是人工智能系統(tǒng)所需的各種類型的數(shù)據(jù)資料,,這些數(shù)據(jù)資料可以是文字、圖片,、語音,、視頻等多種形式。它們?yōu)锳I模型提供了學習和推理的基礎,,使模型能夠模擬人類的思考和行為,。
AI語料的組成豐富多樣,其中最常見的是文本數(shù)據(jù),。這些文本數(shù)據(jù)可以來源于書籍,、文章,、論壇帖子、社交媒體內(nèi)容等,,它們?yōu)锳I模型提供了豐富的語言信息和知識,。此外,圖片,、語音,、視頻等多媒體數(shù)據(jù)也是AI語料的重要組成部分。這些多媒體數(shù)據(jù)為AI模型提供了更加直觀,、生動的學習材料,,有助于模型更好地理解和處理復雜的信息。
AI語料在AI應用中發(fā)揮著至關重要的作用,。以自然語言處理為例,,AI模型需要學習大量的文本數(shù)據(jù),才能理解人類語言的含義和規(guī)則,,從而實現(xiàn)自動翻譯,、文本摘要、對話生成等功能,。在語音識別和語音助手領域,AI模型需要分析大量的語音數(shù)據(jù),,以識別不同的聲音和語調(diào),,從而實現(xiàn)準確的語音識別和自然的語音交互。
AI語料的質(zhì)量直接影響到AI模型的性能,,因此,,構(gòu)建高質(zhì)量、多樣化的語料庫對于AI的發(fā)展至關重要,。
國產(chǎn)大模型加速迭代升級,,AI語料公司有望受益!
近期,,國內(nèi)AI大模型相繼取得突破,。3月18日,月之暗面宣布Kimi智能助手啟動200萬字無損上下文內(nèi)測,,Kimi智能助手憑借突出的長文本無損處理能力,,獲得了良好的用戶口碑和用戶量的快速增長。七麥數(shù)據(jù)顯示Kimi智能助手在iPhone效率類免費榜排名從1月14日的第436名提升至3月24日的第1名,。
3月22日,,阿里通義千問宣布向所有人免費開放1000萬字的長文檔處理功能,科研,、法律,、教育等領域的專業(yè)人士,,都可通過通義千問網(wǎng)站和APP快速研讀科研論文、解讀法律條文,、分析考試成績等,。
3月22日據(jù)《科創(chuàng)板日報》報道,百度文心一言下個月將進行版本升級,,屆時將開放長文本能力,,文字范圍在200萬-500萬。
3月23日,,國內(nèi)初創(chuàng)大模型公司階躍星辰正式發(fā)布Step系列通用大模型(包括Step-2萬億參數(shù)MoE語言大模型的預覽版),。
3月23日,360智腦官方發(fā)布消息稱,,360智腦正內(nèi)測500萬字長文本處理功能,,該功能也即將入駐360AI瀏覽器。
隨著Kimi等國產(chǎn)上下文長文本大模型快速破圈,,大語言模型的涌現(xiàn)能力更是讓AIGC應用體驗得到大幅提升,,有望加速催動國內(nèi)大模型廠商進行產(chǎn)品迭代發(fā)布。大模型的進化依賴于大量多樣化的訓練數(shù)據(jù)持續(xù)投喂,,將拉動對AI語料的需求,。
此外,3月20日,,法國競爭管理局裁定對谷歌罰款2.5億歐元,,主因谷歌未經(jīng)通知使用了法國媒體出版商和新聞機構(gòu)的內(nèi)容訓練聊天機器人,違反歐盟知識產(chǎn)權(quán)規(guī)則,。隨著大模型發(fā)展優(yōu)化,,語料的價值有望放大。
筆者根據(jù)行業(yè)研究報告,、上市公司資訊與公告等內(nèi)容梳理發(fā)現(xiàn),,A股中有多家公司屬于AI語料概念股。其中,,截至2月27日收盤,,華策影視、掌閱科技,、中廣天擇等多家公司股價在今年來已經(jīng)大漲30%以上,。
如在AI預料方面,華策影視是國內(nèi)影視制作龍頭企業(yè),,影視劇版權(quán)數(shù)量超5萬小時,,構(gòu)建了中國最大的影視素材運營平臺。
風險揭示:本文所涉及的內(nèi)容不保證數(shù)據(jù)完整性與準確性,,分析結(jié)論僅供參考,所涉及品種均不構(gòu)成實際投資操作建議,。股市有風險,,投資需謹慎。
版權(quán)聲明:未經(jīng)許可,,任何個人或機構(gòu)不得進行任何形式的修改或?qū)⑵溆糜谏虡I(yè)用途,。轉(zhuǎn)載、引用,、翻譯,、二次創(chuàng)作(包括但不限于以影音等其他形式展現(xiàn)作品內(nèi)容)或以任何商業(yè)目的進行使用的,必須取得我司許可并注明作品來源為私募排排網(wǎng),,同時載明內(nèi)容域名出處,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1118134.html
溫馨提示:投資有風險,,入市須謹慎。本資訊不作為投資理財建議,。