來(lái)源:中國(guó)人工智能學(xué)會(huì)CAAI
4月14日上午,,以“創(chuàng)新驅(qū)動(dòng)[gf]2022[/gf]數(shù)智強(qiáng)國(guó)”為主題的第十三屆吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)?lì)C獎(jiǎng)典禮暨2023中國(guó)人工智能產(chǎn)業(yè)年會(huì)——大模型與通用人工智能專題論壇在蘇州工業(yè)園區(qū)希爾頓酒店圓滿落幕,。來(lái)自國(guó)內(nèi)知名高校的專家學(xué)者匯聚一堂,,觀點(diǎn)碰撞,探究具身智能,、多模態(tài)多任務(wù)學(xué)習(xí),、語(yǔ)義空間對(duì)齊等重要的AI技術(shù)的理論發(fā)展和智能人機(jī)交互、OCR、內(nèi)容生成等AI技術(shù)落地應(yīng)用等關(guān)鍵議題,,共同探討,、分享人工智能的關(guān)鍵技術(shù)、創(chuàng)新難點(diǎn)及發(fā)展趨勢(shì),。
眾抒己見擁抱人工智能大時(shí)代
中國(guó)圖象圖形學(xué)學(xué)會(huì)青工委副主任,、北京航空航天大學(xué)徐邁教授與中國(guó)電信人工智能研究院青年科學(xué)家趙健研究員共同擔(dān)任論壇主席,上海交通大學(xué)電子信息與電氣工程學(xué)院特聘教授熊紅凱,,華南理工大學(xué)二級(jí)教授金連文,,中國(guó)科學(xué)院大學(xué)特聘教授葉齊祥,CAAI教育工委會(huì)主任,、浙江大學(xué)人工智能研究所所長(zhǎng)吳飛,,阿里巴巴通義實(shí)驗(yàn)室人物AIGC負(fù)責(zé)人孫佰貴,北京航空航天大學(xué)電子信息工程學(xué)院教授李勝曦,,深信服科技股份有限公司安全GPT業(yè)務(wù)主管訾然,,西北工業(yè)大學(xué)副教授、上海人工智能實(shí)驗(yàn)室青年科學(xué)家趙斌等學(xué)術(shù)界與產(chǎn)業(yè)界的專家出席并在論壇上發(fā)表專題報(bào)告,。中國(guó)電信人工智能研究院青年科學(xué)家趙健研究員擔(dān)任論壇主持人,。
趙健研究員
中國(guó)圖象圖形學(xué)學(xué)會(huì)青工委副主任、北京航空航天大學(xué)徐邁教授為本次論壇致歡迎詞,。致辭中提到:“隨著人工智能技術(shù)的飛速發(fā)展,,大模型已經(jīng)成為推動(dòng)社會(huì)進(jìn)步,促進(jìn)產(chǎn)業(yè)升級(jí)的重要力量,,它們以強(qiáng)大的數(shù)字處理能力和深度學(xué)習(xí)能力,,正在改變著我們的生活方式、工作模式乃至思想習(xí)慣,?!?/p>
他表示:“本次論壇匯聚了眾多大模型領(lǐng)域的佼佼者,我們共同探討大模型的最新研究成果,、應(yīng)用案例和未來(lái)趨勢(shì),,我相信通過(guò)我們的交流合作,我們能夠更好的理解大模型的潛力和挑戰(zhàn),,更有效的推動(dòng)大模型技術(shù)的發(fā)展和應(yīng)用,。”當(dāng)下而言,,大模型的發(fā)展并非一帆風(fēng)順,,對(duì)計(jì)算資源的巨大需求,對(duì)數(shù)據(jù)質(zhì)量的嚴(yán)格要求,,以及可能帶來(lái)的倫理和隱私問(wèn)題,,亟待領(lǐng)域?qū)W者,、開發(fā)者、使用者共同努力,,探索和創(chuàng)新,,以確保大模型技術(shù)的健康發(fā)展和廣泛應(yīng)用。每一個(gè)人都要以更積極的態(tài)度,,擁抱全新的趨勢(shì),,面對(duì)新時(shí)代背景下技術(shù)邏輯、需求邏輯和場(chǎng)景方面的挑戰(zhàn),。
徐邁教授
共赴AI大模型熱潮聚焦時(shí)代機(jī)遇與挑戰(zhàn)
上海交通大學(xué)電子信息與電氣工程學(xué)院特聘教授熊紅凱作題為《面向通用視覺大模型的稀疏優(yōu)化和泛化設(shè)計(jì)》的主題報(bào)告,,他針對(duì)構(gòu)建大模型的基本架構(gòu)Transformer設(shè)計(jì),與參會(huì)嘉賓共同討論不同場(chǎng)景和幾何結(jié)構(gòu)數(shù)據(jù)的高效可泛化方法,。他討論了模態(tài)混合適配信息遺忘的問(wèn)題,,根據(jù)可逆歸一化流進(jìn)行信息無(wú)損的適應(yīng)性調(diào)整,構(gòu)建多任務(wù)的動(dòng)態(tài)模型拓?fù)?。拓展Transformer結(jié)構(gòu),,形成可學(xué)習(xí)的各向異性濾波,實(shí)現(xiàn)多尺度幾何頻率分析,。對(duì)于一般化的流形上信號(hào),,進(jìn)行動(dòng)態(tài)路由可學(xué)習(xí)構(gòu)圖,設(shè)計(jì)規(guī)范等變網(wǎng)絡(luò),,提升在不同局部坐標(biāo)系,、不同三維網(wǎng)格結(jié)構(gòu)及分辨率下的泛化性能。
熊紅凱教授
華南理工大學(xué)二級(jí)教授金連文作題為《視覺基礎(chǔ)模型與OCR垂直大模型的一些思考》的主題報(bào)告,。隨著大語(yǔ)言模型(LLMs)的興起,,面向自然語(yǔ)言處理領(lǐng)域的通用人工智能(AGI)取得了重大突破,近年來(lái)視覺基礎(chǔ)模型,、多模態(tài)大模型也引起了廣泛的研究關(guān)注并取得了快速發(fā)展,,但針對(duì)光學(xué)文字識(shí)別(OCR)垂直領(lǐng)域的大模型研究工作報(bào)道還不多。他在分享中簡(jiǎn)要回顧了近年來(lái)多模態(tài)大模型,、視覺基礎(chǔ)模型和OCR垂直領(lǐng)域基礎(chǔ)模型等相關(guān)代表性技術(shù)進(jìn)展,,并向大眾介紹了他所在團(tuán)隊(duì)的最新研究,也就是面向OCR的文檔圖像像素級(jí)底層處理基礎(chǔ)大模型構(gòu)建方法和技術(shù)路線,。隨后與參會(huì)嘉賓共同對(duì)大模型時(shí)代OCR等垂直領(lǐng)域的發(fā)展趨勢(shì)與未來(lái)研究方向進(jìn)行討論和展望,為大家?guī)?lái)了非常新穎的見解,。
金連文教授
中國(guó)科學(xué)院大學(xué)特聘教授葉齊祥作題為《視覺表征模型的結(jié)構(gòu)設(shè)計(jì)與物理啟發(fā)》的主題報(bào)告,,他首先分析了局部卷積運(yùn)算與全局注意力運(yùn)算的互補(bǔ)性及辯證關(guān)系,將局部特征與全局特征耦合形成Conformer網(wǎng)絡(luò)結(jié)構(gòu),,顯著增強(qiáng)視覺表征能力,,提升表征模型的性能下限,。接著探討了局部卷積運(yùn)算造成的Mask Image Modeling (MIM)自監(jiān)督學(xué)習(xí)信息泄露問(wèn)題,提出了Token Merging操作,,突破卷積或局部運(yùn)算的局部約束,,形成高效分層Transformer 表征(HiViT)與全預(yù)訓(xùn)練的Transformer 金字塔網(wǎng)絡(luò)(iTPN)。這一系列研究,,從模型結(jié)構(gòu)設(shè)計(jì)角度將視覺目標(biāo)檢測(cè),、分割等任務(wù)性能提升到了一個(gè)新高度。
葉齊祥教授
探索大模型創(chuàng)新發(fā)展打通技術(shù)與典型場(chǎng)景應(yīng)用壁壘
深信服科技股份有限公司的安全GPT業(yè)務(wù)主管訾然作題為《大語(yǔ)言模型在網(wǎng)絡(luò)安全領(lǐng)域的落地實(shí)踐和研究》的主題報(bào)告,。他在報(bào)告中首先介紹了國(guó)內(nèi)外網(wǎng)絡(luò)安全領(lǐng)域落地大語(yǔ)言模型的最新進(jìn)展和落地實(shí)踐,,包括攻擊檢測(cè)、威脅研判,、數(shù)據(jù)安全等,。并探討在RAG、超長(zhǎng)上下文,、AI agent等大語(yǔ)言模型新技術(shù)快速發(fā)展的當(dāng)下,,安全領(lǐng)域的大語(yǔ)言模型會(huì)如何發(fā)展。從更貼近實(shí)際產(chǎn)品的角度向大家介紹了安全領(lǐng)域大模型落地到底會(huì)給客戶展現(xiàn)哪些更為直觀的場(chǎng)景,。
訾然博士
阿里巴巴通義實(shí)驗(yàn)室人物AIGC負(fù)責(zé)人孫佰貴結(jié)合自身豐富的研究經(jīng)驗(yàn)分享了題為《AIGC FaceChain的應(yīng)用與創(chuàng)新》的主題報(bào)告,。他認(rèn)為在AIGC技術(shù)浪潮推動(dòng)下,圖像內(nèi)容生成已經(jīng)在C端和B端展現(xiàn)出了廣闊的應(yīng)用潛力,。結(jié)合實(shí)際應(yīng)用,,他向大家分享了facechain在人物寫真、虛擬試衣,、人物視頻等熱門應(yīng)用場(chǎng)景的攻關(guān)成果,。相關(guān)技術(shù)場(chǎng)景已在飛豬數(shù)字旅拍、通義萬(wàn)相寫真館等多個(gè)應(yīng)用中成功落地,,其開放API具有開箱即用,、自定義模板、靈活配置風(fēng)格以及免訓(xùn)練技術(shù)路徑等優(yōu)勢(shì),。目前facechain團(tuán)隊(duì)積極推進(jìn)開源社區(qū)建設(shè),,在GitHub上收獲超過(guò)8.1K Star,已榮獲6項(xiàng)國(guó)內(nèi)外開源項(xiàng)目和個(gè)人獎(jiǎng)項(xiàng),。他希望通過(guò)此次分享,, facechain能被更多人了解,也更關(guān)注這方面的發(fā)展與未來(lái)應(yīng)用。
孫佰貴研究員
北京航空航天大學(xué)電子信息工程學(xué)院教授李勝曦作題為《面向視覺語(yǔ)義重構(gòu)的表征與壓縮方法》的主題報(bào)告,,他表示:大數(shù)據(jù)、大模型時(shí)代下,智能算法的不斷進(jìn)步常伴隨其表征能力的穩(wěn)步提升,,而概率生成模型以無(wú)監(jiān)督方式對(duì)信號(hào)進(jìn)行概率表征,,以其概率釋義等優(yōu)勢(shì)在人工智能中扮演著極為關(guān)鍵的角色,。報(bào)告圍繞面向視覺語(yǔ)義重構(gòu)的生成對(duì)抗網(wǎng)絡(luò)表征與可逆化方法,分析生成對(duì)抗網(wǎng)絡(luò)的表征性能,,以特征函數(shù)為統(tǒng)計(jì)度量,,進(jìn)而介紹面向語(yǔ)義重構(gòu)的生成對(duì)抗網(wǎng)絡(luò),其理論完備性可確保語(yǔ)義表征的完備性,。
李勝曦教授
CAAI教育工委會(huì)主任,、浙江大學(xué)人工智能研究所所長(zhǎng)吳飛作題為《從文本合成到視頻合成的技術(shù)鏈路與瓶頸挑戰(zhàn)》的主題報(bào)告。他在報(bào)告中介紹了谷歌公司2016年提出能夠捕獲文本單詞之間局部/全局關(guān)聯(lián)的自注意力神經(jīng)網(wǎng)絡(luò)transformer,、谷歌公司2021年將transformer從文本領(lǐng)域拓展到圖像領(lǐng)域的Vision transformer,、Stability AI 公司2022年提出的以文生圖Stable Diffusion,、加州大學(xué)伯克利分校和紐約大學(xué)2023年提出圖像合成技術(shù)Diffusion Transformers (DiTs)等核心算法發(fā)展脈絡(luò),以及在這些核心算法的發(fā)展中,,揭示了對(duì)合成內(nèi)容中的最小單元進(jìn)行有意義的關(guān)聯(lián)組合的機(jī)理與天花板,。
在垂直領(lǐng)域的大模型或者通用大模型方面,他也提出了未來(lái)展望的研究熱點(diǎn)。包括語(yǔ)言大模型躍升為跨媒體大模型,;如何讓大語(yǔ)言模型訓(xùn)練和賦能過(guò)程,,實(shí)現(xiàn)數(shù)據(jù)和知識(shí)的雙輪驅(qū)動(dòng);如何讓大語(yǔ)言模型和環(huán)境進(jìn)行交互,,對(duì)智能體的動(dòng)作行為進(jìn)行指導(dǎo)或者是評(píng)估,;如何設(shè)計(jì)更好的大語(yǔ)言模型工具,,完成基礎(chǔ)科學(xué)研究或者工程技術(shù)領(lǐng)域挑戰(zhàn)的問(wèn)題,;以及如何通過(guò)端云協(xié)同鏈條化技術(shù)打通垂直領(lǐng)域大模型和端側(cè)輕量級(jí)推理之間的障礙,形成大小模型端云協(xié)同的研究等,。這些挑戰(zhàn),,為大模型領(lǐng)域的發(fā)展提出了更具體的科研要求。
吳飛教授
西北工業(yè)大學(xué)副教授,、上海人工智能實(shí)驗(yàn)室青年科學(xué)家趙斌為大家?guī)?lái)了題為《人工智能軟硬件一體化》的主題報(bào)告,。他提到,,生命起源以來(lái),,生物智能的進(jìn)化過(guò)程不僅體現(xiàn)在思維方式的演進(jìn),還包括體型和四肢等身體結(jié)構(gòu)的轉(zhuǎn)變。人工智能是參考生物智能所形成的系列技術(shù),其理論發(fā)展和技術(shù)落地需要軟硬件的協(xié)同,。在這一思想的驅(qū)使下,,有必要關(guān)注人工智能軟硬件一體化研究,,推動(dòng)人工智能應(yīng)用落地,。
他的分享內(nèi)容主要凝練了生物智能“思維計(jì)算-實(shí)體控制-環(huán)境感知”的三元交互模式,,重點(diǎn)介紹大模型驅(qū)動(dòng)具身智能體的相關(guān)研究,包括高層語(yǔ)義理解,、自身技能認(rèn)知與復(fù)雜任務(wù)執(zhí)行等技術(shù),,為大模型時(shí)代的人工智能軟硬件發(fā)展提供新思路,。他表示:“現(xiàn)在大模型的方案能力比較差,和真正環(huán)境交互的時(shí)候,,還有很多長(zhǎng)尾問(wèn)題沒有解決,,這也引導(dǎo)了接下來(lái)做如何的研究。希望未來(lái)人工智能能夠觸及一切,,讓世界都變得好玩起來(lái),,涌現(xiàn)更多新的概念?!?/p>
趙斌副教授
圍繞問(wèn)題與挑戰(zhàn)縱論大模型未來(lái)發(fā)展
圓桌對(duì)話環(huán)節(jié)由部分報(bào)告嘉賓及特別邀請(qǐng)的中科院計(jì)算所山世光研究員共同參與,,就“大模型對(duì)于視覺研究的影響”、“大模型會(huì)不會(huì)主導(dǎo)一切”,、“通用人工智能的實(shí)現(xiàn)方式,?專用人工智能與通用人工智能如何結(jié)合”這三個(gè)話題進(jìn)行探討。
嘉賓們各抒己見,,分別就上述話題發(fā)表了極具啟發(fā)性的深刻見解,帶領(lǐng)參會(huì)觀眾們更為清晰的認(rèn)識(shí)了大模型的發(fā)展與通用人工智能的未來(lái),。嘉賓們表示:大模型不能主導(dǎo)一切,,而未來(lái)人工智能學(xué)習(xí)肯定會(huì)回歸到人類的學(xué)習(xí)上面。大模型將來(lái)能不能在自我創(chuàng)造,、自我發(fā)明方面能夠有所突破,,這是一個(gè)長(zhǎng)期且困難的事情。
隨著大模型推廣,,如何形成批量性,、規(guī)模性的效益,是行業(yè)的共性話題,。隨著應(yīng)用價(jià)值的體現(xiàn),,大模型在金融業(yè)的推廣力度才會(huì)更大。大模型無(wú)疑會(huì)帶來(lái)一個(gè)全新的時(shí)代,,需要政,、產(chǎn)、學(xué),、研,、用深度合作、協(xié)同創(chuàng)新,。
激勵(lì)創(chuàng)新,,智能擔(dān)當(dāng)。本次論壇通過(guò)研討大模型與通用人工智能技術(shù)與應(yīng)用趨勢(shì),,為數(shù)智產(chǎn)業(yè)發(fā)展提供新的思路和建議,,同時(shí)促進(jìn)了行業(yè)的交流與合作,,推動(dòng)AI創(chuàng)新技術(shù)普及和推廣。未來(lái),,大會(huì)將持續(xù)分享人工智能領(lǐng)域的新科技,、新政策和新趨勢(shì),搭建行業(yè)溝通橋梁,,共同推動(dòng)中國(guó)人工智能行業(yè)的高質(zhì)量發(fā)展,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1097823.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。