原文來源:多鯨
作者:曹培杰 黃寶忠
圖片來源:由無界 AI生成
回望2023年,,ChatGPT橫空出世,,國內(nèi)外公司紛紛推出自家大模型,,加入混戰(zhàn),,各種智能化教育產(chǎn)品也隨之落地,,AI+教育概念熱度飆升。由于教育所獨有的個性化,、互動性需求,教育行業(yè)成大模型落地最通暢的場景之一,。從通用大模型到教育專用大模型,從AI概念到實際產(chǎn)品,,如何推動市場生態(tài)走向成熟?
近日,,中國教育科學研究院數(shù)字教育研究所副所長曹培杰、之江實驗室智能教育研究中心主任黃寶忠共同發(fā)布了《重構(gòu)教育圖景:教育專用大模型研究報告》(下簡稱《報告》),?!秷蟾妗肪劢菇逃龑S么竽P停瑥募夹g(shù)基礎,、應用現(xiàn)狀、潛在挑戰(zhàn),、創(chuàng)新構(gòu)思,、落地場景等方面開展研究。
「大模型」(largemodels)是指具有數(shù)十億到數(shù)百億甚至更多可訓練參數(shù)的人工智能模型,,它是深度學習、GPU硬件,、大規(guī)模數(shù)據(jù)集等多種技術(shù)共同發(fā)展的產(chǎn)物。大模型所展現(xiàn)的強大能力實質(zhì)上是深度學習中「量變引起質(zhì)變」的結(jié)果,。當模型參數(shù)量達到一定規(guī)模時,模型準確率會經(jīng)歷質(zhì)的飛躍,,這一過程被稱之為「涌現(xiàn)能力」,,即從原始訓練數(shù)據(jù)中自動學習并發(fā)現(xiàn)新的、更高層次的特征和模式的能力,。這些能力突出表現(xiàn)為通用的用戶意圖理解能力,、強大的大范圍上下文連續(xù)對話能力、智能的交互修正能力,、內(nèi)容的潤色分類和總結(jié)能力,、新內(nèi)容的生成能力、多模態(tài)能力,。
《報告》指出,,教育專用大模型是指以通用大模型為基礎的多層次開放技術(shù)架構(gòu),以多樣的教育數(shù)字化應用為驅(qū)動,,通過統(tǒng)一交互對話界面向師生和社會學習者提供專業(yè)能力,,具備豐富多樣的教育專業(yè)知識,并在應用中持續(xù)升級,。作為重點研發(fā)領(lǐng)域之一,教育專用大模型是大模型技術(shù)、知識庫技術(shù)以及各類智能教育技術(shù)的集成應用,,將在教育過程中訓練形成教育新場景,實現(xiàn)人類學習和機器學習的雙向建構(gòu),。
教育專用大模型應用包括學習空間互動生成、學習資源按需供給,、教師角色轉(zhuǎn)型升級,、探究性學習,、對話式教學,、嵌入式評價,、服務式治理等關(guān)鍵要素。
當前,,教育專用大模型主要采取兩種技術(shù)路線:一是直接調(diào)用通用大模型,通過微調(diào)或提示學習的方式使之具備一定專業(yè)能力,;二是利用教育領(lǐng)域?qū)I(yè)數(shù)據(jù),,專門訓練用于解決教育任務的大模型。
綜合當前業(yè)內(nèi)情況看來,,這兩種技術(shù)路線都取得了一定進展,,但實現(xiàn)效果仍有待提升,。由于缺乏足夠的專業(yè)數(shù)據(jù)訓練,教育深度知識不夠,,智能性不強,難以靈活處理復雜多變的教育任務,。
《報告》指出,,研發(fā)教育專用大模型,,破解之道在于兩條技術(shù)路線整合起來。
這并非簡單相加,,而是通過建立一種全新的開放技術(shù)架構(gòu),,系統(tǒng)整合通用問題解決能力和教育專用問題解決能力,實現(xiàn)技術(shù)突破,。具體來說,要結(jié)合通用大模型與教育領(lǐng)域?qū)I(yè)數(shù)據(jù),打破數(shù)據(jù)孤島,,通過開放數(shù)據(jù)接口源源不斷地獲得來自常態(tài)化教育應用中的數(shù)據(jù),;要以專家知識庫作為大模型的補充,,將學科知識和教育教學中的各種規(guī)則有意識地「教」給大模型,;要整合應用各類智能教育技術(shù),,將已經(jīng)發(fā)展起來的各類智能教育技術(shù)集成于教育專用大模型之中,。
大模型在口語練習,、數(shù)學學習、情感分析和個性化推薦等方面為教育帶來巨大潛力和可能性,?!秷蟾妗肥崂砹宋宸N典型的教育專業(yè)大模型應用案例,對其發(fā)展背景、應用場景,、設計特色等進行了深度分析。
教育專用大模型典型應用案例
從應用場景看,,星火語伴主要用于語言學習,,支持多語言文本,、語音和圖片的實時翻譯,并能糾正語法錯誤,,提供口語陪練等,。EmoGPT用于提供心理健康服務,,能識別和響應用戶情緒,,提供持續(xù)的心理支持,。MathGPT面向全球數(shù)學愛好者和科研機構(gòu),提供解題和講題算法,,支持用戶進行數(shù)學解題和練習,。智海-三樂用于AI專業(yè)教育,,提供搜索引擎,、計算引擎和本地知識庫等功能,支持智能問答和試題生成,。Khanmigo通過對話式AI聊天機器人為學習者提供個性化學習方案,,同時也支持生涯規(guī)劃服務、教學方法輔導優(yōu)化等,。
從技術(shù)進展看,,教育專用大模型在模型性能、應用場景,、技術(shù)特點方面展現(xiàn)出優(yōu)勢,,涵蓋了大部分學科內(nèi)容,主要聚焦于自主學習場景,,包括知識問答,、語言學習,、學習引導和教學輔助等,。在技術(shù)路線上,「通用+微調(diào)」的路徑已證明其有效性,,許多技術(shù)方案以通用大模型為基礎,,通過指令微調(diào)等方式實現(xiàn)針對特定學科知識的有效回答。
從現(xiàn)有不足看,,現(xiàn)有教育專用大模型在準確性,、教學內(nèi)容多樣性、支持核心教育場景,、包容學習者多樣性方面還有所局限,,存在錯誤率較高、缺乏共情理解能力等問題,,主要側(cè)重于學科知識教學和應試教育情境,,在跨學科學習、學生綜合能力與高階思維培養(yǎng)等方面仍有不足,;主要聚焦于支持自主學習,,在真實課堂、同伴協(xié)作,、混合教學等場景下如何充分發(fā)揮大模型的作用尚未得到有效探索,。
總之,,大模型在教育領(lǐng)域的應用取得了明顯進展,但仍面臨著現(xiàn)實問題,,需要進一步提升訓練數(shù)據(jù)的質(zhì)量和規(guī)模,,尤其是將先進教育理念、教育深度知識和教育核心場景的真實需求深度嵌入技術(shù)設計,,結(jié)合用戶反饋進行多輪迭代,,形成更智慧、更靈活的教育專用大模型,。
《報告》指出,,教育自動化和智能化的實現(xiàn)相較于其他領(lǐng)域往往面臨著更高的要求,。因為教育任務大部分是「非程式化」的,可自動化程度相對較低,。隨著大模型在模仿,、生成、創(chuàng)作等能力上的不斷突破,,大模型有望在教育過程中得到深入應用,。作為一項新興的人工智能技術(shù),有必要對教育專用大模型可能面臨的挑戰(zhàn)進行系統(tǒng)性評估,。
一方面,,智能機器與人類教師之間存在模糊分野。教育任務往往需要人類智慧,,這使得具備生成,、創(chuàng)造能力的大模型技術(shù)在承擔復雜認知任務(如藝術(shù)創(chuàng)作、決策制定)時,,逐漸模糊了機器與教師之間的界限,,從而容易導致師生對大模型的過度依賴,造成知識體系的斷裂和碎片化,、偏見等問題,。具體來說,大模型的強大生成能力簡化了師生獲取信息的流程,,但也放大了其對知識探究的惰性,。大模型往往會為復雜問題提供簡潔、直接的答案,,但這些答案缺乏連貫性和完整性,,可能導致學生所獲取的知識處于不斷被切割的狀態(tài)。
同時,,數(shù)據(jù)集本身或算法等原因?qū)е履P蛯δ承┨囟ㄈ后w或主題存在偏好或歧視,,可能會導致模型輸出的答案或結(jié)論存在偏差,。
另一方面,通用與專用大模型在人類價值上可能存在沖突,。通用大模型在教育領(lǐng)域的應用受限主要源于其缺乏教育領(lǐng)域特定的深度知識和個性化定制能力,。這種模型通常是通過廣泛而通用的文本數(shù)據(jù)訓練而成,未必能準確理解教育領(lǐng)域特定術(shù)語,、學科需求及學習模式,,由此引發(fā)通用與專用大模型之間的過程與結(jié)果的沖突、生成與探究的沖突,、自動與協(xié)作的沖突,、透明和可靠的沖突。因此,,需要定制基于領(lǐng)域知識深度理解的教育專用大模型來提供更有效,、精準和深度的智能化支持。
《報告》秉持「應用驅(qū)動,、共建共享」的理念,,提出了開放創(chuàng)新的教育專用大模型架構(gòu),通過集成通用大模型,、教育場景模型(小模型)和知識庫三條技術(shù)路線,,讓教育專用大模型賦能各級各類教育數(shù)字化應用,讓智能算力像「水電」一樣,,接入每一所學校,、每一個課堂、每一臺終端,,讓生成式人工智能成為廣大師生的親密助手,。
教育專用大模型的開放創(chuàng)新架構(gòu)分為三層,,分別是基礎能力層(L0),、專業(yè)能力層(L1)、應用服務層(L2),?;A能力層(L0)基于通用大模型的基礎能力,根據(jù)多元教育數(shù)據(jù)類型和多元任務需求,,調(diào)用不同類型的大模型,。專業(yè)能力層(L1)包括教育場景模型庫和專家知識庫。應用服務層(L2)將各類教育數(shù)字化應用接入大模型,,在大模型為應用賦能的同時,,將應用數(shù)據(jù)源源不斷傳入大模型,持續(xù)提高大模型的教育專業(yè)能力,。
教育專用大模型開放創(chuàng)新架構(gòu)
教育專用大模型并非單一、封閉的模型,,而是一個開發(fā)者和用戶共同參與持續(xù)完善的過程,。廣大師生和各類教育數(shù)字化產(chǎn)品的研發(fā)者既是模型的使用者,也是模型的貢獻者,、建設者,,由此形成共建共享的教育專用大模型創(chuàng)新生態(tài)。教育專用大模型的技術(shù)路線包括大規(guī)模多元教育數(shù)據(jù)采集,、數(shù)據(jù)預處理,、特征工程、模型設計,、模型預訓練,、微調(diào)與遷移學習、模型評估與調(diào)優(yōu)七個關(guān)鍵步驟,。
教育專用大模型的技術(shù)路線
教育專用大模型將把「以學習者為中心」理念變成普遍現(xiàn)實,。其中,,在學前教育階段,主要表現(xiàn)為尊重兒童,、放手兒童,,強調(diào)培養(yǎng)兒童的自主性、創(chuàng)造性,;在基礎教育階段,,主要表現(xiàn)為從講授灌輸式教學走向深度理解和研究性學習,強調(diào)建立學習者的主體性,;在高等教育和職業(yè)教育階段,,主要表現(xiàn)為以學生發(fā)展為中心,強調(diào)科教融合,、產(chǎn)教融合,;在終身教育階段,主要表現(xiàn)為以學習需求為導向,,重點解決優(yōu)質(zhì)教育資源供給與需求匹配的問題,。
未來,人工智能大模型將深度融入各領(lǐng)域各環(huán)節(jié),,賦能千行百業(yè)智能升級,,助力社會生產(chǎn)力躍升。從通用大模型到教育專用大模型,,是人工智能大模型技術(shù)深化發(fā)展的重要趨勢,。這不只是在通用大模型基礎上進行微調(diào)和優(yōu)化,,而是一種基于教育場景、開放模型架構(gòu)的重大創(chuàng)新,。同時,,也是推動教育數(shù)字化改革、推進教育公平惠普化的重要推力,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1083905.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。