楊洪旭在制訂人工智能訓(xùn)練計(jì)劃,。
楊洪旭(右)和同事在討論人工智能訓(xùn)練進(jìn)展,。以上圖片均為人民日?qǐng)?bào)記者黃曉慧攝
打開電腦,開啟智能訓(xùn)練軟件,,人工智能訓(xùn)練師楊洪旭開始一天的工作,。他最近的任務(wù)是訓(xùn)練一個(gè)能自主識(shí)別銀行電匯申請(qǐng)書的人工智能(AI)模型。楊洪旭供職的達(dá)觀數(shù)據(jù)有限公司,,位于上海浦東軟件園,,是一家智能文本處理技術(shù)企業(yè)。這里研發(fā)的AI模型,,能讀懂合同工單,、財(cái)務(wù)報(bào)表、行業(yè)報(bào)告等各類文本文件,,在銀行流水識(shí)別,、合同審核與比對(duì)等多場景落地應(yīng)用?!霸谟?xùn)練AI模型前,,訓(xùn)練師首先要閱讀大量相關(guān)的文件文本,,從中提煉和標(biāo)注出關(guān)鍵信息?!睏詈樾癜炎x文本,、做標(biāo)注的過程比作老師備課,是訓(xùn)練的基礎(chǔ),,“我們劃重點(diǎn),、做標(biāo)注,然后將‘有用’信息‘投喂’給AI模型,,告訴它們應(yīng)該提取哪些信息,、按照什么格式提取?!比斯ぶ悄苡?xùn)練師一年需要閱讀上萬份文檔,,訓(xùn)練幾十個(gè)AI模型。楊洪旭在智能訓(xùn)練軟件中打開某銀行一張電匯申請(qǐng)書的掃描圖像,,將“業(yè)務(wù)種類”“匯款人名稱”“賬號(hào)”“開戶銀行”“聯(lián)系地址”等字段信息一一拉框選中,,再在旁邊打上相應(yīng)標(biāo)簽,隨后點(diǎn)擊生成訓(xùn)練模型,。模型生成后,,他需要給AI模型出一些練習(xí)題,輸入字段信息,,比對(duì)AI模型生成的結(jié)果,,以此檢驗(yàn)學(xué)習(xí)效果。當(dāng)發(fā)現(xiàn)生成結(jié)果與原文本有出入時(shí),,楊洪旭會(huì)記錄并整理成問題列表,。“比如文章中有一處圖像,,它沒有讀取出來,。有一個(gè)圖像應(yīng)該是正向的,它讀取成了側(cè)向的,?!边@些問題會(huì)統(tǒng)一反饋給AI模型的研發(fā)人員,為后續(xù)改進(jìn)作參考,?!癆I模型經(jīng)過訓(xùn)練后,再遇到類似的文本文件,,它就能自主抓取,、審讀這些關(guān)鍵信息,更高效地執(zhí)行人類指令?!痹趧e人眼中單調(diào),、重復(fù)、略顯枯燥的文檔閱讀,、數(shù)據(jù)標(biāo)注,、效果測試等工作,楊洪旭卻得心應(yīng)手,。他最開心的事就是看到自己訓(xùn)練的模型越來越“聰明”,。1993年出生的楊洪旭,患有先天聽力障礙,,要戴助聽器才能聽到外界的聲音,。2014年,他從上海一所職業(yè)技術(shù)學(xué)院的環(huán)境設(shè)計(jì)專業(yè)畢業(yè),,先后做過家裝設(shè)計(jì)、會(huì)計(jì)文員和倉庫管理員等工作,?!昂涂蛻艚涣鲿r(shí),因?yàn)榭邶X表達(dá)不夠清晰流利,,經(jīng)常會(huì)有挫敗感,。”在楊洪旭陷入迷茫之際,,上海市浦東新區(qū)殘聯(lián)向他推薦了達(dá)觀數(shù)據(jù)有限公司的“人工智能訓(xùn)練師”崗位,。盡管沒有計(jì)算機(jī)編程技術(shù)基礎(chǔ),也對(duì)人工智能了解不多,,但在聽說這份新工作主要和機(jī)器打交道后,,楊洪旭決定嘗試。招聘楊洪旭入職的運(yùn)營管理總監(jiān)袁少楊說,,公司首批人工智能訓(xùn)練師主要從事最基礎(chǔ)的數(shù)據(jù)標(biāo)注工作,,重復(fù)的工作內(nèi)容和大批量的標(biāo)注強(qiáng)度,很考驗(yàn)人的耐心,、細(xì)心和專注度,。5年下來,踏實(shí),、專注,、好學(xué)的楊洪旭贏得了同事們的交口稱贊。在公司的內(nèi)部培訓(xùn)和自我學(xué)習(xí)下,,他逐漸勝任模型處理,、產(chǎn)品測試、接洽客戶等多項(xiàng)工作。2022年底,,上海發(fā)布了首批人工智能訓(xùn)練師(二級(jí))職業(yè)技能等級(jí)認(rèn)定通過名單,,楊洪旭位列其中。面對(duì)人工智能產(chǎn)業(yè)的飛速發(fā)展,,楊洪旭主動(dòng)學(xué)習(xí)AI模型主流的編程語言,,編寫一些簡單代碼處理模型出現(xiàn)的問題?!氨热?,當(dāng)發(fā)現(xiàn)訓(xùn)練的模型有誤讀問題,我能夠編寫幾行程序代碼,,做一些初步糾正,,而不是把問題直接轉(zhuǎn)給模型研發(fā)人員?!睏詈樾裾f,,為了提升自己,眼下,,他正在備考信息系統(tǒng)項(xiàng)目管理師職稱證書,。人工智能是上海的三大先導(dǎo)產(chǎn)業(yè)之一。近年來,,上海從算力,、語料、模型,、測試,、應(yīng)用場景等方面布局人工智能產(chǎn)業(yè),同時(shí)加大人才培養(yǎng)力度,。2022年,,上海啟動(dòng)人工智能訓(xùn)練師職業(yè)技能等級(jí)認(rèn)定工作,目前已有450多人獲得了“人工智能訓(xùn)練師”證書,。(人民日?qǐng)?bào)記者:黃曉慧 版式設(shè)計(jì):汪哲平)來源:人民網(wǎng)-人民日?qǐng)?bào)
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1119317.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。