本報記者 黃曉慧楊洪旭在制訂人工智能訓練計劃,。
楊洪旭(右)和同事在討論人工智能訓練進展,。 以上圖片均為本報記者黃曉慧攝
打開電腦,開啟智能訓練軟件,,人工智能訓練師楊洪旭開始一天的工作,。他最近的任務是訓練一個能自主識別銀行電匯申請書的人工智能(AI)模型。楊洪旭供職的達觀數據有限公司,,位于上海浦東軟件園,,是一家智能文本處理技術企業(yè),。這里研發(fā)的AI模型,,能讀懂合同工單、財務報表,、行業(yè)報告等各類文本文件,,在銀行流水識別,、合同審核與比對等多場景落地應用?!霸谟柧欰I模型前,訓練師首先要閱讀大量相關的文件文本,,從中提煉和標注出關鍵信息,。”楊洪旭把讀文本,、做標注的過程比作老師備課,,是訓練的基礎,“我們劃重點,、做標注,,然后將‘有用’信息‘投喂’給AI模型,,告訴它們應該提取哪些信息,、按照什么格式提取?!比斯ぶ悄苡柧殠熞荒晷枰喿x上萬份文檔,,訓練幾十個AI模型。楊洪旭在智能訓練軟件中打開某銀行一張電匯申請書的掃描圖像,,將“業(yè)務種類”“匯款人名稱”“賬號”“開戶銀行”“聯(lián)系地址”等字段信息一一拉框選中,,再在旁邊打上相應標簽,隨后點擊生成訓練模型,。模型生成后,,他需要給AI模型出一些練習題,輸入字段信息,,比對AI模型生成的結果,,以此檢驗學習效果。當發(fā)現(xiàn)生成結果與原文本有出入時,,楊洪旭會記錄并整理成問題列表,。“比如文章中有一處圖像,,它沒有讀取出來,。有一個圖像應該是正向的,,它讀取成了側向的?!边@些問題會統(tǒng)一反饋給AI模型的研發(fā)人員,,為后續(xù)改進作參考?!癆I模型經過訓練后,,再遇到類似的文本文件,它就能自主抓取,、審讀這些關鍵信息,,更高效地執(zhí)行人類指令?!痹趧e人眼中單調,、重復、略顯枯燥的文檔閱讀,、數據標注,、效果測試等工作,楊洪旭卻得心應手,。他最開心的事就是看到自己訓練的模型越來越“聰明”,。1993年出生的楊洪旭,患有先天聽力障礙,,要戴助聽器才能聽到外界的聲音,。2014年,他從上海一所職業(yè)技術學院的環(huán)境設計專業(yè)畢業(yè),,先后做過家裝設計,、會計文員和倉庫管理員等工作?!昂涂蛻艚涣鲿r,,因為口齒表達不夠清晰流利,經常會有挫敗感,。”在楊洪旭陷入迷茫之際,,上海市浦東新區(qū)殘聯(lián)向他推薦了達觀數據有限公司的“人工智能訓練師”崗位,。盡管沒有計算機編程技術基礎,也對人工智能了解不多,,但在聽說這份新工作主要和機器打交道后,,楊洪旭決定嘗試。招聘楊洪旭入職的運營管理總監(jiān)袁少楊說,,公司首批人工智能訓練師主要從事最基礎的數據標注工作,,重復的工作內容和大批量的標注強度,,很考驗人的耐心、細心和專注度,。5年下來,,踏實、專注,、好學的楊洪旭贏得了同事們的交口稱贊,。在公司的內部培訓和自我學習下,,他逐漸勝任模型處理、產品測試,、接洽客戶等多項工作。2022年底,,上海發(fā)布了首批人工智能訓練師(二級)職業(yè)技能等級認定通過名單,楊洪旭位列其中,。面對人工智能產業(yè)的飛速發(fā)展,,楊洪旭主動學習AI模型主流的編程語言,,編寫一些簡單代碼處理模型出現(xiàn)的問題,?!氨热纾敯l(fā)現(xiàn)訓練的模型有誤讀問題,,我能夠編寫幾行程序代碼,,做一些初步糾正,而不是把問題直接轉給模型研發(fā)人員,。”楊洪旭說,,為了提升自己,,眼下,他正在備考信息系統(tǒng)項目管理師職稱證書,。人工智能是上海的三大先導產業(yè)之一,。近年來,上海從算力,、語料,、模型,、測試、應用場景等方面布局人工智能產業(yè),,同時加大人才培養(yǎng)力度,。2022年,上海啟動人工智能訓練師職業(yè)技能等級認定工作,,目前已有450多人獲得了“人工智能訓練師”證書,。版式設計:汪哲平《 人民日報 》( 2024年08月27日 13 版)
免責聲明:本文來自網絡收錄或投稿,觀點僅代表作者本人,,不代表芒果財經贊同其觀點或證實其描述,,版權歸原作者所有。轉載請注明出處:http://lequren.com/1118640.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。