中國青年報客戶端北京3月20日電(中青報·中青網記者 賈驥業)我國7個數據標注基地已形成醫療、工業、教育等行業的高質量數據集335個;賦能121個國產人工智能大模型研發;引進和培育標注企業223家;標注從業人員達5.8萬人;帶動數據標注行業相關產值超過83億元;數據標注總規模達17282TB,相當于中國國家圖書館數字資源總量的6倍左右。
所謂數據標注,就是對數據進行添加標記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關鍵環節。我國有7個數據標注基地,分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同。
據悉,國家數據局未來將進一步暢通數據采集、標注、人工智能應用產業鏈,重點推動工業、金融、醫療、交通、教育等幾大領域的高質量數據集建設,促進數據標注產業高質量發展。