海口推動國家數據標注基地試點建設 打造數據標注產業(yè)集群特色
來源:高新院 achie.org
日期:2024-07-17 點擊:次
今年5月,國家數據局公布首批7家全國數據標注試點基地名單,海口成為我省唯一入選城市。何為數據標注?海口市科工信局相關負責人解釋道,數據標注是指通過加工處理,將圖片、文本、語音、視頻等原始數據轉變?yōu)闄C器可識別信息的過程。數據標注是人工智能算法運行的關鍵環(huán)節(jié),在推動數據資源匯聚、提升數據質量、盤活數據要素價值中起重要作用。
當前,海口市開展數據標注基地試點建設工作主要依托“百度人工智能數據標注產業(yè)基地”。此外,海南長光衛(wèi)星信息技術有限公司(以下簡稱“長光衛(wèi)星”)也正在開展航天航空數據標注業(yè)務。
7月15日上午,在位于秀英區(qū)招商局大廈的海口數字科技創(chuàng)新平臺的百度智能云(海口)人工智能基礎數據產業(yè)基地內,一臺臺計算機前,人工智能(AI)數據標注師正通過數據標注平臺,熟練地判斷、標記大模型生成的內容數據,推進來自全國客戶的AI數據標注項目。
該基地總建設面積1.14萬平方米,自2023年4月運營以來,已吸引超過10家生態(tài)合作企業(yè)入駐,數據標注從業(yè)規(guī)模達1000余人。
而長光衛(wèi)星也正在推進標注基地建設,該基地位于海口膜力創(chuàng)新工場5層,項目分兩期建設,一期面積2447平方米,即將投入使用;二期預計2025年開始動工,2026年完成后將形成總面積5000平方米的產業(yè)基地,構建高質量的數據標注基地。
按照計劃,在2年試點建設期內,海口將圍繞技術創(chuàng)新、行業(yè)賦能、生態(tài)培育、標準應用、人才就業(yè)、數據安全等6個方面建設數據標注基地。在技術創(chuàng)新方面,聚焦數據采集、清洗、標注、合成、檢測等數據治理環(huán)節(jié),攻關一系列相關智能化、自動化數據標注技術,研發(fā)一體化智能標注平臺;同時,圍繞海口跨境貿易、金融、農業(yè)、文化旅游、教育、遙感測繪地理等6個行業(yè)數據,完成標注數據量總規(guī)模不少于1000TB,引進5家數據標注龍頭企業(yè),培育和引進50家標注企業(yè),帶動上萬名數據標注從業(yè)人員就業(yè),直接拉動數據標注產業(yè)規(guī)模達10億元。
下一步,海口將借鑒全國數據標注產業(yè)發(fā)達地區(qū)的相關政策,圍繞場地租金補貼、生產要素扶持、人才培育和引進補貼等,計劃于2024年9月底前出臺海口市數據標注產業(yè)發(fā)展的扶持政策;并依托百度基地“文心一言”大語言模型和長光衛(wèi)星的龍頭企業(yè)優(yōu)勢,開展產業(yè)鏈招商,大力招引生態(tài)合作企業(yè),促進人工智能數據標注產業(yè)上下游產業(yè)鏈發(fā)展,打造數據驅動、智能使然、生態(tài)共融的海口特色的國家級數智經濟產業(yè)集群。