编者按:近日,《对于促进数据标注产业高质地发展的试验见识》由国度发展改良委、国度数据局、财政部、东谈主力资源社会保险部聚积印发。中国经济信息社数字经济推敲中心经营推出系列解读,从企业视角解读文献精神,搭建想想换取平台,助力数据标注产业高质地发展。
新华财经北京1月21日电近日,《对于促进数据标注产业高质地发展的试验见识》(以下简称《试验见识》)印发,系统布局数据标注产业高质地发展旅途,这为数据标注产业提供了强有劲的战略解救,将股东数据标注产业朝着智能化、范围化主见加速迈进。
一、强化科技鼎新,夯实数据标注产业基石
《见识》建议,依托国度重心研发计较、国度科技紧要专项等,加强跨边界跨模态语义对皆、4D标注、大模子标注等数据标注边界的错误本事攻关应用。
现时,数据标注边界存在多重挑战:一是我国数据资源体量大,数据标注恶果低,东谈主力老本高,对大体量数据进行精确化标注尚难有用杀青。二是大模子的发展对数据标注建议了更高条件,传统的数据标注格局已难以得志。三是数据标注是东谈主工智能大模子赋能百行万企的基础,不同业业数据互异大,也需要数据标注具备专科化、细腻化和定制化水平。这条件咱们必须进行科技鼎新,打造智能化的数据标注技能,攻关大模子标注、边界常识辅助标注、标注质地截止等错误本事,提高数据标注恶果,裁减标注老本,从而股东数据标注向高水平发展。
《见识》建议,围绕数据标注错误标准,结合文本、图像、视频、语音等多模态数据标注需求,建立数据标注尺度体系框架,制定数据标注本事、质地、才能等国度尺度。
为了杀青数据集的尺度化和分享流通,不同模态、不同业业要在高质地数据集的界说方面达成共鸣、酿成体系。为此,亟需建立数据标注尺度体系框架,制定涵盖本事、质地、才能等方面的国度尺度,并针对重心行业边界加速制定联系行业尺度,为数据集设备提供明确的标准和提醒,以促进数据集交往、流通。
二、汲引更生生态,杀青高水平数据供给
《试验见识》建议,畅通数据网罗、标注、东谈主工智能应用产业链,股东数据标注产业高下流协同发展。
现时,数据标注产业发展存在诸多瓶颈:一是穷乏具有引颈力的头部企业,产业链不同变装的企业力量较为漫步,盛大企业依赖东谈主力外包,穷乏中枢本事和鼎新才能,中枢竞争力不及,制约了产业全体的发展水平。二是高下流企业之间尚未酿成有用的协同联接机制,供需两边难以有用对接,即标注企业难以找到匹配本人才能的业务需求,而需求方企业也难以寻得高质地的标注团队,影响了产业资源的优化建树和产业生态的良性发展。
因此,一方面要效能打造一批有影响力的数据标注龙头企业,同期扶持和汲引中袖珍数据标注企业,荧惑政府和企业积极先行先试,酿成标杆示范效应。另一方面要建立产业链协同机制,打造数据标注供需对接平台,杀青高下流企业信息分享,酿成范围效应。此外,要充分发达数据标注基地的产业带动、引颈和集效应,促进产业协同鼎新,提高总共这个词数据标注产业的全体竞争力和影响力。
三、优化扶植体系,保险产业健康发展
《试验见识》指出,以东谈主才神气计较和科技神气等为抓手,汲引和引进高端专科东谈主才。
跟着东谈主工智能大模子的发展,数据标注任务日益复杂,数据标注产业急需转型升级,对标注东谈主员的专科教悔和技能水平建议了更高条件。设备劳动化、档次化标注东谈主才军队成为数据标注产业发展的错误。通过产学研和会道路,开展专科培训、举办技能竞赛等格局,提高标注东谈主才的水平,使其具备与行业常识边界相结合的才能,以合乎接续发展的数据标注本事和业务需求。同期,制定数据标注国度劳动尺度,开展劳动技能认定,提高数据标注东谈主员待遇,畅通东谈主才发展通谈,设备多档次的数据标注东谈主才库,为产业发展提供坚实的东谈主才扶植。
四、积极落实国度战略,助力数据标注产业高质地发展
《试验见识》条件,解救数据身分赋能产业转型升级,深挖企业分娩束缚全经由数据标注需求。
国有企业掌执广阔错误数据,这些数据对民生国计至关要紧。通过挖掘数据标注需求并加强设备愚弄,可显贵提高社会解决恶果。中国出动将以国度战略为导向,从四方面开始,平淡整合表里部数据资源,积极打造高质地数据集供给体系:一是设备高质地数据集平台,打造集寻源、集聚、清洗、标注、束缚、供给为一体的高质地数据集解决器具链,攻关错误本事以提高高质地数据集研发恶果;二是设备档次化数据标注军队,加强产学研和会,杀青高水平数据标注;三是协同场所共建数据标注产业基地,股东数据标注产业的区域协同发展;四是夺目中国传统文化与中华价值不雅数据集构建,完善更多代表录取价值不雅的语料。
本文作家系中出动信息本事有限公司党委委员、董事会董事、副总司理陶涛九游会体育