据悉,被称为中国经济“大体检”的全国经济普查,每5年进行一次,第4次普查目前正处于现场登记阶段。随着海量数据不断汇聚,一幅清晰反映中国经济社会发展形态的图景将逐渐成形。而从“体检”数据到“体检”结果,离不开信息的归并和分类,行话称其为“编码”。姜志渊说,编码依据是一本484页厚的《国民经济分类注释》,传统办法就是靠“人工分类”,“上一次大普查,我们20多人花了1个月时间才完成龙湾区3.5万家经济活动主体编码。”
人工编码不仅效率低,而且出错概率也会高。温州市统计局决定向智能科技要效率,由计算机系毕业的姜志渊牵头,整合技术力量,开始了行业分类智能编码的探索与实践,经过1年时间反复研磨,一套“行业分类智能编码程序”上线。“484页分类注释已经全部被系统消化,它会根据经济普查员输入的业务活动描述自动匹配,给出符合其分类的最优推荐列表,准确率在90%以上,后期可再通过人工核查修正。”温州市统计局局长瞿自杰介绍。
目前,这款程序已被国家统计局推广应用于此次全国经济普查,负责对全国1.1亿家单位和个体经营户进行智能编码。(记者 项锐)