经验交流
您现在的位置:首页
 > 农业普查  > 经验交流
    大数据时代背景下的农普资料开发
    时间:2017-04-19 09:52:08 来源:温州市统计局 字号:[ ]

     

    温州市农普办 陈小薇
       深入推进农业供给侧结构性改革是新的历史阶段农业农村工作主线,因而第三次农业普查资料开发应紧紧围绕这个总目标,体现时代要求和地域特色,为实现“农业强、农村美、农民富”提供数据化的决策支持。为了精准服务浙江农普资料开发选题,笔者利用新近出现的大数据平台舆情监测、词云分析等工具对近期领导讲话、专业与热门微博、上次浙江农普课题选题进行对比研究,寻找到了一些答案。
         一、三农关键词有哪些新变化
       (一)“农业”位次排在“三农”之首,而二农普课题更偏重“农村”。近十年来,规模农业、新型农业经营主体不断壮大,“农民”一职从身份符号已转变为职业。浙江全面取消了农业与非农户口划分,推动城乡公共服务一体化,非农产业推动小城镇蓬勃发展,城乡界线逐渐消失。笔者调查收集了4套文本、268个关键词,在4个榜单(2017年领导讲话、浙江农业微博、新浪微博热门文章、2007年浙江二农普课题,数据来源详见下文)中重复出现的高频词共有4个:农业、农村、农民、建设(见表1)。二农普课题标题中农村一词出现频率最高,农村居民居次,农村教育、农村市场、农户分别入榜,农业一词排名第10。但是在2017年的会议讲话、微博中,农业的词频排序全都排名第一,农民、农村分别排名第12、16。建设一词在2017年文本中的外延扩词,主要表现在农产品基地建设、美丽乡村建设、农业“两区”建设、“一区一镇”建设(农业产业集聚区和特色农业强镇)、粮食生产功能区建设、建设大棚和温室等设施、队伍建设(农业生产经营主体、农技服务、农业管理干部)、农产品品牌建设、农科教产学研一体化建设。
               (二)粮食、土地、流转、增收、现代农业等热度持续稳定。二农普课题标题中的粮食等关键词仍然留存于2017年的会议讲话等榜单中。粮食的位次显著提升,土地、文化、流转略有下降;增收有所下降。
       (三)产业、农产品、生态等新词需要着重关注。产业、农产品、生态、质量、安全、示范、经营、主体、推广、绿色、组织、培育、新型、融合、农机、品牌等17个关键词共同出现在会议讲话、微博的排行榜中,而二农普课题标题的热词榜中没有名次(见表2)。结合普查方案设计新变化、新增指标,也可以窥一斑而知全豹。农村一二三产业融合发展、新型经营活动、乡村休闲旅游、设施农业、循环农业、特色农业释放出农业农村发展的新动能。另外,供给侧改革、“十三五”规划、科技、专业合作社、信息化等新词虽然仅出现在会议讲话热词榜中,但排名居前,也值着重点关注。
            (四)劳动力、新农村、承包等热词已被取代。农村居民、劳动力、新农村、就业、区域、分布、流动、农村市场、转移、承包、能源、农村教育、农户、贫困、消费结构、消费水平、小城镇、社会等关键词仅出现在浙江二农普课题热词榜中,2017年的会议讲话、微博热词榜中都没出现。通过近义词或反义词的人工检索初步判断,劳动力、就业、流动、转移等热点已经被设施、机器换人、农机、机械化、新型经营主体等新词取代,农村剩余劳动力已经实现向二三产业转移、向城市转移的进程,不再是一个问题。新农村被美丽乡村代替。承包的替换词可能是规模、规模化、集聚、集聚化。
       二、准确把握浙江三农热点,以供给侧改革为主线布局课题分析
       (一)服务农业供给侧结构性改革是农普资料分析主线。
      学习浙江省副省长孙景淼在2017年三农发展大会的演讲《推行清洁生产方式 发展绿色生态农业》,可以帮助我们认清浙江农业供给侧结构性改革的进程以及农普资料分析的整体框架。浙江是农林牧渔全面发展和一二三产业融合发展的综合性农区,只有全国1.3%的耕地面积,拥有全国现代生态循环农业发展试点省、农产品质量安全示范省、农业“机器换人”示范省、绿色畜牧业发展示范省、海洋渔业可持续发展试点省等五块“国字号”牌子,要坚持以“五化并进”为路径,以“五省联创”为抓手,深入推进农业供给侧结构性改革。
       (二)突现浙江规模经营、特色农业的比较优势与发展对策。
      习近平总书记的两会讲话,特别强调了精细农业、精准脱贫。“虽然很多时候我们强调规模经营,但也要看到,在一些地方,家庭规模的经营相当一段时间内还会存在。在浙江、福建,很多地都是分散的、零碎的,有的梯田叫斗笠田,一个斗笠就能盖住。青蛙一跳过三丘,一跳跳过三块田。所以要因地制宜,根据实际情况做细做精农业”。精细农业,也就是智能化的未来农业发展方向。农普分析要围绕中国传统村落、全国特色景观旅游名村、饮水困难户等指标,还要针对茶叶、食用菌、柑桔、种业(种子)等浙江特色产业做深入细致地分析。
       (三)积极探索大数据时代下的农普资料课题开发技术进步。
      三农普资料开发基于大数据时代背景。大数据不仅是一场技术革命,一场经济变革,也是一场国家治理的变革。国务院关于印发促进大数据发展行动纲要的通知(国发〔2015〕50号),明确要加强农业农村经济大数据建设,推进各地区、各行业、各领域涉农数据资源的共享开放,加强数据资源发掘运用。2017年5月1日起实施的《浙江省公共数据和电子政务管理办法》(省政府令第354号),对农业普查成果的共享开放、有效应用提出了划时代的新要求,要加强技术研发,乘风而上,顺势而为。
      机器写作应用,作为一项信息化技术创新,可以减少人工重复劳动,提高普查分析的时效性,提供更“深广细专”的定制服务,满足社会各界多元化的需求。对于某地区主导产业、特色农产品的数据分析,是历次农普资料开发的短板。可以考虑通过机器写作来弥补不足。通过预先编制的网页程序,输入参数,后台取数,在线生成分析报告。比如,输入两个参数,一个地域参数,用行政区划地址代码表示,一个或一组农产品参数,即农产品代码,通过程序预设的模板文件和取数语句,即时在线生成类似浙江省香菇产业分析报告、温州市甘蔗产业分析报告、瑞安市中药材产业分析报告、泰顺县猕猴桃产业分析报告等初稿。
       (四)高度重视反馈扶持政策的落地情况。
      在三农普课题分析写状况、比较、关系、对策时,要结合现行的惠民扶持政策落地情况,突出发现区域优势、让增效增收有具体抓手。有了农业普查数据,还需要进一步结合典型调查、问卷调查、专家调查以及大数据平台新闻信息搜集整理等方式,对当前各种农业补贴、惠民政策在本地的实施执行情况做出客观公开的评价与分析。
                                      
    三、本文三农关键词数据的收集整理说明
       首先,通过互联网收集整理了4个关键词数据库。一是会议讲话关键词,收集了2017年2月9日省委书记夏宝龙、省长车俊在浙江省委农村工作会议的讲话新闻稿,2月10日副省长孙景淼在全省农业工作会议的讲话新闻稿,2月25日中国三农发展大会《推行清洁生产方式 发展绿色生态农业》的演讲稿,以上文本共2.6万字,再运用“图悦”网站实现在线词频分析,获取关键词及词频名次(见图1)。二是浙江省农业厅官方微博“浙江农业”近90天热词(2016/12/20-2017/3/30),通过Bluemc大数据平台,对浙江省农业厅官方微博“浙江农业”进行KOL(关键意见领袖Key Opinion Leader)画像工作,全部图表中有高频词云模块,获得关键词及名次。数据整理时,删除了“我省”等个别特殊值。三是新浪微博热门文章的关键词,通过“浙江+三农”关键词,收集整理排名前30位的新浪微博热门文章内容,再对该段长文本做“图悦”在线词频分析。四是浙江省第二次农业普查的课题题目词频分析,删了“研究”、“问题”等文章标题特有高频词,以减少畸大值影响。
       其次,通过结构化查询语言SQL将4个关键词数据库合并成一个数据库。主栏为按拼音顺序、不重复出现的全体关键词,宾栏分别为1.会议讲话、2. 农业微博、3.三农新浪微博、4.二农普课题的单项名次。对这个数据库进行并存项数分析、单项是否居前等分析。由于原始素材收集有限,本文对林业、渔业的关注不足,还有待进一步研究。


    上一篇: 下一篇: