大数据技术在乡村画像中的应用研究.docx

上传人:b****5 文档编号:8144312 上传时间:2023-01-29 格式:DOCX 页数:16 大小:464.64KB
下载 相关 举报
大数据技术在乡村画像中的应用研究.docx_第1页
第1页 / 共16页
大数据技术在乡村画像中的应用研究.docx_第2页
第2页 / 共16页
大数据技术在乡村画像中的应用研究.docx_第3页
第3页 / 共16页
大数据技术在乡村画像中的应用研究.docx_第4页
第4页 / 共16页
大数据技术在乡村画像中的应用研究.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

大数据技术在乡村画像中的应用研究.docx

《大数据技术在乡村画像中的应用研究.docx》由会员分享,可在线阅读,更多相关《大数据技术在乡村画像中的应用研究.docx(16页珍藏版)》请在冰豆网上搜索。

大数据技术在乡村画像中的应用研究.docx

大数据技术在乡村画像中的应用研究

摘要:

在国家大数据战略和乡村振兴战略的大背景下,创新性地将大数据技术引入乡村画像中。

在系统研究乡村大数据源、大数据画像技术水平和乡村振兴研究的热点、重点和难点问题的基础上,从乡村发展基础、乡村发展状态和乡村发展行为3个方面构建了大数据乡村画像的概念模型。

借助原始指标、知识图谱、政策文本3类标签化方法,将概念模型具体化为可进行实际操作的3套标签体系,在此基础上,对3套标签体系的大数据计算方法、可视化方法进行阐述,并进行画像举例。

最后探索了大数据乡村画像未来的研究方向。

关键词:

  乡村画像 ; 大数据技术 ; 概念模型 ; 标签体系 ; 乡村振兴 ; 知识图谱

1引言

随着国家大数据战略的实施推进,大数据技术蓬勃发展,正加速成为发现新知识、创造新价值的新一代生产力,其应用已渗入经济社会的各个微观单元,并逐渐成为各行各业寻求突破、创新发展的关键力量。

其中,大数据技术中的用户画像技术在电子商务、金融等领域的成功应用,为这些行业带来了巨大的经济效益。

在最早应用用户画像技术的电子商务领域,目前已实现对上亿用户的智能化画像,为电商企业快速、便捷、精准地了解用户消费行为、兴趣偏好等特征提供了新的途径,同时也为营销策略的精准制定和实施提供了科学依据。

大数据技术同样已经渗入乡村发展的某些领域,其中,应用比较广泛的是农业领域。

通过对气候、土壤、农作物基因库、农业传感器返回的数据等农业大数据进行挖掘、分析发现,大数据技术在推动精准农业实施建设方面做出了重要贡献,在农业产量预测、农业自然灾害的监测预警、农产品价格预测、农产品营销等方面的应用也取得了良好的效果。

但到目前为止,无论是理论层面,还是实践层面,尚未有文献对大数据技术在乡村层面的系统性应用进行研究。

党的十九大报告确立了“乡村振兴”战略的重要地位,实施乡村振兴战略的第一步是立足乡情,全面、准确地了解当前“乡村”这一微观单元的经济社会运行全貌和特征,即首先要开展“乡村画像”工作。

据2016年第三次全国农业普查数据显示,截止到2016年底,全国约有4万个乡镇、60万个行政村,对这些乡镇、村的发展全貌和特征属性进行系统性分析与挖掘需要耗费大量的人力、物力、财力,如果不借助大数据画像技术,将很难实现。

大数据乡村画像可以实现对数十万乡村的智能化管理,是现代农村建设发展的智能型管理工具,为快速了解乡村发展全貌与现代化建设趋势,挖掘乡村优势特征与不足,制定政策支持方向、科研方向、投资决策方向,提供了有力的理论依据和数据支撑。

根据乡村画像的结果,政府部门可以明确乡村产业发展方向、乡村治理领域,同时监测乡村振兴实施效果、制定乡村现代化发展规划;科研机构可以在乡村画像系统的海量数据基础上,使用科学方法构建乡村发展模型,为解决我国“三农”问题提出建议;商业机构可以使用乡村画像系统,根据自身的投资方向,确定最佳投资对象、投资方式和投资期限。

综上所述,大数据技术在多个领域的应用已较为成熟,但在乡村领域的应用大多聚焦于农业领域,对于其在电商等领域成功应用的画像技术,在乡村领域尚未进行应用与实践,而乡村画像又是一项重要且必要的工作。

鉴于此,本文将对大数据技术在乡村画像中的应用开展前瞻性研究,在借鉴用户画像方法的同时,基于乡村大数据情况,建立大数据乡村画像的概念模型、标签体系以及实施算法。

2大数据乡村画像的相关研究现状

鉴于当前尚未检索到以大数据乡村画像为主题的直接文献,本文将沿着“以数据为基础,以技术为手段,以助推乡村振兴发展为目的”的思路,从乡村大数据源、大数据画像技术和乡村振兴领域研究的热点、重点和难点问题3个方面出发,分别进行研究。

2.1乡村大数据源的研究现状

乡村大数据源是大数据技术开展乡村画像的基础。

在对现有文献进行检索研究时,并未发现有关“乡村大数据”“农村大数据”的研究,但近两年关于“农业大数据”的研究逐渐增加,赵瑞雪等人从数据来源上梳理了国内外在农业科技活动中长期积累和整编的海量科学数据,即农业科学大数据,通过对其列出的数据源进行梳理发现,数量上汇集了12个国外数据源和30个国内数据源(包括6个地方政府门户开放数据),内容上大致可分为4类:

自然条件与资源数据,如气象数据、地质数据、再生资源数据、空间数据等;农业经济数据,如宏观农业数据、生态农业、中国饲料数据库等;生命科学数据,如生物信息数据、细胞数据、微生物病毒数据、基因数据等;农业行政机构数据,主要来自于政府部门开放门户。

姜侯等人从农业大数据产生的角度,提出了农业物联网数据、农业遥感和农业无人机数据、农业网络数据、科研及农户生产经验数据4类农业大数据,设计了农业大数据平台整体架构,并对农业大数据的应用方向进行了论述。

除上述微观层面的农业大数据外,中华人民共和国农业农村部、国家统计局、中华人民共和国海关总署等部门拥有的农业统计数据同样是农业大数据。

省、市级别宏观汇总数据可从《中国统计年鉴》《中国农业年鉴》等公开的年鉴资料中获取,但微观数据较难获得。

农业大数据是乡村大数据的一部分,除农业之外的其他乡村大数据主要集中在国家统计局、地方统计局以及其他政府部门。

其中,省、市级别的乡村数据可在《中国农村统计年鉴》《中国农业机械工业年鉴》《中国环境统计年鉴》等公开年鉴中获取,而微观数据由各部门保存,一般不对外公开,外部组织机构也无法通过网络爬取获得。

在国家或地方各部门拥有的乡村数据中,以农业普查数据中包含的农村信息最为全面,普查表中的行政村综合表和乡镇综合表囊括了乡村基本信息和特征信息;普查表中的农户基层表包括了村内农户生活、生产经营活动的方方面面,进一步丰富了乡村数据。

农业普查数据可提供全面的乡村数据信息,局限性为每十年开展一次,最近一次是2016年开展的第三次全国农业普查。

但随着近两年地方乡村振兴战略统计工作的开展,乡村振兴战略统计的调查指标与普查指标具有较高的相似度,可对相同的指标进行不同年度的连续分析。

除农业普查数据外,乡村层面还存在着数量可观的非传统数据,如中国精神文明网网站(中国共产党中央委员会宣传部、中央精神文明建设指导委员办公室)发布的5个批次共计4717个全国文明村镇的名单数据,中华人民共和国建设部、中华人民共和国文化和旅游部、中华人民共和国财政部等7个部门发布的5个批次共计6819个中国传统村落的名单数据,中华人民共和国农业农村部发布的两个批次共计300个中国美丽休闲乡村的名单数据。

此外,随着《乡村振兴战略规划(2018—2022年)》和《数字乡村发展战略纲要》的推进实施,数字乡村的建设速度加快,乡村大数据将会得到快速沉淀。

2.2大数据画像技术的研究现状

大数据画像技术是大数据乡村画像的核心技术手段。

大数据画像的概念来源于用户画像,用户画像的英文概念“userpersona”最早由艾伦·库珀提出,其认为userpersona是真实用户的虚拟代表,根据用户行为、动机等将用户分为不同的类型,从中抽取每类用户的社会属性、生活习惯、消费行为和兴趣偏好等信息的共同特征,并设定名字、照片、场景等要素对其进行描述。

用户画像又称为人群画像,是根据用户信息抽象出的一个标签化的用户模型,即用高度精练的特征描述一类人,例如年龄、性别、职业、兴趣偏好等。

大数据画像技术是用户画像在大数据环境下的延伸和发展,是基于大量传统数据和非传统数据、静态数据和动态数据、结构化数据和非结构化数据,使用统计分析、机器学习和人工智能等算法,构建模型、挖掘数据、提取特征并进行动态可视化展示的一门数据分析与展示技术。

在中国知网文献数据库中,以“大数据画像”“乡村画像”“画像”等关键词进行检索,对现有文献从画像对象、画像技术方法两个方面进行归纳总结。

从画像对象来看,当前文献库中可检索到以“用户画像”“产品画像”“企业画像”“城市画像”为标题的研究,其中,“用户画像”作为画像技术的初始应用领域,研究的文献最多,应用也最为广泛,尤其是在互联网电商等,主要的大数据关联规则方法有APRORI算法、FPGrowth关联规则算法,这些方法主要应用于电商、金融等行业的用户画像。

虽然当前关于特征值提取的方法很多,但是特征值挖掘和提取的准确性仍是要持续攻克的难点。

2.3乡村振兴领域研究的热点、重点及难点问题

乡村振兴领域的热点、重点及难点问题是大数据乡村画像的重要应用方向。

自2017年党的十九大报告中提出乡村振兴战略,到2018年《乡村振兴战略规划(2018—2022年)》正式出台,再到2019年《数字乡村发展战略纲要》的提出,学术界关于乡村振兴领域研究的热点、重点及难点问题的研究大多围绕着乡村振兴发展而开展,或是聚焦乡村振兴发展的产业兴旺、生态宜居、乡村文明、治理有效、生活富裕5个维度整体,或是聚焦某一个局部展开研究。

通过对乡村领域相关文献进行研究和分析,可以总结为:

乡村振兴领域研究的热点是乡村振兴实施效果评价,文献以乡村振兴评价指标体系构建为主,部分文献选取对象进行实证分析;乡村振兴领域研究的重点是乡村振兴实施路径,当前文献大多对乡村振兴的某一方面进行重点研究,从问题导向给出乡村振兴的实施路径;乡村振兴领域研究的难点是乡村振兴差异化的前期规划,如黄祖辉提出要从区域新型城镇化战略和乡村差异化发展的实际出发,落实乡村振兴战略。

其中,除乡村振兴的实施效果可以进行定量分析外,其他研究大多为定性分析。

大数据乡村画像系统的成果可以为乡村振兴领域热点、重点及难点问题的研究提供科学有力的支撑,在实际应用过程中,大数据乡村画像系统主要有三大作用。

第一,充分了解乡村全貌。

传统的乡村发展评价模型一般使用年鉴数据和调查数据,对互联网上大量可用数据的利用率不高,维度通常也局限于年鉴数据提供的信息,无法全面刻画乡村面貌。

大数据乡村画像系统可以充分利用年鉴数据、政府网站公开数据等结构化数据,同时也可以利用地理位置信息、气候信息、政策文件信息、政策称号信息等非结构化数据,多维度、全方位、立体化地对乡村发展情况进行描述,帮助政府根据乡村存在的现实问题,有针对性地制定政策。

第二,寻找差异,为因地制宜发展乡村振兴提供理论支持。

利用大数据乡村画像系统,可以对省份层面、地市层面、县域层面、乡镇层面以及行政村层面等各级行政区划的乡村振兴发展情况进行分析,应用范围广泛。

通过对比,可以发现研究主体的优势和劣势,帮助当地政府因地制宜,开展“千村千面”个性化、特色化规划,解决规划的同质性和落地难等问题。

同时,大数据乡村画像系统可智能化匹配生产条件、自然条件或者社会条件相似的标杆性乡村,帮助落后乡村找到适合当地的乡村振兴发展路径和实施路径。

第三,监测乡村振兴政策实施效果。

大数据乡村画像系统可以对乡村振兴发展情况进行连续时间的监测,通过对多年的数据和信息进行对比,系统可使用标签对分析结果进行展示,例如,某省份人均农林牧渔产值连续5年增加,乡村画像标签可展示为“连续5年人均农林牧渔产值增加”。

同时,大数据乡村画像系统也可设置预警机制,在指标值出现异常波动或者下降趋势时(针对正向指标),发出预警信号,帮助政府部门及时做出应对。

综上所述,本文结合已有研究成果,以乡村大数据为基础,以大数据画像技术为手段,以辅助解决乡村振兴发展中的热点、重点和难点问题为导向,开展乡村画像概念模型和标签体系的构建工作。

3乡村画像概念模型构建及数据支撑

概念模型来源于数据库设计,是对现实世界中问题域内的事物进行描述的模型,是现实世界到信息世界的第一层抽象,是用户与数据库设计人员进行交流的语言,因此,概念模型一般具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识,且简单、清晰、易于用户理解。

乡村画像概念模型是对乡村微观单元中的经济和社会发展进行描述的模型,是对真实乡村的经济社会运行状态和行为的刻画,是大数据乡村画像的核心内容,是影响乡村画像结果的关键。

本文将在确立乡村画像构建原则的基础上,从基本属性、状态属性和行为属性3个方面构建乡村画像概念模型,并在概念模型的基础上,系统性梳理所需的乡村画像数据支撑。

3.1乡村画像概念模型的构建原则

乡村画像概念模型是大数据乡村画像的基础,构建科学合理的大数据乡村画像概念模型应遵循全面性、系统性、特征性、可行性和智能性的原则。

(1)全面性原则乡村画像概念模型在构建时应遵循全面性原则,即应充分考虑各类乡村的属性,构建的乡村画像模型应覆盖全部村的基本属性,可以实现对任何一个乡村进行画像,不应存在不能进行乡村画像的情况。

(2)系统性原则乡村画像的系统性是指在乡村画像概念模型的构建中,坚持全局意识、整体观念。

概念模型构建时应系统地考虑各要素的层次性,各要素由外至内层层深入,构建一个乡村经济社会内各子系统、各要素相互独立又相互联系的有机整体。

(3)特征性原则乡村画像概念模型的构建要突出特征性,特征属性是乡村画像概念模型的重要组成部分,是彰显乡村特色、挖掘乡村价值、因地制宜地推进乡村振兴的重要工作抓手。

(4)可行性原则乡村大数据是大数据乡村画像落地实施的前提,乡村画像是在乡村大数据分析、计算和研究的基础上开展的,如果乡村画像的数据不可获得,那么乡村画像概念模型的构建将会停留在理论研究层面,无法走向实际操作层面。

(5)智能性原则概念模型的构建应清晰、明确,能够被计算机理解,便于进行程序化实施,进而保障后续对4万个乡镇、60万个行政村的大数据画像的自动化、智能化、动态化实现。

3.2乡村画像概念模型的建立

基于乡村画像概念模型的构建原则,在乡村画像概念模型构建的过程中,综合考量乡村经济社会的基本属性和特征属性、静态属性和动态属性、微观属性和宏观属性,最终确定乡村画像概念模型从“基本属性”“状态属性”“行为属性”3个方面进行构建。

在构建概念模型时,将按照“345”的原则构建,即乡村画像基本属性由3个维度构成,分别为“地理区位”“自然条件”“政策称号”;乡村画像状态属性由4个维度构成,分别为“规模”“速度”“结构”“效率”;乡村画像行为属性由5个维度构成,分别为“发展产业”“保护生态”“延续文明”“加强治理”“推动共同富裕”。

乡村画像概念模型如图1所示。

图1   乡村画像概念模型

3.3乡村画像概念模型的数据支撑

乡村画像概念模型及标签体系的设立是基于广泛的、多维度的乡村大数据源进行的,包括传统数据和非传统数据、结构化数据和非结构化数据等多种类型。

本文使用的主要数据来源及相应用途见表1。

4大数据乡村画像标签体系的构建

在乡村画像概念模型的框架下,以乡村大数据为基础,以展示乡村全貌、挖掘乡村特征、助力乡村振兴发展为目标,构建乡村画像标签体系。

相对于概念模型而言,乡村画像标签体系更加具体和形象,在获取数据的基础上,可直接进行可视化标签分析。

4.1标签体系的构建方法

与指标体系不同,标签体系不再受各指标层级必须相同、指标值必须为数值型数据的限制,是一种更为灵活、更适合大数据生态的模型体系。

本文将从指标数据、知识图谱、政策规划文本3个方面,介绍5类标签的构建方法。

其中,从指标数据出发,可以构建2类原始标签;从知识图谱出发,可以通过对原始标签进行扩展和泛化处理,生成2类新的标签;从政策规划文本出发,提取关键词,可以生成宏观属性的乡村行为标签。

(1)基于指标名称的原始标签提取从乡村数据指标出发,对数据指标名称进行转换,在保持指标含义不变的条件下,将原始指标转换为以短词语或短词组形式为主、指标名称更为精简的标签,并将其标记为原始标签。

如第三次全国农业普查中行政村普查表中的“生活污水是否经过集中处理”这一指标,在提取标签时,可以提取为“生活污水集中处理”。

此外,对于指标中存在的“个数”“人数”“户数”等内容,在进行标签提取时,一般进行删除处理,如“村集体创办的互助型养老服务设施个数”指标,在提取标签时,转化为“村集体创办互助型养老服务设施”。

(2)基于指标数据计算的标签提取从乡村数据出发,借助传统描述性统计分析,计算某一指标或原始标签的基本统计量,对单时点数据计算最大值、最小值、均值、秩(排序),对连续时点数据计算增长率等,并对计算后的统计量中的突出特征进行提取。

以单时点第三次全国农业普查数据为例,针对行政村“外来人口”这一指标,在全省样本层面计算指标排名,针对排名提取最具特征的标签,如“外来人口省内Top3”“外来人口省内前10%”等。

对于非传统数据的标签化处理,视数据情况而定,其中,政府部门公开评选的乡村称号数据,如“乡村振兴示范村”“生态村”等文本型数据,无需转换,可直接作为乡村画像标签。

(3)基于知识图谱的原始标签扩展基本知识图谱的原始标签扩展是指从原始指标出发,借助相关知识图谱,引入外部相关信息,在原始指标的基础上,扩展出新的标签。

关于扩展型标签的知识图谱的构建,应将乡村的地理区位等基本属性与国家政策、本区域的特征、相邻区域的特征建立直接或间接的关系,借助相关知识图谱,可以扩展出是否为“两省边界村”、是否“与一线城市相邻”、是否“与经济大省相邻”等扩展性标签。

(4)基于知识图谱的原始标签泛化基本知识图谱的原始标签泛化是指从原始指标出发,借助知识图谱技术,挖掘出多个指标的共同属性,并将其泛化成一个共性标签。

对于泛化型标签的知识图谱的构建,应将乡村的各项经济和社会活动进行系统化处理,并建立乡村各项经济和社会活动的层级关系,进而基于建立的层次关系,实现原始标签准确、高效的泛化。

如某个乡村在“设施农业、循环农业、工厂化生产”“高标准农田”“按测土配方施肥”方面开展了大量工作,则基于相关的知识图谱,可以泛化出“开展新型生产模式”这一标签。

(5)基于政策规划文本的标签提取从国家级政策规划文本出发,提取其中的关键词,对关键词进行转换,生成新的标签,一般适用于宏观属性一、二级标签的提取,对于三级以上标签的提取仍需依赖相关的知识图谱。

这种标签提取方法紧跟国家政策形势,提取的标签可直接用于政策实施进度、实施效果的监测,受到政府相关部门的高度关注。

如从《乡村振兴战略规划(2018—2022年)》中提取“构建现代农业产业体系”一词,可以将其标签化为“推行现代农业产业化发展”。

4.2乡村画像基本属性标签体系

在乡村画像概念模型中,乡村画像基本属性包含“地理区位”“自然条件”“政策称号”3个维度。

地理区位从行政区划出发,借助基于地理、经济等知识图谱体系,生成行政区划、区域扩展、临近区域等新型标签;自然条件将地形、气候、土壤、资源、自然灾害作为画像标签;政策称号将乡村、乡村所属市县园区、乡村下属企业在涉农领域获取的国家部委机构公开评选的政策称号,直接作为乡村标签。

这3个维度的标签值在短期内相对稳定,除行政村区划调整和滚动评审的政策称号之外,绝大多乡村的基本属性在短期内不会变动。

乡村画像基本属性标签体系如图2所示。

图2   乡村画像基本属性标签体系

乡村画像基本属性标签体系构建中,地理区位标签的初始数据一般仅为乡村所属的行政区划这一个数据值的信息,对于其他地理区位标签,需借助知识图谱进行标签扩展;自然条件的数据支撑以农业部信息中心、国家气象信息中心等政府部门的公开数据为主,进行标签构建;政策称号数据以中华人民共和国农业农村部、中华人民共和国国家发展和改革委员会、中华人民共和国科学技术部、中华人民共和国财政部、中华人民共和国生态环境部、中华人民共和国水利部、中华人民共和国文化和旅游部、中华人民共和国住房和城乡建设部、中华人民共和国民政部等政府部门联合或单独公开评审的称号名单为主,进行标签构建,其中“农业产业化国家重点龙头企业”和“国家自然保护区”的评审为滚动式评选,当年评审后,之前发布的名单作废;国家有机食品生产基地会定期对前面审批的基地进行复核,公布审核后的名单。

最终确立一级标签3类,二级标签12类,三级标签29类,四级标签35类,五级标签35类。

具体标签体系见表2。

4.3乡村画像状态属性标签体系

乡村画像状态属性标签体系,主要用来标识当前乡村发展的基础性、代表性指标的发展状态,反映乡村发展的基本水平。

通过状态属性可以对当前乡村的发展水平有一个概括性的了解,一般地,状态标签多为长期以来政府部门关注的指标。

对于状态属性标签化体系的构建,将从“规模”“速度”“结构”“效率”4个维度开展。

在规模和速度维度下,主要对乡村产业、乡村人口、村集体收支的规模和速度进行考量;在结构维度下,对乡村非农收入、老龄化人口、农民受教育、医疗资源配置、教育资源配置的结构进行考量;在效率维度下,对人均产值、农业机械化效率进行考量。

乡村画像状态属性标签体系如图3所示。

图3   乡村画像状态属性标签体系

乡村画像状态属性标签体系中的数据一般为常见性数据,对于省、市层面的数据,可以在《中国农业年鉴》《中国农村统计年鉴》等公开年鉴中获取;对于乡村层级的状态数据,一般保存在各县级以上的统计部门,不对外公开。

全国乡村的状态标签数据可从农业普查数据中获取,但一般乡村级别底层微观数据的获取存在一定困难。

对于非政府部门开展的状态标签的画像,可以考虑借助非传统数据,如借助遥感数据获取农业产业数据,借助手机信令数据获取乡村人口流动的信息。

最终确立一级标签4类,二级标签13类,三级标签20类,具体状态标签体系见表3。

4.4乡村画像行为属性标签体系

乡村画像行为属性标签体系,将从乡村微观行为标签和乡村宏观行为标签两个方面开展,微观行为标签主要反映被刻画的对象的单一行为,较为具体,而宏观行为标签则为多种行为的综合反映,较为抽象。

微观行为标签有2类:

一是某些单时点原始指标可直接被转换为微观行为标签,如集中处理生活垃圾、村集体创办卫生室、施用农家肥;二是对连续时点的状态性指标变动进行加工计算,将其转换为微观行为标签,如可以通过计算“村集体支出”两年间的变动,生成“缩减村集体支出”这一标签。

宏观行为标签可借助政策文本进行提取,同时也可借助相关知识图谱进行扩展和泛化。

基于《国家乡村振兴发展战略规划(2018—2022)年》(以下简称战略规划)和第三次全国农业普查的数据指标,从“发展产业”“保护生态”“延续文明”“加强治理”“推动共同富裕”5个维度,构建了乡村画像行为属性标签体系。

其中,从战略规划原文提炼了乡村画像宏观行为标签,标识为“乡村画像一级标签和部分二级标签”,同时从第三次全国农业普查指标数据中提取了乡村画像的微观行为标签,最终构建乡村画像行为属性标签体系如图4所示。

图4   乡村画像行为属性标签体系

在乡村画像行为属性标签体系的构建中,一级标签是基于战略规划原文信息直接提取的,二级和三级标签以第三次全国农业普查的调查表指标为基础,以农业普查中的行政村、农业经营户、规模以上农业经营户3类主体的调查信息表为依据,构建乡村画像行为属性标签体系。

乡村画像行为属性包含正向属性和负向属性,本文的行为标签体系多以正向属性的形式给出,以期引导乡村振兴正向发展,在应用中视乡村各标签值的大小,加入相应的程度副词或否定词进行负向刻画。

最终确定一级标签5类、二级标签23类、三级标签44类、四级标签31类,具体行为属性标签体系见表4。

5大数据乡村画像的实施算法及画像举例

5.1大数据乡村画像的标签计算方法

(1)乡村画像基本属性标签的计算方法一是地理区位标签计算。

从乡村所属行政区划出发,借助大数据工具,识别乡村行政区划边界,借助知识图谱,通过建立区域特征判别算法、邻近村特征识别算法、边界村识别算法,对临近区域中的相邻区域、边界村、边境村进行计算识别。

二是自然属性标签计算。

在乡村数据较难获得的情况下,可借助所属县、市自然属性的数据,进行标签化处理。

三是政策称号标签计算。

通过大数据技术查找比对政府部门公开评选的各类涉农名单,政府公开评选的涉农的各种名称头衔可直接用于乡村画像,直接生成乡村画像的特征标签。

此类标签的生成以收集整理的政府部门公开评审的涉农名单为前提,在收集、积累涉农数据的基础上,分类建立“村”“镇”“县”“产业园”等名录。

在具体开展乡村画像工作时,可对被画像的乡村名称与名录库中公开评选的名称进行查找、比对,若能在名录库中查找到乡村名称,则记录此乡村对应的被评选

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1