1、基于ArcGIS空间分析的不同地区单身情况模型项目建立的原因根据国家民政局统计,2015年,我国单身的成年人数量已超过2亿。为了帮助广大的单身人士早日找到心仪的对象所以我们想到了建立一个基于ArcGIS空间分析的不同地区单身情况模型系统来帮助大家。系统架构微博数据获取层QQ珍爱网百合网世纪佳缘网中国社科院数据处理层性格匹配经济状况匹配爱好匹配信息聚合层地域分析数据可视化年龄分析区域分析职业分析通过用户提供资料中性格、经济收入、兴趣爱好等信息的抽取,微博、相亲网站等数据信息的获取,采用地域分析及可视化技术聚合并组织模块功能,提供性格,爱好相投的心仪对象。性格分析 应用层较易落单城市珍爱网报告显示
2、,北京、深圳、上海、广州、成都、重庆、西安、武汉、东莞、长沙成为全国单身人群很多的十个城市。相亲频率超7成的单身男女有被催婚的经历,其中,近20%的人表示一年内被父母逼婚(催找对象)次数超过12次,近半单身男女表示逢年过节必遭遇催婚。较难脱单原因:“脱单逃避者”里,有近四成人表示“感觉很难找到对象”,超两成人认为“即使找到喜欢的人,但不擅沟通难以进入到恋爱阶段”,19%的人表示会积极的社交或相亲,仅7.85%的人享受单身状态。单身人口的职业分布在各行各业的单身人群中,男性单身人群集中在互联网行业IT工程师,其次为生产制造业中的工程师;女性单身人群主要集中为销售业务类职业,其次为金融从业者。单身
3、人群的经济情况有63.05%的单身男女个人存款在3-5万之间,占比较多,其次为6-10万,占比达15.37%,10万以上个人存款的人群占12.18%,3-5万6-10万10万以上3万下0.00%10.00%20.00%30.00%40.00%50.00%60.00%70.00%单身人口年龄分布Series1203030-4040-5050-60根据社科院的报告单身人数年龄30-40居多其次是40-50.功能实现模块通过准备的数据与GIS相结合可以实现功能如下:区域分析年龄分析职业分析性格分析对象匹配区域分析通过用户轨迹抽取用户的平时活动的位置,然后以相似定位作为特征获取高相似定位和高用户流入的
4、目标位置,最后通过区域分析查看目标用户与自身平时活动区域的重叠情况,从而为用户发现潜在交友对象。年龄分析本功能基于用户发布在各大社交平台上的详细信息,通过网页爬取,文本抽取的方式,获取到用户好友对用户主观认知,通过对用户心理活动进行分析,从而绘制得到用户好友主观认知下的用户与不同年龄人群的交流的心理舒适度,据此分析用户的最佳适合年龄,绘制最宽的年龄适合的范围。职业分析基于用户对于自身职业的描述,对于用户职业的关键词进行提取,然后通过关键词进行联想分析,再基于大数据找出与用户关键词和相应的联想词有重合的职业。通过关键词的权重分析出与用户职业匹配的较好的职业。性格分析性格分析上,我们首先通过对用户评论数据的抓取,获取到用户评论语料,通过人工筛选得到约500条正面评论语料、400条负面评论语料,最后基于贝叶斯公式建立朴素贝叶斯情感分类器,使用拉普拉斯进行归一化处理得到用户的性格。对象匹配将区域分析、年龄分析、职业分析、性格分析的结果分别定义不同的权重然后通过系统的大数据支持进行在线的云匹配,然后根据权重的不同输出相应的匹配结果。并得出最佳的匹配结果。最后祝愿大家早日脱单最后祝愿大家早日脱单