数学建模D题.docx
《数学建模D题.docx》由会员分享,可在线阅读,更多相关《数学建模D题.docx(19页珍藏版)》请在冰豆网上搜索。
数学建模D题
2013高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
D
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
平
日期:
2013年9月16日
赛区评阅编号(由赛区组委会评阅前进行编号):
2013高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
公共自行车服务系统的统计分析
摘要
本文研究的是有关公共自行车服务系统的统计分析,包括站点设置和锁桩数量的配置问题。
对于该题中的问题我们转化为数学中的数据统计与图像,利用Excel、matlab软件对数据进行处理。
分别得到本题中的五个问题。
对与问题一:
首先要进行总体样本数据统计,利用Excel软件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。
第一、用Excel统计各站点20天中每天以及累计的借车频次和还车频次。
第二、对所有站点按照累计的借车频次和还车频次分别给它们排序。
第三、在Excel中汇总出每次用车时长的数据,随即将数据导入matlab中,通过matlab处理去除奇异数据,并做出图像。
第四、通过该图得出用车时长最长的时段数据,拟合出函数分布,并判断实际观察的属性类别分配是否符合已知属性类别分配理论。
第五、检测观察数与理论数之间的一致性,通过检测真实数据与理论数据间的一致性来判定事物之间的独立性。
对于问题二:
首先在表借车卡SN列中用数据透视筛选出20天每张借车卡的数量,再将数据导入matlab中,统计数据中每张出现过的借车卡累计借车次数,进行数据处理后得出每张借车卡累计次数的分布情况。
对于问题三:
首先根据问题二的统计结果确定使用公共自行车次数最多的一天。
在解答下列小问
1)先从统计数据结果找出自行车用车的借、还车站点之间(非零)最短距离和最长距离。
在利用Excel对借、还车是同一站点且使用时间在1分钟以上的借、还车情况进行统计。
2)从问题一数据中选择那一天借还频次最高的站点,分别统计其借、还车时刻及用车时长的分布。
3)列表统计出那一天各站点借、还车高峰时段及其高峰时段的借、还车的频次,把共同借还车高峰时段的站点分别进行分类。
对于问题四:
通过从数据中分析出有用信息,并对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
对于问题五:
从统计出来的数据中找出公共自行车服务系统的运行规律,并提出合理的改进建议
关键词:
公共自行车ExcelMatlab总体样本平面直方图数据统计与分析分布的检验拟合优度检验
(一)问题重述
1.1.背景资料与条件
低碳生活是世界可持续发展的首要任务。
全球变暖等气候问题致使人类不得不考量目前的生态环境。
人类意识到生产和消费过程中出现的过量碳排放是形成气候问题的重要因素之一,所以要减少碳排放就要相应优化和约束某些消费和生产活动。
公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及。
在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。
题目给出了:
附件1是公共自行车数据(内含20个Excel文件);附件2公共自行车站点分布图。
1.2.需要解决的问题
1.2.1.问题一
分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序。
另外,试统计分析每次用车时长的分布情况。
1.2.2.问题二
试统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。
1.2.3.问题三
找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:
(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。
(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
1.2.4.问题四
请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
1.2.5.问题五
找出公共自行车服务系统的其他运行规律,提出改进建议。
(二)问题分析
2.1.问题的重要性分析
建立此模型的目的是为了使公共自行车服务系统更加完善,便于市民通行。
以此合理分布站点,根据不同站点人员借车的密集程度安排自行车的数量。
做好每天高峰时段及节假日用车高峰时段的自行车调度是重要问题。
2.2.问题的思路分析
2.2.1.问题一
对与问题一需要进行大量的数据统计,利用所给的Excel文件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。
首先统计各站点20天中每天以及累计的借车频次和还车频次,然后对所有站点按照累计的借车频次和还车频次分别给它们排序,最后,统计分析每次用车时长的分布情况,可以通过该图看出用车时长最长的时段,数据处理后可以找出其满足的函数分布。
并对其分布进行检验。
2.2.2.问题二
与问题一相同,要先统计出各天使用公共自行车的不同借车卡数量,然后统计数据中每张出现过的借车卡累计借车次数,进行数据处理后得出每张借车卡累计次数的分布情况。
2.2.3.问题三
通过的数据统计找出所有已给站点合计使用公共自行车次数最大的一天。
1)首先任意定义两站点之间的距离,找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
然后对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
2)将统计出借车频次和还车频次的数据进行筛选,找出借车频次和还车频次最高的站点,把借、还车时刻的数据进行统计分析,处理得其分布以及车时长的分布。
3)在统计数据中找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行数据处理分类。
2.2.4.问题四
通过问题一到问题三的数据处理,在统计结果中列出有用的信息,通过观察数据对目前公共自行车服务系统站点的设置和锁桩数量的配置进行评价。
2.2.5.问题五
从数据中找出公共自行车服务系统的一些规律,提出合理的改进建议
(三)模型假设
为了我们更好的解决该问题,在此之前,我们作出以下假设:
1)假设路程与时间成正比;
2)假设借出的车都归还(借车未还的忽略不计);
3)假设公共自行车不存在跨市运营;
4)假设公共自行车不存在跨市运营且只有一家运营公司;
5)假设公共自行车在借车以后一直处于行驶状态
6)假设每个锁桩所能容纳的车辆都相同,
(四)符号说明
:
中心距
:
偏斜度
:
偏斜度
:
表示【附件3】数据中每张卡的总次数的平均值;
:
表示【附件3】数据中每张卡的总次数
:
表示【附件3】数据中卡的总次数;
:
表示【附件3】数据中每张卡的总次数的标准差
(五)模型的建立与求解
5.1问题一
首先统计各站点20天中每天以及累计的借车频次和还车频次
见附件中的【附件1】
然后对所有站点按照累计的借车频次和还车频次分别给它们排序
见附件中的【附件2】
最后,统计分析每次用车时长的分布情况
1)去除大数据、奇异值
原因:
1、通过把每次用车时长数据统计后画出直方图1【附件3】,经观察后发现有较多大数据阻碍了图像的完美表达,并且数据主要集中在0-150之间,为了便于观察分析,剔除大于150的奇异数据。
编辑matlab程序:
a=data;j=1;
b=a(:
1);
fori=2:
20
b=[b;a(:
i)];
end
fori=1:
size(b)
ifb(i)>150;
b(i)=0;j=j+1;
end
end
j
运行程序的结果:
j=844
图1
偏态测定:
将三阶中心距
与其标准差的三次方
对比,求得偏态偏斜度
即:
注:
=0,表示数据为对称分布;
>0,表示数据为右偏或者正偏;表示
<0,表示数据为左偏或者负偏。
编辑matlab程序,计算结果如下:
=-2.31
峰度测定:
将四阶中心距
与其标准差的三次方
对比,求得峰度偏斜度
即:
注:
当
=3时,为正态分布;当
>3时,分布曲线为尖峰;当
>3时,分布曲线为平峰。
编辑matlab程序,计算结果如下:
=4.23
2)利用Matlab软件画出每次用车时长在0-150之间的直方图。
如图2所示。
编辑matlab程序
a=data;
b=a(:
1);
fori=2:
20
b=[b;a(:
i)];
end
fori=1:
size(b)
ifb(i)>150
b(i)=0;
end
end
hist(b,1000)
图2
3)验证图2中曲线的分布情况。
对于这种直方图,我们尝试用卡方分布,F分布,泊松分布来拟合,为了方便起见,编写matlab程序进行分析;程序见附件中程序1,检验结果都不予通过。
下面通过拟合曲线来看清分布情况
图3
注:
(1)拟合的指数方程为
(2)
为拟合优度,越接近1越好,以上拟合优度
=0.9412,效果良好。
5.2问题二
1)先统计出各天使用公共自行车的不同借车卡数量
见附件中的【附件4】
2)然后统计数据中每张出现过的借车卡累计借车次数
见附件中的【附件5】
3)进行数据处理后得出每张借车卡累计次数(见附件中【附件6】)
分布情况:
图4
每张借车卡累计借车次数的统计如附表1,利用excel画出其分布图像,如图4
经观察,图像分布接近指数分布图像,再利用excel进行拟合
得到
=0.9728,非常接近于1,(
为优度系数,越接近1,拟合程度越好)因此每张借车卡累计接车次数的分布较符合指数分布
其函数为
算得:
=1
因此,进一步证明了每张借车卡累计接车次数的分布与指数分布具有满意的一致性。
5.3.问题三
通过分析所有已给站点合计使用公共自行车次数,使用最大的一天为第20天
1)定义两站点之间的距离,找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
见附件中的【附件7】
由假设中路程与时间成