ImageVerifierCode 换一换
格式:DOCX , 页数:20 ,大小:145.33KB ,
资源ID:4362614      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4362614.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计回归01.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

统计回归01.docx

1、统计回归01习题一:江苏省各市经济发展水平的聚类分析 改革开放30年来,我国经济取得了很大的发展。但同时经济发展中也存在着很多问题,这些问题越来越成为我国经济持续发展的障碍。地区发展不平衡就是众多问题中的一个。发达城市都集中东部地区,广大中西部地区和农村地区长期处在不发达状态。地区发展的失衡使得我国经济难以取得全面的发展,造成的后果是我国经济总量和总体发展速度十分显著,但人均水平长期徘徊在世界的中下层次,大多数人口难以享受到改革的成果。另外,地区发展的失衡使得人口过度迅速地向少数发达城市集中,已经造成这些城市处于负荷运作,给这些城市的治安、环境和居住条件等带来了巨大的挑战,给城市居住和生活水平

2、造成严重的影响。也由于地区之间发展的失衡,使得各地区之间的经济难以形成一个顺畅的经济链,从而形成一个良性的经济发展循环体。要解决好这个问题,首要的问题是对全国范围内,各省市范围内的经济体进行分类,正确划分发达经济体和不发达经济体,进而制定出有针对性的经济政策。 对2007年江苏省的13个地市的国民经济进行了聚类分析,试探讨依据本文选取的若干主要经济指标进行的分类是否与传统上将江苏省划分为苏南、苏中和苏北三部分是否一致。结果供有关决策部门参考。 数据资料为了得出2007年江苏省的13个地市的国民经济分布规律,在众多衡量经济水平的指标中我们将采用下列指标:年末户籍人口(万人):城镇化率(%):地区

3、生产总值GDP(亿元):第三产业占GDP的比重 (%):城镇固定资产投资额(亿元):社会消费品零售总额(亿元):城市居民人均可支配收入(元):恩格尔系数(城市)(%):农村居民人均纯收入(元):恩格尔系数(农村)(%)下面的表格是2007年江苏省各市国民经济主要指标值。地 区苏州624.4365.65700.857.41704.271250.052126037.91047535.7无锡461.7467.43858.549.11180.741134.752089839.81002637.6常州357.3860.91881.2818.6748.89610.851908935.0903338.0南京

4、617.1776.83283.7311.01443.401380.462031735.3802037.4镇江268.7859.61206.6924.5363.73331.361677538.7766839.4南通766.1348.62111.8835.1633.94736.541645138.5690537.9扬州459.2550.21311.8935.3438.35418.901505737.9658638.9泰州500.7047.61201.8233.2347.73321.071494043.1646938.1徐州940.9545.81679.5636.0769.59543.0114875

5、34.9553439.0连云港482.2340.5618.1836.2409.56249.081325438.9482843.7淮安534.0039.9765.2334.8394.91269.401216438.9501043.2盐城809.7943.71371.2634.1470.06433.741385738.5609241.7宿迁531.5334.1542.0032.0256.18158.87946842.4478346.0解:方法同二题第一步,主成分分析,得到其特征值为:v = Columns 1 through 7 0.0005 0.0095 0.0139 0.0302 0.0669

6、 0.1544 0.4604 Columns 8 through 10 0.7776 1.4252 7.0613可见,占据70.61%,占据14.25%,占据7.78%因此,选择后三项做主成分,并进行模糊聚类。选取截集等于0.74,得到第一类:1 2 8 10 11 12 13降低为0.6,得到第二类:3 5继续降低,得到第三类:4 6 7 9因此,对比发现,与题中的传统分类有一定的差距2.试根据附件一数据对全国35所城市进行分类,划分出一二三线城市群体。解:由于衡量指标有9种,过多不易聚类,所以,采用主成分分析,对9个指标挑选主要成分,再对主要成分进行聚类,可得一二三线城市的划分。分别对九个

7、指标进行主成分分析:1. 年末总人口数_市辖区2. 地区生产总值(GDP)_市辖区3. 客运总量_市辖区4. 货运总量5. 地方财政预算内收入_市辖区6. 固定资产投资总额_市辖区7. 城乡居民储蓄年末余额_市辖区8. 在岗职工平均人数_市辖区9. 在岗职工工资总额_市辖区得到特征向量:v = Columns 1 through 7 0.0071 0.0110 0.0303 0.0337 0.1021 0.2778 0.6845 Columns 8 through 9 0.9953 6.8582可见,第9、8、7个因素占据主导地位,且三者和在特征向量中的比重大于85%,因此后续的聚类以这三个为

8、准,对35个国家和地区进行以这三个指标为标准进行聚类。第二步,进行聚类分析以城乡居民储蓄年末余额_市辖区、在岗职工平均人数_市辖区、在岗职工工资总额_市辖区这三因素进行聚类,得到模糊相似矩阵以及模糊等价矩阵,见excel表格,并选取截集,当取0.6时,选择出1、10、23号。当取0.5时,选择出1、2、10、23三个城市,发现正好是:北京、天津、上海、广州这四座城市,同时该结果十分符合常识!并将此定为一线城市。继续降低截集,当取0.2时,选得1、2、6、7、9、10、11、21、23、24、27、28、31,发现,这13座城市除去一线城市后为6、7、9、11、21、24、27、28、31,二线

9、城市分别为:沈阳市、大连市、哈尔滨市、南京市、武汉市、深圳市、重庆市、成都市、西安市其余的22个城市定为三线城市,分别为:石家庄、太原市、呼和浩特、长春市、杭州市、宁波市、合肥市、福州市、厦门市、南昌市、济南市、青岛市与中国实际的一线二线城市对比发现,有些二线城市被列入三线的范围,究其原因有二:第一, 我们选取的截集过大,应该继续降低标准,使得更多额城市进入二线的系列第二, 我们所用以衡量一线二线城市的标准过于单一,应该从多个指标入手,诸如题中的GDP等指标3.试根据附件二探寻中国GDP与教育投入之间的关系解:显然为回归模型,自变量为3个(在校人数、教师人数、经费),因变量为1个(GDP),因

10、此,由于自变量并不多,只有那个,所以只要进行简单的回归分析就可,没必要进行主成分回归。回归结果见下:第一步:讨论“在校人数”对GDP的影响类似S型曲线,显然为非线性回归。选用多项式回归拟合结果:y = p1*x5 + p2*x4 +p3*x3 + p4*x2 +p5*x + p6 Coefficients: p1 = -2.0458e-08 p2 = 5.2307e-05 p3 = -0.049102 p4 = 20.393 p5 = -3386.4 p6 = 1.933e+05Norm of residuals = 17373第一步:讨论“教师人数”对GDP的影响过程同上:y = p1*x5

11、 + p2*x4 + p3*x3 + p4*x2 +p5*x + p6 Coefficients: p1 = -0.028429 p2 = 7.7764 p3 = -828.47 p4 = 42801 p5 = -1.0648e+06 p6 = 1.0183e+07Norm of residuals = 71169第一步:讨论“费用”对GDP的影响过程同样:y = p1*x4 + p2*x3 +p3*x2 + p4*x + p5 Coefficients: p1 = -1.7067e-10 p2 = 3.3182e-06 p3 = -0.022363 p4 = 70.382 p5 = -657

12、0.4Norm of residuals = 10653因此,都是正相关,且,拟合结果见上。如果,在三个因变量独立的前提下,可以将变量融合。如果不满足独立性,还需要使用主成分回归除去相关性,再进行回归,解法同上次作业,不重述。4.为了全面分析机械类行业各企业的经济效益,选择不个不同的利润指标,14个企业关于这八个指标的统计数据如下,试进行主成分分析企业标号净产值利润率(%)xi1固定资产利润率(%)xi2总产值利润率(%)xi3销售收入利润率(%)xi4产品成本利润率(%)xi5物耗利润率(%)xi6人均利润率(%)xi7流动资金利润率(%)xi8140.424.77.26.18.38.72.

13、44220.0225.012.711.211012.920.23.5429.1313.23.33.94.34.45.50.5783.6422.36.75.63.76.07.40.1767.3534.311.87.117.18.08.91.72627.5635.612.516.416.722.829.33.01726.6722.07.89.910.212.617.60.84710.6848.413.419.09.910.913.91.77217.8940.619.119.819.029.739.62.44935.81024.88.09.88.911.916.20.78913.71112.59.7

14、4.24.24.66.50.8743.9121.80.60.70.70.81.10.0561.01332.313.99.48.39.813.32.12617.11438.59.111.39.512.216.41.32711.6解:直接套用自己写过的代码:得到特征向量:v = Columns 1 through 7 0.0017 0.0303 0.0400 0.2465 0.3669 0.4594 0.9291 Column 85.9261因此主成分为最后两项:即“流动资金利润率”比重最大为74% “人均利润率”比重次之,为11.6% 此两项比重已经超过85%,因此,可以判断,这两项为主成分另附

15、:代码:第一题代码:主成分分析代码:n=13; %nm=10; %m%P=149.3 161.2 171.5 175.5 180.8 190.7 202.1 212.4 226.1 231.99 239.0;4.2 4.1 3.1 3.1 1.1 2.2 2.1 5.6 5.0 5.1 0.7;108.1 114.8 123.2 126.9 132.1 137.7 146.0 154.1 162.3 164.3 167.6;P=624.43 65.6 5700.85 7.4 1704.27 1250.05 21260 37.9 10475 35.7461.74 67.4 3858.54 9.1

16、 1180.74 1134.75 20898 39.8 10026 37.6357.38 60.9 1881.28 18.6 748.89 610.85 19089 35.0 9033 38.0617.17 76.8 3283.73 11.0 1443.40 1380.46 20317 35.3 8020 37.4268.78 59.6 1206.69 24.5 363.73 331.36 16775 38.7 7668 39.4766.13 48.6 2111.88 35.1 633.94 736.54 16451 38.5 6905 37.9459.25 50.2 1311.89 35.3

17、 438.35 418.90 15057 37.9 6586 38.9500.70 47.6 1201.82 33.2 347.73 321.07 14940 43.1 6469 38.1940.95 45.8 1679.56 36.0 769.59 543.01 14875 34.9 5534 39.0482.23 40.5 618.18 36.2 409.56 249.08 13254 38.9 4828 43.7534.00 39.9 765.23 34.8 394.91 269.40 12164 38.9 5010 43.2809.79 43.7 1371.26 34.1 470.06

18、 433.74 13857 38.5 6092 41.7531.53 34.1 542.00 32.0 256.18 158.87 9468 42.4 4783 46.0;%Y=15.9 16.4 19.0 19.1 18.8 20.4 22.7 26.5 28.1 27.6 26.3;%P=xlsread(C:UsersMrliDesktop1); %359 aver=mean(P,1);vari=std(P,0,1); %stdZ=;%Z(:,1)=(P(:,1)-aver(1)/vari(1); %ppt x*%Z(:,2)=(P(:,2)-aver(2)/vari(2);%Z(:,3)

19、=(P(:,3)-aver(3)/vari(3);for i=1:1:m Z(:,i)=(P(:,i)-aver(i)/vari(i);endZ;R=(Z*Z)/(n-1);D,V=eig(R)for i=1:1:m v(i)=V(i,i);endv%Z1=Z*D(:,3); %Z2=-1*Z*D(:,2); % %A=Z1;Z2;%Y1=(Y-mean(Y)/(std(Y);%b,bint,r,rint,stats=regress(Y1,A) %b,bint,r,rint,stats=regress(Y,P)聚类代码:clear all;%A=xlsread(C:UsersMrliDeskt

20、op1); % 3%A=xlsread(C:UsersMrliDesktop2); % 3 %B=xlsread(C:UsersMrliDesktop1); % 3%A(:,1)=B(:,7);%A(:,2)=B(:,8);%A(:,3)=B(:,9);%A; A=37.9 10475 35.739.8 10026 37.635.0 9033 38.035.3 8020 37.438.7 7668 39.438.5 6905 37.937.9 6586 38.943.1 6469 38.134.9 5534 39.038.9 4828 43.738.9 5010 43.238.5 6092 4

21、1.742.4 4783 46.0; % %M=13; %35N=3; %9%for i=1:1:N A(:,i)=(A(:,i)-min(A(:,i)/(max(A(:,i)-min(A(:,i);endlook_1=A;R=zeros(M,M);for i=1:1:M for j=1:1:M for k=1:1:N if i=j R(i,j)=R(i,j)+A(i,k)*A(j,k); end end endend R=R/max(max(R);for i=1:1:M R(i,i)=1;endR_xiangsi=R;%xlswrite(mohu_xiangsi.xls,R); %h=1;f

22、or n=1:1:N for i=1:1:M for j=1:1:M for m=1:1:M temp(h) = min(R(i,m),R(m,j); h=h+1; end R(i,j)=max(temp); h=1; end endendR_dengjai=R;%xlswrite(mohu_dengjia.xls,R); %la=0.703;%la=0.932;% la=0.7;%for i=1:1:M for j=1:1:M if R(i,j)la R(i,j)=1; else R(i,j)=0; end endendR;%xlswrite(distance1.xls,R); %recor

23、d=zeros(M,M);k=1;for i=1:1:M for j=1:1:M if R(i,j)=1 record(i,k)=j; k=k+1; end end k=1;end for i=1:1:M if record(1,i)=0 break end tidui_1(i)=record(1,i);endtidui_1%w =0.1007 0.2255 0.6738第二题代码:主成分分析代码:n=35; %nm=9; %mP=xlsread(C:UsersMrliDesktop2); aver=mean(P,1);vari=std(P,0,1); %stdZ=;%Z(:,1)=(P(:,

24、1)-aver(1)/vari(1); %ppt x*%Z(:,2)=(P(:,2)-aver(2)/vari(2);%Z(:,3)=(P(:,3)-aver(3)/vari(3);for i=1:1:m Z(:,i)=(P(:,i)-aver(i)/vari(i);endZ;R=(Z*Z)/(n-1);D,V=eig(R)for i=1:1:m v(i)=V(i,i);endv%Z1=Z*D(:,3); %Z2=-1*Z*D(:,2); % %A=Z1;Z2;%Y1=(Y-mean(Y)/(std(Y);%b,bint,r,rint,stats=regress(Y1,A) %b,bint,r

25、,rint,stats=regress(Y,P)(聚类代码:)clear all;%A=xlsread(C:UsersMrliDesktop1); % 3%A=xlsread(C:UsersMrliDesktop2); % 3B=xlsread(C:UsersMrliDesktop2); % 3A(:,1)=B(:,7);A(:,2)=B(:,8);A(:,3)=B(:,9);A;M=35; %35N=3; %9%for i=1:1:N A(:,i)=(A(:,i)-min(A(:,i)/(max(A(:,i)-min(A(:,i);endlook_1=A;R=zeros(M,M);for i

26、=1:1:M for j=1:1:M for k=1:1:N if i=j R(i,j)=R(i,j)+A(i,k)*A(j,k); end end endend R=R/max(max(R);for i=1:1:M R(i,i)=1;endR_xiangsi=R;%xlswrite(mohu_xiangsi.xls,R); %h=1;for n=1:1:N for i=1:1:M for j=1:1:M for m=1:1:M temp(h) = min(R(i,m),R(m,j); h=h+1; end R(i,j)=max(temp); h=1; end endendR_dengjai=R;%xlswrite(mohu_dengjia.xls,R); %la=0.703;%la=0.932;% la=0.5;%for i=1:1:

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1