时间序列分析实验报告1.docx
《时间序列分析实验报告1.docx》由会员分享,可在线阅读,更多相关《时间序列分析实验报告1.docx(18页珍藏版)》请在冰豆网上搜索。
时间序列分析实验报告1
《时间序列分析》
课程实验报告
项目名称:
数据集建立&时间序列的预处理
组员姓名:
李菲
指导教师:
牛宪华
完成日期:
201年3月16日
练习题:
1.Input语句数据输入格式有:
列表方式或自由格式、列方式、格式化方式、命名方式,分别给出程序例子和运行结果,并分析运行结果。
(1)自由格式
datalianxi1_1;
inputname$sex$age@@;
cards;
nawÄÐ22ejniwÅ®23dhf
ÄÐ23husiÅ®21huhÅ®24
;
procprintdata=lianxi1_1;
run;
(2)列方式
datalianxi1_2;
inputname$2-5sex$6-8age9-12;
cards;
nawÄÐ22
ejniwŮ23
dhfÄÐ23
husiŮ21
huhŮ24
;
procprintdata=lianxi1_2;
run;
(3)格式化方式
datalianxi1_3;
inputname$5.sex$age2.;
cards;
nawÄÐ22
ejniwŮ23
dhfÄÐ23
husiŮ21
huhŮ24
;
procprintdata=lianxi1_3;
run;
(4)命名方式
datalianxi1_4;
Inputidname=$age=;
Cards;
200012name=marryage=15
200015age=16name=join
200011age=16name=smith
;
procprintdata=lianxi1_4;
run;
分析:
由以上结果及程序可知,自由方式的input后必须加“@@”表示连续输入,而下面的数据可以随意排列;列方式中每个列名后必须加这个列是下面数据的第几个字节到第几个字节,并且输入的数据要对应整齐;格式化方式中在列名后加“数字.”表示这个列取到第几位(数字表示位数),输入的数据也要一行一行对齐不能多加几列上去;而命名方式在列名后要加“=”,并且在输入数据时要把对应的数据都写成“列名=数据”的形式,输入时可以与自由方式一样进行输入,不一定要整齐。
2.下面已给出相应的数据步,请分别对数据集sample进行如下操作:
(1)使用sort过程,按照x变量进行降序排列,并输出查看结果;
(2)使用print过程中的by、pageby、sumby语句,查看输出结果,并分析by、pageby、sumby语句的含义。
datasample2;
inputxyz@@;
cards;
1111231789543424
55667143562
;
(1)排序
datasample2;
inputxyz@@;
cards;
1111231789543424
55667143562
;
procsortdata=sample2;
bydescendingx;
procprintdata=sample2;
run;
(2)
by语句
datasample2;
inputxyz@@;
cards;
1111231789543424
55667143562
;
procsortdata=sample2;
byx;
procprintdata=sample2;
byx;
run;
分析:
by语句就是针对不同的x对y、z进行分组。
例如x=1时,y、z有4组。
pageby语句
datasample2;
inputxyz@@;
cards;
1111231789543424
55667143562
;
procsortdata=sample2;
byx;
procprintdata=sample2;
byx;pagebyx;
run;
分析:
pageby语句需要和by语句一起使用,他就是将by进行的分组再分页表示出来。
sumby语句
datasample2;
inputxyz@@;
cards;
1111231789543424
55667143562
;
procsortdata=sample2;
byx;
procprintdata=sample2;
byx;sumbyx;
run;
分析:
sumby语句和by语句一起使用就是在by语句的基础上把每组的y、z的和求出来,如x=1时的结果,而下面的因为每组只有一组数据所以就省略的求和的结果,在最下名时也求出了所有y、z的和。
实训题:
一、在D盘根目录下使用自己学号后三位定义一个SAS库标记,并在此库下用DATA步把下列数据创建成一个student数据集,再按身高降序输出。
结果要求:
1.完整程序;
2.给出新定义的SAS库的截图;
3.给出排序后student数据集的输出结果。
Name
Age
Sex
Height(cm)
Weight(kg)
Mike
23
Male
170
62
Alice
21
Female
161
48
James
21
Male
180
80
Katie
22
Female
157
50
Susan
20
Female
168
55
Tim
22
Male
175
75
二、已知某公司2003-2005年computer和MP3销量如下表所示,对数据做如下操作:
1.为上述数据建立一个临时SAS数据集company;
2.分别创建产品com和P3的SAS数据集,计算3年间computer和MP3各自的总销量,并输出该结果;
结果要求:
1.完整程序;2.给出第二问的输出结果。
year
product
sale
2003
computer
2000
2003
mp3
1400
2004
computer
1400
2004
mp3
1300
2005
computer
1600
2005
mp3
2200
1、
程序:
libname_102'D:
\';
data_102.student;
inputname$agesex$heightweight;
cards;
Mike23male17062
Alice21female16148
James21male18080
Katie22female15750
Susan20female16855
Tim22male17575
;
procsortdata=_102.student;
bydescendingheight;
procprintdata=_102.student;
run;
输出结果:
2、
程序:
datacompany;
inputyearpruduct$sale;
cards;
2003computer2000
2003mp31400
2004computer1400
2004mp31300
2005computer1600
2005mp32200
;
datacom;
setcompany;
wherepruduct='computer';
datap3;
setcompany;
wherepruduct='mp3';
procprintdata=com;
sumsale;
procprintdata=p3;
sumsale;
run;
输出结果:
3、下图分别为间隔函数intnx('month','01jan2005'd,_n_k)中k取-2、-1、0、1、2时的结果图:
分析:
由上图可知k的取值代表开始的观测指针,-1代表当前参展时间开始,-2时是当前时间向前,0、1、2表示从-1的时间依次向后一个时间作为开始值。
P34页:
习题3、
程序:
dataxiti3;
inputrain@@;
month=intnx('month','1jan1945'd,_n_-1);
formatmonthdate.;
cards;
69.380.040.974.984.6101.1225.095.3100.648.3144.5128.3
38.452.368.637.1148.6218.7131.6112.881.831.047.570.1
96.861.555.6171.7220.5119.463.2181.673.964.8166.948.0
137.780.5105.289.9174.8124.086.4136.931.535.3112.3143.0
160.897.080.562.5158.27.6165.9106.792.263.226.277.0
52.3105.4144.349.5116.154.1148.6159.385.367.3112.859.4
;
procarimadata=xiti3;
identifyvar=rain;
run;
运行结果:
分析:
由上图分析后可知该序列的自相关系数一直都比较小,始终控制在2倍的标准差范围内,基本可以认为该序列自始至终都在零轴附近波动,故该序列为平稳时间序列。
分析:
由上图可知当延迟阶数为18时p值为0.1352,大于显著性水平0.05,接受原假设,即该序列为纯随机性序列。
习题5、
程序:
dataxiti5;
inputsale@@;
month=intnx('month','1jan2000'd,_n_-1);
formatmonthdate.;
cards;
1531872342123002212011751231048578
1341752432272982562371651241068774
145203189214295220231174119856775
117178149178248202162135120969063
;
procgplotdata=xiti5;
plotsale*month=1;
symbolc=redv=stari=spline;
procarimadata=xiti5;
identifyvar=sale;
run;
输出结果:
分析:
由该序列的时序图可知该序列具有明显的周期性,其一年为周期,且每年基本无递增或递减趋势,故该序列不是平稳序列。
分析:
由上图分析可知,该序列的自相关系数开始从1减到0再到负轴直至接近于-1再慢慢向正轴的1靠近,具有明显的周期性,故该序列为非平稳序列。
和时序图的变化基本是吻合的。
分析:
由上图可知p值均小于0.0001,故也小于显著性水平0.05,即拒绝原假设,故该序列为非白噪声序列,即为非纯随机性序列。