统计软件及应用实验报告模板.docx
《统计软件及应用实验报告模板.docx》由会员分享,可在线阅读,更多相关《统计软件及应用实验报告模板.docx(39页珍藏版)》请在冰豆网上搜索。
统计软件及应用实验报告模板
关于实验报告提交的说明
下面8个实验报告每位同学都要交电子稿,全部实验课上完之后一周之内,每位同学建立一个实验报告文件夹,以自己的班级学号姓名命名,压缩之后发我电子邮箱lixiaohui235@
实验报告打印稿上交作如下要求:
1班单号提交“参数检验”、和“回归分析”两个实验报告;
1班双号提交“基本统计分析”和“非参数检验”两个实验报告;
2班单号提交“方差分析”和“聚类分析”两个实验报告;
2班双号提交“相关分析”和“因子分析”两个实验报告。
南昌航空大学经济管理学院学生实验报告
实验课程名称:
统计软件及应用
专业
市场营销
班级学号
10095211
姓名
曾立芳
成绩
实验地点
G805
实验性质:
演示性验证性综合性设计性
实验项目
名称
基本统计分析(交叉分组下的频数分析)
指导
教师
李晓辉
一、实验目的
掌握利用SPSS软件进行基本统计量均值与均值标准误、中位数、众数、全距、方差和标准差、四分位数、十分位数和百分位数、频数、峰度、偏度的计算,进行标准化Z分数及其线形转换,统计表、统计图的显示。
二、实验内容及步骤(包括实验案例及基本操作步骤)
案例4-5利用第二章案例2-1的住房状况问卷调查数据,分析本市户口和外地户口家庭对“未来三年是否打算买房”是否持相同态度
SPSS交叉分组下频数分析的基本操作步骤:
(1)选择菜单:
【Analyze】→【DescriptiveStatistics】→【Crosstabs】
(2)选择行变量“户口状况”到【Row(s)】框中,选择列变量“未来三年”到【Column(s)】中
(3)选择【Displayclusteredbarcharts】选项
(4)cell按钮指定列联表单元格中的输出内容。
Spass默认列联表单元格中只输出观测数【Observed】。
为方便分析,通常还应指定输出【Percentages】框中的百分比【Row】、列百分比【Column】、总百分比【Total】。
【Counts】框中的【Expected】表示输出期望频数;【Residuals】框中的各个选项是在各单元格中输出观测数与期望聘书的差。
其中,【Unstandardized】为非标准化剩余,定义为“观测聘书-期望频数”;【Standardized】为标准化剩余
(5)Format按钮指定列联表个单元格的输出排列顺序。
【Ascending】表示已行变量取值的升序排列,是Spass的默认项;【Descending】表示以行变量取值的降序排列
(6)Statistics按钮指定用哪种方法分析行变量和列变量间的关系
三、包括SPSS输出结果及解释分析
[DataSet2] D:
\人大版SPSS教材数据\住房状况调查.sav
CaseProcessingSummary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
户口状况*未来三年
2880
96.2%
113
3.8%
2993
100.0%
户口状况*未来三年Crosstabulation
未来三年
Total
不买
购买
户口状况
本市户口
Count
2052
660
2712
ExpectedCount
2034.9
677.1
2712.0
%within户口状况
75.7%
24.3%
100.0%
%within未来三年
95.0%
91.8%
94.2%
%ofTotal
71.2%
22.9%
94.2%
Residual
17.1
-17.1
Std.Residual
.4
-.7
外地户口
Count
109
59
168
ExpectedCount
126.1
41.9
168.0
%within户口状况
64.9%
35.1%
100.0%
%within未来三年
5.0%
8.2%
5.8%
%ofTotal
3.8%
2.0%
5.8%
Residual
-17.1
17.1
Std.Residual
-1.5
2.6
Total
Count
2161
719
2880
ExpectedCount
2161.0
719.0
2880.0
%within户口状况
75.0%
25.0%
100.0%
%within未来三年
100.0%
100.0%
100.0%
%ofTotal
75.0%
25.0%
100.0%
在所调查的2880个样本中2712为本市户口,168户为外地户口,分别占总样本的94.2%和5.8%,;未来三年不打算买房、打算买房的样本量分别为2161和719,各占中样本的75%和25%,不打算买房的占较大比例。
其次,对不同户口状况进行分析。
在本市户口中,未来三年不打算买房和打算买房的样本量分别为2052和660,个占样本的75.7%和24.3%,不打算买房的仍占较大比例,但打算买房的比例低于中体比例(25%);在外地户口(168)中,未来三年不打算买房和打算买房的样本量分别为109和59,各占总样本(168)的64.9%和35.1%,未来三年不打算买房的仍占比较大比例,但打算买房的比例高于总体比例(25%)
Chi-SquareTests
Value
df
Asymp.Sig.(2-sided)
ExactSig.(2-sided)
ExactSig.(1-sided)
PearsonChi-Square
9.819a
1
.002
ContinuityCorrectionb
9.252
1
.002
LikelihoodRatio
9.148
1
.002
Fisher'sExactTest
.002
.002
Linear-by-LinearAssociation
9.816
1
.002
NofValidCasesb
2880
a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis41.94.
b.Computedonlyfora2x2table
对不同看法进行分析。
在未来三年不打算买房的样本(2161)中,本市户口和外地户口的家庭数是2052和109,分别占总样本(2161)的95%和5%,比例相差较为悬殊;在未来打算买房的样本中,本市户口和外地户口的家庭数分别是660和59,分别占总样本的91.8%和8.2%,比例相差比较悬殊,因此这里的分析师存在一定的问题的。
根据上述卡方检验的基本不走和决策方式可知,本检验的原假设是:
本市户口和外地户口家庭对未来三年是否买房的看法是一致的。
如果显著水平设为0.05,由于卡方的概率值小于显著性水平值,因此应拒绝原假设,认为本市户口和外地户口家庭对未来三年是否打算买房的看法不一致。
南昌航空大学经济管理学院学生实验报告
实验课程名称:
统计软件及应用
专业
市场营销
班级学号
10095211
姓名
曾立芳
成绩
实验地点
G805
实验性质:
演示性验证性综合性设计性
实验项目
名称
参数检验(两独立样本T检验)
指导
教师
李晓辉
一、实验目的
掌握利用SPSS进行单样本T检验、两独立样本T检验和两配对样本T检验的基本方法,并能够解释软件运行结果。
二、实验内容及步骤(包括实验案例及基本操作步骤)
案例5-3利用案例2-1的住房问卷调查数据,推断本书户口总体和外地户口总体的家庭人均住房面积的平均值是否有显著的差异,具体数据在可供下载的压缩包中,文件名为“住房状况调查。
sav”
三、实验结论(包括SPSS输出结果及分析解释)
[DataSet3] D:
\人大版SPSS教材数据\住房状况调查.sav
GroupStatistics
户口状况
N
Mean
Std.Deviation
Std.ErrorMean
人均面积
本市户口
2825
21.7258
12.17539
.22907
外地户口
168
26.7165
18.96748
1.46337
IndependentSamplesTest
Levene'sTestforEqualityofVariances
t-testforEqualityofMeans
F
Sig.
t
df
Sig.(2-tailed)
MeanDifference
Std.ErrorDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
人均面积
Equalvariancesassumed
65.469
.000
-4.968
2991
.000
-4.99069
1.00466
-6.96057
-3.02080
Equalvariancesnotassumed
-3.369
175.278
.001
-4.99069
1.48119
-7.91396
-2.06742
由第一幅图可以看出,本市户口和外地户口的家庭人均住房面积的样本平均值有一定的差距。
通过检验应退出这种差异是由抽样误差造成的还是系统性的
有第二幅图是本地户口和外事户口家庭人均住房面积的均值的检验结果。
分析结论应通过两步完成:
第一步,两总体方差是否相等的F值得检验。
这里,该检验的F统计量的观察值为65.469,对应的概率值为0.00。
如果显著性水平a为0.05,由于概率P4小于0.05,可以认为量总体的方差有显著差异。
第二步,两总体均值的检验。
在第一步中,由于两总体方差有显著的差异,因此应看第三列t检验的结果。
其中,t统计量的观测值为-3.369,对应的双未开率P值为0.001。
如果显著性水平a为0.05,由于概率P值小于0.05,可以认为两总体的均值有显著差异,即本市户口和外地户口的家庭人均住房的平均面积存在显著差异
南昌航空大学经济管理学院学生实验报告
实验课程名称:
统计软件及应用
专业
市场营销
班级学号
10095211
姓名
曾立芳
成绩
实验地点
G805
实验性质:
演示性验证性综合性设计性
实验项目
名称
方差分析(多因素方差分析)
指导
教师
李晓辉
一、实验目的
掌握利用SPSS进行单因素方差分析、多因素方差分析的基本方法,并能够解释软件运行结果。
二、实验内容及步骤(包括实验案例及基本操作步骤)
案例6-3某企业在指定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的销售额数据,希望对广告形式、地区以及广告形式和地区的交互作用是否对商品销售额产生影响进行分析。
具体数据在可供下载的压缩包中,文件名为“广告地区与销售额”,
案例6-4,在案例6-3中,一度广告形式、地区对销售额的影响进行了多因素分析,建立了饱和模型。
三、实验结论(包括SPSS输出结果及分析解释)
Between-SubjectsFactors
ValueLabel
N
广告形式
1
报纸
36
2
广播
36
3
宣传品
36
4
体验
36
地区
1
8
2
8
3
8
4
8
5
8
6
8
7
8
8
8
9
8
10
8
11
8
12
8
13
8
14
8
15
8
16
8
17
8
18
8
TestsofBetween-SubjectsEffects
DependentVariable:
销售额
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
20094.306a
71
283.018
3.354
.000
642936.694
1
642936.694
7.620E3
.000
x1
5866.083
3
1955.361
23.175
.000
x2
9265.306
17
545.018
6.459
.000
x1*x2
4962.917
51
97.312
1.153
.286
Error
6075.000
72
84.375
Total
669106.000
144
CorrectedTotal
26169.306
143
a.RSquared=.768(AdjustedRSquared=.539)
有图可知:
观测变量的总变量差SST为26169.306,他被分解为四个部分,分别时:
有广告形式不同引起的变差(5866.083),由地区差异引起的变差(9265.306),由广告形式和地区交互作用引起的变差(4962.917),有随机因素引起的变差(error6075.000)。
这些变差除以各自的自由度后,得到各自的方差,并可计算出各F检验统计量的观测值和在一定自由度下的概率P值,因为Fx1、Fx2、Fx1*x2的概率P值分别为0.00,0.00,0.286.如果显著性水平a为0.05,由于,Fx1,Fx2的概率P值小于显著性水平a,所以应拒绝原假设,可认为不同广告形式、地区下的销售额总体均值存在显著性差异,对销售额的效应不同时为0,各自不同的水平给销售额带来显著影响。
.6-4
ContrastResults(KMatrix)
广告形式DeviationContrasta
DependentVariable
销售额
Level1vs.Mean
ContrastEstimate
6.403
HypothesizedValue
0
Difference(Estimate-Hypothesized)
6.403
Std.Error
1.367
Sig.
.000
95%ConfidenceIntervalforDifference
LowerBound
3.696
UpperBound
9.109
Level2vs.Mean
ContrastEstimate
4.069
HypothesizedValue
0
Difference(Estimate-Hypothesized)
4.069
Std.Error
1.367
Sig.
.004
95%ConfidenceIntervalforDifference
LowerBound
1.363
UpperBound
6.776
Level3vs.Mean
ContrastEstimate
-10.264
HypothesizedValue
0
Difference(Estimate-Hypothesized)
-10.264
Std.Error
1.367
Sig.
.000
95%ConfidenceIntervalforDifference
LowerBound
-12.970
UpperBound
-7.557
a.Omittedcategory=4
上图分别显示了广告形式前三个水平下销售额总体的均值检验结果,省略了第四水平的检验结果,检验值各水下的总体均值。
可以看出:
第一种广告形式下的销售额的均值与检验值的差为6.403,标准误差为1.367,t检验统计量的概率P值为0.000,差值的95%置信区间的下限和上线分别为3.696和9.109.分析结论是第一种广告形式下的销售额的均值与检验值间存在显著差异,其明显高于总体水平。
同理,第二种广告形式下的销售额却明显低于总体水平。
三种广告形式产生的效果有显著差异
TestResults
DependentVariable:
销售额
Source
SumofSquares
df
MeanSquare
F
Sig.
Contrast
5866.083
3
1955.361
21.789
.000
Error
11037.917
123
89.739
Post Hoc Tests
广告形式
MultipleComparisons
销售额
LSD
(I)广告形式
(J)广告形式
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
报纸
广播
2.3333
2.23283
.298
-2.0864
6.7531
宣传品
16.6667*
2.23283
.000
12.2469
21.0864
体验
6.6111*
2.23283
.004
2.1914
11.0309
广播
报纸
-2.3333
2.23283
.298
-6.7531
2.0864
宣传品
14.3333*
2.23283
.000
9.9136
18.7531
体验
4.2778
2.23283
.058
-.1420
8.6975
宣传品
报纸
-16.6667*
2.23283
.000
-21.0864
-12.2469
广播
-14.3333*
2.23283
.000
-18.7531
-9.9136
体验
-10.0556*
2.23283
.000
-14.4753
-5.6358
体验
报纸
-6.6111*
2.23283
.004
-11.0309
-2.1914
广播
-4.2778
2.23283
.058
-8.6975
.1420
宣传品
10.0556*
2.23283
.000
5.6358
14.4753
Basedonobservedmeans.
TheerrortermisMeanSquare(Error)=89.739.
*.Themeandifferenceissignificantatthe0.05level.
Profile Plots
南昌航空大学经济管理学院学生实验报告
实验课程名称:
统计软件及应用
专业
市场营销
班级学号
10095211
姓名
曾立芳
成绩
实验地点
G805
实验性质:
演示性验证性综合性设计性
实验项目
名称
非参数检验(单样本非参数检验)
指导
教师
李晓辉
一、实验目的
掌握利用SPSS软件进行非参数检验的基本方法。
包括卡方(Chi-Square)检验;二项分布(Binomial)检验;游程(Runs)检验;单样本(l-Sample)K-S检验;2个独立样本(2IndependentSamples)检验;K个独立样本(KIndependentSamples)检验;2个相关样本(2RelatedSamples)检验;K个相关样本(KRelatedSamples)检验。
二、实验内容及步骤(包括实验案例及基本操作步骤)
案例7-1医学家在研究心脏病人猝死人数与日期的关系时发现:
一周之中,星期一心脏病人猝死比较多,其他日子则基本相当。
各天的比例近似为2.8:
1:
1:
1:
1:
1:
1.先收集到心脏病人死亡日期的样本数据,推断其总分布是否与上述理论相合。
具体数据在可供下载的压缩包中,文件名为“心脏病猝死”
三、实验结论(包括SPSS输出结果及分析解释)
死亡日期
ObservedN
ExpectedN
Residual
1
55
53.5
1.5
2
23
19.1
3.9
3
18
19.1
-1.1
4
11
19.1
-8.1
5
26
19.1
6.9
6
20
19.1
.9
7
15
19.1
-4.1
Total
168
由图可知,168个观察数据中,星期一至星期日实际死亡人数分别为55,23,18,11,26,20,15人;按照理论分布,168人在一周隔天的死亡的期望频数应为53.5,19.1,19.1,19.1,19.1,19.1,19.1;实际观察频数与期望频数的差分别为1.5,3.9,-1.1,-8.1,6.9,0.9,-4.1.
TestStatistics
死亡日期
Chi-Square
7.757a
df
6
Asymp.Sig.
.256
a.0cells(.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis19.1.
上表是计算的卡方统计量以及对应的概率P值。
如果显著性水平a是0.05,由于概率P值大于a,表示实际分布与理论分布无显著差异,即心脏病人猝死人数与日期的关系基本是2.8:
1:
1:
1:
1:
1:
1。
南昌航空大学经济管理学院学生实验报告
实验课程名称:
统计软件及应用
专业
市场营销
班级学号
10095211
姓名
曾立芳
成绩
实验地点
G805
实验性质:
演示性验证性综合性设计性
实验项目
名称
相关分析
指导
教师
李晓辉
一、实验目的
掌握利用SPSS软件进行相关分析的基本方法,包括简单相关分析、偏相关分析和其它相关系数的计算。
二、实验内容及步骤(包括实验案例及基本操作步骤)
案例8-1利用第二章案例2-1的住房状况问卷调查数据,分析家庭收入与购买的住房面积之间存在怎样的统计关系。
具体数据在可供下载的压缩包中,文件名为“住房状况调查”
三、实验结论(包括SPSS输出结果及分,析解释)
计算相关系数的应用举例:
:
\人大版SPSS教材数据\住房