数据分析报告.docx
《数据分析报告.docx》由会员分享,可在线阅读,更多相关《数据分析报告.docx(21页珍藏版)》请在冰豆网上搜索。
![数据分析报告.docx](https://file1.bdocx.com/fileroot1/2022-12/7/6fec508c-ac4c-4c4a-9e26-6ca830e9f671/6fec508c-ac4c-4c4a-9e26-6ca830e9f6711.gif)
数据分析报告
数据分析报告
--------关于安徽大学大学生虚荣心的调查
报告人:
付平君李悦
2007年6月18日星期一
一,预试问卷的检验
1.预试问卷项目:
性别、是否独生子女、家庭住址、衣服数量、衣服选择、穿新衣服、衣服价格、生日礼物、礼物选择、交往朋友、话题、老师联系、高档商品、首饰挂件、买东西、朋友家庭背景、朋友装束、穿衣服、发型、减肥、希望自己被认识、希望被崇拜、希望担任领导、希望朋友好看、毕业选择去向、毕业选择工作。
2.预试样本:
榴园社会学系女生。
3.规模:
20
4.信度检验:
α系数=0.679。
5.结论:
(1)态度性问题删除,以保持整张问卷题目的一致性。
(2)选项统一为李克特量表形式。
(3)衣服选择、生日礼物、礼物选择、话题、首饰挂件、买东西、朋友家庭背景这些项目删除,分辨率不高。
(4)个别项目改换形式问答,老师联系分为联系个数和频率两个题目。
6.正式问卷项目:
性别、是否独生子女、家庭住址、衣服数量、新衣服、衣服价格、朋友交往、老师交往数量、老师交往频率、生日礼物、庆祝生日、吃饭付帐、朋友装束、穿衣服、发型、减肥、买礼物、买东西、领导。
二,抽样方法
1,总体:
安徽大学罄苑校区大一、大二、大三的全体本科生
2,抽样单位:
单个的大学生
3,样本框:
桂园1号:
1-5层47个寝室
6层42个寝室
槐园1号:
1-5层22个寝室
6层17个寝室
槐园2号:
1-5层42个寝室
6层37个寝室
枣园1号:
1-5层38个寝室
6层33个寝室
枣园2号:
1-5层22个寝室
6层17个寝室
杏园1号:
1-5层26个寝室
6层21个寝室
杏园2号:
1-3层35个寝室
4-5层38个寝室
6层31个寝室
竹园1号:
1-5层42个寝室
6层37个寝室
松园1号:
1-5层26个寝室
6层21个寝室
枫园2号:
1-5层47个寝室
6层42个寝室
榴园1号:
1-5层34个寝室
6层29个寝室
榴园2号:
1-5层51个寝室
6层46个寝室
梅园1号:
1-5层29个寝室
6层24个寝室
梅园2号:
1-5层34个寝室
6层29个寝室
梅园3号:
1-5层26个寝室
6层21个寝室
以上寝室的学生名单就是这次抽样的样本框
4,样本规模:
n=180。
包括108位男生和72位女生
5,抽样方法:
第一阶段:
采用简单随机抽样方法抽取楼:
样本框
男生宿舍楼
女生宿舍楼
序号
宿舍楼
抽中
序号
宿舍楼
抽中
1
桂园1号
是
12
枫园1号
2
槐园1号
是
13
枫园2号
是
3
槐园2号
是
14
榴园1号
是
4
枣园1号
是
15
榴园2号
是
5
枣园2号
是
16
梅园1号
是
6
杏园1号
是
17
梅园2号
是
7
杏园2号
是
18
梅园3号
是
8
竹园1号
是
9
竹园2号
10
松园1号
是
11
松园2号
第二阶段:
采用简单随机抽样抽取楼层
被抽中的楼
男生楼:
桂园1号,槐园1号,槐园2号,枣园1号,枣园2号,杏园1号,杏园2号,竹园1号,松园1号;女生楼:
枫园2号,榴园1号,榴园2号,梅园1号,梅园2号,梅园2号
序号
楼层
抽中
1
所有楼的1层
2
所有楼的二层
是
3
所有楼的三层
是
4
所有楼的四层
是
5
所有楼的五层
是
6
所有楼的六层
第三阶段:
采用等距抽样方法抽取寝室。
1,桂园1号楼,2,3,4,5每层均有47个寝室。
每层楼抽取3个寝室,因此抽样间距为15。
先从1-10中抽取一个数字,抽到的是6。
因此抽取的桂园1号楼的寝室号码为:
1206,1221,1236,1306,1321,1336,1403,1421,1436,1506,1521,1536。
2,槐园1号楼,2,3,4,5每层均有22个寝室。
每层楼抽取3个寝室,因此抽样间距为7。
先从1-10中抽取一个数字,抽到的是7。
因此抽取的槐园1号楼的寝室号码为1207,1214,1221,1307,1314,1321,1407,1414,1421,1507,1514,1521。
3,槐园2号楼,2,3,4,5每层均有42个寝室。
每层楼抽取3个寝室,因此抽样间距为14。
先从1-10中抽取一个数字,抽到的是9。
因此抽取的槐园2号楼的寝室号码为2209,2223,2237,2309,2323,2337,2409,2423,2437,2509,2523,2537。
4,枣园1号楼,2,3,4,5每层均有38个寝室。
每层楼抽取3个寝室,因此抽样间距为12。
先从1-10中抽取一个数字,抽到的是4。
因此抽取的枣园1号楼的寝室号码为1204,1216,1228,1304,1316,1328,1404,1416,1428,1504,1516,1528。
5,枣园2号楼,2,3,4,5每层均有22个寝室。
每层楼抽取3个寝室,因此抽样间距为7。
先从1-10中抽取一个数字,抽到的是5。
因此抽取的枣园2号楼的寝室号码为2205,2212,2219,2305,2312,2319,2405,2412,2419,2505,2512,2519。
6,杏园1号楼,2,3,4,5每层均有26个寝室。
每层楼抽取3个寝室,因此抽样间距为8。
先从1-10中抽取一个数字,抽到的是7。
因此抽取的杏园1号楼的寝室号码为1207,1215,1223,1307,1312,1323,1407,1412,1423,1507,1512,1523。
7,杏园2号楼,2,3每层均有35个寝室。
每层抽取3个寝室,因此抽样间距为11。
先从1-10中抽取一个数字,抽到的是10。
4,5每层均有38个寝室。
每层楼抽取3个寝室,因此抽样间距为12。
从1-10中抽取一个数字,抽到的是8。
因此抽取的杏园2号楼的寝室号码为:
2210,2221,2232,2310,2321,2332,2408,2420,2432,2508,2520,2532。
8,竹园1号楼,2,3,4,5每层均有42个寝室。
每层楼抽取3个寝室,因此抽样间距为14。
先从1-10中抽取一个数字,抽到的是5。
因此抽取的竹园1号楼的寝室号码为1205,1219,1233,1305,1319,1333,1405,1419,1433,1505,1519,1533。
9,松园1号楼,2,3,4,5每层均有26个寝室。
每层楼抽取3个寝室,因此抽样间距为8。
先从1-10中抽取一个数字,抽到的是1。
因此抽取的松园1号楼的寝室号码为1201,1209,1217,1301,1309,1317,1401,1409,1417,1501,1509,1517。
10,枫园2号楼,2,3,4,5每层均有47个寝室。
每层楼抽取3个寝室,因此抽样间距为15。
先从1-10中抽取一个数字,抽到的是3。
因此抽取的枫园2号楼的寝室号码为:
2203,2218,2233,2303,2318,2333,2403,2418,2433,2503,2518,2533。
11,榴园1号楼,2,3,4,5每层均有34个寝室。
每层楼抽取3个寝室,因此抽样间距为11。
先从1-10中抽取一个数字,抽到的是2。
因此抽取的榴园1号楼的寝室号码为:
1202,1213,1224,1302,1313,1324,1402,1413,1424,1502,1513,1524。
12,榴园2号楼,2,3,4,5每层均有51个寝室。
每层楼抽取3个寝室,因此抽样间距为17。
先从1-10中抽取一个数字,抽到的是6。
因此抽取的榴园2号楼的寝室号码为:
2206,2223,2240,2306,2323,2340,2406,2423,2440,2506,2523,2540。
13,梅园1号楼,2,3,4,5每层均有29个寝室。
每层楼抽取3个寝室,因此抽样间距为9。
先从1-10中抽取一个数字,抽到的是4。
因此抽取的梅园1号楼的寝室号码为1204,1213,1222,1304,1313,1322,1404,1413,1422,1504,1513,1522
14,梅园2号楼,2,3,4,5每层均有34个寝室。
每层楼抽取3个寝室,因此抽样间距为11。
先从1-10中抽取一个数字,抽到的是5。
因此抽取的梅园2号楼的寝室号码为2205,2216,2227,2305,2316,2327,2405,2416,2427,2505,2516,2527
15,梅园3号楼,2,3,4,5每层均有26个寝室。
每层楼抽取3个寝室,因此抽样间距为8。
先从1-10中抽取一个数字,抽到的是7。
因此抽取的梅园3号楼的寝室号码为3207,3215,3223,3307,3315,3323,3407,3415,3423,3507,3515,3523。
第四阶段:
采用简单随机抽样抽取个体
采用简单随机抽样,抽取的是2号床。
6,抽样清单。
序号
园
楼号
寝室
床位
审核
001
桂园
1
1206
2
合格
002
桂园
1
1221
2
合格
003
桂园
1
1236
2
合格
004
桂园
1
1306
2
合格
005
桂园
1
1321
2
合格
006
桂园
1
1336
2
合格
007
桂园
1
1406
2
合格
008
桂园
1
1421
2
合格
009
桂园
1
1436
2
合格
010
桂园
1
1506
2
合格
011
桂园
1
1521
2
合格
012
桂园
1
1536
2
合格
013
槐园
1
1207
2
合格
014
槐园
1
1214
2
合格
015
槐园
1
1221
2
合格
016
槐园
1
1307
2
合格
017
槐园
1
1314
2
合格
018
槐园
1
1321
2
合格
019
槐园
1
1407
2
合格
020
槐园
1
1414
2
合格
021
槐园
1
1421
2
合格
022
槐园
1
1507
2
合格
023
槐园
1
1514
2
合格
024
槐园
1
1521
2
合格
025
槐园
2
2209
2
合格
026
槐园
2
2223
2
废卷
027
槐园
2
2237
2
合格
028
槐园
2
2309
2
合格
029
槐园
2
2323
2
合格
030
槐园
2
2337
2
合格
031
槐园
2
2409
2
合格
032
槐园
2
2423
2
合格
033
槐园
2
2437
2
合格
034
槐园
2
2509
2
合格
035
槐园
2
2523
2
合格
036
槐园
2
2537
2
合格
037
枣园
1
1204
2
合格
038
枣园
1
1216
2
合格
039
枣园
1
1228
2
合格
040
枣园
1
1304
2
合格
041
枣园
1
1316
2
合格
042
枣园
1
1328
2
合格
043
枣园
1
1404
2
合格
044
枣园
1
1416
2
合格
045
枣园
1
1428
2
合格
046
枣园
1
1504
2
合格
047
枣园
1
1516
2
合格
048
枣园
1
1528
2
合格
049
枣园
2
2205
2
合格
050
枣园
2
2212
2
合格
051
枣园
2
2219
2
合格
052
枣园
2
2305
2
合格
053
枣园
2
2312
2
废卷
054
枣园
2
2319
2
合格
055
枣园
2
2405
2
合格
056
枣园
2
2412
2
合格
057
枣园
2
2419
2
合格
058
枣园
2
2505
2
合格
059
枣园
2
2512
2
合格
060
枣园
2
2519
2
合格
061
杏园
1
1207
2
合格
062
杏园
1
1215
2
合格
063
杏园
1
1223
2
合格
064
杏园
1
1307
2
合格
065
杏园
1
1315
2
合格
066
杏园
1
1323
2
合格
067
杏园
1
1407
2
合格
068
杏园
1
1415
2
合格
069
杏园
1
1423
2
合格
070
杏园
1
1507
2
合格
071
杏园
1
1515
2
合格
072
杏园
1
1523
2
合格
073
杏园
2
2210
2
合格
074
杏园
2
2221
2
合格
075
杏园
2
2232
2
合格
076
杏园
2
2310
2
合格
077
杏园
2
2321
2
合格
078
杏园
2
2332
2
合格
079
杏园
2
2408
2
合格
080
杏园
2
2420
2
合格
081
杏园
2
2432
2
合格
082
杏园
2
2508
2
合格
083
杏园
2
2520
2
合格
084
杏园
2
2532
2
合格
085
竹园
1
1205
2
合格
086
竹园
1
1219
2
合格
087
竹园
1
1233
2
合格
088
竹园
1
1305
2
合格
089
竹园
1
1319
2
合格
090
竹园
1
1333
2
合格
091
竹园
1
1405
2
合格
092
竹园
1
1419
2
合格
093
竹园
1
1433
2
合格
094
竹园
1
1509
2
合格
095
竹园
1
1519
2
合格
096
竹园
1
1533
2
合格
097
松园
1
1201
2
合格
098
松园
1
1209
2
合格
099
松园
1
1217
2
合格
100
松园
1
1301
2
合格
101
松园
1
1309
2
合格
102
松园
1
1317
2
合格
103
松园
1
1401
2
合格
104
松园
1
1409
2
合格
105
松园
1
1417
2
合格
106
松园
1
1501
2
合格
107
松园
1
1509
2
合格
108
松园
1
1517
2
合格
109
枫园
2
2203
2
合格
110
枫园
2
2218
2
合格
111
枫园
2
2233
2
合格
112
枫园
2
2303
2
合格
113
枫园
2
2318
2
合格
114
枫园
2
2333
2
合格
115
枫园
2
2403
2
合格
116
枫园
2
2418
2
合格
117
枫园
2
2433
2
合格
118
枫园
2
2503
2
合格
119
枫园
2
2518
2
合格
120
枫园
2
2533
2
合格
121
榴园
1
1202
2
合格
122
榴园
1
1213
2
合格
123
榴园
1
1224
2
合格
124
榴园
1
1302
2
合格
125
榴园
1
1313
2
合格
126
榴园
1
1324
2
合格
127
榴园
1
1402
2
合格
128
榴园
1
1413
2
合格
129
榴园
1
1424
2
合格
130
榴园
1
1502
2
合格
131
榴园
1
1513
2
合格
132
榴园
1
1524
2
合格
133
榴园
2
2206
2
合格
134
榴园
2
2223
2
合格
135
榴园
2
2240
2
合格
136
榴园
2
2306
2
合格
137
榴园
2
2323
2
合格
138
榴园
2
2340
2
合格
139
榴园
2
2406
2
合格
140
榴园
2
2423
2
合格
141
榴园
2
2440
2
合格
142
榴园
2
2506
2
合格
143
榴园
2
2523
2
合格
144
榴园
2
2540
2
合格
145
梅园
1
1204
2
合格
146
梅园
1
1213
2
合格
147
梅园
1
1222
2
合格
148
梅园
1
1304
2
合格
149
梅园
1
1313
2
合格
150
梅园
1
1322
2
合格
151
梅园
1
1404
2
合格
152
梅园
1
1413
2
合格
153
梅园
1
1422
2
合格
154
梅园
1
1504
2
合格
155
梅园
1
1513
2
合格
156
梅园
1
1522
2
合格
157
梅园
2
2205
2
合格
158
梅园
2
2216
2
合格
159
梅园
2
2227
2
合格
160
梅园
2
2305
2
合格
161
梅园
2
2316
2
合格
162
梅园
2
2327
2
合格
163
梅园
2
2405
2
合格
164
梅园
2
2416
2
合格
165
梅园
2
2427
2
合格
166
梅园
2
2505
2
合格
167
梅园
2
2516
2
合格
168
梅园
2
2527
2
合格
169
梅园
3
3207
2
合格
170
梅园
3
3215
2
合格
171
梅园
3
3223
2
合格
172
梅园
3
3307
2
合格
173
梅园
3
3315
2
合格
174
梅园
3
3323
2
合格
175
梅园
3
3407
2
合格
176
梅园
3
3415
2
合格
177
梅园
3
3423
2
合格
178
梅园
3
3507
2
合格
179
梅园
3
3515
2
合格
180
梅园
3
3523
2
合格
6,选择该抽样方法的原因。
多段抽样:
安徽大学罄苑校区学生总体范围特别大,无法获取全部学生清单。
并且层次比较多,分寝室楼、楼层、各寝室。
最后才能具体到人。
适合选用分段抽样。
通过各阶段的抽样,代表范围比较广,同质性较差,异质性较好,能很好的代表总体。
三,数据收集
1,调查资料的收集方法及原因。
收集方法:
个别发送法。
男生做男生寝室楼的调查,女生做女生寝室楼的调查。
依据所抽取的样本,调查员先敲门得到该寝室成员的认可及开门,进门说明来意,找到抽取的相应床位的同学,麻烦其帮忙填写问卷,调查员在一旁等候。
原因:
被调查者住在新区,都在一个社区内,住的并不分散,利于调查者上门及联系。
问卷设计的题目简单易答,不用花费太多时间,所以调查者完全可以等待问卷的回收。
2,收集中遇到的困难以及如何克服。
困难:
有的寝室在调查员调查的时间没有人在。
有的寝室虽然有人,但是抽到的作为样本的那个人没有在。
有的虽然在,但是比较忙,没有时间帮忙填写。
有的被调查者态度不是太友好,不是太情愿帮忙填写。
解决方式:
被调查者一次联系不到的,另找时间再去联系。
多跑两次。
被调查者正在忙的,如果等的时间不是太久,可以等他忙完;如果很久的话,则先做其他的问卷,再找时间联系他,要求其帮忙填写问卷。
被调查者态度不好的,调查员依旧保持笑容,客气的请其帮忙。
不情愿填写的,则尽力强调做问卷不用花费太多时间并且采用匿名方式,对其没有影响,进行说服。
3,问卷回收率
共计发放180份问卷,由于丢失2份问卷,实际回收178份,所以问卷回收率为99%。
四,资料的整理与录入
1,资料的审核。
采用的方法是:
在收集过程中进行,边收集边审核。
一旦发现填答错误,或漏填误填,或其他一些有疑问的地方,就及时进行询问核实。
2,资料的转换。
完全按编码手册进行资料转换。
3。
,数据录入。
直接从问卷上将编好码的数据输入计算机。
方法是直接在SPSS软件上输入。
4,数据清理。
(1)有效范围清理。
在计算机上,用SPSS软件执行一条统计各变量分布频数分布的命令。
当发现频数分布表中变量的取值出现了超出编码手册所规定的赋值范围时,通过计算机将这些个案查找出来,并同原始问卷进行核对和修改。
(2)逻辑一致性清理。
依据问卷中的问题相互之间所存在的某种内在逻辑联系,来检查前后数据之间的合理性。
通过SPSS软件执行条件选择命令或者构成新变量的命令。
(3)数据质量抽查。
随机抽取一部分个案,拿着原始问卷一份一份的、一个答案一个答案的进行校对。
5,问卷有效率。
经过数据的清理工作,最后得到178份有效问卷,有效率达99%。
五,描述性统计分析
a)定性变量:
图、表
b)定量变量:
图、表、数
六,推论性统计分析
a)假设检验(置信区间):
t检验、F检验、卡方检验等.
假设一:
男生和女生的虚荣心有差异。
男生和女生的虚荣心有差异,女生的虚荣心强于男生。
假设二,独生子女和非独生子女的虚荣心有差异。
独生子女和非独生子女的虚荣心没有差异。
假设三,来自城市、乡镇和农村的人虚荣心有差异。
来自城市、乡镇和农村的人虚荣心有差异。
TWO-WAYANOVA
THREE-WAYANOVA
回归:
T检验
b)结论
1,男生和女生的虚荣心有差异。
2,独生子女和非独生子女的