国家开放大学《社会统计学》网上作业15参考答案11.docx

上传人:b****6 文档编号:5887887 上传时间:2023-01-01 格式:DOCX 页数:34 大小:874.29KB
下载 相关 举报
国家开放大学《社会统计学》网上作业15参考答案11.docx_第1页
第1页 / 共34页
国家开放大学《社会统计学》网上作业15参考答案11.docx_第2页
第2页 / 共34页
国家开放大学《社会统计学》网上作业15参考答案11.docx_第3页
第3页 / 共34页
国家开放大学《社会统计学》网上作业15参考答案11.docx_第4页
第4页 / 共34页
国家开放大学《社会统计学》网上作业15参考答案11.docx_第5页
第5页 / 共34页
点击查看更多>>
下载资源
资源描述

国家开放大学《社会统计学》网上作业15参考答案11.docx

《国家开放大学《社会统计学》网上作业15参考答案11.docx》由会员分享,可在线阅读,更多相关《国家开放大学《社会统计学》网上作业15参考答案11.docx(34页珍藏版)》请在冰豆网上搜索。

国家开放大学《社会统计学》网上作业15参考答案11.docx

国家开放大学《社会统计学》网上作业15参考答案11

《社会统计学》形考任务

形考任务1(占比20%)

表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并

(1)对考试成绩进行排序和分组(40分),

(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。

请注意分组时按照下列标准:

等级

A

A-

B+

B

B-

C+

C

C-

D+

D

F

分数

90-100

86-89

83-85

80-82

76-79

73-75

70-72

66-69

63-65

60-62

0-59

请注意分组时按照下列标准:

表1某专业二年级同学社会统计学期末考试成绩(百分制)

学生

成绩

学生

成绩

学生

成绩

学生

成绩

学生

成绩

1

86

28

34

55

88

82

70

109

71

2

60

29

65

56

93

83

88

110

80

3

65

30

30

57

85

84

88

111

87

4

28

31

78

58

83

85

68

112

66

5

85

32

86

59

93

86

87

113

84

6

87

33

84

60

95

87

88

114

83

7

70

34

87

61

71

88

91

115

85

8

64

35

85

62

90

89

76

116

78

9

51

36

93

63

86

90

87

117

81

10

58

37

96

64

89

91

81

118

81

11

90

38

82

65

89

92

61

119

71

12

50

39

78

66

83

93

72

120

86

13

87

40

80

67

84

94

86

121

91

14

82

41

74

68

44

95

29

122

66

15

65

42

72

69

68

96

37

123

58

16

68

43

73

70

89

97

82

124

68

17

86

44

86

71

84

98

82

125

80

18

80

45

85

72

86

99

82

126

77

19

81

46

90

73

79

100

85

127

55

20

70

47

69

74

78

101

78

128

54

21

80

48

86

75

87

102

80

129

62

22

49

49

86

76

88

103

90

130

54

23

80

50

84

77

82

104

82

131

65

24

70

51

81

78

83

105

72

132

74

25

59

52

90

79

92

106

86

133

70

26

80

53

34

80

86

107

80

134

72

27

52

54

84

81

86

108

82

135

73

解:

形考任务2(占比20%)

 表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件。

(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。

(2)计算学生上网时间的标准分(Z值)及其均值和标准差。

(20分)

(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。

(30分)

表1某专业一年级同学一周上网时间(小时)

学生

上网 时间

学生

上网 时间

学生

上网 时间

学生

上网 时间

学生

上网 时间

1

13

21

18

41

14

61

8

81

10

2

9

22

22

42

7

62

19

82

10

3

8

23

22

43

9

63

24

83

20

4

12

24

10

44

8

64

13

84

21

5

8

25

13

45

10

65

21

85

16

6

26

26

10

46

18

66

21

86

10

7

13

27

12

47

26

67

10

87

10

8

5

28

22

48

14

68

13

88

21

9

3

29

19

49

8

69

20

89

19

10

18

30

10

50

10

70

21

90

10

11

3

31

22

51

13

71

12

91

32

12

10

32

30

52

28

72

15

92

7

13

20

33

8

53

12

73

26

93

28

14

19

34

20

54

10

74

20

94

19

15

15

35

17

55

9

75

17

95

15

16

8

36

14

56

10

76

19

96

10

17

8

37

8

57

12

77

9

97

20

18

15

38

12

58

24

78

21

98

8

19

20

39

15

59

26

79

17

99

14

20

22

40

13

60

20

80

16

100

18

解:

形考任务3(占比20%)

学习完7-12章后,你可以完成本次形考任务了,本次任务的题型包含:

单项选择题(5道),名词解释(5道),简答题(2道),计算题(2道),本次任务按照百分制计,占形成性考核总成绩的20%。

形考任务4(占比20%)

学习完1-12章所有内容后,你可以完成本次形考任务了,本次任务的题型包含:

单项选择题(10道),名词解释(4道),简答题(3道),计算题(2道),本次任务按照百分制计,占形成性考核总成绩的20%。

网上学习行为(占比20%)

辅导教师根据学生到课情况、参与讨论、发言情况(包括课堂和网络)、按时提交作业情况、学习活动完成情况等,对学生学习情况进行综合评价,在第18周完成。

占课程综合成绩的20%,按百分制计算。

分隔小组:

所有成员。

作业3

一、单项选择题(每题2分,共20分)

1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于(系统抽样)。

2.以下关于因变量与自变量的表述不正确的是(自变量的变化是以因变量的变化为前提)

3.某地区2001-2010年人口总量(单位:

万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(线图)。

4.以下关于条形图的表述,不正确的是(条形图的矩形通常是紧密排列的)

5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。

某学生语文得了83分,数学得了97分,从相对名次的角度看,该生(数学)的成绩考得更好。

6.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是(甲的离散程度小,稳定性水平高)

7.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(第5组)组。

组别

按年龄分组(岁)

工作人员数(人)

1

20~24

6

2

25~29

14

3

30~34

24

4

35~39

18

5

40~44

12

6

45~49

18

7

50~54

14

8

55~59

6

 

合计

112

8.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间(相关程度越小)

9.回归平方和(SSR)反映了y的总变差中(由于x与y之间的线性关系引起的y的变化部分)

10.下列哪种情况不适合用方差分析(年龄对收入的影响)

二、名词解释(每题5分,共20分)

1.非概率抽样:

根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。

2.二维表:

二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表

3.置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例

4.卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布

三、简答题(每题10分,共30分)

1.等距分组和不等距分组有什么区别?

请举例说明

(1)定类变量:

当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。

(2分)例如:

性别

(2)定序变量:

当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。

(2分)例如:

学历

(3)定距变量:

当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。

(2分)例如:

智商

(4)定比变量:

除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。

(2分)例如:

收入.

2.简述相关系数的取值与意义

相关系数的取值在-1~1之间(2分);相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关(2分);相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1(2分);反之,绝对值越小,及r越接近0,相关程度越弱(2分);相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关

3.简述什么是简单回归分析?

其作用是什么

(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。

(2)回归分析的作用包括:

①从已知数据出发,确定变量之间的数学关系式;

②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;

③利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。

四、计算题(共30分)

1.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。

请问:

(1)是男生体重差异大还是女生体重差异大?

为什么?

(2)男生中有多少比重的人体重在55千克-65千克之间?

(3)女生中有多少比重的人体重在40千克-60千克之间?

备注:

ф

(1)=0.8413,ф

(2)=0.9772

2.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。

通过分析得到以下方差分析表:

 

变差来源

SS

df

MS

F

Sig.

回归

1602708.6

B

D

F

0.000

残差

40158.08

C

E

总计

A

11

  要求:

  

(1)计算上面方差分析表中A、B、C、D、E、F处的值。

  

(2)商品销售量的变差中有多少是由价格的差异引起的?

作业4

一、单项选择题(每题2分,共20分)

1.以下关于因变量与自变量的表述不正确的是(自变量是引起其他变量变化的变量)

2.某班级学生平均每天上网时间可以分为以下六组:

1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(5.5小时)

3.以下关于条形图的表述,不正确的是(条形图的矩形通常是紧密排列的)

4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(第5组)组

组别

按年龄分组(岁)

工作人员数(人)

1

20~24

6

2

25~29

14

3

30~34

24

4

35~39

18

5

40~44

12

6

45~49

18

7

50~54

14

8

55~59

6

 

合计

112

5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。

某学生语文得了83分,数学得了97分,从相对名次的角度看,该生(数学)的成绩考得更好。

6.在假设检验中,不拒绝虚无假设意味着(没有证据证明虚无假设是错误的)

7.根据一个样本均值求出的90%的置信区间表明(总体均值有90%的概率会落入该区间内)

8.在回归方程中,若回归系数等于0,这表明(自变量x对因变量y的影响是不显著的)

9.中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为(μ)、方差为(σ2/n)的正态分布。

10.下列哪种情况不适合用方差分析(年龄对收入的影响)

二、名词解释(每题5分,共20分)

1.整群抽样:

先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。

2.Z值:

Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:

Z=(X-μ)/σ

3.二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

4.误差减少比例:

在预测变量Y的值时,知道变量X的值时所减少的误差(-)与总误差的比值称为误差减少比例,简称PRE。

三、简答题(每题10分,共30分)

1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)网络供应商的姓名

(2)每月的网络服务费(3)每月上网时间(4)上网的目的

(5)上月网购次数

判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)网络供应商的姓名:

定性(2分)

(2)每月的网络服务费:

定量、连续变量(2分)

(3)每月上网时间:

定量、连续变量(2分)

(4)上网的目的:

定性(2分)

(5)上月网购次数:

定量、离散变量(2分)

2.简述什么是简单回归分析?

其作用是什么?

(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。

(2)回归分析的作用包括:

①从已知数据出发,确定变量之间的数学关系式;

②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;

3.如何对配对样本进行t检验。

配对样本检验主要是判断不同的处理或试验结果是否有差异。

配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。

在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。

四、计算题(共30分)

1.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。

(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。

(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。

以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。

注:

 Z0.025=1.96

2.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。

通过对每块试验田的产量进行分析得到下面的方差分析表。

请完成方差分析表。

变差来源

SS

df

MS

F

Sig.

组间

A

C

320

F

0.000

组内

6048

D

E

总计

B

39

 

1.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。

这种调查方法属于(分层抽样)。

2.以下关于因变量与自变量的表述不正确的是(自变量的变化是以因变量的变化为前提)。

3.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。

此处5000户是(样本 )。

4.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于(系统抽样)。

5.某班级学生平均每天上网时间可以分为以下六组:

1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(5.5小时)。

6.下表为某专业一年级学生平均每周上网时间的频率分布表,按照向上累积的方法计算第5组的累积频率是(66.1%)。

组别

按年龄分组(岁)

工作人员数(人)

1

20~24

6

2

25~29

14

3

30~34

24

4

35~39

18

5

40~44

12

6

45~49

18

7

50~54

14

8

55~59

6

 

合计

112

7.以下关于条形图的表述,不正确的是(条形图的矩形通常是紧密排列的)

8.下表是某单位工作人员年龄分布表,该单位工作人员的平均年龄是(39)。

组别

按年龄分组(岁)

工作人员数(人)

1

20~24

6

2

25~29

14

3

30~34

24

4

35~39

18

5

40~44

12

6

45~49

18

7

50~54

14

8

55~59

6

 

合计

112

9.依据上表,该单位工作人员的年龄众数出现在第( 第4)组。

10.对于左偏分布,平均数、中位数和众数之间的关系是(中位数>平均数>众数,众数>中位数>平均数)。

11.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于(系统抽样)。

12.甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下关于甲、乙两人打靶的稳定性水平表述正确的是(甲的离散程度小,稳定性水平高)。

13.社会工作一班男生的平均体重为55千克,社会工作二班男生的平均体重为52千克,两个班级男生体重的标准差均为5千克,那么(二班学生体重的离散程度大)。

14.在标准正态分布中,σ值越小,则(离散趋势越小 )。

15.某班级学生期末统计学考试平均成绩为82分,标准差为5分。

如果已知这个班学生的考试分数服从正态分布,可以判断成绩在72-92之间的学生大约占全班学生的( 95% )。

16.中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为(μ )、方差为(σ2/n)的正态分布。

17.在假设检验中,不拒绝虚无假设意味着(没有证据证明虚无假设是错误的)。

18.对消费的回归分析中,学历、年龄、性别、收入都是自变量,其中收入的回归系数为2.8,这表明(收入每增加1元,消费增加2.8元)。

19.回归平方和(SSR)反映了y的总变差中(由于x与y之间的线性关系引起的y的变化部分)

20.在回归方程中,若回归系数等于0,这表明(自变量x对因变量y的影响是不显著的)。

21.下列哪种情况不适合用方差分析(年龄对收入的影响)。

22.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为(432,71)。

 

1.随机现象就是在同一组条件下,每次试验可能出现某一结果,也可能不出现,也就偶然现象。

2.总体与样本一般地,把所研究对象的全体元素组成的集合称为总体(或称母体),而把组成总体的每个元素成为称为个体。

为了了解总体X的分布规律或某些特征,必须对总体进行抽样观察,即从总体中,随机抽取个个体,,…,,记为,并称此为来自总体的容量为的样本。

3.参数与统计量:

参数(parameter)是研究者想要了解的总体的某种特征值。

统计量(statistic)是根据样本数据计算出来的一个量。

4.抽样分布:

抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。

5.置信水平(confidencelevel)就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。

6.置信区间(confidenceinterval)是在区间估计中,由样本统计量所构造的总体参数的估计区间,它有估计量加减抽样误差构成,我们将区间的最小值称为置信下限,区间的最大值称为置信上限。

 

等距分组和不等距分组有什么区别?

请举例说明。

(1)在对数据进行分组时,如果各组组距相等,则称为等距分组。

例如,分析某班同学期末统计课成绩时,假如最低分为73分,最高分为98分,以5分为组距进行分组,分为70-75分,75-80分,80-85分,85-90分,90-95分,95-100分。

(2)如果各组组距不相等,则称为不等距分组。

例如,在分析人口时,往往将人口分为婴幼儿组(0-6岁),少年儿童组(7-17岁)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1