精选医学统计数据的收集与整理doc.docx

上传人:b****5 文档编号:2882385 上传时间:2022-11-16 格式:DOCX 页数:19 大小:96.63KB
下载 相关 举报
精选医学统计数据的收集与整理doc.docx_第1页
第1页 / 共19页
精选医学统计数据的收集与整理doc.docx_第2页
第2页 / 共19页
精选医学统计数据的收集与整理doc.docx_第3页
第3页 / 共19页
精选医学统计数据的收集与整理doc.docx_第4页
第4页 / 共19页
精选医学统计数据的收集与整理doc.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

精选医学统计数据的收集与整理doc.docx

《精选医学统计数据的收集与整理doc.docx》由会员分享,可在线阅读,更多相关《精选医学统计数据的收集与整理doc.docx(19页珍藏版)》请在冰豆网上搜索。

精选医学统计数据的收集与整理doc.docx

精选医学统计数据的收集与整理doc

第一章统计数据的收集与整理

1.1算术平均数是怎样计算的?

为什么要计算平均数?

答:

算数平均数由下式计算:

,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。

计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。

1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?

答:

标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。

1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同?

答:

变异系数可以说是用平均数标准化了的标准差。

在比较两个平均数不同的样本时所得结果更可靠。

1.4完整地描述一组数据需要哪几个特征数?

答:

平均数、标准差、偏斜度和峭度。

1.5下表是我国青年男子体重(kg)。

由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。

根据表中所给出的数据编制频数分布表。

66

69

64

65

64

66

68

65

62

64

69

61

61

68

66

57

66

69

66

65

70

64

58

67

66

66

67

66

66

62

66

66

64

62

62

65

64

65

66

72

60

66

65

61

61

66

67

62

65

65

61

64

62

64

65

62

65

68

68

65

67

68

62

63

70

65

64

65

62

66

62

63

68

65

68

57

67

66

68

63

64

66

68

64

63

60

64

69

65

66

67

67

67

65

67

67

66

68

64

67

59

66

65

63

56

66

63

63

66

67

63

70

67

70

62

64

72

69

67

67

66

68

64

65

71

61

63

61

64

64

67

69

70

66

64

65

64

63

70

64

62

69

70

68

65

63

65

66

64

68

69

65

63

67

63

70

65

68

67

69

66

65

67

66

74

64

69

65

64

65

65

68

67

65

65

66

67

72

65

67

62

67

71

69

65

65

75

62

69

68

68

65

63

66

66

65

62

61

68

65

64

67

66

64

60

61

68

67

63

59

65

60

64

63

69

62

71

69

60

63

59

67

61

68

69

66

64

69

65

68

67

64

64

66

69

73

68

60

60

63

38

62

67

65

65

69

65

67

65

72

66

67

64

61

64

66

63

63

66

66

66

63

65

63

67

68

66

62

63

61

66

61

63

68

65

66

69

64

66

70

69

70

63

64

65

64

67

67

65

66

62

61

65

65

60

63

65

62

66

64

答:

首先建立一个外部数据文件,名称和路径为:

E:

\data\exer1-5e.dat。

所用的SAS程序和计算结果如下:

procformat;

valuehfmt

56-57='56-57'58-59='58-59'60-61='60-61'

62-63='62-63'64-65='64-65'66-67='66-67'

68-69='68-69'70-71='70-71'72-73='72-73'

74-75='74-75';

run;

dataweight;

infile'E:

\data\exer1-5e.dat';

inputbw@@;

run;

procfreq;

tablebw;

formatbwhfmt.;

run;

TheSASSystem

CumulativeCumulative

BWFrequencyPercentFrequencyPercent

-----------------------------------------------------

56-5731.031.0

58-5941.372.3

60-61227.3299.7

62-634615.37525.0

64-658327.715852.7

66-677725.723578.3

68-694515.028093.3

70-71134.329397.7

72-7351.729899.3

74-7520.7300100.0

1.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。

它们的平均数相等吗?

标准差相等吗?

能够解释为什么吗?

答:

用means过程计算,两个样本分别称为

,结果见下表:

TheSASSystem

VariableNMeanStdDev

----------------------------------------

Y11064.50000003.5039660

Y21063.90000003.1780497

----------------------------------------

随机抽出的两个样本,它们的平均数和标准差都不相等。

因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。

1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?

为什么?

本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?

答:

不是简单的随机样本。

从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。

应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。

1.8证明

其中

若用

编码时,前式是否仍然相等?

答:

(1)令

平均数特性之③。

(2)令

平均数特性之②。

用第二种编码方式编码结果,两式不再相等。

1.9有一个样本:

,设B为其中任意一个数值。

证明只有当

最小。

这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。

答:

,为求使p达最小之B,令

1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下[1]:

10.0

9.3

7.2

9.1

8.5

8.0

10.5

10.6

9.6

10.1

7.0

6.7

9.5

7.8

10.5

7.9

8.1

9.6

7.6

9.4

10.0

7.5

7.2

5.0

7.3

8.7

7.1

6.1

5.2

6.8

10.0

9.9

7.5

4.5

7.6

7.0

9.7

6.2

8.0

6.9

8.3

8.6

10.0

4.8

4.9

7.0

8.3

8.4

7.8

7.5

6.6

10.0

6.5

9.5

8.5

11.0

9.7

6.6

10.0

5.0

6.5

8.0

8.4

8.3

7.4

7.4

8.1

7.7

7.5

7.1

7.8

7.6

8.6

6.0

7.0

6.4

6.7

6.3

6.4

11.0

10.5

7.8

5.0

8.0

7.0

7.4

5.2

6.7

9.0

8.6

4.6

6.9

3.5

6.2

9.7

6.4

5.8

6.4

9.3

6.4

编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。

答:

首先建立一个外部数据文件,名称和路径为:

E:

\data\exr1-10e.dat。

SAS程序及结果如下:

optionsnodate;

procformat;

valuehfmt

3.5-4.4='3.5-4.4'4.5-5.4='4.5-5.4'5.5-6.4='5.5-6.4'

6.5-7.4='6.5-7.4'7.5-8.4='7.5-8.4'8.5-9.4='8.5-9.4'

9.5-10.4='9.5-10.4'10.5-11.4='10.5-11.4';

run;

datawheat;

infile'E:

\data\exr1-10e.dat';

inputheight@@;

run;

procfreq;

tableheight;

formatheighthfmt.;

run;

proccapabilitygraphicsnoprint;

varheight;

histogram/vscale=count;

insetmeanvarskewnesskurtosis;

run;

TheSASSystem

TheFREQProcedure

CumulativeCumulative

heightFrequencyPercentFrequencyPercent

---------------------------------------------------------------------

3.5-4.411.0011.00

4.5-5.499.001010.00

5.5-6.41111.002121.00

6.5-7.42323.004444.00

7.5-8.42424.006868.00

8.5-9.41111.007979.00

9.5-10.41515.009494.00

10.5-11.466.00100100.00

1.11北太平洋宽吻海豚羟丁酸脱氢酶(HDBH)数据的接收范围频数表[2]如下:

(略作调整)

HDBH

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1