中医药统计学和软件应用笔记重点Word文档格式.docx

上传人:b****3 文档编号:15827609 上传时间:2022-11-16 格式:DOCX 页数:80 大小:1.33MB
下载 相关 举报
中医药统计学和软件应用笔记重点Word文档格式.docx_第1页
第1页 / 共80页
中医药统计学和软件应用笔记重点Word文档格式.docx_第2页
第2页 / 共80页
中医药统计学和软件应用笔记重点Word文档格式.docx_第3页
第3页 / 共80页
中医药统计学和软件应用笔记重点Word文档格式.docx_第4页
第4页 / 共80页
中医药统计学和软件应用笔记重点Word文档格式.docx_第5页
第5页 / 共80页
点击查看更多>>
下载资源
资源描述

中医药统计学和软件应用笔记重点Word文档格式.docx

《中医药统计学和软件应用笔记重点Word文档格式.docx》由会员分享,可在线阅读,更多相关《中医药统计学和软件应用笔记重点Word文档格式.docx(80页珍藏版)》请在冰豆网上搜索。

中医药统计学和软件应用笔记重点Word文档格式.docx

(2)搜集资料:

①常规保存的记录;

②现场调查记录;

③实验/试验记录;

④医学文献/网络信息。

(3)整理资料:

①检查;

②审核;

③计算机检查;

④分组。

(4)分析资料

2.统计学认识现象的特点

(1)数量性:

(2)群体性:

(3)具体性:

(4)概率性:

三、统计学中常用的概念

1.总体(population):

是根据研究目的确定的同质观察单位的集合。

例①河北省18岁男性的身高和体重分布②某性红地2005年健康成年男细胞数

③河北省18岁身高在170-175cm男性的体重分布

⑴有限总体:

指总体限定于特定的空间、时间范围内有限个观察单位。

⑵无限总体:

指没有空间和时间范围限制的总体。

2.样本(sample):

从总体中随机抽取的有代表性的一部分观察单位的集合。

样本的可靠性:

指总体确定后,样本中的每一个观察单位确属预先规定的同质总体。

样本的代表性:

即样本能够充分反映总体的真实情况。

3.随机(random):

即在抽样、分组、安排试验顺序时,让总体中每个受试者或观察单位都有同等的机会被抽中、被分配或被安排,而不受研究者的主观意愿驱使。

不能将随机理解为随便。

4.事件(event):

指事物发生某种情况或在调查、观察和实验中获得的某种结果。

⑴确定性事件是可预言在一定条件下必然发生的事件,发生的概率为1。

⑵随机事件:

指一定条件下可能发生也可能不发生的不确定性事件,发生的概率介于0~1之间。

⑶模糊事件:

事物本身的含义不确定的现象。

5.频率(frequency):

对于随机事件A,在相同的条件下进行了n次实验,事件A发生的次数为m,比值m/n为频率,记为fn(A);

概率(probability):

描述某随机事件A发生的可能性大小,统计符号为P,0≤P≤1,记为P(A)。

当n→∝时,频率fn(A)→概率P(A)。

小概率事件:

表示某事件发生的可能性很小,在医学研究中,习惯上把P≤0.05或P≤0.01的事件称为小概率事件。

6.变异(variation):

总体中各个体之间的差异性。

同质是相对的,研究对象只是在某一方面是性质相同的,同类的观察对象之间往往也存在着变异。

变异是绝对的、客观存在的。

7.误差(error):

指测量值与真值之差。

⑴过失误差:

也叫粗差。

观测者粗心大意造成的误差。

⑵系统误差:

由于仪器未校准、试剂未标定、观测标准未统一等固定原因造成的误差。

⑶测量误差:

由事先难于预料的实验或观察条件的随机波动造成的误差。

⑷抽样误差:

由抽样引起的样本指标(统计量)与总体指标(参数)的差别。

8.统计量(statistical):

是反映样本特征的统计指标。

统计符号为小写的英文字母。

如样本均数、样本标准差s、样本率p等。

9.参数(parameter):

是描述总体特征的统计指标。

统计符号为小写的希腊字母。

如总体均数μ、总体标准差σ、总体率π等。

10.统计资料的类型

根据研究目的,对研究对象的某些特征进行观测,将这些观测指标或项目称为变量。

变量的具体数值(变量值)构成了统计数据或统计资料。

统计资料分为两类:

1值变量(numericalvariable):

亦称定量资料。

是指对每个观察单位用计量方法测得某项

数值大小所获得的资料。

特点为其变量值大多有度量衡单位,其具体取值通常是正实数(零、正整数和小数)。

如身高1.75m、体重68kg、血压9.6kPa、血糖6.8mmol/L。

⑵分类变量(categoricalvariable):

又称定性资料。

指对每个观察单位按某一方面的特征、性质或等级分组计数而得到的资料。

特点是变量值表现为互不相容的属性或类别,无度量衡单位。

分类变量又可分为两类:

1序分类变量:

又称为名义资料。

具体取值通常是具有某种属性或特征的个数。

特点是可在非数字中取值,各类之间具有性质上的差异。

可分为二分变量和多分变量。

二分变量是按互不相容的属性分成两类的资料。

多分变量是按某种属性或特征分成两类以上的资料。

2序分类变量:

亦称等级资料或半定量资料。

具体取值也是具有某种属性或特征的个数,

但不同取值之间有半定量的关系。

特点是其各类别间有等级、程度或量的差异,即可按数量的相对大小或程度的高低排出顺序。

四、学习中医统计学的目的

1.顺应中医药学的发展趋势。

2.强化中医科研的计划性和科学性。

3.拓宽研究思路。

4.学会正确地运用统计方法和合理地解释统计结果。

五、学习中医统计学的注意事项

1.理解和领会基本概念和原理,切忌死记硬背。

2.不追究公式的来源和推导,但要掌握其应用条件。

3.重视分析问题和解决问题能力的培养。

4.学会使用统计软件。

数值变量资料的统计描述

统计描述——概念:

即利用原始数据,选择适宜的统计指标及统计图表,简明准确地探察数据的分布类型和数量特征的基本统计方法。

目的:

是根据样本中所包含的信息,客观、正确地推论出其总体规律。

第一节频数分布

频数:

相同观察值或观察结果出现的次数。

分布:

指随着随机变量取值的变化,其相应的概率变化的规律性。

频数分布:

观察值(变量值)按大小分组,各个组段内观察值个数(频数)的分布,是了解数据分布形态特征与规律的基础。

一、频数分布的特征

1.集中趋势:

指一组变量值的集中倾向或中心位置。

2.离散趋势:

即一组变量值的离散倾向。

二、频数分布的类型

1.对称分布:

指集中位置居中、左右两侧的2.非对称分布:

亦称偏态分布,是集中位置

频数分布基本对称的频数分布。

偏倚、两侧频数的分布不对分为正态分布和非正态分布两称的频数分布,可分为正

种类型。

偏态和负偏态分布。

三、频数分布表/图的作用

1.直观地揭示数据的分布类型和特征。

2.便于发现资料中某些远离群体的特大或特小的可疑值。

3.描述频数分布的集中趋势与离散趋势。

4.便于进一步计算统计指标。

四、频数表

概念:

频数分布表的简称。

指观察值或某些类别及其相应的频数按一定顺序排列的表格。

例题:

随机抽取某地120例正常人,测得血清铜的含量(μmol/L)如下表,试编制频数表。

13.8412.5313.7014.8917.5313.1918.82

14.7317.4413.9914.1012.2912.6114.78

14.5914.7118.6219.0410.9513.8110.53

13.5611.4813.0716.8817.0417.9812.67

11.039.2315.0414.0915.9011.4814.64

13.6414.3915.7413.9911.3117.6116.26

13.5311.6813.2511.8814.2115.2115.29

13.7014.4511.2319.8413.1115.1511.70

频数表的编制方法:

1.找极值:

Xmax=19.84,Xmin=9.23

2.求全距:

R=Xmax-Xmin,R=19.84-9.23=10.61

3.定组数:

K=8~15。

4.求组距:

i=R/(K–1)(i为组距,k为组段数,R为全距)i=10.61/(11-1)=1.061≈1

5.确定各组段的上下限:

6.归纳计数:

某地120名正常成年人血清铜含量频数表

组段频数f频率P(%)fCPC(%)

9.00~ 32.532.5

10.00~ 43.375.8

11.00~1210.01915.8

12.00~1310.83226.6

13.00~1714.24940.8

14.00~2218.37159.1

15.00~1815.08974.1

16.00~1310.810284.9

17.00~119.211394.1

18.00~54.211898.3

19.00~21.7120100.0

合计120100.0

五、频数图

概念:

亦称直方图,是以直方的宽度代表组距,以直方的面积大小表示频数的多少、以直方面积在总面积中的比例表示频率大小的图形。

等距分组——以横轴表示变量,以纵轴表示频数。

不等距分组——以横轴表示变量,但纵轴是频数除以组距。

第二节数值变量资料集中趋势的描述

集中趋势:

是度量变量值集中位置和平均水平的数量指标,其代表值为平均数。

平均数:

是描述一组观测值平均水平的指标,是对同质基础上的样本或总体一般特征的表达指标。

算术平均数、几何平均数、中位数、众数

一、算术平均数

1.定义:

算术平均数简称均数。

是一组观察值的和与观察值个数之商。

是数量上的平均。

用于说明一组观测值的趋中位置或平均水平。

表示样本均数,表示总体均数。

2.适用条件:

正态或近似正态分布的资料。

如生理指标。

3.计算方法:

⑴直接法:

有n个观察值,分别为X1,X2,……Xn,

式中Σ是求和的符号。

10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5,122.5,140.0。

求平均数。

⑵加权法:

用于观察值中相同数据较多或频数表资料。

=1737.00/120=14.48(μmol/L)

二、几何均数

n个数值连乘积的n次方根。

是比例或倍数上的平均。

统计符号G。

2.应用条件:

等比数列资料。

如抗体滴度。

6份血清抗体滴度为1:

2,1:

4,1:

8,1:

16,1:

32,求平均数。

平均滴度为1:

8。

三、中位数

将一组观察值按由小到大的顺序排列,位次居中的数值即中位数。

是位次上的平均。

统计符号M。

不拘分布、分布类型不明或一端无界的资料。

如潜伏期、治愈时间和发病年龄。

n为奇数时

n为偶数时

式中

均为下标,表示有序数列中观察值的位次。

某医院用大黄粉治疗胃热血瘀型血证病人9例,其大便转阴天数分别为1、1、2、2、3、4、5、7、10,求其中位数。

本例n=9,M=X5=3(天)。

如果本例n=10,第10个数值为16天,则M=(3+4)/2=3.5(天)。

2数表法

用于观察值例数较多或频数表资料。

L为M所在组段的下限;

i为该组段的组

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1