医学统计学案例分析报告.docx
《医学统计学案例分析报告.docx》由会员分享,可在线阅读,更多相关《医学统计学案例分析报告.docx(6页珍藏版)》请在冰豆网上搜索。
医学统计学案例分析报告
医学统计学案例分析评述
医学期刊论著:
《口岸出入境人员预防接种统计分析》
【题目】口岸出入境人员预防接种统计分析
【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染
性疾病的预防提供参考数据。
【研究人群】2010年1月--2012年5月口岸接受预防接种的出入境人员6870
位,其基本资料如下:
男3678人,女3021人;年龄在3-79岁之
间,平均年龄45.6岁。
经免疫前检查和询问,研究对象均无严重
的疾病,且无接种疫苗过敏史及禁忌症。
【资料类型】本资料是计数资料。
(1)原文:
研究对象:
选择我处2010年1月-2011年4月,2011年5月-2012
年5月两个时间段6870位出入境人员,将其按公务人员、船员、劳
务人员、留学人员、旅游探亲及商务等进行分组。
(2)问题:
①文献中未明确“我处”的具体含义,没有明确研究对象的来源。
②文献中未提及“6870位出入境人员”是如何产生的,即是普查,
还是抽样调查?
如果是抽样调查,未明确抽样的方法,是如何应用
随机抽样的方法选择这6870位研究对象的?
【统计方法】
(1)本论著未明确使用了何种统计学方法,我们组认为:
首先应对资料进行正
态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选
用秩和检验。
一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果
进行判断。
如果没有检验方法或检验方法不合理,就无法知道检验结果是
否出错,也就无法对结论进行准确判断。
(2)文献尽管在“1.4统计学处理”中提及了“使用SPSSl5.2软件进行统计学
分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确
采用了那种统计方法,即是卡方检验还是秩和检验等。
(3)在没有提及统计方法的前提下,全文也没有表示统计结果,即具体的计算
值和相对应的P值,只有P<0.05,表述不完整。
正确的统计分析方法、具体的统计量值和P值是最终准确推断结论的重要
依据,三者缺一不可。
所以,具体的P值和统计量应在论文表格或文字描
述中说明。
(4)统计符号书写不规范:
检验水准表述有误,原文“检验水平取P=0.05”,应改为“检验水准ɑ=0.05”。
【结果表达】
(1)在“2.1不同时间段接种人数比较”中:
①原文:
研究将研究对象按照2010年1月-2011年4月,2011年5月-2012年
5月分为两个时间段进行研究,第一个时间段接种人数为4606人,第
二时间段接种人数为2264人。
第二时间段较第一时间段接种人数明显
减少,且具有显著差异性(P<0.05)。
②错误:
结果表述有误:
“第二时间段较第一时间段接种人数明显减少,且具有
显著差异性”。
2个时间段研究对象数量不同,通过统计分析不能得出
“人数明显较少”的结论,应表述为:
按ɑ=0.05水准,差别有统计学意
义,可以认为2个时间段接种人数不同。
(2)在“结果2.2和2.3”的结论中:
①错误:
均未明确具体的统计值及相对应的P值,“具有显著性差异”应改为“差
别有统计学意义”。
(3)统计表表示不正确:
①统计表为三线表,在有“合计”一项时,应加一条分隔线。
《小剂量米非司酮在子宫腺肌病治疗中的临床疗效分析》
【题目】《小剂量米非司酮在子宫腺肌病治疗中的临床疗效分析》
【研究目标】探讨米非司酮治疗子宫腺肌病的临床疗效。
【研究人群】:
72例依临床症状、彩色超声或腔镜检查诊断为子宫腺肌病的患者
【资料类型】:
此资料为计量资料
【所用统计分析方法名称】:
t检验
【结果表达规范情况】:
统计表有问题。
首先,无数字的地方没有用“—”表示,而是直接空格。
其次,P值表达的意思与文中所论述的不同,文中说是将治疗后3个月与6个月分别与治疗前比较得出P值,而表格中表达出的含义是P值是由三组数据一起比较得出的。
再次,统计表并不能完整地表达文中所论述的情况,例数为什么减少这个信息这个并没有在表格中表达出来。
虽然文章中说明了情况,但是信息有些杂乱,使用统计表可以使重要的信息一目了然,为读者提供便利。
【应用的分析方法是否正确】:
个人认为应用的分析方法不正确。
首先,它并未说做过方差齐性检验,
其次,它看不出使用的是哪种t检验,不是单样本资料的t检验,也不是独立样本的t检验,若说是配对样本的t检验,它每次的观察例数不相同,治疗前是72例,治疗后3个月是56例,治疗后6个月又变成62例。
再次,它将治疗后3个月与6个月分别与治疗前比较,割裂了原来的整体设计方案,资料的利用率及结论的可靠性低,应采用方差分析进行处理。
【结果解释是否正确】:
结果描述中,“32例病人的月经情况与治疗前比较差异有统计学意义”这句话中,32例病人来的莫名其妙,看不出是从哪里来的,可能是笔误。
【如何修正】:
应采用方差分析进行处理。
医学期刊论著研究案例分析
2010年中国60岁以上居民高血压和糖尿病及血脂异常状况调查
一、论文题目
《2010年中国60岁以上居民高血压和糖尿病及血脂异常状况调查》
二、研究目的
凋查2010年中困60岁以上居民高血压、糖尿病及血脂异常状况。
随着我国人口老龄化程度的加剧,高血压、糖尿病和心脑血管疾病等慢性病的患病率逐年增长。
高血压与脑卒中关系密切,70%以上脑卒巾患者患有高血压弘。
。
糖尿病患者发生高血压的风险是非糖尿病患者的2~3倍,糖尿病患者的脑梗死发生率也明显高于非糖尿病者。
血清TC或LDL—C升高均是冠心病和缺血性脑卒中的独立危险。
笔者利用2010年中国慢性病监测数据,分析了我国不同地区60岁以上居民的高血压、糖尿病及血脂异常状况。
三、研究人群
对象:
2010年在中国内地31个省(自治区、直辖市)及新疆建设兵团开展了中国慢性病及其危险因素监测调查。
该调查采用多阶段整群随机抽样方法,在全国疾病监测系统的162个监测点进行。
调查对象为监测点18岁以上的常住居民(在该地区居住6个月以上的居民),纳人分析的有效样本量共为97187名,其中60岁以上居民共19981名。
所有调查对象均签署了知情同意书,本研究通过巾国CDC伦理委员会审查。
四、资料类型
本次调查项目包括问卷调查,体重、身高和血压测量,以及血糖与血脂的检测。
问卷调查:
包括家庭问卷和个人问卷。
家庭问卷内容包括家庭成员人口学基本信息、家庭经济和饮食状况;个人问卷内容主要包括吸烟、饮酒、饮食、身体活动状况,以及高血压、糖尿病、慢性阻塞性肺病(COPD)、肿瘤等主要慢性病的患病情况。
计量资料:
体重、身高、血压、血糖、血脂
二分类变量:
性别、是否患病
五、统计分析方法
统计学分析:
对≥60岁居民监测数据,以性别、年龄、城乡和地域(东、中、西部)作为分层因素进行统计分析。
按照同家统计局的分类方法,将全国所有的县(区)按照地域分成东、中、西部;将县、县级市和旗定义为农村(参与本次调查的新疆建设兵团某部被定义为农村),其他为城市。
采用患病率指标,运用
检验分析各层内及各年龄组之间的高血压、糖尿病以及血脂异常的差别。
所有结果(患病率)均经过复杂加权调整,按照2010年中国慢性病监测的抽样方案计算了抽样权重,计算权重的过程和方法详见文献。
应用SAS9.2统计软件进行数据分析,以P<0.05为差异有统计学意义。
纠错:
统计学分析方法中说明了本文使用
检验来分析各层内及各年龄组之间的高血压、糖尿病以及血脂异常的差别。
虽然没有什么错误。
但我认为最好先说明资料类型之后再说明具体使用哪种
检验才比较合适。
六、结果表达
(1)高血压、糖尿病及各项血脂异常患病情况:
经过复杂加权计算后,我国60岁以上居民高血压患病率为66.9%,东部高于西部;糖尿病患病率为19.6%,东部高于西部,城市高于农村,女性高于男性;3项血脂异常患病率均呈现女性高于男性,城市高于农村,高甘油三酯血症是血脂异常的主要类型,患病率为10.8%(表1)。
结论:
高血压患病率为66.9%,东部高于西部(分别为67.9%和62.5%)(P<0.05),城乡差异无统计学意义(P>0.05)。
糖尿病患病率为19.6%,东部高于西部(分别为21.5%和17.7%)(P<0.05),城市高于农村(分别为25.O%和17.0%)(P<0.05)。
纠错:
(1)假设检验结果结果正确表达方法:
应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,以及可信区间、检验统计量、P值;然后根据P值做出统计学推断,并作出相应的医学专业结论。
以上面的结论为例:
对于高血压患病率东部高于西部这个结论来说,不仅没有给出统计量卡方值,也没有写出在α=0.05的检验水准。
而且在下面的表1中是对东、西、中部进行了卡方检验,并没有看到两两比较的结果,这显然是不对的,而且也没有给出95%可信区间。
(2)线条使用错误:
至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。
部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。
其它竖线和斜线一概省去。
本篇文章的统计表违背了三线表的基本原则。
(3)组段分组方法错误:
本例中组段为为60~64,65~69,70~74,75~79
这样划分年组段的问题是:
64岁零几个月的人就不能归到任何一个年龄组中,这是不对的。
而本文列表中的表述方法,实际只是各相应年龄组,而不是组段。
根据组段划分原则:
1、确定各组段上下限时,各组段要连续但不重叠。
除去最后一个组段,其余组段应包含下限值,不包含上限值。
2、同时分组不宜过粗,也不宜过细。
通常分为10~15个组。
本文中的组段较少,应再细分。
3、第一组段应包含最小值,最后一组段应包含最大值。
本例中最后一组并无最大值。