论文中统计结果的表达及说明.docx
《论文中统计结果的表达及说明.docx》由会员分享,可在线阅读,更多相关《论文中统计结果的表达及说明.docx(8页珍藏版)》请在冰豆网上搜索。
论文中统计结果的表达及说明
《中华消化外科杂志》对P值标准化表述的要求
依照中华医学会杂志社的要求,依照人民卫生出版社的全国高等学校教材《卫生统计学》第5版,报告统计学查验的结论时,对P值小于或等于查验水准(一样为的情形,一概描述为“不同有统计学意义”,同时写明P的具体数值或相应的不等式,在用不等式表示P值的情形下,一样情形下选用P>、P<和P<三种表达方式即可知足需要,不必再细分为P<或<。
再也不采纳将P<描述为“不同有显著意义”(或不同有显著性)”,或将P<描述为“不同有超级显著意义(或不同有超级显著性)”的表达方式。
______________________________________________
论文中统计结果的表达及说明
【摘要】 统计学是生物医学研究所必需的重要手腕,生物医学研究的实验设计、资料搜集、数据处置分析和结论都离不开统计学应用。
生物医学研究论文要紧由摘要、引言、材料与方式、结果和讨论5个部份组成,各个部份都涉及统计结果的表达和说明,统计学是专业结论成立与否的重要依据。
统计学应用不妥不仅阻碍论文的科学性,还有可能得犯错误的专业结论。
【关键词】统计学科研论文统计分析统计表达
最近几年来,统计学在生物医学科研中的应用愈来愈受到重视,统计分析结果的表达及说明已成为医学科研论文中不可缺少的重要组成部份。
除论文涉及的专业(如细胞与分子免疫学杂志为免疫学专业)和表述的文字2个方面外,统计学是评判论文质量好坏的重要依据,但是国内生物医学论文中统计学应用仍存在着较为严峻的问题[1-4],如2003年某大学学报拟发表论著中统计方式误用率为57%[3]。
细胞与分子免疫学杂志尽管在国内生物医学系列杂志中具有较高的学术地位[5],但拟发表及刊出论文在科研设计、统计学分析、结果说明等方面也不同程度地存在一些问题,作者的统计学应用水平有待进一步提高。
许多生物医学杂志,如国外闻名杂志JAMA、新英格兰医学杂志(NEJM)和英国医学杂志(BMJ)等,和国内中华医学会系列杂志及细胞与分子免疫学杂志等,
对来稿都有统计学表达的大体要求或统计学指导原那么。
国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包括了统计学表达的大体要求。
生物医学研究性论文要紧由摘要、引言、材料与方式、结果和讨论5个部份组成,各个部份或多或少都涉及到统计结果的表达和说明问题。
例如在论文的“引言”部份需要给出文献温习的综合结果,如文献报告的组间不同及P值等。
其他重要的统计表达和说明要紧集中在论文的“摘要”、“材料和方式”、“结果”及“讨论”4个部份[6]。
1摘要
“摘要”中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设查验结果(P值)。
如处置组和对照组的均数(中位数)、标准差(标准误)、率、P值,或2组均数(率)之差、95%可信区间、OR值及多个观看指标的相关系数等。
这些数据是循证医学Meta分析的大体依据。
2材料和方式
“材料和方式”中的统计学描述包括以下两个方面。
描述研究设计的内容内容包括研究类型、观看对象类型、入选和剔除标准、观看方式和测量技术和实验、实验或调查资料的搜集进程等。
尤其应具体地描述研究对象的来源和选择方式(如是不是配对、随机抽样),包括观看对象的大体情形、有无随机分组(随机抽样)、随机化分组方式、样本含量及其估量的依据等。
关于非随机化分组的观看性研究(含调查研究),还应给出阻碍因素(如年龄、性别、病情)的均衡性分析结果。
关于临床实验,还需要专门说明诊断标准、疗效评判标准、病例入选标准、病例剔除标准、依从性如何、有无失访及失访的比例、有无“知情同意”、疗效评判是不是采纳“盲法”(“单盲”、“双盲”或“多盲”)等。
描述统计分析方式与统计计算软件论文顶用到的所有统计分析方式都要说明,且需指出在何处用了何种方式。
统计计算软件一样给出名称即可,如SPSS、SAS等。
但是,有些论文却把统计学当做“修饰物”,论文中没有效到的统计分析方式也都一一罗列出来,乃至有的形态学研究不需要统计学分析,却也给出了“P值”。
在那个地址,有些作者错误地以为,只要给出了“P值”,就标志用了统计学,却不管统计学用得是不是正确。
事实上,
误用或滥用统计学不仅不能提高论文的质量,反而会大大降低论文的科学性!
研究设计常见的要紧问题
(1)研究目的不分主次,试图通过一次实验回答多个问题,测量指标多,样本小,实验前未进行样本含量估量,对研究对象的来源和选择方式不做任何说明或只做超级简单的说明,统计分析方式没有任何说明,尤其是一些特殊的统计方式。
例如,动物实验没有随机化分组,或只说明经随机化分组,未说明具体的随机化分组方式(如完全随机、配对或分层随机分组等);
(2)观看对照的研究轻率利用“随机选择对照”、“随机抽取健康儿童××例”等用语,对照组间的均衡性未交代或组间不做比较,只说明组间均衡,未给出反映均衡性的统计指标的具体数据和所用的统计分析方式;(3)临床实验没有报告伦理学要求对随机化分组的限制与改动、受试者的代表性、依从性、是不是有失访等,疗效评判未说明是不是采纳“盲法”,或只说明采纳了“盲法”,未说明是受试者遮蔽仍是评判者遮蔽等;(4)实验或实验的样本量超级小,如每组3例,却不说明任何理由等等。
3结果
统计学分析结果要紧用统计指标(统计量)表示。
统计指标比较多且需分组比较时,常常须借助统计图表。
统计量在生物医学论文中,对不同类型的研究资料需用不同的统计指标进行描述。
对细胞与分子生物学实验中的常见观测指标,如TRAIL表达、mRNA表达水平、光密度值(OD值)、吸光度值(A值)、百分比含量及抑制率等,常作为计量数据(计量资料)进行统计描述与分析。
关于计量资料,当资料为近似正态(或对称)散布时,可用算术均数x和标准差s描述;在没有变异指标或精准性指标的情形下,不宜单独利用均数。
在“±”后直接写具体数值而无标准误或标准差的符号表示,如±,容易引发混淆。
配对t查验,应给出差数的均数及标准误(或标准差)。
当资料为偏态时,应采纳中位数Md和四分位数间距QR来描述,而不宜用x和s。
用非参数统计分析方式处置的资料,数据的中心位置用中位数表示,散布范围(如95%的散布范围)用百分位数表示。
另外,假设对原始数据进行了变量转换,那么原始数据的均数及标准差不能专门好地反映数据的中心位置及其散布范围,没必要将其列出。
关于计数资料,经常使用的统计指标有率和组成比(百分比)。
利用百分比时,分母要交待清楚。
小样本资料不宜计算百分比。
实际工作中统计指标应用常见的问题有:
计量资料不管是不是近似服从正态散布,通通用x±s描述研究结果的数据特点;分子生物学或细胞实验(如ELISA法、MTT法、RTPCR法、免疫细胞化学法、蛋白质印迹分析法等)数据用x±s表示,其样本量(例数)n在“材料和方式”或“结果”中未交代;计数资料统计指标率和组成比(百分比)容易混淆,常将组成比误用为率来讲明事物发生的强度;率和组成比的分母过小,却计算相对数来进行描述和比较。
分母过小时,率(组成比)的靠得住性不能保证。
因此,在这种情形下,宜直接用绝对数进行描述而不宜计算相对数。
当计量资料符合正态散布条件时,约有68%的观看数据在x±s的范围内,约有95%的观看数据在x±2s的范围内。
当数据不符合正态散布时,就没有这些特点了。
假设查验的结果表达不仅要给出P值,还要给出查验统计量的实际值,如u值、t值、χ2值等。
描述统计量,如均数、率、相关系数,不管查验结果是不是有统计学意义,均应列出。
水平是经常使用的查验水准,但P为或时,与并无太大不同,得出的结论也理应一致,不该有本质上的不同。
用P>作为不“显著”(统计学意义)的表达方式容易使读者(也包括作者)误解,由于统计软件的普及,因此提倡报告P的具体数值(精准P值),如P=或P=等。
若是提供精准P值实在有困难,应给出实际的χ2值、t值、F值和相应的自由度,以便他人在Meta分析时转换为精准P值。
统计图表统计图表是研究结果统计表达的重要手腕,统计图便于读者直观了解研究结果,而且提倡用图来显示个体值的散布情形,如相关和回归分析的散点图。
同一个体值不同时刻的重复测量值最好连成曲线,不同组别的个体值(均值)随时刻转变的曲线亦可标在同一个图上。
提倡采纳误差条图(或线图),但由均数加减标准误绘出的误差条图,仅能描述68%的可信区间,不能误解为95%的可信区间。
医学论文中要求采纳“三线”表。
数值结果按列(行)放置,位数要对齐,不要显现交*换行的情形。
不同类型数据(如均数、标准误)要有标目,表中应列出相应的观看例数。
大量统计结果的表达要运用统计表或统计图,实际应用中统计图表还存在一些问题,要紧有:
(1)图形类别的选择与资料性质不符;
(2)纵横两轴的等距离尺度不代表等差数据(算术尺度)或等比数据(对数尺度);(3)无图例或标目;(4)条图的纵轴起点不为0、横轴的刻度为算术刻度、排列顺序未按指标值大小(或自然顺序)排列;(5)圆图各部份未按比例大小或自然顺序顺时针方向排列(其他项放最后)、起点位置不在12时或9时;(6)统计表的标目不明确,主辞和宾辞倒置或混淆,表中存在斜线或竖线,数据为“0”、无数据或缺失数据时留有空白,同一指标小数位数(精度)不一致、小数点(位)未对齐等图表不标准问题。
数据精准度一样来讲,数据精准度只要足以区分个体不同即可,并非小数位数越多越好。
表示观测结果时,2个数的小数位数应一致,如±,应写成±,平均值(x)与标准差(s)的位数,除取决于测量仪器的周密度外,还取决于样本内个体的变异,一样按s3而定,例如±g,其中s3超过200g,平均值在百克的位上波动,故应写成±kg。
与实际情形不符的精准度并非能增加论文的价值,反而降低了论文的可读性与可信程度。
从计算器或运算机取得的计算结果需要四舍五入。
计量资料的统计指标(x、s、中位数、百分位数等)要保留的小数位数,应该与原始数据记录的小数位数相同。
均数的有效位数通常不该比原始数据的有效位数多,但标准差或标准误必要时需多增加一个位数。
计数资料的百分比保留1位小数,一样不超过2位小数;病死率、发病率按老例选择比例基数,如1000‰,10000/万和10万/10万等,或自行选择适合的比例基数,使率的整数部份至少有1位有效数字;相关系数保留2位小数;精准概率P值一样没必要给出四位小数,有时乃至保留两位小数也能够;查验统计量,如χ2值、t值保留2位小数即可。
当样本数小于100时,小数位数的多少并非能增加精准度,应幸免取过量的小数位数。
注意,以上要求仅适用于表达最终的统计结果,数据在分析之前或分析进程中不能舍入。
在表达t值、χ2值或r值时,有2位小数就足够了。
经常使用统计专业术语一些经常使用的统计专业术语,要注意不能作为一般名词利用,如参数(parameter)、可信区间(confidenceinterval)、相关(correlation)、发病率(morbidity)、患病率(prevalencerate)、非参数法(nonparametricstatistics)、百分位数(percentile)、灵敏度(sensitivity)、特异度(specificity)等。
4讨论
“统计学”是“专业结论成立与否的重要依据”[2]。
统计学分析结果的说明要紧集中在论文的“讨论”
部份。
作者往往要在“讨论”部份引用统计结果作为支持其新发觉、新结果、新观点的统计学依据,对统计结果明白得和说明上的误差,可能致使专业结论上的错误。
假设查验结果的说明假设查验是在“无效假设”正确的前提下(如施加干与以前,组间无不同或观看对象来自同一整体),用P值大小说明实际观看结果是不是符合“无效假设”。
P值小(如P<),那么疑心“无效假设”的正确性;P值大(如P>),那么不能拒绝“无效假设”。
但不能把P值明白得为处置无效的概率。
要注意区分“统计学显著”和“生物学(或医学)显著”是2种不同的结论。
不可一取得P<就以为有实际意义,而不管其生物学效应有多大。
组间生物学效应很小时(如DCAgTDLNC组比DCTDLNC组CD3+T细胞含量仅提高了%[7]),大样本量也可能使统计结果“显著”。
例如肝硬化患者外周血IP10水平与ALT水平的Spearman相关系数为,当n=100时,Spearman相关系数经假设查验“统计显著”(P<),但IP10水平与ALT水平彼此只能说明4%的变异,实际意义已经很小。
因此,统计学意义上的“显著”并非等同于生物学上的不同“显著”。
同理,也不能一看到P>就以为某2种生物学处置“无显著不同”,乃至以为能够彼此替代。
即便生物学上的不同“显著”,当观看的样本很小时,也极有可能显现统计学上不“显著”的结果。
在医学论文中,有一些P>的“阴性”结果,查验效能不足是一个要紧的缘故。
综上所述,有统计学意义的查验结果并非必然意味着确有生物学效应。
那个地址有两个缘故,一是总会有错判的危险性,P值越小错判的危险性越小;二是假设查验为定性的查验结果(是不是拒绝无效假设)时,专业上是不是成心义还要看统计量的大小。
可信区间有助于假设查验结果的说明,小样本时尤其如此。
由于可信区间反映了研究结果的不确信性,并可提示不同有无实际意义,因此不管假设查验结果是不是显著,都可计算可信区间,如两均数差值的可信区间、相关系数的可信区间等。
将可信区间与不显著的结果一路列出,专门有启发作用。
关联与因果在观看性研究中,变量间的关联(association)或组间不同可能是因果关系(causation),也可能是偏倚,确信因果关系需要依照专业知识进行进一步的分析研究。
例如,有人曾观看到眼晶状体后纤维增生的新生儿,注射促肾上腺皮质激素后,治愈率75%,说明促肾上腺皮质激素与患儿治愈有关联(前后比较:
P<)。
但随后进行的前瞻性的临床实验发觉,患儿离开富氧环境后,75%患儿自然痊愈(组间比较:
P≈)。
若是将观看结果说明为“注射促肾上腺皮质激素与患儿痊愈有因果联系”,并以此作为统计学证据,临床上大量利用促肾上腺皮质激素医治新生儿眼晶状体后纤维增生,会致使严峻后果。
在随机对照研究中,关联和组间不同能够说明为有概率保证的因果关系。
当变量都随时刻而转变时,变量间很容易显现虚假的相关关系,必需专门加以警惕。
预测与诊断实验在细胞与分子生物学检测(诊断)实验中,常常碰到标准曲线(直线)的绘制,即需要进行回归分析。
在回归分析中,即便两变量间有显著关系,但用回归方程从变量X推算Y的个体值,仍可能不很精准。
预测的精准程度不能依照有关或回归系数来评判,它需按不同的X值计算预测的个体Y值的允许区间(或Y值均数的可信区间)。
直线回归仅适用于用自变量X预测应变量Y,而不是Y预测X。
具有高灵敏度、特异度的诊断查验,不必然能达到诊断疾病的目的,在人群发病率很低的情形下尤其如此,而计算患者在诊断实验阳性人数中的比率(阳性预测值,PV+)会更有有效价值。
持续性变量也有类似诊断实验的问题。
通常把“异样”值概念为该变量“正常范围”之外的数值。
但如果是实际患病率很低,许多正常人的个体值在“正常范围”之外也是正常的。
异样者的判定应同时依照临床上和统计上的标准。
缺点或不足要指出在研究设计和实施进程中有哪些不足。
假设发觉缺点,那么应考虑这些缺点对结果和说明可能产生的阻碍。
不能对缺点或不足视而不见,更不能寄希望于不被读者发觉。
总之,生物(医学)统计学是生物(医学)专业结论成立与否的重要依据。
生物医学研究者应重视统计研究设计及统计分析结果的表达和说明,正确运用统计方式的前提是良好的实验设计。
若是实验前没有良好的设计,或设计存在错误,那么,即便利用高级的运算机和复杂的统计方式处置数据,也只能取得错误的结论。
因此,统计学问题的咨询应该在一个研究项目开始之前,而不是在研究数据出来以后,不然,就象统计学家Fisher所告戒的一样:
实验完成后再找统计学家,无异于请统计学家为实验进行“尸身解剖”,统计学家或许只能告知你实验失败的缘故。