生物统计学答案第一章Word格式.docx

上传人:b****6 文档编号:21359818 上传时间:2023-01-30 格式:DOCX 页数:18 大小:118.84KB
下载 相关 举报
生物统计学答案第一章Word格式.docx_第1页
第1页 / 共18页
生物统计学答案第一章Word格式.docx_第2页
第2页 / 共18页
生物统计学答案第一章Word格式.docx_第3页
第3页 / 共18页
生物统计学答案第一章Word格式.docx_第4页
第4页 / 共18页
生物统计学答案第一章Word格式.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

生物统计学答案第一章Word格式.docx

《生物统计学答案第一章Word格式.docx》由会员分享,可在线阅读,更多相关《生物统计学答案第一章Word格式.docx(18页珍藏版)》请在冰豆网上搜索。

生物统计学答案第一章Word格式.docx

1.5下表是我国青年男子体重(kg)。

由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。

根据表中所给出的数据编制频数分布表。

694546852491186769650487667662664225456206511672551424525885782305452623858776834684304956777577684796536633673070242977684511314479064543042908535648953730587965764495455875567257271955529885366521854764018739504392190397189649587446938003827559575267414633666353786231613856946090345477562155035264答:

首先建立一个外部数据文件,名称和路径为:

E:

dataexer1-5e.dat。

所用的SAS程序和计算结果如下:

procformat;

valuehfmt56-57=56-5758-59=58-5960-61=60-6162-63=62-6364-65=64-6566-67=66-6768-69=68-6970-71=70-7172-73=72-7374-75=74-75;

run;

dataweight;

infileE:

dataexer1-5e.dat;

inputbw;

procfreq;

tablebw;

formatbwhfmt.;

TheSASSystemCumulativeCumulativeBWFrequencyPercentFrequencyPercent-56-5731.031.058-5941.372.360-61227.3299.762-634615.37525.064-658327.715852.766-677725.723578.368-694515.028093.370-71134.329397.772-7351.729899.374-7520.7300100.01.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。

它们的平均数相等吗?

标准差相等吗?

能够解释为什么吗?

用means过程计算,两个样本分别称为和,结果见下表:

TheSASSystemVariableNMeanStdDev-Y11064.50000003.5039660Y21063.90000003.1780497-随机抽出的两个样本,它们的平均数和标准差都不相等。

因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。

1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?

为什么?

本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?

不是简单的随机样本。

从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。

应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。

1.8证明若用或编码时,前式是否仍然相等?

(1)令则平均数特性之。

(2)令则平均数特性之。

用第二种编码方式编码结果,两式不再相等。

1.9有一个样本:

,设B为其中任意一个数值。

证明只有当最小。

这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。

令,为求使p达最小之B,令则。

1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下1:

10.09.37.29.18.58.010.510.69.610.17.06.79.57.810.57.98.19.67.69.410.07.57.25.07.38.77.16.15.26.810.09.97.54.57.67.09.76.28.06.98.38.610.04.84.97.08.38.47.87.56.610.06.59.58.511.09.76.610.05.06.58.08.48.37.47.48.17.77.57.17.87.68.66.07.06.46.76.36.411.010.57.85.08.07.07.45.26.79.08.64.66.93.56.29.76.45.86.49.36.4编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。

dataexr1-10e.dat。

SAS程序及结果如下:

optionsnodate;

valuehfmt3.5-4.4=3.5-4.44.5-5.4=4.5-5.45.5-6.4=5.5-6.46.5-7.4=6.5-7.47.5-8.4=7.5-8.48.5-9.4=8.5-9.49.5-10.4=9.5-10.410.5-11.4=10.5-11.4;

datawheat;

dataexr1-10e.dat;

inputheight;

tableheight;

formatheighthfmt.;

proccapabilitygraphicsnoprint;

varheight;

histogram/vscale=count;

insetmeanvarskewnesskurtosis;

TheSASSystemTheFREQProcedureCumulativeCumulativeheightFrequencyPercentFrequencyPercent-3.5-4.411.0011.004.5-5.499.001010.005.5-6.41111.002121.006.5-7.42323.004444.007.5-8.42424.006868.008.5-9.41111.007979.009.5-10.41515.009494.0010.5-11.466.00100100.001.11北太平洋宽吻海豚羟丁酸脱氢酶(HDBH)数据的接收范围频数表2如下:

(略作调整)HDBH数据的接收范围/(UL-1)频数2141245.90913277.818211309.727319341.636426373.545522405.454511437.363613469.27276501.18183533.09092根据上表中的数据作出直方图。

以表中第一列所给出的数值为组界,直方图如下:

1.12灵长类手掌和脚掌可以握物一侧的皮肤表面都有突起的皮肤纹嵴。

纹嵴有许多特征,这些特征在胚胎形成之后是终生不变的。

人类手指尖的纹型,大致可以分为弓、箕和斗三种类型。

在手指第一节的基部可以找到一个点,从该点纹嵴向三个方向辐射,这个点称为三叉点。

弓形纹没有三叉点,箕形纹有一个三叉点,斗形纹有两个三叉点,记录从三叉点到箕或斗中心的纹嵴数目称为纹嵴数(fingerridgecount,FRC)。

将双手十个指尖的全部箕形纹的纹嵴数和/或斗形纹两个纹嵴数中较大者相加,称为总纹嵴数(totalfingerridgecount,TFRC)。

下表给出了大理白族人群总纹嵴数的频数分布3:

TFRC分组中值频数113020231504015170608719080299111010054111130120631311501406815117016051171190180181912102006首先判断数据的类型,然后绘出样本频数分布图,计算样本的四个特征数并描述样本分布形态。

总纹脊数属计数数据。

计数数据的频数分布图为柱状图,频数分布图如下:

样本特征数(以TFRC的中值计算)SAS程序:

datatfrc;

doi=1to10;

inputy;

inputn;

doj=1ton;

output;

end;

cards;

202401608802910054120631406816051180182006;

procmeansmeanstdskewnesskurtosis;

vary;

结果见下表:

TheSASSystemAnalysisVariable:

YMeanStdDevSkewnessKurtosis-126.533333332.8366112-0.2056527-0.0325058-从频数分布图可以看出,该分布的众数在第七组,即总纹脊数的中值为140的那一组。

分布不对称,平均数略小于众数,有些负偏。

偏斜度为-0.2056527,偏斜的程度不是很明显,基本上还可以认为是对称的,峭度几乎为零。

1.13海南粗榧叶长度的频数分布4:

叶长度/mm中值频数2.02.22.13902.22.42.314342.42.62.526432.62.82.735462.83.02.956923.03.23.151873.23.43.343333.43.63.527673.63.83.716773.84.03.91137nag4.04.24.16674.24.44.33464.44.64.5181绘出频数分布图,并计算偏斜度和峭度。

表中第一列所给出的数值为组限,下图为海南粗榧叶长度的频数分布图。

计算偏斜度和峭度的SAS程序和计算结果如下:

datalength;

doi=1to13;

2.13902.314342.526432.735462.956923.151873.343333.527673.716773.911374.16674.33464.5181;

procmeansnskewnesskurtosis;

YnSkewnessKurtosis-300000.41064580.0587006-样本含量n30000,是一个很大的样本,样本的偏斜度和峭度都已经很可靠了。

偏斜度为0.41,有一个明显的正偏。

1.14马边河贝氏高原鳅繁殖群体体重分布如下5:

体质量/g中值雌鱼雄鱼2.003.002.50143.004.003.50674.005.004.5013115.006.005.5030256.007.006.5025257.008.007.5016238.009.008.5021179.0010.009.50181610.0011.0010.5012411.0012.0011.50312.0013.0012.502首先判断数据的类型,然后分别绘制雌鱼和雄鱼的频数分布图,计算样本平均数、标准差、偏斜度和峭度并比较两者的变异程度。

鱼的体重为度量数据,表中第一列所给出的数值为组限。

在下面的分布图中雌鱼和雄鱼的分布绘在了同一张图上,以不同的颜色表示。

计算统计量的SAS程序与前面的例题类似,这里不再给出,只给出结果。

雌鱼:

YNMeanStdDevSkewnessKurtosis-1477.24149662.14568200.2318337-0.6758677-雄鱼:

YNMeanStdDevSkewnessKurtosis-1326.78030301.9233971-0.1322816-0.5510332-直观地看,雄鱼的平均体重低于雌鱼。

雌鱼有一正偏,雄鱼有一负偏。

因此,相对来说雌鱼低体重者较多,雄鱼高体重者较多。

但两者都有很明显的负峭度,说明“曲线”较平坦,两尾翘得较高。

1.15黄胸鼠体重的频数分布6:

组界/g频数01510153026304530456022607522759017901051610512014120613513515041501652总数169绘制频数分布图,从图形上看分布是对称的吗,说明什么问题?

下面是频数分布图:

从上图可见,图形不是对称的,有一些正偏。

说明在该黄雄鼠群体中,低体重者分布数量,高于高体重者的数量。

另外,似乎峭度也有些低。

1.1625名患者入院后最初的白细胞数量(103)7如下表:

851241168771273111411966561014455计算白细胞数量的平均数、方差和标准差。

用means过程计算,程序不再给出,只给出运行结果。

YNMeanVarianceStdDev-257.840000010.30666673.2103998-1.17细胞珠蛋白基因(CYGB)可能是非小细胞肺癌(NSCLC)的抑制基因之一。

一个研究小组研究了该基因的表达、启动子甲基化和等位基因不平衡状态等,以便发现它与肿瘤发病间的关联。

下面列出了其中15名患者的基因表达(肿瘤患者/正常对照,T/N),肿瘤患者与正常对照甲基化指数差(MtIT-MtIN)8:

样本号T/NMtIT-MtIN3570.0140.4193700.0190.0173670.0350.1053160.0440.3333690.0540.1703580.0840.2463030.1110.2423140.1350.3643080.2360.0513100.2530.5203410.2640.2003480.3150.1033230.3590.1673600.4220.1763360.4420.037计算以上两项指标的平均数和标准差并计算两者的变异系数,这两个变异系数可以比较吗?

记T/N为,MtIT-MtIN为,用means过程计算,SAS运行的结果见下表:

TheSASSystemVariableNMeanStdDevCV-Y1150.18580000.150562481.0346471Y2150.21000000.146527469.7749634-两个变异系数是可以比较的,因为它们的标准差都是用平均数标准化了的,已经不存在不同单位的影响了。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1