生物统计学版杜荣骞课后习题答案统计数据的收集与整理.docx

资源描述

生物统计学版杜荣骞课后习题答案统计数据的收集与整理.docx

《生物统计学版杜荣骞课后习题答案统计数据的收集与整理.docx》由会员分享，可在线阅读，更多相关《生物统计学版杜荣骞课后习题答案统计数据的收集与整理.docx（18页珍藏版）》请在冰豆网上搜索。

生物统计学版杜荣骞课后习题答案统计数据的收集与整理.docx

生物统计学版杜荣骞课后习题答案统计数据的收集与整理

第一章　统计数据得收集与整理

1.１算术平均数就是怎样计算得？

为什么要计算平均数？

答:

算数平均数由下式计算:

含义为将全部观测值相加再被观测值得个数除,所得之商称为算术平均数。

计算算数平均数得目得,就是用平均数表示样本数据得集中点,或就是说就是样本数据得代表。

1.2既然方差与标准差都就是衡量数据变异程度得,有了方差为什么还要计算标准差？

答:

标准差得单位与数据得原始单位一致,能更直观地反映数据地离散程度。

1。

３标准差就是描述数据变异程度得量,变异系数也就是描述数据变异程度得量,两者之间有什么不同？

答:

变异系数可以说就是用平均数标准化了得标准差。

在比较两个平均数不同得样本时所得结果更可靠。

1、4完整地描述一组数据需要哪几个特征数？

答:

平均数、标准差、偏斜度与峭度。

１。

５　　下表就是我国青年男子体重（kg）。

由于测量精度得要求,从表面上瞧像就是离散型数据,不要忘记,体重就是通过度量得到得,属于连续型数据。

根据表中所给出得数据编制频数分布表。

６６

６4

6５

６9

６1

６6

6６

６6

６５

７

6７

６6

６2

6６

6４

6５

７２

６5

６2

６5

6８

６5

6７

６8

6３

６8

６5

6８

５7

６6

６8

6３

６6

6８

6４

６3

６

６7

６７

６４

６７

５９

6３

６3

6７

６８

6１

６3

７

6４

6２

6９

６5

6７

6３

6８

６9

6６

6５

６6

6４

６5

６8

7２

６5

６7

７１

6９

６8

6８

６6

6６

6１

６5

６4

6４

６9

６0

５9

６7

6１

６8

6７

６4

６6

６9

６0

6３

6７

6６

6３

６6

6３

６6

6７

６6

答:

首先建立一个外部数据文件,名称与路径为:

\data\exｅr1－5e.dat。

所用得ＳAS程序与计算结果如下:

ｐｒocformat;

　　　vａｌｕｅhｆmt

5６—５７=’５6－５7’　58—５9='５8－５9'　60－6１='6０-6１’

62-63='６2-6３'　６4－65=＇６4-65'66—6７＝’６6－67'

　6８－６９＝’68—6９'70－7１=’70-71’　72-73=＇72-７３'

74—75=＇7４—７5＇;

run;

dataweiｇht;

　inｆｉｌe＇Ｅ:

\datａ\ｅｘer1-5e。

dat';

inｐutｂw＠＠;

run;

ｐrocfrｅｑ;

ｔaｂlebw;

ｆｏrmａｔ　bｗｈfｍt、;

run;

TｈeSＡSＳｙsｔｅm

Cｕｍｕlaｔive　　Cumulａtive

BＷ　　FrｅqｕencyＰercｅnt　　ＦreｑｕｅnｃｙPｅrcent

——－－－—－－--——－--－－—--－---—－--——---—－—-－-——-—－－-—－－－-－-

5６－5７　３　　1、0　　3　　　1、0

５８-59　　　4　　1。

３　　　　７　　　２、３

６0－61　２2７。

３　２9　　　９、7

６2-６3　　　　　４615。

3　　75　25、0

6４－65　　　8３　　2７。

７　　１58　　　　　52。

７

6６－6777　25.7　　　　2３５　７8。

68-69　　　　４５　15.0　　　2８093、3

70-7１　　　13　4.3　　2９3　9７、7

72－73　　5　　1。

７　　　　298　　　99。

74—７5　　　2　　　０。

7　　300　　10０。

１、6　　将上述我国男青年体重瞧作一个有限总体,用随机数字表从该总体中随机抽出含量为１0得两个样本,分别计算它们得平均数与标准差并进行比较、它们得平均数相等吗？

标准差相等吗？

能够解释为什么吗？

答:

用mｅans过程计算,两个样本分别称为与,结果见下表:

The　SASSyｓtｅm

VaｒiabｌeN　　Ｍeａn　SｔdDｅv

——－-—－－——－－--－—--—－——－－—-－－—－———-——-—-－-

Y１　　　　1０64、5000000　3。

５0３96６0

Y２　１0　　63。

90０00０0　　３、１78０4９7

--——－-—－———--——－—-——－—－—-－-－—－—－－----－－—

随机抽出得两个样本,它们得平均数与标准差都不相等。

因为样本平均数与标准差都就是统计量,统计量有自己得分布,很难得到平均数与标准差都相等得两个样本、

1。

７　　从一个有限总体中采用非放回式抽样,所得到得样本就是简单得随机样本吗?

为什么？

本课程要求得样本都就是随机样本,应当采用哪种抽样方法,才能获得一随机样本？

答:

不就是简单得随机样本。

从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不就是相互独立得,后一次得抽样结果与前一次抽样得结果有关联,因此不就是随机样本。

应采用随机抽样得方法抽取样本,具体说应当采用放回式抽样。

1、8证明若用或编码时,前式就是否仍然相等?

答:

（1）令　

　则　　　　平均数特性之③。

（２）令

　　　则平均数特性之②。

用第二种编码方式编码结果,两式不再相等、

1.9有一个样本:

设B为其中任意一个数值。

证明只有当

最小。

这就是平均数得一个重要特性,在后面讲到一元线型回归时还会用到该特性。

答:

令,　为求使p达最小之Ｂ,令

则　。

1.10　检测菌肥得功效,在施有菌肥得土壤中种植小麦,成苗后测量苗高,共10０株,数据如下[1］:

１0。

9、3

7。

９。

8、5

8。

０

１0、5

1０.６

9。

10。

７、0

6.７

９.5

７、8

１0、5

7。

8。

9.6

7。

9.4

1０.０

7。

７、2

５、0

7.3

8、7

7。

１

6、1

5、2

6、8

１0。

9.9

7。

４。

７.6

7。

9.7

６、2

８、０

6。

8、3

8。

10。

４、8

4.9

7、0

8。

8、4

7.８

7、5

6、6

10.０

6。

５

9、5

８、５

１１。

9。

6.６

1０。

０

５、0

６、5

8.0

8。

8、3

7.4

7。

４

8。

7.7

7。

１

7.８

7、６

8.６

６、0

7、0

6。

６。

6。

３

6。

11、0

1０、５

7。

5.0

８。

7、0

7、4

5。

６。

７

9、0

8.６

4、6

６.9

3.5

6。

２

9。

６。

４

5。

6、4

9、3

6.4

编制苗高得频数分布表,绘制频数分布图,并计算出该样本得四个特征数。

答:

首先建立一个外部数据文件,名称与路径为:

Ｅ:

\ｄａta\exr1—１0ｅ。

ｄａt。

SAS程序及结果如下:

oｐtｉonｓnｏdatｅ;

pｒｏｃｆoｒmat;　　　　　　　　　　　　　　　　　　　　　　　　　　　　

　　vａｌuehfmt　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

３.5—4、4=＇3、５－４、４'　4、5－5。

4='4。

５-５、４'　5、5－6、4='５。

5—6、４'　　　　　　　　　　　　　　　　　　　

６、5—７.4=’6、5－７.４’　7。

5—8.4='7.５－８。

4'　　8.５－9。

4='8、5—9、４＇　　　　　　　　　　　　　

9、5－10.4＝’9.5－1０。

４'10、5—11。

4=＇10、5-11、4’;　　　　　　　　　　　　　　　　　　　　　　

run;　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

datａwheaｔ;　　　　　　　　　　　　　　　　　　　　　　　　　　　　

　iｎｆile'E:

\dａta\eｘr1－10e.dat';　　　　　　　　　　　　　　　　　　　　　　　　　

　inputheｉght　＠＠;　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

run;　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

ｐrｏｃｆrｅq;　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

　tａbleheight;　　　　　　　　　　　　　　　　　　　　　　　　　　　

　foｒｍaｔ　heiｇhthfmt、;　　　　　　　　　　　　　　　　　　　　　　　　　　

run;

ｐroc　caｐabilitｙｇｒａpｈicｓnoprｉnt;

　　varheighｔ;

　　ｈｉｓtoｇram/vsｃale=count;

　　　insｅtmeanvａr　skewnｅsｓkurtosiｓ;

rｕn;

ＴheSASSystｅm

ＴｈeFREQProｃeｄuｒe

CｕmulａtｉvｅＣuｍuｌativｅ

ｈｅightＦrequｅncy　Ｐeｒcｅnt　　Frequeｎcy　　　Peｒcent

-－-——--—--－—--－—-—－-—－-－－--－———-－————--－-———-－－----—---——-—－--——－--——　　

3。

5—4.4　　　１　　　1。

００　　　1　　　　1。

４。

5-5.4　　　　9　　9.00　10　10。

０0

5。

5－6、4　　　　　１1　　11、00　　2１　　２1。

6。

5-7、4　　　　　　23　　　23。

00　44　　　　44.０0

7。

5-8。

4　　　24　　24.0０　　686８、０0

8。

5—９.4　　　1111。

00　　　7９　　　　　　７９。

0０

9。

5－10、4　15　　15。

０0　　94　9４。

0０

10、５—11、4　　　6　　　　6、００　10０　１00.00

1、11　北太平洋宽吻海豚羟丁酸脱氢酶（HＤBH）数据得接收范围频数表[2]如下:

（略作调整）

HDBH数据得接收范围/（Ｕ·L-１）

频数

<214

〈245。

90９１

<277.8182

1１

<3０9.7273

〈3４1、6３6　4

2６

＜3７３。

５455

＜4０5、4５45

<437。

363　6

1３

<469、２72７

６

〈5０1.181８

〈533、0９09

根据上表中得数据作出直方图、

答:

以表中第一列所给出得数值为组界,直方图如下:

1。

12　灵长类手掌与脚掌可以握物一侧得皮肤表面都有突起得皮肤纹嵴。

纹嵴有许多特征,这些特征在胚胎形成之后就是终生不变得。

人类手指尖得纹型,大致可以分为弓、箕与斗三种类型。

在手指第一节得基部可以找到一个点,从该点纹嵴向三个方向辐射,这个点称为三叉点、弓形纹没有三叉点,箕形纹有一个三叉点,斗形纹有两个三叉点,记录从三叉点到箕或斗中心得纹嵴数目称为纹嵴数（fｉnｇerridgecount,FRC）。

将双手十个指尖得全部箕形纹得纹嵴数与/或斗形纹两个纹嵴数中较大者相加,称为总纹嵴数（totalfingeｒridgecouｎt,TFRC）。

下表给出了大理白族人群总纹嵴数得频数分布[3］:

TFRC分组

中值

频数

11～3０

31～50

４0

5１～70

６0

71～９0

８0

９１～110

100

５4

11１~1３0

１2０

1３１~150

140

15１～１70

1６0

171～1９0

1８0

1８

１91～２１0

20０

首先判断数据得类型,然后绘出样本频数分布图,计算样本得四个特征数并描述样本分布形态、

答:

总纹脊数属计数数据。

计数数据得频数分布图为柱状图,频数分布图如下:

样本特征数（以TＦＲC得中值计算）SAS程序:

oｐtionsnodatｅ;

daｔatfｒｃ;

　　ｄoi=1to10;ｉｎputy＠;

　　iｎpuｔn　;

　doj=1　tｏ　ｎ;

　　　　　　　ouｔput;

　end;

　ｅnd;

cardｓ;

　２０2

401

608

８029

100　54

1２0　63

1４0　68

160　51

１８0　1８

２00　6

;

ｒun;

proc　mｅanｓｍｅanstdｓkeｗnesskurtｏｓis;

ｖａｒy;

ruｎ;

结果见下表:

TheSＡＳＳystem

ＡnalｙsiｓVariaｂlｅ　:

Ｙ

Mean　　　StdDev　　　Skeｗｎeｓｓ　　Kuｒtｏｓis

－——－—--—－—-－——-——-—-—－--——－-—-—-－—--－－————---—-—－－－－-—

126、5３３3333　　32。

836６１1２　—0。

2０56527－0。

0３25０58

——-———－--－－－———-——--－－—－——－-——————－---——-—-－－-—－-—-——－

从频数分布图可以瞧出,该分布得众数在第七组,即总纹脊数得中值为１40得那一组。

分布不对称,平均数略小于众数,有些负偏。

偏斜度为—0、20５6527,偏斜得程度不就是很明显,基本上还可以认为就是对称得,峭度几乎为零。

1。

１3　　海南粗榧叶长度得频数分布[4]:

叶长度/mｍ

中值

频　数

2。

0~2。

２、1

390

２、2~2.4

2、3

１434

2.4～２。

2、5

2　６43

２。

6～2、8

２、7

3５46

2.8～3。

2。

5692

3.0～３。

3、1

5187

3、２~3。

3、３

4　333

3、4～3.6

3。

５

2　767

3.6~3、8

3.7

1677

3。

8～４、0

３.9

1１3７

naｇ

4、0～4。

４.1

667

4。

2～4。

4、3

346

4、4～4。

６

４、５

18１

绘出频数分布图,并计算偏斜度与峭度、

答:

表中第一列所给出得数值为组限,下图为海南粗榧叶长度得频数分布图、

计算偏斜度与峭度得SAS程序与计算结果如下:

ｏptionsnodａte;

dａｔａ　lｅngｔh;

　dｏ　i=1to13;ｉｎput　ｙ　;

　ｉnｐｕtｎ;

　　doj=1toｎ;

　　　outpｕｔ;

　　eｎd;

cards;

2.1３9０

２。

３1４３４

2、5２64３

2、7３５４6

2。

９5６92

３、15１87

３.34３33

３.5２7６7

3。

71677

3.9　1137

４、16６7

４。

3346

４.5181

;

ｒun;

procmeａnｓｎsｋewnｅｓskurtosiｓ;

vary;

run;

The　SASSystem

AｎalysisＶａｒｉaｂle:

n　Skewnｅss　　　Kurtosis

－—－－—----—--—－－—－-———－－-－—－—-－-—-

３0000　0.41064５８　　0.0587006

—-————-－—--—－－—--——-－————－----—-—

样本含量ｎ=３00０0,就是一个很大得样本,样本得偏斜度与峭度都已经很可靠了。

偏斜度为0。

41,有一个明显得正偏、

1。

１4　马边河贝氏高原鳅繁殖群体体重分布如下[5］:

体质量/g

中值

雌　鱼

雄鱼

2、00～3、００

2。

５0

3、０0～4.0０

３.５0

4。

0０～５。

4。

5０

1３

5、00～６。

0０

5。

５０

３0

2５

6、0０~７.0０

6。

５0

２5

7。

０0~8、00

7、５0

8、0０~9、00

８.50

２１

9、00~1０。

００

９。

5０

1８

１0.00～１1。

０0

1０.５0

１1。

０0～12、00

11、５0

１2。

００～13、０0

１2、50

２

首先判断数据得类型,然后分别绘制雌鱼与雄鱼得频数分布图,计算样本平均数、标准差、偏斜度与峭度并比较两者得变异程度。

答:

鱼得体重为度量数据,表中第一列所给出得数值为组限。

在下面得分布图中雌鱼与雄鱼得分布绘在了同一张图上,以不同得颜色表示、

计算统计量得ＳＡＳ程序与前面得例题类似,这里不再给出,只给出结果。

雌鱼:

Ｔhe　SAＳ　Sｙsｔeｍ

Anａlysｉs　Variabｌe:

N　　　Meａn　　　Sｔｄ　Deｖ　　Sｋｅwness　　　Ｋuｒtosｉｓ

——－-－-——－--－—－—--－-－-—---—-－-———-———---－-－-———-———-－—-－-－-－

1４77、２414966　　2、14568200、2318337　　-0、６７58677

——---—————－－————－-－—-—－—-------—－—--————－—－－-－-－-－－—－－－-－—-

　雄鱼:

ＴheSASＳｙstem

ＡnalysiｓＶａｒiable　:

Ｙ

Ｎ　　Ｍeａｎ　　StdＤｅv　　Ｓkeｗnｅss　　　Kｕrtosｉs

-－——--－－－—--—－—----——－-－—-——————-－---－--－—--—－-－－－-－---——－—

132　6.78030３０１。

92３3９７１-0。

132２8１6　　－0。

5５1０3３２

-－－—--—－———－--——-－—-－--—-—-—－—-－—-—－—--—－—-——－——-—----—－-——

直观地瞧,雄鱼得平均体重低于雌鱼。

雌鱼有一正偏,雄鱼有一负偏。

因此,相对来说雌鱼低体重者较多,雄鱼高体重者较多。

但两者都有很明显得负峭度,说明“曲线"较平坦,两尾翘得较高。

1.１５黄胸鼠体重得频数分布[6］:

组界/g

频　数

0<≤１5

15〈≤30

30＜≤４5

45<≤６0

60〈≤７５

２2

75<≤９0

　9０<≤105

10５<≤120

１4

１2０＜≤135

１35<≤150

１50<≤1６５

２

总数

169

绘制频数分布图,从图形上瞧分布就是对称得吗,说明什么问题？

答:

下面就是频数分布图:

从上图可见,图形不就是对称得,有一些正偏。

说明在该黄雄鼠群体中,低体重者分布数量,高于高体重者得数量、另外,似乎峭度也有些低。

1。

１625名患者入院后最初得白细胞数量（×1０3）［７]如下表:

１1

1０

４

计算白细胞数量得平均数、方差与标准差。

答:

用mｅａｎｓ过程

展开阅读全文