第十单元统计图表.docx
《第十单元统计图表.docx》由会员分享,可在线阅读,更多相关《第十单元统计图表.docx(45页珍藏版)》请在冰豆网上搜索。
第十单元统计图表
第十单元统计图表
【习题】
分析计算题
10.1某地进行冠心病危险因素研究时,调查了居民的心理得分值与其他冠
心病有关因素,结果列成表43。
指出该表存在的问题,并请改正。
表43不同心理分值的冠心病危险因素水平比较
心理分值
因素
1(242人)
2(243人)
3(242人)
4(243人)
P值
X±S
%
X±S
%
X±S
%
X±S
%
年龄/岁
34.^F6.4
37.^^.3
36.4±5.8
37.8±6.4
<0.05
收缩压/mmHg
120.7±13.4
121.2±13.2
121.1±13.2
120.4±12.8
<0.4
舒张压/mmHg
78.8±10.2
77.9±10.4
78.2±11.0
78.4±10.6
<0.39
体力活动
2.1±12
2.1±0.1
2.1也.2
2.3±0.3
<0.08
体重指数
23.1±3.2
24.0母4
24.8±3.1
24.8±3.1
<0.01
吸烟率/%
70.8
69.4
70.7
71.1
<0.41
吸烟量支•d-1
8±1
10艺
14艺
1化
<0.001
饮酒率/%
42.3
44.4
43.1
42.8
<0.13
饮酒量/g•d-1
60.1±7.4
78.2拐.4
79.3±5.8
106.8±10.2
<0.001
受教育程度
4.4±3.8
4.2±0.9
3.4也.8
3.4±0.8
<0.05
社会支持
8.7±1.2
7.4±1.1
7.0也.2
7.0±1.2
<0.05
慢性疾患数构成
/%
0
81.6
79.3
77.4
73.9
<0.18
1
14.1
16.2
16.4
14.0
<0.43
3.3
4.4
6.0
11.1
<0.05
10.2根据表44资料,绘制适当的统计图。
表441982年和1990年3个直辖市的人口密度比较
年份
人口密度/(人-km-2)
北京
天津
上海
1982
449
687
1913
1990
644
777
2118
10.3根据表45资料,绘制适当的统计图,并作简要分析。
表45251例胃癌患者病理组织学类型的分布情况
例数
构成比
例数
构成比
例数
构成比
分化型癌
101
50.0
16
32.6
117
46.6
低分化腺癌
54
26.7
9
18.4
63
25.1
未分化型癌
47
23.3
24
49.0
71
28.3
合计
202
100.0
49
100.0
251
100.0
男女合计
男
女
病理组织学类型
10.4将表46资料分别绘制普通线图和半对数线图,并请说出2种图示法的
意义。
表46
某地1977年
-1985年普通感冒与支气管炎发病率
/%0
年份
1977
1978
1979
1980
19811982
1983
1984
1985
普通感冒
126.27
92.19
107.49
101.93
92.6073.20
41.40
42.39
33.92
支气管炎
6.63
6.37
4.90
4.69
4.494.32
3.04
2.42
2.27
10.5根据表47资料,
绘制适当的统计图
。
表47某帀某年小儿丿林痹症患者的年龄分布
年龄
例数
年龄
例数
0〜
30
9〜
64
1〜
30
10〜
143
2〜
74
15〜
77
3〜
78
20〜
16
4
77
25〜
10
5〜
49
30〜
12
6〜
71
35〜
7
7〜
49
40〜45
4
8〜
46
10.6最佳选择题
(1)欲比较两地20年来心脏病和恶性肿瘤死亡率的上升速度,宜选
a•普通线图
b.半对数线图
C•条图
d.直方图
e•圆图
(2)图示6岁男孩体重与身高的关系,宜绘制
a.条图
b.百分条图
C.散点图
d.线图
e.直方图
(3)表示某地区某年各种死因的构成比,可绘制
a.条图
b.圆图
C.直方图
d.统计地图
e.线图
(4)表示某地6岁男孩体重的频数分布可用
a.构成比条图
b.复式条图
C.线图
d.直方图
e.圆图
复习思考题
10.7统计表的制作原则和要求有哪些?
10.8统计图的制作原则和要求有哪些?
10.9常用的统计图有哪几种,各适用于什么类型资料?
10.10普通线图和半对数线图的主要区别是什么?
10.11直方图、条图、百分比条图有什么区别?
10.12统计表与统计图有何联系和区别?
【习题解答】
分析计算题
10.1解:
该表不符合统计表的要求有:
①将过于烦杂的内容放在了一张表中;
②标目“%”意义不明;③多重纵标目应该用短横线分开;④样本例数n应
单独列出;⑤概率P表达有误;⑥构成比计算有误。
可将原表拆分为几个相对
简单的复合表(见表10.1.1〜10.1.3)。
表10.1.1不同心理分值的冠心病危险因素水平比较
心理例数
年龄收缩压
危险因素(X±s)
舒张压
体力体重受教育社会
1
242
34.2坦4
120.7*3.4
78.8勺0.2
2.1±0.2
23.1±3.2
4.4±0.8
8.7±1.2
2
243
37.0坦3
121.2*3.2
77.9*0.4
2.1也1
24.0±3.4
4.2±0.9
7.4±1.1
3
242
36.4坦8
121.1也3.2
78.2勺1.0
2.1如.2
24.8±3.1
3.4±0.8
7.0±1.2
4
243
37.8坦4
120.4也2.8
78.4勺0.6
2.3如.3
24.8±3.1
3.4±0.8
7.0±1.2
P值
一
<0.05
0.4
0.39
0.08
<0.01
<0.05
<0.05
表10.1.2不同心理分值的冠心7内患者吸烟饮酒力、平比较
心理
分值
例数
危险因素
吸烟
饮酒
n
量/支-d1(X±S)
率/%
1
量/g-d(X±S)
率/%
1
242
8±1
70.8
60.1±7.4
42.3
2
243
1^^
69.4
78.2^.4
44.4
3
242
1辽
70.7
79.3毎8
43.1
4
243
14^2
71.1
106.8±10.2
42.8
P值
一
<0.001
0.41
<0.001
0.13
/岁
程度支持
/mmHg/mmHg活动指数
分值n
表10.1.3不同心理分值的慢性疾患构成比较
心理
分值
例数
n
慢性疾患数构成/%
0
1
1
242
81.6
14.1
3.3
2
243
79.3
16.2
4.4
3
242
77.4
16.4
6.0
4
243
73.9
14.0
11.1
P值
一
0.18
0.43
<0.05
10.2解:
因该资料按地区和年份两个因素分类来比较人口密度,故宜绘制复式条
图(见图10.2.1)。
I
止薄
郴
天津
I阪年1
图10.2.1
1982年和1990年3个直辖市的人口密度比较
SAS程序
dataxt10_2;
/*建立临时数据集xt102*/
inputcityyearcount@@;
/*定义变量city、year和count,数据连续输入*/
cards;
/*直接输入数据,数据块开始*/
1198244911990644
2198268721990777
319821913319902118
procgchart;
/*调用gchart过程*/
vbaryear/sumvar=countgroup=city
/*绘制条图,变量为year,直条代表变量count的
subgroup=yeartype=meansum
均数,并产生以city为分组变量,year为亚组变量
Patternid=subgroup
的并排图,组间距离为6,直条宽度为6,亚组间距
width=6space=0gspace=6noframe
为0,图中无外边框*/
discrete;
labelcount='人口密度/(人-km-2)';
/*定义纵标目标签*/
labelcity=(1='北京'2='天津'
3='
上海');
Pattern1v=x2c=grey;
/*定义第一亚组直条的图案和颜色
*/
Pattern2v=x3c=grey;
/*定义第二亚组直条的图案和颜色
*/
run;
/*提交运行*/
SAS输出结果(见图10.2.2)
人口ffiSA人.HwH
3&00-
2500-
1000-
130219^0
hIT
I
10般199019921期0gr
卜2T卜3T(1目匕京护天邃沪上海)
yeir1S821990
图10221982年和1990年3个直辖市的人口密度比较(SAS结果)
SPSS操作
数据录入:
打开SPSSDataEdito窗口,点击VariableView标签,定义要输入的变量year、
city和count,变量city的Values的值为:
1为北京,2为天津,3为上海;再点击Data
View标签,录入数据(见图10.2.3,图1024)。
BKt10
_2-SPSS
DataEdit02
:
匚回®
FileEditViewDataTransformAnalyieGraphsUtilitiesWindowHelp
目H|
到雪厂c釧胡"1Hitt[\|塗◎
Name
Type1Width
Decimals|Label
Values
Missing上|
1
year
Numeric
4
0年份
None
忖one
2
city
String
1
0城市{仁北药…
忖Cine
3|
count
Numeric
4
01Nome
忖oneT
1►(\DataViewX^*riableVi"/|H|1
SFSSFroca百EDri百irvady|
图10.2.3VariableView窗口内定义变量
xt1O_2-SPSSDaztaEditor
兰回鱼I團IIj7臼|观I卡产I曰也rM叵功I
1:
FileEditViewDataTranzfotrm^alyze去宜phsUtilitieiffindowHelp
year
city
count1
1var
■■:
'ar
var
var1
[var
1
I~1362
北京
445
2
1990
北京
644
3
19S2
天津
567
4
1990
天津
777
5
1982
上海
1913
6
1990
上海
2113
Il\DataViCTXVariab]
上View/
ILlL
J
1982
SFSSFroctssoriwr«ady
图1024DataView窗口内录入数据
分析:
绘制复式条图
忖Othersummaryfunction:
count
选用变量COUnt的其他汇总函数
GraphsBar►Clustered►Define
点击ChangeSummary…
窗Meanofvalues
直条的高度代表变量count的均数
Continue
CategoryAxis:
城市[city]
以变量city为分类轴(条图的横轴)
以变量year为分组因素
DefineClustersby:
年份[year]
OK
Stata程序
inputcy82y90
1449644
2687777319132118endlabdefinecity1beijing”2tianjin"3Shanghai'
-2
gray82y90,barby(c)sh(31)11(人口密度/(人-km))b1(城市)ylab(0(200)2200)lablist
10.3解:
本资料为胃癌患者按性别分组的不同病理组织学类型的构成情况,故宜
绘制百分比条图,以便比较其构成的差异,见图
10.3.1。
图10.3.1251例胃癌患者病理组织学类型构成比/%
由图10.3.1可见,该胃癌患者中以分化型癌所占的比重较大,接近一半,而
低分化腺癌和未分化型癌所占比重相近;因为资料中男性所占比重较大
(202/251),故男性胃癌的病理组织学类型的构成情况与该研究人群相似;而女
性则以未分化型癌所占的比重最大(占49.0%),其次为分化型癌,比重最小的
是低分化腺癌。
SAS程序
dataxt10_3;
/*变量sex为字符型*/
inputsex$typeratio@@;
cards;
男150.0
26.7
23.3
32.6
18.4
49.0
合计1
46.6
合计2
25.1
合计3
28.3
procgchart;
hbarsex/subgroup=typeminor=0sumvar=ratiomaxis=axis1
/*绘制变量sex的水平条图,每个直条按
nostatsspace=1width=3
变量type分为几个部分,条块的面积代表
noframediscrete;
变量ratio的大小,图中无外边框
*/
axisilabel=none;
/*不输出纵标目*/
labelratio='累计百分比/%';
/*定义横标目*/
labeltype=(1='分化型癌'2=低分化腺癌'
3='未分化型癌');
Pattern1v=l2c=grey;
/*定义第一条块的图案和颜色
*/
Pattern2v=x2c=grey;
/*定义第二条块的图案和颜色
*/
Pattern3v=x3c=grey;
/*定义第三条块的图案和颜色
*/
run;
/*提交运行*/
SAS输出结果(见图10.3.2)
ID
4n5D冊
累计百分比用
11=知<型®2=旺制训®3=未分化型痂酸1宓£
3D
ao
/%(SAS结果)
10.3.2251例胃癌患者病理组织学类型构成比
SPSS操作
数据录入:
打开SPSSDataEdito窗口,点击VariableView标签,定义要输入的变量sex、
type、count和ratio,变量性别的Values为:
1为男,2为女,3为合计;病理类型的
Values为:
1为分化型癌,2为低分化腺癌,3为未分化型癌;再点击DataView标
签,录入数据(见图10.3.3,图10.3.4)。
□回冈
圉忑七103-SPSSDataEditor
Name
Type
Widih1
IDecimals
1Label|
Values1
1Missing
1
sex
Stnrg
1
ri
性别
⑴男}•■
None
2
type
String
1
li)
病理类型
{1■分化型癌}
None
3
count
Numeric
3
0
例数
None
None
14
ratio
Numeric
4
1
构成比
None
None
=c?
|禹I餐leisF
aJ
I卜l\DataViev
fileEditViewDataTransfarmAnalyzeGraphsUtilitiesWindowHelp
Ti"/|d_
SFSSFrocfrssoriwr«ady
图10.3.3VariableView窗口内定义变量
p匡]盘髦1(1_3-SPSSDataEditor
FileEditView屯毗盘X^^sfqrm^alyjeSr^phsUtilitivs虹Help
11_J匚土I&開IS~r^i回圭昌I衿⑪I
sex
type
count1
1ratio
1
分化型癌
101
50.0
2
低分化腺癌
54
267
3
男
耒分化型癌
47
23.3
4
女
分化型癌
ie
銘匕
5
女
低分化腺癌
9
ie.4
&
立
耒分化型癌
24
49.0
7
合计
分化型癌
117
4E.E
sex
ataView人VariableView
SPSSProc电asorisready
空JH&\珂
ar
var
图10.3.4DataView窗口内录入数据
分析:
绘制交互式条图
GraphsInteractive►Bar…
2-DCoardina〒
Assignvariables选项卡:
绘制二维水平条图
将变量性别[sex]移入y轴
条图以变量sex为纵轴
将变量构成比[ratio]移入x轴
条图以变量ratio为横轴
style框:
移入变量病理类型[type]
以变量type为分类变量
D口stack▼
选择池
选择绘制分段条图
BarChartOptions选项卡:
BarLables:
value
要求显示各条的标签值
Options选项卡:
CategoricalOrder框组:
VariabI:
病理类型
Sort:
*Descending
亚组按变量病理类型的降序排列
Axes框组:
定义坐标轴的长度
Y轴用默认的3.00in.
X1轴改为4.50in.
确定
Stata程序
inputsexdifIdifndif150.026.723.3232.618.449.0
346.625.128.3end
labdefinesex1
“male”2“fernkfe”3“tot
gradifIdifndif,barby(sex)stackaltI1(构成比/%)b1(性别)yIab(0(25)100)gap(3)lablist
10.4解:
普通线图(见图10.4.1):
某地1977年一1985年普通感冒与支气管炎发病率(普通线图)
图1041
半对数线图(见图
10.4.2):
图10.4.2某地1977年一1985年普通感冒与支气管炎发病率
(半对数线图)
普通线图描述了两种疾病的发病率随时间变化的趋势,
可以看出该地区两种
疾病的发病率在1977年至1985年间逐渐下降,普通感冒下降幅度较大。
半对数线图则描述了两种疾病的发病率随时间变化的速度,两种疾病的下降速度基本相同。
SAS程序
dataxt10_4;
inputyearratelrate2@@;
cards;
1977126.276.63
197892.196.37
1979107.494.90
1980101.934.69
198192.604.49
198273.204.32
198341.403.04
198442.392.42
198533.922.27
procgplot;
plotrate1*yearrate2*year/hminor=0
/*以rate1为纵轴,year为横轴,绘制散点图,
vminor=0overlaylegend=legend1
以rate2为纵轴,year为横轴,绘制散点图
noframehaxis=axis1vaxis=axis2;
要求在一张图上重叠作多个散点图
*/
symbol1i=joinc=blackwidth=2;
/*以直线连接各点,
连线的宽度为
2*/
symbol2i=joinc=blackl=3width=2;
/*以虚线连接各点,
连线的宽度为
2*/
legend1down=3position=(topright
/*定义图例的位置、
颜色、名称
*/
inside)framecshadow=grey
label=(h=1.5)
value=(t=1'普通感冒't=2'支气管炎');
axis1label=('年份');
/*定义横标目*/
axis2label=('发病率/%o');
/*定义纵标目*/
run;
procgplot;
/*调用gplot过程*/
plotrate1*yearrate2*year/overlay
/*以rate1为纵轴,year为横轴,绘制散点图
hminor=0
以rate2为纵轴,year为横轴,绘制散点图
haxis=axis1vaxi