统计检定详细分析.docx
《统计检定详细分析.docx》由会员分享,可在线阅读,更多相关《统计检定详细分析.docx(17页珍藏版)》请在冰豆网上搜索。
![统计检定详细分析.docx](https://file1.bdocx.com/fileroot1/2022-10/12/ffe9a62b-ce02-45a0-81ea-1cdbd96b3189/ffe9a62b-ce02-45a0-81ea-1cdbd96b31891.gif)
统计检定详细分析
授課目錄
第1章導論
第2章統計資料的整理與描述
第3章機率導論
第4章常用的機率分配與統計分佈
第5章描樣方法與描樣分佈
第6章統計估計
第7章統計檢定
第8章變異數分析
第9章相關分析與迴歸模式
第10章無母數統計檢定
第11章類別資料分析---列聯表與卡方檢定
第七章統計檢定
◎未經檢定(Testing),僅能稱為假設。
『實驗驗檢真理』。
◎統計檢定是利用樣本統計式,對已提出的母體參數或特徵,進行統計程序的檢定,以決定是否同意先前提出的母體參數或特徵論點。
此種統計程序過程又稱之為的假設檢定(TestingHypothesis)。
◎假設檢定與區間估計是推論統計之主體。
◎倘無根據之理論與往常的研究,即無所謂之假設檢定。
無根據之理論與往常的研究,即隨意進行假設檢定,實是假設檢定之濫用,此時宜作區間估計而不是假設檢定。
總言之,要進行假設檢定,先問問此假設從何而來?
。
範例、倘系學會宣稱,『本系學生每週平均看書時間為23hrs』,懷疑者進行隨機抽樣,欲以實際的資料驗證與駁斥此宣稱,然資料顯示懷疑者是不能駁斥此宣稱,因為,
◎該系學生每週平均看書時間為23hrs的確在95%信賴區間21-25hrs之內。
倘系學會宣稱,『本系學生每週平均看書時間為30hrs』,然資料顯示懷疑者能駁斥此宣稱,因為,
◎該系學生每週平均看書時間為30hrs不在95%信賴區間21-25hrs之內。
---------此過程稱之為假設檢定----------
7.1統計檢定的概念
一般而言,統計假設包括事先假設H0(NullHypothesis)與對立假設H1(AlternativeHypothesis)。
檢定統計式(TestingStatistics)确实是用來檢驗統計假設的度量工具。
在顯著水準下(01),檢定統計式將母體分為兩個區域:
同意區域(AcceptanceRegion)與拒絕區域(RejectionRegion)。
此兩區域的分界點稱為臨界值(CriticalValue),通常以C表示(若母體為常態分佈則以Z表示)。
(雙邊與單邊)
檢定統計係利用適合的檢定統計式,在顯著水準下,對統計假設進行統計程序之檢驗。
此統計檢驗的過程又稱為假設檢定。
其程序如下:
範例、老闆欲知公司正研發的手機是否較Motorola手機好,如『品質沒有比Motorola來得差,則考慮量產上市』。
因此各隨機抽取10部,比較其通話品質。
(為方便,以通話品質為品質指標)。
計算結果,在95%的信心下,二牌子手機品質的母體平均值的差異介於(-2.5,3.2),由於『此區間包含著0(即無差異),那麼就不能說此二牌子手機品質的有差異』。
老闆會专门高興,也許會將公司此新產品上市。
------此即以事實作決策也------
7.1.1建立統計假設
模糊語句或思想,轉換為確定問題的陳述,並建構統計假設,如:
某型汽車輪胎平均壽命的國際標準為40km,則
事先假設H0:
40
對立假設H1:
40(互斥的集合)
一般統計假設被設立成立以下三種類型:
(以上述為例)
(a)雙邊檢定
事先假設H0:
40;對立假設H1:
40
(b)左邊檢定(以拒絕域作為判定之準則)
事先假設H0:
40;對立假設H1:
40
(c)右邊檢定
事先假設H0:
40;對立假設H1:
40
7.1.2決定拒絕域
模糊語句或思想,轉換為確定問題的陳述,並建構統計假設,與選取適當的檢定統計式,再根據顯著水準,並找出拒絕區域R。
因統計檢定是一種決策法則,用來決定是否要拒絕事先假設,而這項法則便是以拒絕域作為判定的準則。
7.1.3型誤差與型誤差
由檢定統計式根據顯著水準找出拒絕域後,最後即將隨機樣本值代入檢定統計式中求算。
但進行假定檢定時,由於機率的關係,會產生二種錯誤的決策:
(一般設為=5%)
◎=P(TypeError)=P(RejectH0|TrueH0)
Ex:
事先假設H0:
40;對立假設H1:
40
=P(TypeError)=P(Reject40|True40)
◎=P(TypeError)=P(AcceptH0|FalseH0)
=P(AcceptH0|TrueH1)
=P(TypeError)=P(Accept40|False40)
=P(Accept40|True40)
定義檢定力(Power)為:
Power=1-=P(RejectH0|FalseH0)
=P(RejectH0|TrueH1)
◎檢定力是評量統計檢定優劣的量值,檢定力愈大,表示此統計檢定的效率愈佳。
倘有多個統計式存在,採同一顯著水準,則檢定力之大小,可從中找出最佳的檢定統計式。
◎顯著水準可視為『可能發生的錯誤機率』或『所能同意的錯誤機率』。
◎統計檢定亦可視為『抽樣結果與統計假設H0比較,以判決抽樣結果是被同意或拒絕』。
7.2母體平均值之檢定
7.2.1常態母體平均值之假設檢定
對母體(,2)的平均值進行假設檢定。
因為樣本平均值為母體平均值之最佳點估計式,因此值之檢定可透過統計量進行,然在小樣本(n30)情況下,由於受到變異數已知與否的影響,須分2種情況處理。
(a)變異數已知:
檢定用Z檢定式進行檢定:
Z=(-)/(/n1/2)
統計假設
決策法則
雙邊檢定:
H0:
μ=μ0,H1:
μ≠μ0
IfZ<-Zα/2orZ>Zα/2,
thenRejectH0
左邊檢定:
H0:
μ≥μ0,H1:
μ<μ0
IfZ<-Zα,thenRejectH0
右邊檢定:
H0:
μ≤μ0,H1:
μ>μ0
IfZ>Zα,thenRejectH0
(b)變異數未知:
檢定用t檢定式進行檢定:
tn-1=(-)/(S/n1/2)
統計假設
決策法則
雙邊檢定:
H0:
μ=μ0,H1:
μ≠μ0
Ift<-tα/2,n-1ort>tα/2,n-1,
thenRejectH0
左邊檢定:
H0:
μ≥μ0,H1:
μ<μ0
Ift<-tα,n-1,thenRejectH0
右邊檢定:
H0:
μ≤μ0,H1:
μ>μ0
Ift>tα,n-1,thenRejectH0
範例、致遠治理學院假設預算報告指出,A棟宿舍每月用電費為24萬。
為了瞭解此預算之合適度,該校隨機抽取10與A棟相似之宿舍,求得其每月用電費平均為22萬,假設每月用電費為為常態分佈,且已知=6,則在顯著水準=0.05時,試問此項預算合理乎?
SOL:
令為A棟宿舍平均每月用電費。
(1)建立統計假設
H0:
0,H1:
0H0:
24,H1:
24
(2)樣本來自常態分佈,且已知=6,故採用Z檢定
(3)應用雙邊檢定,檢定臨界值Z0.025=1.96
(4)樣本統計量為
Z=(-)/(/n1/2)=(22-24)/(6/101/2)=-1.05>-1.96
AcceptH0
A棟宿舍每月用電費為24萬預确实是合理的。
範例、某校規定所有教師每年平均出差不超過8天,董事會為了解此項規定執行情形,於是在去年所有教師中隨機抽取15位進行調查,發現平均出差天數10,假設該校所有教師每年出差為N(8,4),則在顯著水準=0.05時,試問此項規定,校方是否依規定執行?
SOL:
令為所有教師每年平均出差天數。
(1)建立統計假設
H0:
0,H1:
>0H0:
8,H1:
>8
(2)樣本來自常態分佈,且已知=2,故採用Z檢定
(3)應用右邊檢定,檢定臨界值Z0.05=1.645
(4)樣本統計量為
Z=(-)/(/n1/2)=(10-8)/(2/151/2)=3.87>1.645
RejectH0
此項規定校方未依規定執行。
範例、某公司宣稱它們每日生產之超大珍宝奶茶為N(3600,2),2未知。
其經理發現最近有減產現象,為實際瞭解平均每日產量,於是自每日產量記錄中隨機抽取20天進行調查,發現平均產量3500杯,標準差為180杯,則在顯著水準=0.05時,試問該公司生產之超大珍宝奶茶最近是否有減產現象?
SOL:
令為該公司生產之超大珍宝奶茶每日平均產量。
(1)建立統計假設
H0:
0,H1:
<0H0:
3600,H1:
<3600
(2)樣本來自常態分佈,且未知,故採用t檢定
(3)應用左邊檢定,檢定臨界值-t0.05/2,19=-2.093
(4)樣本統計量為
tn-1=(-)/(S/n1/2)=(3500-3600)/(180/201/2)=-2.485
RejectH0
該公司生產之超大珍宝奶茶最近是有減產現象。
7.2.2兩個常態母體平均值差之假設檢定
假設兩樣本平均值與分別來自兩母體N(1,12)、N(2,22),由上節知-為1-2之最佳點估計式,因此1-2的檢定可透過統計量-來進行。
(a)兩變異數已知,兩平均值是否相等的Z檢定式
Z=[(-)-(1-2)]/[(12/n1)+(22/n2)]1/2
統計假設
決策法則
雙邊檢定:
H0:
μ1=μ2,H1:
μ1≠μ2
IfZ<-Zα/2orZ>Zα/2,
thenRejectH0
左邊檢定:
H0:
μ1≥μ2,H1:
μ1<μ2
IfZ<-Zα,thenRejectH0
右邊檢定:
H0:
μ1≤μ2,H1:
μ1>μ2
IfZ>Zα,thenRejectH0
(b)兩變異數未知,兩平均值是否相等的t檢定式
其中假設12=22=2,
共同(Common)變異數
統計假設
決策法則
雙邊檢定:
H0:
μ1=μ2,H1:
μ1≠μ2
Ift<-tα/2,n-1ort>tα/2,n-1,
thenRejectH0
左邊檢定:
H0:
μ1≥μ2,H1:
μ1<μ2
Ift<-tα,n-1,thenRejectH0
右邊檢定:
H0:
μ1≤μ2,H1:
μ1>μ2
Ift>tα,n-1,thenRejectH0
範例、甲公司廣告宣稱它們的嬰兒奶粉較乙公司的產品好,此謂好是指嬰兒食用甲公司的奶粉,體重明顯增加較快。
消基會為查證甲公司為此廣告是否誇大其詞,隨機抽取10位甫出生的健康寶寶,其中5位餵食甲公司的奶粉,另5位餵食乙公司的奶粉,經過2週後觀察每位嬰兒體重增加值如下:
(單位:
盎司)
嬰兒
1
2
3
4
5
甲公司的奶粉
32
24
30
29
27
乙公司的奶粉
30
36
28
37
40
假設2週內嬰兒體重上升服從常態分佈,試問(a)已知食用甲公司的奶粉體重上升變異數為11,而食用乙公司的奶粉體重上升變異數為9,則在顯著水準=0.05時,試問甲公司廣告之聲稱是否正確?
(b)若12=22=2,但未知,則在顯著水準=0.05時