第21章什么是信赖区间.docx-资源下载

第21章什么是信赖区间.docx

1、第21章什么是信赖区间第21章什麼是信賴區間一、簡介用來描述母體的數叫做參數(parameter)，要估計母體參數，必須從母體取一個樣本，並從樣本算出來的某個統計量(statistic)的值來當做我們的估計。樣本的結果通常不會和母體的真正比例一模一樣，所以就需要信賴區間(confidence interval)把這個大約更具體化；信賴區間就是估計一個未知參數的方式，可以提供我們該估計的不確定程度。二、我學得1.95%信賴區間是從樣本數據計算出來的一個區間，保證在所有樣本當中，有 95%會把真正的母體參數包含在區間內。2.一個統計量的抽樣分布，是指同一母體所抽出，同樣大小的所有可能樣本，

2、其統計量的值之分布，用表示成功的樣本比例：=樣本中的成功計數/n 當樣本夠大時，的分布為近似常態；且抽樣分布的平均數和p相等。3.信賴區間應用機率的中心概念：如果重複抽樣許多次，95%信賴區間中的 95%是機率，是這個方法所產生的區間會抓到真正參數值的機率。所以從同一母體重複抽樣，會得到不一樣的95%信賴區間，但是這些區間當中，有95%會抓到真正的母體比例p。4.信賴水準是一項機率，它告訴我們在許多樣本中，不斷重複抽樣測量時，區間會抓到真正參數的機率，這個機率就是信賴水準。三、我覺得1.要找信賴區間，先得考慮統計量的抽樣分布，也就是重複抽樣之下統計量會如何變化；信賴區間展現的是這個

3、參數的真實值有一定機率落在測量結果附近的程度。信賴區間公式有很多種，可以在不同情形下使用，但是更重要的是，解釋的方法都是一樣的。2.抽樣分布是在描述從同一母體抽出的許多樣本之結果；我們可以信任大的隨機樣本的結果，都很接近母體的真正值。但是我們永遠不會知道，我們手上的這組數據所得到的區間，是不是真正的母體參數，如果認為風險太大，可以改用更高比例的信賴區間。3.用簡單隨機樣本（SRS）中的成功比例，來估計母體中的成功比例p。統計量做為參數p之估計，表現如何？要知道答案，我們會問：如果我們取許許多多樣本，會發生什麼情況？我們也知道這個抽樣變異並不是偶發的。長期下來它有很清楚的型態，用常

4、態曲線可以把這個型態描繪得相當接近。第22章什麼是顯著性檢定一、簡介統計推論是利用樣本的數據，來對母體做結論，所以統計檢定處理的，是有關母體的判斷，故顯著性檢定則是要評估對某一未知參數斷言的證據；顯著性檢定用機率來回答之問題為，光憑機遇就會得到像某樣本的極端結果之機率有多少？統計檢定的p值，如果小於或等於值，代表我們的結果只靠機遇碰巧發生的機率不大，p值是在H0為真的假設下計算得到的，結果應該會像著對立假設的方向。二、我學得1.統計量對於參數的結果，完全是由機遇造成的機率非常小，可以用顯著性檢定對這個基本論據，處理得更精確；統計檢定會先假設我們再找的效應並不存在，然後開始尋找的證據

5、，必須不利這項假設，而支持我們想找的效應。2.統計檢定的P值是在H0為真的假設下，所得到樣本結果會像實際觀測結果那麼極端或更極端的機率。P值愈小，資料所提供否定H0的證據就愈強；在實際應用時，大部分的統計檢定可以由電腦軟體來執行。3.統計檢定量(即其對應之P)是否落在拒絕區域，即落在顯著水準值外更為極端之區域，來判定是否該拒絕這個假設。(以下參考教育論文寫作一書)p .05，表示結果不顯著，不加以註記； p.05，表示結果顯著，通常會以*註記； p .01，表示結果更顯著，通常會以*註記。三、我覺得1.顯著性檢定的目的，通常是想提出母體中存在某種不利原始假設的證據有多強，檢定並沒有說我們

6、正在尋求的母體效應，到底有多大或多重要；但是要證明原始假設不正確，p值要多小才能令人信服？不同的人常會想用不同的顯著水準，所以在顯著與不顯著之間並沒有清楚的界線。2.如果P值小於或等於值，我們稱該組數據於水準有統計顯著性。然而顯著（significant）在統計上的意義並不是重要，而只代表光是靠機遇不容易發生。第23章統計推論的使用與濫用一、簡介信賴區間和顯著性檢定這兩種主要的統計推論，背後的倫理基礎是一樣的，但是聰明做推論的第一步，是了解你的數據及你想回答的問題。了解信賴區間和統計顯著性檢定檢定的意義，有助於避免不恰當的的結論，只是樣本小時，母體的重要真實情況卻可能達不到顯著性

7、的標準，樣本大時，也不見得有實質上的意義。二、我學得1.推論統計的要點： (1)產生數據的設計很重要：數據從哪裡來的？是所有統計研究中該問的第一個問題。數據必須是從我們關心的母體中所抽出的簡單隨機樣本 (SRS)。 (2)了解信賴區間的運作：信賴區間可以估計未知參數的值，同時告訴我們估計的不確定程度有多大。 (3)了解統計顯著性的意義：許多統計研究的目的，是想要顯示某種斷言是正確的，檢定可以幫助我們了解，是否的確找到了正在尋找的目標。 (4)了解所用的方法必須滿足的條件：我們對於比例p所做的檢定及信賴區間，都要求母體必需比樣本大很多，還要求樣本本身也要夠大，使得樣本比例的抽樣分布會

8、接近常態。2.讀一項顯著性檢定的結果時，要特別注意樣本大小，理由： (1)較大的樣本會讓顯著性檢定比較敏感，但是可能一項發現有統計顯著性，卻沒有實際上的重要性。 (2)沒有達到統計顯著性不代表效應不存在，只能說我們沒有找到合理證據來支持，因此小樣本常會漏掉母體中確實存在的一些效應。3.在顯著與不顯著之間並沒有清楚的界線，只是在p值越來越小時，我們就有越來越強的證據而已。所以水準5%之顯著性並非一個全球性的標準。三、我覺得1.統計推論是根據樣本所提供的證據，對母體做出結論，在數學領域做結論，是要從某些假設開始，然後根據邏輯推演，證明結論確實毫無疑問絕對成立。統計卻不一樣，統計結論不是

9、百分之百確定的，因為樣本不等於整個母體。所以統計推論除了結論以外，還得說明結論的不確定程度。2.信賴區間提供的訊息比檢定多，因為信賴區間實際上估計了母體參數的值，而且信賴區間比較容易解釋，因此，好的作法是儘可能以提出信賴區間的方式來推論統計。3.我們必須真正瞭解統計顯著性的意義：􀂄(1)樣本愈多愈容拒絕虛無假設。􀂄(2)統計上的顯著性和實際上的顯著性是一樣的。除注意P值外，要多花點時間詳細檢視資本身。􀂄(3)選擇顯著水準。􀂄(4)要忽沒有顯著性的結果。4.統計推論是利用樣本的數據，來對母體做結論。如果我們取許多樣本而且斷

10、言正確，我們很少會得到這樣的結果。要得到樣本證據強度的數值量度，就要把語意模糊的很少用機率來取代。第24章雙向表及卡方檢定一、簡介要顯示兩個類別變數之間的關聯，可以用雙向表，來探討兩個類別變數之間是否有關係；要檢視樣本數據很容易，但是樣本顯示出的關聯，是否可以證明整個母體中這兩個變數有關聯？還是只因為隨機抽樣的巧合就發生了呢？卡方檢驗是一種用途很廣的計數資料的假設檢驗方法，可以用來判斷雙向表中所出現的關聯，是否有統計顯著性，避免由潛在變數造成的誤導。二、我學得1.要顯示兩個類別變數之間的關聯，用雙向表來探討兩個類別變數之間是否有關係；例如職級是列變數(row variable)，每一列

11、代表一種職級，性別是行變數(column variable)，每一行代表一種性別。職級和性別之間有何關聯，一定要用到整個雙向表，根據所給的計數，計算出適當的百分比。2.辛浦森詭(Simpsons paradox)：當潛在變存有影響時，雙向表觀察到的關有可能是誤導的，在幾組值中都顯示出的關聯或比較，有可能在據合併成一組時全消失甚至倒轉方向。3.預期計數：H0為真時，雙向表中任一格的預期計數(expected count)為：預期計數=(列總和行總和)/表總和要檢定H0，會把雙向表中以觀察到的計數和預期計數做比較，如果觀察到的計數和預期計數相差很大，就是不利於H0的證據。4.卡方統計

12、量：出雙向表中所觀察到的計和預期計之間的差距，其公式是：X2=(觀察到的據預期的據)2/預期的據􀂄用以檢定據是否提供於沒有關的原始假設之證據，對所觀察到的據與預期沒有關的據作比較。5.卡方分布：當無關聯的原始假設為真時，卡方統計量X2的分布就稱為卡方分布(chi-square distribution)，卡方分布是指一整族的分布，而這個分布只有正值且為右偏。三、我覺得1.別尺資無法透過散布圖、計算相關係或迴歸直線描述變間的關，表字只能呈現事實，但無法解釋其意義。要描述別變間的關，可根據雙向表所給的計，計算出適當的百分比，通常用百分比可將分布的情形清楚表出。2.當

13、存在潛在變數時，觀察到的關聯有可能是誤導的，所以第十五章曾經提醒過，潛在變數可以藉由共同反應或交絡製造出關聯，所以如果可以實驗，才可以得到足以證明的證據來證明因果關聯。3.檢驗兩個或兩個以上總體的某一特性分布，也就是各變數的比例是否統一或相近，稱為卡方統一性檢驗或者卡方同質性檢驗在不同水準之下，卡方統計量X2的值要多大，才能使結果有統計顯著性？每一種自由度對應不同的結果。第25章有關母體平均數的推論一、簡介信賴區間和顯著性檢定背後的理論依據是一樣的，但是處理方法卻大不相同，推論過程的形式，首先和想從中尋求的資訊參數有關，第二項影響因素是抽樣或實驗的設計。我們用取自母體的SRS之樣本

14、平均，來估計母體平均數，的信賴區間和顯著性檢定，是根據的抽樣分布得來的，但是關於的推論方式，很像關於母體比例p的推論，因為兩者都是根據常態抽樣分布而來的。二、我學得1.從平均數為，標準差為的母體抽取大小為n的SRS，則 (1)當樣本大小n較大時，的抽樣分布會近似常態。 (2)抽樣分布的平均數等於。 (3)抽樣分布的標準差是/n。2.中央極限定理：3.從個體平均數為的大母體裡，抽取大小為n的SRS，當n很大時，的近似水準C信賴區間為 z* s/n。4.H0為真時很難得出現的值，就是H0不正確的根據。如果假設檢定是要檢定母體平均數的值，檢定人員選定的顯著水準就決定了發生型錯誤的機率。再藉著控制樣本數，檢定人員可同時控制發生型錯誤的機率。5.若母體呈常態分配，則不管樣本多大，抽樣分配為常態。若母體標準差為已知，即使是小樣本，仍能計算母體平均數的區間估計值。三、我覺得當樣本很大時，樣本平均數的抽樣分配近以於常態分配。若樣本大小在30(含)以上時，就認為其滿足大樣本的條件。若母體呈常態分配，則不管樣本多大，的抽樣分配為常態。若母體標準差為已知，即使是小樣本，仍能計算母體平均數的區間估計值。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？