ImageVerifierCode 换一换
格式:DOCX , 页数:7 ,大小:21.19KB ,
资源ID:2371294      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2371294.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第21章什么是信赖区间.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第21章什么是信赖区间.docx

1、第21章什么是信赖区间 第21章 什麼是信賴區間一、簡介 用來描述母體的數叫做參數(parameter),要估計母體參數,必須從母體取一個樣本,並從樣本算出來的某個統計量(statistic)的值來當做我們的估計。樣本的結果通常不會和母體的真正比例一模一樣,所以就需要信賴區間(confidence interval)把這個大約更具體化;信賴區間就是估計一個未知參數的方式,可以提供我們該估計的不確定程度。二、我學得1.95%信賴區間是從樣本數據計算出來的一個區間,保證在所有樣本當中,有 95%會把真正的母體參數包含在區間內。2.一個統計量的抽樣分布,是指同一母體所抽出,同樣大小的所有可能樣本,

2、其統計量的值之分布,用 表示成功的樣本比例:=樣本中的成功計數/n 當樣本夠大時, 的分布為近似常態;且抽樣分布的平均數和p相等。3.信賴區間應用機率的中心概念:如果重複抽樣許多次,95%信賴區間中的 95%是機率,是這個方法所產生的區間會抓到真正參數值的機率。所以從 同一母體重複抽樣,會得到不一樣的95%信賴區間,但是這些區間當中, 有95%會抓到真正的母體比例p。4.信賴水準是一項機率,它告訴我們在許多樣本中,不斷重複抽樣測量時, 區間會抓到真正參數的機率,這個機率就是信賴水準。三、我覺得1.要找信賴區間,先得考慮統計量的抽樣分布,也就是重複抽樣之下統計量 會如何變化;信賴區間展現的是這個

3、參數的真實值有一定機率落在測量結 果附近的程度。信賴區間公式有很多種,可以在不同情形下使用,但是更 重要的是,解釋的方法都是一樣的。2.抽樣分布是在描述從同一母體抽出的許多樣本之結果;我們可以信任大的 隨機樣本的結果,都很接近母體的真正值。但是我們永遠不會知道,我們 手上的這組數據所得到的區間,是不是真正的母體參數,如果認為風險太 大,可以改用更高比例的信賴區間。3.用簡單隨機樣本(SRS)中的成功比例, 來估計母體中的成功比例p。統計量 做為參數p之估計,表現如何?要知道答案,我們會問:如果我們取許許多多樣本,會發生什麼情況?我們也知道這個抽樣變異並不是偶發的。長期下來它有很清楚的型態,用常

4、態曲線可以把這個型態描繪得相當接近。 第22章 什麼是顯著性檢定一、簡介 統計推論是利用樣本的數據,來對母體做結論,所以統計檢定處理的,是有關母體的判斷,故顯著性檢定則是要評估對某一未知參數斷言的證據;顯著性檢定用機率來回答之問題為,光憑機遇就會得到像某樣本的極端結果之機率有多少? 統計檢定的p值,如果小於或等於值,代表我們的結果只靠機遇碰巧發生的機率不大,p值是在H0為真的假設下計算得到的,結果應該會像著對立假設的方向。二、我學得1.統計量對於參數的結果,完全是由機遇造成的機率非常小,可以用顯著性 檢定對這個基本論據,處理得更精確;統計檢定會先假設我們再找的效應 並不存在,然後開始尋找的證據

5、,必須不利這項假設,而支持我們想找的 效應。2.統計檢定的P值是在H0為真的假設下,所得到樣本結果會像實際觀測結果那麼極端或更極端的機率。P值愈小,資料所提供否定H0的證據就愈強;在實際應用時,大部分的統計檢定可以由電腦軟體來執行。3.統計檢定量(即其對應之P)是否落在拒絕區域,即落在顯著水準值外更為 極端之區域,來判定是否該拒絕這個假設。(以下參考教育論文寫作一書)p .05,表示結果不顯著,不加以註記; p.05,表示結果顯著,通常會以*註記; p .01,表示結果更顯著,通常會以*註記。三、我覺得1.顯著性檢定的目的,通常是想提出母體中存在某種不利原始假設的證據有 多強,檢定並沒有說我們

6、正在尋求的母體效應,到底有多大或多重要;但 是要證明原始假設不正確,p值要多小才能令人信服?不同的人常會想用 不同的顯著水準,所以在顯著與不顯著之間並沒有清楚的界線。2.如果P值小於或等於值,我們稱該組數據於水準有統計顯著性。然而 顯著(significant)在統計上的意義並不是重要,而只代表光是靠 機遇不容易發生。 第23章 統計推論的使用與濫用一、簡介 信賴區間和顯著性檢定這兩種主要的統計推論,背後的倫理基礎是一樣的,但是聰明做推論的第一步,是了解你的數據及你想回答的問題。了解信賴區間和統計顯著性檢定檢定的意義,有助於避免不恰當的的結論,只是樣本小時,母體的重要真實情況卻可能達不到顯著性

7、的標準,樣本大時,也不見得有實質上的意義。二、我學得1.推論統計的要點: (1)產生數據的設計很重要:數據從哪裡來的?是所有統計研究中該問 的第一個問題。數據必須是從我們關心的母體中所抽出的簡單隨機樣本 (SRS)。 (2)了解信賴區間的運作:信賴區間可以估計未知參數的值,同時告訴我們 估計的不確定程度有多大。 (3)了解統計顯著性的意義:許多統計研究的目的,是想要顯示某種斷言是 正確的,檢定可以幫助我們了解,是否的確找到了正在尋找的目標。 (4)了解所用的方法必須滿足的條件:我們對於比例p所做的檢定及信賴區 間,都要求母體必需比樣本大很多,還要求樣本本身也要夠大,使得樣 本比例 的抽樣分布會

8、接近常態。2.讀一項顯著性檢定的結果時,要特別注意樣本大小,理由: (1)較大的樣本會讓顯著性檢定比較敏感,但是可能一項發現有統計顯著 性,卻沒有實際上的重要性。 (2)沒有達到統計顯著性不代表效應不存在,只能說我們沒有找到合理證據 來支持,因此小樣本常會漏掉母體中確實存在的一些效應。3.在顯著與不顯著之間並沒有清楚的界線,只是在p值越來越小時, 我們就有越來越強的證據而已。所以水準5%之顯著性並非一個全球性 的標準。三、我覺得1.統計推論是根據樣本所提供的證據,對母體做出結論,在數學領域做結論, 是要從某些假設開始,然後根據邏輯推演,證明結論確實毫無疑問絕對成 立。統計卻不一樣,統計結論不是

9、百分之百確定的,因為樣本不等於整個 母體。所以統計推論除了結論以外,還得說明結論的不確定程度。2.信賴區間提供的訊息比檢定多,因為信賴區間實際上估計了母體參數的值,而且信賴區間比較容易解釋,因此,好的作法是儘可能以提出信賴區間的方式來推論統計。3.我們必須真正瞭解統計顯著性的意義:􀂄(1)樣本愈多愈容拒絕虛無假設。􀂄(2)統計上的顯著性和實際上的顯著性是一樣的。除注意P值外,要多花點時間詳細檢視資本身。􀂄(3)選擇顯著水準。􀂄(4)要忽沒有顯著性的結果。4.統計推論是利用樣本的數據,來對母體做結論。如果我們取許多樣本而且斷

10、言正確,我們很少會得到這樣的結果。要得到樣本證據強度的數值量度,就要把語意模糊的很少用機率來取代。 第24章 雙向表及卡方檢定一、簡介 要顯示兩個類別變數之間的關聯,可以用雙向表,來探討兩個類別變數之間是否有關係;要檢視樣本數據很容易,但是樣本顯示出的關聯,是否可以證明整個母體中這兩個變數有關聯?還是只因為隨機抽樣的巧合就發生了呢?卡方檢驗是一種用途很廣的計數資料的假設檢驗方法,可以用來判斷雙向表中所出現的關聯,是否有統計顯著性,避免由潛在變數造成的誤導。二、我學得1.要顯示兩個類別變數之間的關聯,用雙向表來探討兩個類別變數之間是否 有關係;例如職級是列變數(row variable),每一列

11、代表一種職級,性別是 行變數(column variable),每一行代表一種性別。職級和性別之間有何關聯, 一定要用到整個雙向表,根據所給的計數,計算出適當的百分比。2.辛浦森詭(Simpsons paradox):當潛在變存有影響時,雙向表觀察到的 關有可能是誤導的,在幾組值中都顯示出的關聯或比較,有可能在據 合併成一組時全消失甚至倒轉方向。3.預期計數:H0為真時,雙向表中任一格的預期計數(expected count)為: 預期計數=(列總和行總和)/表總和 要檢定H0,會把雙向表中以觀察到的計數和預期計數做比較,如果觀察到 的計數和預期計數相差很大,就是不利於H0的證據。4.卡方統計

12、量:出雙向表中所觀察到的計和預期計之間的差距,其 公式是:X2=(觀察到的據預期的據)2/預期的據􀂄用以檢定據是否提供於沒有關的原始假設之證據,對所觀 察到的據與預期沒有關的據作比較。5.卡方分布:當無關聯的原始假設為真時,卡方統計量X2的分布就稱為卡方 分布(chi-square distribution),卡方分布是指一整族的分布,而這個分布只 有正值且為右偏。三、我覺得1.別尺資無法透過散布圖、計算相關係或迴歸直線描述變間的 關,表字只能呈現事實,但無法解釋其意義。要描述別變間的 關,可根據雙向表所給的計,計算出適當的百分比,通常用百分比可 將分布的情形清楚表出。2.當

13、存在潛在變數時,觀察到的關聯有可能是誤導的,所以第十五章曾經提 醒過,潛在變數可以藉由共同反應或交絡製造出關聯,所以如果可以實驗, 才可以得到足以證明的證據來證明因果關聯。3.檢驗兩個或兩個以上總體的某一特性分布,也就是各變數的比例是否統一或相近,稱為卡方統一性檢驗或者卡方同質性檢驗在不同水準之下,卡方統計量X2的值要多大,才能使結果有統計顯著性?每一種自由度對應不同的結果。 第25章 有關母體平均數的推論一、簡介 信賴區間和顯著性檢定背後的理論依據是一樣的,但是處理方法卻大不相同,推論過程的形式,首先和想從中尋求的資訊參數有關,第二項影響因素是抽樣或實驗的設計。 我們用取自母體的SRS之樣本

14、平均,來估計母體平均數,的信賴區間和顯著性檢定,是根據的抽樣分布得來的,但是關於的推論方式,很像關於母體比例p的推論,因為兩者都是根據常態抽樣分布而來的。二、我學得1.從平均數為,標準差為的母體抽取大小為n的SRS,則 (1)當樣本大小n較大時,的抽樣分布會近似常態。 (2)抽樣分布的平均數等於。 (3)抽樣分布的標準差是/n。2.中央極限定理:3.從個體平均數為的大母體裡,抽取大小為n的SRS,當n很大時,的近 似水準C信賴區間為 z* s/n。4.H0為真時很難得出現的值,就是H0不正確的根據。如果假設檢定是要檢 定母體平均數的值,檢定人員選定的顯著水準就決定了發生型錯誤的機 率。再藉著控制樣本數,檢定人員可同時控制發生型錯誤的機率。5.若母體呈常態分配,則不管樣本多大,抽樣分配為常態。若母體標準差為已知,即使是小樣本,仍能計算母體平均數的區間估計值。三、我覺得當樣本很大時,樣本平均數的抽樣分配近以於常態分配。若樣本大小在30(含)以上時,就認為其滿足大樣本的條件。若母體呈常態分配,則不管樣本多大, 的抽樣分配為常態。若母體標準差為已知,即使是小樣本,仍能計算母體平均數的區間估計值。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1