第21章什麼是信赖区间.docx

上传人:b****6 文档编号:13521376 上传时间:2023-06-14 格式:DOCX 页数:10 大小:21.11KB
下载 相关 举报
第21章什麼是信赖区间.docx_第1页
第1页 / 共10页
第21章什麼是信赖区间.docx_第2页
第2页 / 共10页
第21章什麼是信赖区间.docx_第3页
第3页 / 共10页
第21章什麼是信赖区间.docx_第4页
第4页 / 共10页
第21章什麼是信赖区间.docx_第5页
第5页 / 共10页
第21章什麼是信赖区间.docx_第6页
第6页 / 共10页
第21章什麼是信赖区间.docx_第7页
第7页 / 共10页
第21章什麼是信赖区间.docx_第8页
第8页 / 共10页
第21章什麼是信赖区间.docx_第9页
第9页 / 共10页
第21章什麼是信赖区间.docx_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

第21章什麼是信赖区间.docx

《第21章什麼是信赖区间.docx》由会员分享,可在线阅读,更多相关《第21章什麼是信赖区间.docx(10页珍藏版)》请在冰点文库上搜索。

第21章什麼是信赖区间.docx

第21章什麼是信赖区间

第21章什麼是信賴區間

一、簡介

用來描述母體的數叫做參數(parameter),要估計母體參數,必須從母體取一個樣本,並從樣本算出來的某個統計量(statistic)的值來當做我們的估計。

樣本的結果通常不會和母體的真正比例一模一樣,所以就需要信賴區間(confidenceinterval)把這個大約更具體化;信賴區間就是估計一個未知參數的方式,可以提供我們該估計的不確定程度。

二、我學得

1.95%信賴區間是從樣本數據計算出來的一個區間,保證在所有樣本當中,有

95%會把真正的母體參數包含在區間內。

2.一個統計量的抽樣分布,是指同一母體所抽出,同樣大小的所有可能樣本,

其統計量的值之分布,用表示成功的樣本比例:

=樣本中的成功計數/n

當樣本夠大時,的分布為近似常態;且抽樣分布的平均數和p相等。

3.信賴區間應用機率的中心概念:

如果重複抽樣許多次,95%信賴區間中的

95%是機率,是這個方法所產生的區間會抓到真正參數值的機率。

所以從

同一母體重複抽樣,會得到不一樣的95%信賴區間,但是這些區間當中,

有95%會抓到真正的母體比例p。

4.信賴水準是一項機率,它告訴我們在許多樣本中,不斷重複抽樣測量時,

區間會抓到真正參數的機率,這個機率就是信賴水準。

三、我覺得

1.要找信賴區間,先得考慮統計量的抽樣分布,也就是重複抽樣之下統計量

會如何變化;信賴區間展現的是這個參數的真實值有一定機率落在測量結

果附近的程度。

信賴區間公式有很多種,可以在不同情形下使用,但是更

重要的是,解釋的方法都是一樣的。

 

2.抽樣分布是在描述從同一母體抽出的許多樣本之結果;我們可以信任大的

隨機樣本的結果,都很接近母體的真正值。

但是我們永遠不會知道,我們

手上的這組數據所得到的區間,是不是真正的母體參數,如果認為風險太

大,可以改用更高比例的信賴區間。

3.用簡單隨機樣本(SRS)中的成功比例,來估計母體中的成功比例p。

統計量做為參數p之估計,表現如何?

要知道答案,我們會問:

「如果我們取許許多多樣本,會發生什麼情況?

」我們也知道這個抽樣變異並不是偶發的。

長期下來它有很清楚的型態,用常態曲線可以把這個型態描繪得相當接近。

 

第22章什麼是顯著性檢定

一、簡介

統計推論是利用樣本的數據,來對母體做結論,所以統計檢定處理的,是有關母體的判斷,故顯著性檢定則是要評估對某一未知參數斷言的證據;顯著性檢定用機率來回答之問題為,光憑機遇就會得到像某樣本的極端結果之機率有多少?

統計檢定的p值,如果小於或等於α值,代表我們的結果只靠機遇碰巧發生的機率不大,p值是在H0為真的假設下計算得到的,結果應該會像著對立假設的方向。

二、我學得

1.統計量對於參數的結果,完全是由機遇造成的機率非常小,可以用顯著性

檢定對這個基本論據,處理得更精確;統計檢定會先假設我們再找的效應

並不存在,然後開始尋找的證據,必須不利這項假設,而支持我們想找的

效應。

2.統計檢定的P值是在H0為真的假設下,所得到樣本結果會像實際觀測結果

那麼極端或更極端的機率。

P值愈小,資料所提供否定H0的證據就愈強;在實際應用時,大部分的統計檢定可以由電腦軟體來執行。

3.統計檢定量(即其對應之P)是否落在拒絕區域,即落在顯著水準α值外更為

極端之區域,來判定是否該拒絕這個假設。

(以下參考教育論文寫作一書)

p>.05,表示結果不顯著,不加以註記;

p≦.05,表示結果顯著,通常會以「*」註記;

p<.01,表示結果更顯著,通常會以「**」註記。

三、我覺得

1.顯著性檢定的目的,通常是想提出母體中存在某種不利原始假設的證據有

多強,檢定並沒有說我們正在尋求的母體效應,到底有多大或多重要;但

是要證明原始假設不正確,p值要多小才能令人信服?

不同的人常會想用

不同的顯著水準,所以在「顯著」與「不顯著」之間並沒有清楚的界線。

2.如果P值小於或等於α值,我們稱該組數據於水準α有統計顯著性。

然而

「顯著」(significant)在統計上的意義並不是「重要」,而只代表「光是靠

機遇不容易發生」。

 

第23章統計推論的使用與濫用

一、簡介

「信賴區間」和「顯著性檢定」這兩種主要的統計推論,背後的倫理基礎是一樣的,但是聰明做推論的第一步,是了解你的數據及你想回答的問題。

了解信賴區間和統計顯著性檢定檢定的意義,有助於避免不恰當的的結論,只是樣本小時,母體的重要真實情況卻可能達不到顯著性的標準,樣本大時,也不見得有實質上的意義。

二、我學得

1.推論統計的要點:

(1)產生數據的設計很重要:

「數據從哪裡來的?

」是所有統計研究中該問

的第一個問題。

數據必須是從我們關心的母體中所抽出的簡單隨機樣本

(SRS)。

(2)了解信賴區間的運作:

信賴區間可以估計未知參數的值,同時告訴我們

估計的不確定程度有多大。

(3)了解統計顯著性的意義:

許多統計研究的目的,是想要顯示某種斷言是

正確的,檢定可以幫助我們了解,是否的確找到了正在尋找的目標。

(4)了解所用的方法必須滿足的條件:

我們對於比例p所做的檢定及信賴區

間,都要求母體必需比樣本大很多,還要求樣本本身也要夠大,使得樣

本比例的抽樣分布會接近常態。

2.讀一項顯著性檢定的結果時,要特別注意樣本大小,理由:

(1)較大的樣本會讓顯著性檢定比較敏感,但是可能一項發現有統計顯著

性,卻沒有實際上的重要性。

(2)沒有達到統計顯著性不代表效應不存在,只能說我們沒有找到合理證據

來支持,因此小樣本常會漏掉母體中確實存在的一些效應。

3.在「顯著」與「不顯著」之間並沒有清楚的界線,只是在p值越來越小時,

我們就有越來越強的證據而已。

所以「水準5%之顯著性」並非一個全球性

的標準。

三、我覺得

1.統計推論是根據樣本所提供的證據,對母體做出結論,在數學領域做結論,

是要從某些假設開始,然後根據邏輯推演,證明結論確實毫無疑問絕對成

立。

統計卻不一樣,統計結論不是百分之百確定的,因為樣本不等於整個

母體。

所以統計推論除了結論以外,還得說明結論的不確定程度。

2.信賴區間提供的訊息比檢定多,因為信賴區間實際上估計了母體參數的

值,而且信賴區間比較容易解釋,因此,好的作法是儘可能以提出信賴區

間的方式來推論統計。

3.我們必須真正瞭解統計顯著性的意義:

􀂄

(1)樣本愈多愈容易拒絕虛無假設。

􀂄

(2)統計上的顯著性和實際上的顯著性是不一樣的。

除了注意P值外,要多

花點時間詳細檢視資料本身。

􀂄(3)選擇顯著水準。

􀂄(4)不要忽略沒有顯著性的結果。

4.統計推論是利用樣本的數據,來對母體做結論。

如果我們取許多樣本而且

斷言正確,我們很少會得到這樣的結果。

要得到樣本證據強度的數值量度,

就要把語意模糊的「很少」用機率來取代。

 

第24章雙向表及卡方檢定

一、簡介

要顯示兩個類別變數之間的關聯,可以用「雙向表」,來探討兩個類別變數之間是否有關係;要檢視樣本數據很容易,但是樣本顯示出的關聯,是否可以證明整個母體中這兩個變數有關聯?

還是只因為隨機抽樣的巧合就發生了呢?

卡方檢驗是一種用途很廣的計數資料的假設檢驗方法,可以用來判斷雙向表中所出現的關聯,是否有統計顯著性,避免由潛在變數造成的誤導。

二、我學得

1.要顯示兩個類別變數之間的關聯,用雙向表來探討兩個類別變數之間是否

有關係;例如職級是列變數(rowvariable),每一列代表一種職級,性別是

行變數(columnvariable),每一行代表一種性別。

職級和性別之間有何關聯,

一定要用到整個雙向表,根據所給的計數,計算出適當的百分比。

2.辛浦森詭論(Simpson’sparadox):

當潛在變數存有影響時,雙向表觀察到的

關聯有可能是誤導的,在幾組值中都顯示出的關聯或比較,有可能在數據

合併成一組時全都消失甚至倒轉方向。

3.預期計數:

H0為真時,雙向表中任一格的預期計數(expectedcount)為:

預期計數=(列總和×行總和)/表總和

要檢定H0,會把雙向表中以觀察到的計數和預期計數做比較,如果觀察到

的計數和預期計數相差很大,就是不利於H0的證據。

4.卡方統計量:

度量出雙向表中所觀察到的計數和預期計數之間的差距,其

公式是:

X2=Σ(觀察到的數據—預期的數據)2/預期的數據

􀂄用以檢定數據是否提供了不利於「沒有關聯」的原始假設之證據,對所觀

察到的數據與預期沒有關聯的數據作比較。

5.卡方分布:

當無關聯的原始假設為真時,卡方統計量X2的分布就稱為卡方

分布(chi-squaredistribution),卡方分布是指一整族的分布,而這個分布只

有正值且為右偏。

三、我覺得

1.類別尺度資料無法透過散布圖、計算相關係數或迴歸直線來描述變數間的

關聯,表列數字只能呈現事實,但無法解釋其意義。

要描述類別變數間的

關聯,可根據雙向表所給的計數,計算出適當的百分比,通常用百分比可

將分布的情形更清楚表出。

2.當存在潛在變數時,觀察到的關聯有可能是誤導的,所以第十五章曾經提

醒過,潛在變數可以藉由共同反應或交絡製造出關聯,所以如果可以實驗,

才可以得到足以證明的證據來證明因果關聯。

3.檢驗兩個或兩個以上總體的某一特性分布,也就是各變數的比例是否統一

或相近,稱為卡方統一性檢驗或者卡方同質性檢驗在不同水準之下,卡方

統計量X2的值要多大,才能使結果有統計顯著性?

每一種自由度對應不同

的結果。

 

第25章有關母體平均數的推論

一、簡介

信賴區間和顯著性檢定背後的理論依據是一樣的,但是處理方法卻大不相同,推論過程的形式,首先和想從中尋求的資訊參數有關,第二項影響因素是抽樣或實驗的設計。

我們用取自母體的SRS之樣本平均χ,來估計母體平均數μ,μ的信賴區間和顯著性檢定,是根據χ的抽樣分布得來的,但是關於μ的推論方式,很像關於母體比例p的推論,因為兩者都是根據常態抽樣分布而來的。

二、我學得

1.從平均數為μ,標準差為σ的母體抽取大小為n的SRS,則

(1)當樣本大小n較大時,χ的抽樣分布會近似常態。

(2)抽樣分布的平均數等於μ。

(3)抽樣分布的標準差是σ/√n。

2.中央極限定理:

3.從個體平均數為μ的大母體裡,抽取大小為n的SRS,當n很大時,μ的近

似水準C信賴區間為χ±z*s/√n。

4.H0為真時很難得出現的χ值,就是H0不正確的根據。

如果假設檢定是要檢

定母體平均數的值,檢定人員選定的顯著水準就決定了發生型Ⅰ錯誤的機

率。

再藉著控制樣本數,檢定人員可同時控制發生型Ⅱ錯誤的機率。

5.若母體呈常態分配,則不管樣本多大,抽樣分配為常態。

若母體標準差為

已知,即使是小樣本,仍能計算母體平均數的區間估計值。

三、我覺得

 

當樣本很大時,樣本平均數的抽樣分配近以於常態分配。

若樣本大小在30(含)以上時,就認為其滿足大樣本的條

件。

若母體呈常態分配,則不管樣本多大,的

抽樣分配為常態。

若母體標準差為已知,即使是小樣本,仍

能計算母體平均數的區間估計值。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2