SPC 理论指导
第 第1章 章
導 導 論 第 第2章 章
統計資料的整顿與描述 第 第3章 章
機率導論 第 第4章 章
常用的機率分佈與統計分佈 第 第5章 章
描樣办法與描樣分佈 第 第6章 章
統計估計 第 第7章 章
統計檢定 第 第8章 章
變異數分析 第 第9章 章
相關分析與迴歸模式 第 第10章 章
無母數統計檢定 第 第11章 章
類別資料分析--- 列聯表與卡方檢定
當獲得母體的樣本資料時,可由各種機率分佈當中, 選擇出最接近該母體的機率分佈 , 續之即估計該分佈之參數值, 使樣本資料與母體參數有最佳的推論與檢定才能。
然即使隨機變數的機率分佈及其參數值已知,仍無法準確的預測某特定事宜必定或不必定發生,而只能預測此事宜發生之機率為若干。此 不確 定 性發生的原因主如果因為天然現象有固有的隨機性(Inherent Randomness) 。但 不確定性的其他身分則可能包含分佈模式選擇的不適切,或參數推定不準確所致。
雖然參數推定值的準確性可因樣本數的增长而进步。但固有的變異性確可能因為樣本數增长而益形顯著。
統計估計過程是由母體中抽掏出數樣本,藉機率道理找第六章 統計估計 母體 樣本 分佈、參數 統計量 隨機抽取 推 推
論 檢定檢定 計算計算 描述描述
出適當的樣本統計量,再以此樣本統計量推估母體參數。
統計估計办法,一般分為點估計與區間估計兩種。
。
6.1 點估計(Point Estimation) ◎ 數 假設隨機變數 X 的母體機率密度函數 f(x| ) ,个中 為未知的參數。為估計此未知的參數,則由母體中抽掏為 出數樣本,获得觀測值為 x 1 , x 2 ,…,x n 。
。
◎ 应用點估計办法求出一估計式(Estimator) ,以ˆ表示。為 再將觀測值為 x 1 , x 2 ,…,x n 代入估計式中获得一數值,此數值稱之為參數 的估計值(Estimate) 。
◎ 常用办法:(1) 最大年夜概似法,(2) 動差法。
6.2.1
最大年夜概似法(Maximum Likelihood Method) 體 母體 f(x| )
為 觀測值為 x 1 , x 2 ,…,x n
估計式 ˆ 參數 的估計值
◎ 由 由 Fisher (1912) 提出。假設隨機變數 X 的母體機率密數 度函數 f(x| ) ,个中 為未知的參數,為估計此未知的為 參數,則由母體中抽掏出數樣本,获得觀測值為 x 1 , x 2 ,…,x n 。則概似函數定義為 L(x 1 , x 2 ,…,x n ; ; ) = f(x 1 , )f(x 2 , )…f(x n , )
(6.1) ◎ 數 使概似函數 L(x 1 , x 2 ,…,x n ; ; ) 值為最大年夜,則能求出估計式ˆ,稱此ˆ為式 最大年夜概似估計式(MLE, Maximum Likelihood Method)
範例、某公司新 推出光碟燒錄機,其应用壽命服從指數分佈
f(x) = (1/ )e -x/ 。為估計參數 以懂得平均应用壽命,隨機出 抽掏出 11 台樣本做測試,測得其壽命結果如下:8 ,10, ,13 ,14 ,19 ,21 ,27 ,28 ,34 ,41 ,52 ( 百小時) 。試以最大年夜概似法估計 值。
SOL :L(x 1 , x 2 ,…,x n ; ; ) = f(x 1 , )f(x 2 , )…f(x n , )
n1 iin 2 1/ xn / x / x / xe )1( e1e1e1
ln L(x 1 , x 2 ,…,x n ; ; )= -n ln -(1/ ) n i =1
x i
d (ln L)/d = -n / + (1/ 2 ) n i =1
x i
= 0
Estimator( 估計式)
ˆ= n i =1
x i
/n ˆ= (8+10+13+14+19+21+27+28+34+41+52)/11= 267/11
數 範例、假設隨機變數 X~N( , 2 ) ,從个中隨機抽掏出一組樣體 母體 f(x) =(1/ )e-x/ 觀測值為 8 ,10 ,13 ,14 ,19 ,21 ,27 ,28 ,34 ,41 ,52 估計式ˆ= n i =1
x i
/n 參數 的估計值ˆ= 267/11
本 本 x 1 , x 2 ,…,x n ,試以最大年夜概似法估計 , 2 值。
SOL :L(x 1 , x 2 ,…,x n ; ; , 2 ) = f(x 1 , , 2 )f(x 2 , , 2 )…f(x n , , 2 ) 22i22n2212) x (n2) x (2) x (e )21( e21e21
ln L(x 1 , x 2 ,…,x n ; ; , 2 ) = ln 22i2) x (ne )21(
= -(n/2) ln (2 ) - (n/2) ln ( 2 )- ( (x i - ) 2 )/ 2 2
x xn1ˆ 0) , ( L lnn1 ii2 2n1 ii222) x x (n1ˆ 0) , ( L ln
範例、台灣的地舆地位處於東亞地动帶,地动活動 較頻繁。佈 假設台灣發生有感地动的次數服從卜氏分佈 Poi( ) 。台東氣象站為了要估計此參數 ,以懂得台灣有感地动情况,於是觀察過去一年來的每月資料,获得台灣有感地动資料如下:9, 7, 12, 14, 3, 11, 7, 10, 4, 6, 8, 10 。試以最大年夜概似法求 之估計式,並由樣資料去估計 值。
SOL :L(x 1 , x 2 ,…,x n ; ; ) = f(x 1 , )f(x 2 , )…f(x n , )
! xe! xe! xe! xein1 ixnnx2x1xn1 iin 2 1
ln L(x 1 , x 2 ,…,x n ; ; )= -n + n i =1
x i
ln - ln n i =1
x i !
d (ln L)/d = -n + ( n i =1
x i )/ = 0
Estimator( 估計式)
ˆ= n i =1
x i
/n ˆ= (9+7+12+14+3+11+7+10+4+6+8+10)/12= 101/12=8.42
6.2.2 動差法(Moment Method) ◎ 由 由 Pearson (1894) 提出。假設隨機變數 數 X 的 的 k 次動差為 k = E[X k ] ,則樣本動差定義為 n1 ikkixn1ˆ
kˆ 對 即為對 k 次動差 k 點估計。
◎對母體平均值 、變異數 2 做點估計 一次動差( k=1) n1 i1i 1xn1ˆ n1 iix xn1ˆ
二次動差(k=2) 22n1 i2i2n1 ii2ˆ ˆ x xn1) x x (n1ˆ ◎ 對常態分派 、 2 而言, 用動差法估計與用最大年夜概似法估計的結果是一樣的。但對其他分派,其結果有異。
。
數 範例、假設隨機變數 X~U(0, ) 代表致遠校門口學生等待計程車時間所滿足之分佈,茲從學生等待計程車時間,隨機出 抽掏出 5 樣本:0.5 、1 、2 、3.5 、8 ( 分鐘) ,試以動差法估計 值。
SOL:
:以 均勻分佈以 X~U(a, b) 表示,其期望值與變異數為:
E[x]= (a+b)/2
Var[x] = (b-a) 2 /12
X~U(0, ) E[x] = /2 = /2 = 2
ˆ=(2/n) n i =1
x i
= 2 x = 2(0.5+1+2+3.5+8)/5 = 6 ( 動差法) 計 若用最大年夜概似法估計 U(0, ) ,易得 之最大年夜概似法估計式
ˆ= max 1 i n x i = {0.5 、1 、2 、3.5 、8}= 8
6.2 若何評量『點估計』的優良性
同一未知參數的估計式有很多種,何者最佳? 統計學定義三個準則:(1) 不偏 (2) 有效性(3) 最小變異數。
定義:不偏估計式(Unbiased Estimator)
設未知參數 的估計式為ˆ,ˆ可視為一隨機變數。是以,隨機變數ˆ值 會服從某一機率分佈,當此分佈的期望值 E[ˆ]正 正
即 好等於未知參數時,即 E[ˆ]= , , 稱ˆ為 的不偏估計式。
數 範例、假設由一個隨機變數 X~N( , 2 ) ,從个中隨機抽掏出5 個樣本 x 1 , x 2 , x 3 , x 4 , x 5 列 ,試下列 4 個估計式,何者是 的不偏估計式。
(1) 1ˆ = x 1 , (2)
2ˆ = (x 1 +x 5 )/2 ,(3) 3ˆ = (x 1 +2x 5 )/2 , ,
(4)
4ˆ = (x 1 +x 2 +x 3 +x 4 +x 5 )/5 SOL :(1) ]ˆ[ E1 = E[x 1 ]=
(2) ]ˆ[ E2 = E[(x 1 +x 5 )/2]=
(3) ]ˆ[ E3 = E[(x 1 +2x 5 )/2]= 3 /2
(4)
]ˆ[ E4 = E[(x 1 +x 2 +x 3 +x 4 +x 5 )/5]=
4 2 1ˆ,ˆ,ˆ 是 的不偏估計式。
數 範例、假設由一個隨機變數 X~N( , 2 ) ,從个中隨機抽掏出n 個樣本,試下列樣本變異數 S 2 是否是母體變異數 2 之不偏估計式。
SOL :
E[S 2 ] = E[ n i =1 (x i
– x ) 2 /(n-1)]= E[ n i =1 (x i 2
–n x2 )]/(n-1)
={ n i =1 E[x i 2 ]- nE[2x ]}/(n-1)
= {n( 2 + 2 )- n( 2 + 2 /n)}/(n-1) = 2
◎ 數 平日由一個隨機變數 X~N( , 2 ) ,從个中隨機抽掏出 n個樣本,下列關係成立,且為不偏估計值。
E[ x ]= 、E[2 1x x ]= 1 - 2 、
E[S 2 ]= 2
E[pˆ]=
p 、E[2 1p ˆp ˆ ] = p 1 -p 2
定義:有效性(Efficiency)
設 茲 有 二 個 不 偏 估 計 式 , 即 為1ˆ 與2ˆ 。
若Var[1ˆ ] Var[2ˆ ] ,則稱1ˆ 比2ˆ 有效力。
數 範例、承上題,假設由一個隨機變數 X~N( , 2 ) ,從个中隨出 機抽掏出 5 個樣本 x 1 , x 2 , x 3 , x 4 , x 5 列 ,試下列 4 個估計式,何者是 的不偏估計式。
(1) 1ˆ = x 1 , (2)
2ˆ = (x 1 +x 5 )/2 ,(3) 3ˆ = (x 1 +2x 5 )/2 , ,
(4)
4ˆ = (x 1 +x 2 +x 3 +x 4 +x 5 )/5 SOL :
4 2 1ˆ,ˆ,ˆ 是 的不偏估計式。
Var[1ˆ ] = Var[x 1 ] = 2
Var[2ˆ ] = {Var[x 1 ] + Var[x 5 ]}/4= 2 /2
Var[4ˆ ] = 2 /5 4ˆ 之變異數最小,故選用4ˆ 來估計 最佳,即最有效力也。
定義:最小變異不偏估計式(Minimum-Variance Unbiased ) 若一不偏估計式,且其變異數比其他不偏估計式的變異數小,則稱此不偏估計式為最小變異不偏估計式,亦稱最佳估計式(Best Estimator) 。如,上題4ˆ 即為最小變異不偏估計式。
設 範例、假設 x 1
, x 2
, x 3 數 由波松機率密度函數 Poi( ) 个中 是未知參數,隨機抽取的三個樣本。現有四個估計式分別為:
(1) 1ˆ = x 1 , (2)
2ˆ = (x 1 +x 2 )/2 ,(3) 3ˆ = (x 1 +2x 2 )/3 , ,
(4)
4ˆ = (x 1 +x 2 +x 3 )/3 試問:(A) 那些是 的不偏估計式? (B) 在所有不偏估計式中,何者具有最小變異數?
SOL :
(A)
(1) 、(2) 、(3) 、(4) 皆是 的不偏估計式。
(B)
Var[1ˆ ] = Var[x 1 ] =
Var[2ˆ ] = Var[(x 1 +x 2 )/2]= /2
Var[3ˆ ] = Var[(x 1 +2x 2 )/3]= 5 /9
Var[4ˆ ] = Var[(x 1 +x 2 +x 3 )/3]= 3 /9 Var[1ˆ ] Var[2ˆ ] Var[3ˆ ] Var[4ˆ ] 4ˆ 之變異數最小,故選用4ˆ 來估計 最佳。
Excel , p.175 ~ p. 186
6.3 區間估計(Interval Estimation)
用點估計办法找出 的估計值為ˆ時,平日ˆ的樣本估計值不必定會準確的落於 上,而是略大年夜於或小於 ,即ˆ的樣本估計值會落於 邻近區間內。將估計結果以區間的情势表示之--- 『區間估計』,即『此區間包含了真正的參數 』。
區間估計之法度榜样:
以機率表示:
P(L U) = 1-
中 个中 1- 為信賴水準(Confidence Level) 。 為顯著水準(Significance Level) 。
。
(L, U) 為 信 賴 區 間 (Confidence Interval) ,即對參數 所做估計的 1- 信賴水準的信賴區間。L 為信賴區間下限,U 為信賴區 間上限。
體 母體 f(x| )
估計式 ˆ ˆ 區間(L, U)
區間(L, U) 包含參數 的機率 1-
的 以樣本平均值的 95% 信賴區間為例,即在 100 次抽樣中有 有 95 次包含母體平均值,亦就是表示會有 5 次沒有包含母體平均值。 = 5% ,P(L U) = 1- = 1- 5% = 95% 。
令信賴區間長度 = L - U ,在 1- 信賴水準下,區間長度 度( 即誤差是也) 愈短,表示此區間估計的精確度愈高。亦即對未知的母體參數 的可能變動範圍較小,其控轨制較高。
6.3.1 常態分佈母體平均值 之區間估計
體 母體 N( , 2 ) x 為 之最佳估計值
的區間估計由以 x 為中间往兩邊延长
變異數 2 已知 變異數 2 未知
6.3.1.(a) 變異數 2 已知
假設 x 由 為由 N( , 2 ) 中隨機抽取 n 個樣本的樣本平均值。令 令 Z /2 代表標準常態分佈下,右邊機率為 /2 所對應的 Z 值;-Z /2 代表標準常態分佈下,左邊機率為 /2 所對應的 Z 值。
1- = P(-Z /2 < Z < Z /2 ) = P(-Z /2 < n /x < Z /2 )
P ( x - Z /2 ( )/(n) 1/2 < < x +
Z /2 ( )/(n) 1/2 )
母體平均值 的 的 1- 信賴區間為:
( x - Z /2 ( )/(n) 1/2 , x +
Z /2 ( )/(n) 1/2 )
x95%
/2 =0.025 /2 =0.025 Z /2
-Z /2
範例、致遠實習銀行欲知學生的平均一般按期存款金額,以取 便業務拓展參考。於是隨機抽取 49 位一般按期存款金此 額學生,得知此 49 位學生一般按期存款金額為 3 萬元。假設學生一般按期存款金額為常態分佈,變異數已知為0.64 的 萬元,試問平均一般按期存款金額的 90% 、95%與 與 99% 之信賴區間? SOL :
母體平均值 的 的 1- 信賴區間為 ( x - Z /2 ( )/(n) 1/2 , x +
Z /2 ( )/(n) 1/2 )
n = 49, , x = 3 , 2 = 0.64 ; 90% 之信賴區間 /2 = 0.05
( x - Z 0.05 ( )/(n) 1/2 , x +
Z 0.05 ( )/(n) 1/2 ) = (3 1.645(0.8)/(49) 1/2 ) 萬元 95% 之信賴區間 /2 = 0.025
( x - Z 0.025 ( )/(n) 1/2 , x +
Z 0.025 ( )/(n) 1/2 ) = (3 1.96(0.8)/(49) 1/2 )萬 萬元 元 99% 之信賴區間 /2 = 0.005 ( x -Z 0.005 ( )/(n) 1/2 , x + Z 0.005 ( )/(n) 1/2 )= (3 2.5758(0.8)/(49) 1/2 )萬 萬元 元
6.3.1.(b) 變異數 2 未知 一般情況下,變異數 2 常是未知的,則上述之信賴區間便弗成应用,須修改如下:
當 當n 夠大年夜(n 30), ,S 2 =[ n i =1
(x i - x ) 2 ]/(n-1)
2
母體平均值 的 的 1- 信賴區間為:
( x -Z /2 (S)/(n) 1/2 , x + Z /2 (S)/(n) 1/2 ) 當 當 n 不大年夜(n 30), ,n / Sxt = t
n-1
母體平均值 的 的 1- 信賴區間為:
( x -t /2,n-1 (S)/(n) 1/2 , x + t /2,n-1 (S)/(n) 1/2 )
萬一不是常態母體,并且樣本數又小,則須用其他办法,如無母體統計之办法。
範例、致遠治理學院欲知學生天天上網平均時間,於是隨機取 抽取 26 位學生,得知此 26 位學生平均天天上網時間80 分鐘。樣本標準為 差為 30 分鐘。假設學生天天上網平均時間為常態分佈,變異數未知,試問該校學生天天上的 網平均時間的 90% 、95%與 與 99% 之信賴區間? SOL :
母體平均值 的 的 1- 信賴區間為 ( x -t /2,n-1 (S)/(n) 1/2 , x + t /2,n-1 (S)/(n) 1/2 )
n = 26, , x = 80 ,S= 30 ; 90% 之信賴區間 /2 = 0.05
( x -t 0.05,25 (S)/(n) 1/2 , x +t 0.05,25 (S)/(n) 1/2 )= (80 1.708(30)/(26) 1/2 ) 分鐘 95% 之信賴區間 /2 = 0.025
( x -t 0.025,25 (S)/(n) 1/2 , x +t 0.025,25 (S)/(n) 1/2 )= (80 2.06(30)/(26) 1/2 ) 分鐘 99% 之信賴區間 /2 = 0.005 ( x -t 0.005,25 (S)/(n) 1/2 , x +t 0.005,25 (S)/(n) 1/2 )= (80 2.787(30)/(26) 1/2 )分 分鐘 鐘
6.3.2 常態分佈母體平均值 1 - 2 之區間估計
平日是應用在『不合母體間某性質差異之比較』,如工管系學生統計學成績的差異,對母體平均值差 1 - 2 做區間估計,其办法與母體平均值 的區間估計办法雷同。
6.3.2.(a) 變異數 1 2 , 2 2 已知 假 設 兩樣本平均值1x 與2x 分別來自體 兩母體 N( 1 , 1 2 )、 、N( 2 , 2 2 ) ,由上節知1x -2x 為 1 - 2 之最佳點估計式,茲對此兩母體平均值差 1 - 2 進行區間估計,就是以1x -2x 為中间往兩邊延长。
。
1- = P(-Z /2 < Z < Z /2 )= ) Zn n) ( ) x x (Z ( P2 /2221212 1 2 12 /
)n nZ ) x x (n nZ ) x x (( P2221212 / 2 1 2 12221212 / 2 1 母體平均值 的 的 1- 信賴區間為:
) x x (2 1 Z /2 [( 1 2 )/(n 1 )+( 2 2 )/(n 2 )] 1/2
6.3.2.(b) 變異數 1 2 , 2 2 未知 一般情況下,變異數 1 2 , 2 2 常是未知的,則上述之信賴區間便弗成应用,須修改如下:
當 當 n 夠大年夜,以 S 1 2 , S 2 2
1 2 , 2 2
母體平均值 的 的 1- 信賴區間為:
) x x (2 1 Z /2 [( S 1 2 )/(n 1 )+( S 2 2 )/(n 2 )] 1/2
當 當 n 不大年夜,而 1 2 = 2 2 = 2 採 ,採 t 分派處理之。
2 n n22p12p2 1 2 12 1tnSnS) ( ) x x (t
个中『共變異數』2 n nS ) 1 n ( S ) 1 n (S2 122 221 12p 為 2 之估計式。
母體平均值 的 的 1- 信賴區間為:
22p12p2 n n , 2 / 2 1nSnSt ) x x (2 1
有 範例、某房地產投資公司現有 2 種地盘投資計畫,其 5 年盈收率平均值為 1 , 2 第 。假設投資第 1 類地盘 50 筆,投資第 第 2 類地盘 75 筆,其 5 年平均盈餘為1x =120, ,2x =110(百 百萬 萬) 。(a) 盈餘的變異數已知,且 1 2 = 2 2 =30 ,試問 1 - 2的 的 90% 之信賴區間? (b) 盈餘的變異數未知,但樣本變數 異數 S 1 2 =20, , S 2 2 =25 ,試問 1 - 2 的 的 90% 之信賴區間? (c) 盈餘的變異數未知,然则 1 2 = 2 2 = 2 且 ,且 n 1 =12 ,n 2 =10數 而樣本變異數 S 1 2 =20 ,S 2 2 =25 ,試問 1 - 2 的 的 90% 之信賴區間? SOL :
(a) 1 2 = 2 2 = 30, ,1x -2x =10 , 1 - 2 的 的 90% 之信賴區間為:
67 . 1 1075305030645 . 1 10n nZ ) x x (2221212 / 2 1 (b) S 1 2 =20 ,S 2 2 =25 , 1 - 2 的 的 90% 之信賴區間為:
41 . 1 1075255020645 . 1 10nSnSZ ) x x (2221212 / 2 1
(c) n 1 -n 2 -2=20 , 1 - 2 的 的 90% 之 信 賴 區 間 為 :
个 中25 . 222 10 1225 ) 1 10 ( 20 ) 1 12 (2 n nS ) 1 n ( S ) 1 n (S2 122 221 12p
5 . 3 101025 . 221225 . 22725 . 1 10nSnSt ) x x (22p12p2 n n , 2 / 2 12 1 6.3.3 异常態分佈母體平均值 之區間估計
上述就常態母體平均值與平均值差之 區間估計办法討論之。若隨機本並非來自常態分佈母體時,數 當樣本數 n 夠大年夜 ,可依『 中心極限制理似 』,類似 P(L U) = 1- 推導即可。是以對於非來自常態分佈母體平均值 之區間估計:
(a) 變異數已知 母體平均值 的 的 1- 信賴區間為:
x Z /2 ( )/(n) 1/2
(b) 變異數未知 母體平均值 的 的 1- 信賴區間為:
x Z /2 ( S )/(n) 1/2
範例、依據經驗顯示,吹風機的壽命服從指數分派。
某電氣公司生產部經理欲估計新生產的一批吹風機的平均壽取 命。茲隨機抽取 50 台吹風機測試,得其平均壽命為 980差 小時,樣本標準差 260 小時。試問此批吹風機的平均壽
的 命的 95% 信賴區間? SOL :
母體平均值 的 的 95% 信賴區間為 x Z /2 ( S )/(n) 1/2
n = 50, , x = 980 ,S = 260 ; x Z 0.025 ( S )/(n) 1/2 = (980 1.96 ( 260 )/(50) 1/2 ) 萬元 6.3.4 常態母體變異數 2 之區間估計
體 自常態母體 N( , 2 ) 中隨機抽取 n 個樣本,因樣本變異數S 2 = n i =1 (x i
– x ) 2 /(n-1) 為母體變異數 2 的最佳估計式,又(n-1)S 2 / 2 = 2 n-1 。另因
1- = P(L U)=P( 2 1- /2,n-1 < (n-1)S 2 / 2 < 2 /2,n-1 )
=P[(n-1)S 2 / 2 /2,n-1 < 2 <(n-1)S 2 / 2 1- /2,n-1 ] 母體變異數 2 的 的 1- 信賴區間為:
(n-1)S 2 / 2 /2,n-1 < 2 <(n-1)S 2 / 2 1- /2,n-1
即變異數 2 落於信賴區間[(n-1)S 2 / 2 /2,n-1 , (n-1)S 2 / 2 1- /2,n-1
]為 之機率為 1-
( 留意:卡方分佈並非對稱形狀)
範例、某食物公司特製提神飲料,強調是經過嚴格品管的飲料,其內容量的變異數對品質控制身分相當重要。假設取 每瓶提神飲料的內容量相符常態分佈。茲隨機抽取 10 個 個樣本如下:199 、198 、201 、200 、199 、198 、197 、203、 、201 、204( 公克) 。試問每瓶提神飲料的內容量的變異數 2 的 的 95% 信賴區間? SOL :
x = (199+198+201+200+199+198+197+203+201+204)/10=200
S 2 = n i =1 (x i
– x ) 2 /(n-1)= 5.11 母體變異數 2 的 的 95% 信賴區間為
[(n-1)S 2 / 2 /2,n-1 , (n-1)S 2 / 2 1- /2,n-1
]=
[9(5.11)/19.0228, 9(5.11)/2.70039]=(2.418, 17.03)
6.3.4.(a) 兩常態母體變異數比 1 2 / 2 2 之區間估計
對兩常態母體變異數比 1 2 / 2 2 進行估計,以比較何者較具有穩定性。如兩種不合的生產過程、兩種不合的投資組設 合、兩地區的經濟程度等。假設 S 1 2 及 及 S 2 2 為來自常態母體N( 1 , 1 2 ) 與 與 N( 2 , 2 2 ) 中隨機抽掏出 n 1 與 與 n 2 個樣本之樣本數 變異數,試下列樣本變異數 S 2 是否是母體變異數 2 之不偏估計式。若令 F = (S 1 2 / 1 2 )/( S 2 2 / 2 2 )=1 n , 1 n2 1F 另因
1- = P(L U) ) F F F ( P1 n , 1 n , 2 / 1 n , 1 n , 2 / 12 1 2 1
) F/ S/ SF ( P1 n , 1 n , 2 /222221211 n , 1 n , 2 / 12 1 2 1
)F1SSF1SS( P1 n , 1 n , 2 / 1222122211 n , 1 n , 2 /22212 1 2 1
母體變異數比 1 2 / 2 2 的 的 1- 信賴區間為:
)F1SS,F1SS(1 n , 1 n , 2 / 122211 n , 1 n , 2 /22212 1 2 1 簡化
) FSS,F1SS(1 n , 1 n , 2 /22211 n , 1 n , 2 /22211 22 1
範例、承上題,某食物公司特製提神飲料銷售極佳,是以另推出一條生線,為了要與原有之生產線比較,品管室分取 別由此兩條生產線隨機抽取 n 1 =10 與 與 n 2 =11 個 個 樣本,並得 得 S 1 2 = 9.2 ,S 2 2 = 8.9 。假設兩條生產線生產之提神飲料的內容量相符常態分佈。試問每瓶提神飲料的內容量的變異數比 1 2 / 2 2 的 的 90% 信賴區間? SOL :
兩母體變異數比 1 2 / 2 2 的 的 90% 信賴區間為 ) FSS,F1SS(1 n , 1 n , 2 /22211 n , 1 n , 2 /22211 22 1 =[(9.2/8.9)(1/3.02), (9.2/8.9)(3.14)= (0.34, 3.25)
6.3.5.(a) 母體比例 p 之估計
例 欲估計母體中具有某種屬性的比例 p ,點估計pˆ=x/n 為最中 佳估計式,个中 n 為實驗的次數,x 為成功的之次數。樣本比例pˆ為 的期望值與變異數為 E[pˆ]= p ,V[pˆ]= p(1-p)/n 。根據當 中心極限制理,當 n 很大年夜時,樣本比例pˆ的抽樣分佈會近似於常態分佈,pˆ~N(p, p(1-p)/n) 。另因, 1- = P(L U) = P(-Z /2 Z Z /2 ) = P(-Z /2 (pˆ-p)/ [pˆ(1-pˆ)/n] 1/2
Z /2 ) =P{pˆ- Z /2 [pˆ(1-pˆ)/n] 1/2 p pˆ+Z /2 [pˆ(1-pˆ)/n] 1/2 }
母體比例 p 的 的 1- 信賴區間為:
{pˆ Z /2 [pˆ(1-pˆ)/n] 1/2 }
範例、致遠治理學院欲知學生抽煙人口比例,於是隨機抽取
100 位學生,發現有 19 位學生是抽煙人口,試問該校學的 生抽煙人口比例的 95% 之信賴區間? SOL:
:的 該校學生抽煙人口比例的 95% 信賴區間為 {pˆ Z /2 [pˆ(1-pˆ)/n] 1/2 }={0.19 1.96[0.19(0.81)/100] 1/2 }= = (0.19 0.08)
6.3.5.(b) 兩個二項分佈母體比例差 p 1
– p 2 之估計 為 假設有兩個二項分佈母體,其母體比例分別為 p 1 , p 2 ,則其樣本比例最佳估計式為1pˆ=x 1 /n 1 , 2p ˆ=x 2 /n 2 中 ,个中 n 1 , n 2 分別為 兩個母體實驗的次數,x 1 , x 2 為成功的之次數。當樣本很大年夜時,樣本比例2 1p ˆp ˆ 的抽樣分佈會近似於常態分佈,2 1p ˆpˆ ~N(p 1 - p 2 , ,p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 ) 。另因, 1- = P(L U) = P(-Z /2 Z Z /2 ) ) Zn / )p ˆ1 (p ˆn / )p ˆ1 (p ˆ) p p ( )p ˆp ˆ (Z ( P2 /2 2 2 1 1 12 1 2 12 /
兩母體比例差的 1- 信賴區間為:
{(2 1p ˆpˆ ) Z /2 [1pˆ(1-1pˆ)/n 1 +2p ˆ(1-2p ˆ)/n 2 ] 1/2 }
範例、致遠治理學院欲知學生暑期出國旅遊中,男、女人數之 比例,於是隨機抽取暑期出國旅遊之 100 位學生,發現
有 男性有 25 位、女性有 10 位,試問該校學生暑期出國旅的 遊的男、女人數比例的 95% 之信賴區間? SOL:
:的 該校學生抽煙人口比例的 95% 信賴區間為 {(2 1p ˆpˆ ) Z /2 [1pˆ(1-1pˆ)/n 1 +2p ˆ(1-2p ˆ)/n 2 ] 1/2 }=
{(0.25-0.1) 1.96[0.25(0.75)/100+0.1(0.9)/100] 1/2 }= (0.15 0.103) 6.4 決定樣本數
在進行區間估計時,信賴區間的長度( 係 誤差是也,即 2倍誤差) 愈短愈好,然信此長度受因於樣本數與信賴水準 1- 的影響。
6.4.(a) 估計母體平均值時,若何選取起码樣本數
因母體平均值 的 的 1- 信賴區間為:
( x - Z /2 ( )/(n) 1/2 , x +
Z /2 ( )/(n) 1/2 )
度 其區間的長度( )( 係 即 誤差是也,即 2 倍誤差)
( x + Z /2 ( )/(n) 1/2 - x +
Z /2 ( )/(n) 1/2 )=2
Z /2 ( )/(n) 1/2
其樣本數之決定 2
Z /2 ( )/(n) 1/2 n [ 2
Z /2 ( ) / ] 2
將 故欲將 1- 信賴水準的區間長度維持在區間的長度
數 之內,得先將樣本數 n 設定大年夜於[ 2
Z /2 ( ) / ] 2 的數值。
的 實際運用時,母體變異數未知,常採樣本全距的 1/4 來估計 計 ,即『 ( 樣本全距)/4 』,因經驗法則,幾乎 95%以 以上的觀察值會落在母體平均值 阁下2內 個標準差的範圍內。
。
範例、工管系欲知『** 品管試驗』的平均操作時間,該任課為 老師發現操作時間最長為28 分鐘、最短為12 分鐘。在90%之信賴水準下,若欲望此試驗在 平均操作時間在 2 分鐘以內,試問須要抽取若干學生才能合乎请求? SOL :
操作時間最長與最短相差為(28-12=)16 分鐘,即 4 16, ,故 故 = 4
n [ 2
Z /2 ( ) / ] 2
= [ 2 (1.645)(4)/2] 2
= 43.03 要 故須要 44 學生才能合乎请求--- 若欲望此試驗平均操作時在 間在 2 分鐘以內( 即誤差為 1 分鐘以內) 。
6.4.(b) 估計兩母體平均值差時,若何選取起码樣本數
同理(n 1 = n 2 = n) 2
Z /2 [( 1 2 )/(n)+ ( 2 2 )/(n)] 1/2
n { 2 Z /2 [( 1 2 )+ ( 2 2 )] 1/2 / } 2
較 範例、工管系欲比較 2 種『** 品管試驗』办法,是以將學生第 分成兩組,第 1 組採用第 1 種办法、第 2 組採用第 2 種 種办法。試驗完成後,實際操作,並記錄試驗時間。該任此 課老師發現此 2 種办法的操作時間最長與最短相差約為 均為 12 分鐘。在 95% 之信賴水準下,若欲望兩組平均在 試驗時間差的估計在 3 分鐘以內( 即誤差 3 分鐘以內), ,試問每組須要若干學生才能合乎请求? SOL :
為 操作時間最長與最短相差約均為 12 分鐘,即 4 12 ,故 1 =
2 = 3 n { 2 Z /2 [( 1 2 )+ ( 2 2 )] 1/2 / } 2
={ 2 (1.96) [( 9 )+ ( 9 )] 1/2 /3} 2
=30.73
要 故此每組須要 31 學生才能合乎请求。
。
6.4.(c) 估計母體比例 p 時,若何選取起码樣本數 同理 2
Z /2 [pˆ(1-pˆ)/n] 1/2 n { 2
Z /2 [pˆ(1-pˆ)/ ] 1/2 } 2
當pˆ=(1-pˆ)=0.5 時,pˆ(1-pˆ) 為最大年夜值 1/4 ,是以 n { 2
Z /2 / } 2
率 範例、工管系欲知學生對統計學課程的接收率 p ,以作為該率 課程教學之參考。若欲望統計學課程的接收率 p ,在 90%在 之信賴水準下的區間長度控在 0.2 之內( 即誤差在 0.2 之 之內 內) ,試問該系應抽取若干樣本才能合乎请求? SOL :
最保守估計:n { 2
Z /2 / } 2
= { 2
(1.645) / 0.2} 2
= 67.65 取 至少抽取 68 位學生樣本才能合乎请求。
。
抽樣誤差
平日平易近調所涉及者即比率問題,如有若干的比率喜歡這個,有若干的比率喜歡那個,倘pˆ為是喜歡的比率,則1-pˆ即不喜歡的比率。依比率的抽樣理論,比率之標準誤(Standard Error) 即,
[pˆ(1-pˆ)/n] 1/2
个中為pˆ為是喜歡的比率,n 為樣本數
當大年夜樣本時,此比率的抽樣分佈呈常態分佈,是以95% 的信念水準即 1.96。
。在 欲使抽樣誤差在 3%, , 即,
1.96*[pˆ(1-pˆ)/n] 1/2 = 0.03
, 假設pˆ= 0.5, ,則 則
1.96*[0.5(1-0.5)/n] 1/2 = 0.03 , ,則 則 n = 1067 然而,pˆ於 不等於 0.5 時,n 會較小些。總之,在 95% 信念水在 準下,欲使比率的抽樣誤差在 3% 時,樣本數至多須 1067 人。
pˆ 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n 385 683 897 1025 1067 1025 897 683 385
在 假使比率的抽樣誤差在 1% 時,樣本數至多須 9604 人。
pˆ 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n 3485 6147 8067 9120 9604 9120 8067 6147 3485
習題一 1. 屏東東港海鮮聞名南台灣,每年秋冬之際盛產紅蟳肥厚味佳,吸引大年夜批為 饕客。根據過去經驗,每隻紅蟳重量服從常態分派,標準差為 3 兩。為了估計紅蟳平均重量 了 ,我們從這整櫃紅蟳中抽出了 8 隻,測量其重量如下:7,8,12,8,10,9,9,11 。試求出此批紅蟳平均重量 的 的 90% 信賴區間(9.25 1.74) 。
2. 衛生署藥物研究所調查坊間暗地风行的快樂丸,是否產生超活力,於是將10mg 快樂丸藥劑注入 50 隻小白鼠體內然後對 每隻小白鼠做活力測驗。获得樣本平均數 6 . 4 , 1 . 15 S X 。若活力測驗服從常態分佈,試求活力測驗平均值 的 的 95% 信賴區間(15.1 1.275) 。
3. 海山企業集團的員工反應:新成立的分公司的地點不佳,乃至於天天必須花查 費許多時間在塞車上。為此,公司進行調查員工塞車的狀況。現在調查 20為 名員工,發現員工平均花費在塞車的時間為 36.5 分鐘,樣本標準差為 11.3 分 分從 鐘。假設每位員工天天花費在塞車的時間服從 N( , 2 ) ,試求每位員工花費在塞車上的平均時間 之 之 95% 信賴區間(36.5 5.29) 。
4. 科學中偉大年夜的發現往往是由創造力豐富的年輕人所提出的。下表是 16 世 世至 紀中葉至 20 世紀的 12 個重大年夜科學冲破的歷史:
科學發現 科學家 年代 年齡 太陽中间論 哥白尼 1543 40 天文學的根本定律 伽利略 1600 43 運動定律、微積分、萬有引力 牛頓 1665 23 電的實質 富蘭克林 1746 40 燃燒即氧化 拉瓦席 1774 31 進化論 達爾文 1858 49 光的電磁場 麥斯威爾 1864 33 留聲機、電燈 愛迪生 1877 30 X 放射線 居禮夫人 1896 34 量子論 普朗克 1901 43 相對論 愛因斯坦 1905 26 量子力學的數學基礎 薛丁爾 1926 39 從 假設提出重大年夜科學冲破時科學家的年齡服從 N( , 2 ) 分佈,變異數未知。試求重大年夜科學冲破時科學家平均年齡 的 的 95% 信賴區間(35.92 4.89) 。
5. 高血壓是近年來國人罹患率甚高的疾病。醫護人員不斷地找尋有效的办法來物 治療高血壓。某醫學院传授想瞭解藥物 A 及藥物 B 何者對治療高血壓較為有取 效。現在各別選取 50 名高血壓病人,分別以藥物 A 及藥物 B 治療。則血壓降低的程度物 如下:藥物 A:
:值 樣本平均值 14.31、 、為 樣本標準差為 1.63, ,物 及藥物 B:
:值 樣本平均值 13.28、 、為 樣本標準差為 1.82。
。物 根據以往經驗,以藥物 A ,B 來治療血壓降低的程度服從均勻分派。試求在這二種藥物的治療之下,血壓降低之平均數差 1 - 2 的 的 95% 信賴區間(1.03 0.677) 。
6. 神數電腦公司為測試二種電腦 CPU 速度,將 8 個以完成的 Pascal 程式,分別在這兩種電腦上執行,CPU 所花費的時間如下:
程式 Computer 1 Computer 2 1 32 28 2 47 42 3 60 55 4 24 25 5 45 42 6 55 49 7 51 52 8 30 36
若兩種電腦 CPU 所花費的時間分別服從 N( 1 , 1 2 ), N( 2 , 2 2 ) 未知。試求此二腦 種電腦 CPU 平均時間差 1 - 2 的 的 95 ﹪信賴區間(1.875 12.82) 。
7. 雪山飲料公司專門製造蘆薈露健康飲料。該公司老闆想要瞭解裝填機器釋出取 飲料量的變異程度,以控制產品品質。於是隨機抽取 10 瓶蘆薈露,並求出蘆差 薈露量之樣本標準差 S=1.2cc., 假設機器每次從 釋出的蘆薈露量是服從 N( , 2 ) ,試求該機器每次釋出蘆薈露量變異數 2 的 的 95% 信賴區間(0.68, 4.8) 。
8. 台北市和平高中的天然組數學教師想要研究在該核模擬考中,考生數學成績取 的變異程度。現從天然組中隨機抽取 41 位考生,並求出他們成績的樣本標準差 差 S=18 。假設全校天然組考生的數學成績呈常態分佈 N( , 2 ) ,試求天然組考生數學成績變異數 2 的 的 95% 信賴區間(218.396, 530.429) 。
9. 社會學者曾提出社會貧富懸殊過大年夜,是造成犯法率增长的重要原因之一。中心研究院社會科學所研究群 針對兩個犯法率明顯不合的城市,做居平市 易近年所得的抽樣調查。自城市 A 抽出 41 個樣本,自城市 B 抽出 31 個樣本,得 获得 S A 2 =16 ,S B 2 =10 。假設兩城市居平易近年所得呈常態分佈。試求 A 2 / B 2之 之 90% 信賴區間(1.89, 2.78) 。
10. 洋洋貿易公司品質單位要調查新進一批禮品中瑕疵品的比例 p 。調查人員從了 這些批禮品中隨機抽取了 32 件樣本,發現个中 4 件是瑕疪品。試求此批禮品例 中瑕疪品比例 p 的 的 95% 信賴區間(0.125 0.096) 。
11. 某假日職棒與職籃比賽同時開打,主辦單位想要比較這兩場比賽女性觀 眾比為 例差距。假設在職棒比賽中女性觀眾的比例為 p 1 取 ,現從觀眾中抽取 800 人,
有 發現个中有 300 人為女性。别的在職籃比賽中,女性觀眾的比例為 p 2 ,也從眾 中抽取觀眾 200 人,發現个中有 36 人為女性。試求職棒與職籃兩場比賽女性差 觀眾的比例差 p 1 -p 2 之 之 95% 信賴區間(0.195 0.002) 。
12. 三商郵購公司想要估計顧客電話訂購至收到商品的平均時間。研發部經理根多 據經驗知道,郵遞時間最多 8 天可寄達。試問在 95% 信賴水準下,他要估計在 郵遞平均時間在 1 天以內時,該研發部經理應抽取若干樣本才能合乎请求(62)? Range/4= ,8/4= ,n= {2*1.96*2] 2 =61.46
13. 為了引水與放水便利,大年夜多數的能源工廠喜歡蓋在河道或海岸邊。由於近年來生態環保的请求,能源工廠必須提交環保評估規劃,方能營運。根據過 資料顯示,能源工廠排放熱水與鄰近海域的水溫差最多不得超過 5 ℃。現在能源工廠要估計排放熱水與墾丁國家公園鄰近海域的平均水溫差。試問在95%在 信賴水準下,能源工廠排放熱水與鄰近海域的平均水溫差的估計在 0.8℃以內,須要採集若干樣本才能合乎请求(76) 。
Range/4= ,5/4= 1.25= ,n= {2*1.96*[(1.25) 2 +(1.25) 2 ]
0.5 /0.8} 2 =75.0134 14. 依過去資料顯示,平易近意調查若以通信方法進行,其有效收受接收率大年在 夜約在 7 成阁下。現在大年夜觀基金會正進行一項離島開設觀光賭場的平易在 近意試行調查。若欲望在收受接收率與真實結果之間的誤差,在 90 ℃信賴水在 準下的區間長度控在 0.08 之內時,該基金會應抽取若干樣本才能合乎请求(354) 。
n {2 Z /2 [pˆ(1-pˆ)/ ] 1/2 } 2
= {2*1.645*[0.7(1-0.7)/0.08] 1/2 } 2 =353.01 。
相关热词搜索: 理论 指导 SPC