統計學(8)

2024 年 5 月 8 日
文章摘要
FakeGPT
加載中...
此內容由人工不智慧生成。

這篇文章介紹抽樣分佈。

複習:由群體觀測值計算而得之表徵值成為參數(parameter)(比如 μ\muσ\sigma)。由樣本觀測值計算而得之表徵稱為統計量(statistic)(比如 X\overline{X}ss)。

定義:當從給定群體中反覆抽取(有放回抽取)大小為 n 的隨機樣本時,統計量的概率分佈稱為統計量的抽樣分佈。

X\overline{X} 之抽樣分佈為例,利用蒙地卡羅模擬法近似抽樣分佈

齊一分佈

齊一分佈的隨機變數群體做隨機抽樣,其 X\overline{X} 的抽樣分佈近似於常態分佈。且:

  1. 上述常態分佈的平均數約等於其群體的平均數 μ\mu
  2. 當每次抽樣數量 n 越大,變異越小。且形狀越接近常態分佈。

指數分佈

指數分佈的隨機變數群體做隨機抽樣,其 X\overline{X} 的抽樣分佈有兩種情況:

  1. 當每次抽樣數量 n 比較小,抽樣分佈近似於右偏態分佈。
  2. 當每次抽樣數量 n 比較大,抽樣分佈近似於常態分佈。

常態分佈

常態分佈的隨機變數群體做隨機抽樣,其 X\overline{X} 的抽樣分佈近似於常態分佈。與齊一分佈幾乎相同。

X\overline{X} 的抽樣分佈

當群體變異數 σ2\sigma^2 已知

無論群體分佈是不是常態分佈,當 n30n \ge 30 時,X\overline{X} 的分佈都呈現近似常態分佈。其平均數和變異數是:

μX=μ\mu_{\overline{X}} = \mu

σX2=σ2n\sigma^2_{\overline{X}} = \frac{\sigma^2}{n}

中央極限定理(❗️❗️❗️)

就是我們上面剛剛講到的,無論群體分佈是不是常態分佈,當 n30n \ge 30 時,X\overline{X} 的分佈都呈現近似常態分佈。平均數為 μX=μ\mu_{\overline{X}} = \mu,變異數 σX2=σ2n\sigma^2_{\overline{X}} = \frac{\sigma^2}{n}

即:XN(μ,σ2/n),if n30\overline{X} \sim N(\mu, \sigma^2/n), if\ n \ge 30

如果對此做標準化,則有:

z=Xμσ/nz = \frac{\overline{X} - \mu}{\sigma / \sqrt{n}}

服從 Z 分佈。

注意,如果群體確定呈現常態分佈,則 X\overline{X} 永遠呈現常態分佈,不論 nn 的大小。

當群體變異數 σ2\sigma^2 未知

如果 X\overline{X} 是從具有均值 μ\mu 和變異數 σ2\sigma^2常態群體中提取的大小為 nn 的隨機樣本的平均值,則樣本統計量:

t=Xμs/nt = \frac{\overline{X} - \mu}{s/\sqrt{n}}

則 t 值服從著名的司徒頓 t 分佈(Student-t distribution)。

t distribution

當樣本數 nn 越大,ttzz 越接近。(當 n30n \ge 30tt 基本等同於 zz

自由度:ν=n1\nu = n - 1,自由度控制 t 分佈的形狀。

由自由度可知,t 分佈實際上是變動的,變動的原因是因為,分母上是 s/ns/\sqrt{n},是一個近似。

司徒頓t分佈

P(ttα,μ=n1)=αP(t \ge t_{\alpha, \mu = n - 1}) = \alpha,可以透過這個公式,在 t 值表中直接查到 t 值。

p^\hat{p} 的抽樣分佈

p^=xn=成功次數總實驗次數\hat{p} = \frac{x}{n} = \frac{成功次數}{總實驗次數}

當 n 足夠大,p^N(p,pqn)\hat{p} \sim N(p, \sqrt{\frac{pq}{n}})

例: A production line of light bulbs at a manufacturing company produces 5% defective items. If a random sample of 100 light bulbs is taken, what is the probability that the sample defective rate is less than 4%?

根據題目,p=0.05,q=0.95,n=100p = 0.05, q = 0.95, n = 100,則 p^N(0.05,0.000475)\hat{p} \sim N(0.05, \sqrt{0.000475})。求 P(p^<0.04)P(\hat{p} < 0.04),答案是 0.3228。

群體為常態分布之其他抽樣分佈— χ2\chi^2 分佈及 F 分佈

χ2\chi^2 分佈

在一常態分佈的群體中隨機抽樣 n 次,且 σ\sigma 已知,則樣本 S2S^2 之分佈統計量:

χ2=(n1)S2σ2\chi^2 = \frac{(n - 1)S^2}{\sigma^2}

χ2\chi^2 服從一個右偏分佈。自由度 ν=n1\nu = n - 1,自由度越大,右偏越小。

χ2\chi^2 分佈和 t 分佈的關係:設 Z 爲標準常態變數,χ2\chi^2 爲自由度爲 ν\nu 的卡方變數,則有:

t=Zχ2/νt = \frac{Z}{\sqrt{\chi^2 / \nu}}

F 分佈

兩樣本 S2S^2 之比例(S12/S22S_1^2/S_2^2)的抽樣分佈。假設兩個常態分佈的群體,σ1=σ2=σ\sigma_1 = \sigma_2 = \sigma,從各自取獨立樣本。有統計量:

F=s12s22=χ2/ν1χ2/ν2F = \frac{s_1^2}{s_2^2} = \frac{\chi^2/\nu_1}{\chi^2/\nu_2}

F 機率分佈函數是一個右偏函數。

統計學(8)
https://blog.kynix.tw/posts/1731112755135/
作者
Adrian Chen
建檔時間
2024 年 5 月 8 日
協議
BY-NC-SA 4.0
姓名標示-非商業性-相同方式分享 4.0 國際