統計學(5)

2024 年 5 月 4 日
文章摘要
FakeGPT
加載中...
此內容由人工不智慧生成。

這篇文章介紹隨機變數及離散型機率分佈。

隨機變數

  • 定義:隨機變數是一個隨機實驗(random experiment)之結果(outcome)依其某種特質以數值之方式表現。
  • 分類
    • 離散型:離散型隨機變數是指一個隨機變數其所有可能值之個數是有限的或個數無限但可數;即若一個隨機變數 X 之值域是一個離散集合,則 X 是一個離散型之隨機變數。
    • 連續型:連續型隨機變數是指一個隨機變數其所有可能值之個數為無限或不可數;另連續型之隨機變數可能之值域為一個區間(interval)。

離散型隨機變數之機率分佈

定義:離散型隨機變數之機率分佈,是以圖或表來表示隨機變數 X 的每一可能值之相關機率。

P(X=x)=p(x)P(X = x) = p(x)

特性:

  • 0p(xi)10 \le p(x_i) \le 1
  • Σall i p(xi)=1\Sigma_{all\ i}\ p(x_i) = 1

期望值

Exp(X)=μX=Σall x x×p(x)Exp(X) = \mu_X = \Sigma_{all\ x}\ x\times p(x)

變異數和標準差

Var(X)=Exp[(Xμx)2]=Exp(X2)μX2=ΣX2p(x)μx2Var(X) = Exp[(X - \mu_x)^2] = Exp(X^2) - \mu_X^2 = \Sigma X^2p(x) - \mu_x^2

St.D.(X)=Var(X)=σXSt.D.(X) = \sqrt{Var(X)} = \sigma_X

例:擲一枚銅板三次,令X表銅板出現人頭(正面)的次數,X 之機率分佈為:

xp
01/8
13/8
23/8
31/8

求:
1)出現正面的期望次數,Exp(x)。 2)變異數與標準差。

解題如下:

  1. Exp(X)=0×1/8+1×3/8+2×3/8+3×1/8=1.5Exp(X) = 0\times 1/8 + 1\times 3/8 + 2\times 3/8 + 3\times 1/8 = 1.5
  2. 變異數:Var(X)=ΣX2p(x)μx2=0.75Var(X) = \Sigma X^2p(x) - \mu_x^2 = 0.75 標準差:0.75\sqrt{0.75}

定理

  1. 常數定理:設 X 為一隨機變數(離散或連續),則:
    • E(C)=CE(C)=C,其中 C 為一常數
    • E[C×H(X)]=C×E[H(X)]E[C\times H(X)]=C\times E[H(X)]
    • E[H(X)+J(X)]=E[H(X)]+E[J(X)]E[H(X)+J(X)]=E[H(X)]+ E[J(X)]
  2. E(X)E(X)Var(X)Var(X) 存在且 Y=aX+bY=aX+b,其中 a 和 b 為任意常數,則:μY=aμX+b,σY2=a2σX2,σy=aσX\mu_Y = a\mu_X + b, \sigma^2_Y = a^2\sigma_X^2, \sigma_y = |a|\sigma_X

常用之離散型機率分佈

二項分佈

  • 二項實驗:一個實驗必須滿足以下四個條件,才能稱為二項實驗:
    • 此一實驗獨立、重複的試行 n 次。
    • 每一試行均產生兩結果:成功(Success)或失敗(Failure)。
    • 每一試行成功的機率均為 p,失敗的機率為(1-p)或 q。
    • 我們對試行 n 次中,成功 X 次之機率有興趣。
  • 二項隨機變數:在二項實驗試行中,X 表示成功發生的次數,稱 X 為二項隨機變數。
  • 二項分佈:在 n 次獨立二項實驗試行中,二項隨機變數的機率為:p(x)=(nx)pxqnx,x=0,1,2,,Np(x) = \tbinom{n}{x}p^xq^{n - x}, x = 0, 1, 2,\dots, N
  • 平均數:Exp(X)=μX=npExp(X) = \mu_X = np
  • 變異數:Var(X)=σX2=npqVar(X) = \sigma_X^2 = npq

白努力分佈

  1. 當 X 服從 (n=1,P)(n=1,P) 之二項分佈,則 X 稱為白努力 (Bernoulli) 隨機變數。
  2. 白努力分佈:p(x)=pxq1x,x=0,1p(x) = p^xq^{1-x}, x = 0, 1
  3. 一個服從二項分佈 (n,p)(n, p) 之隨機變數 Y 是 n 個白努力隨機變數之和。

超幾何分佈

  1. 超幾何實驗:一個實驗必須滿足以下三個條件,才能稱為超幾何實驗:
    • 此實驗是在一個有 N 個元素之集合中,以取後不放回(without replacement)的方式隨機抽取 n 個元素。
    • N 個元素中包含兩個類別,一類為「成功」(以 S 表之),共包含 a 個元素;另一類為「失敗」(以 F 表之),共包含 N-a 個元素。
    • 我們對在 n 個元素中,「成功」出現 x 次之機率有興趣。
  2. 超幾何隨機變數:X 表示成功的個數。
  3. 超幾何分佈: P(x)=(ax)(Nanx)(Nn),x=0,1,2,,aP(x) = \frac{\tbinom{a}{x} \tbinom{N - a}{n - x}}{\tbinom{N}{n}}, x = 0, 1, 2, \dots, a
  4. 平均數:Exp(X)=μX=naNExp(X) = \mu_X = \frac{na}{N},變異數 Var(x)=σx2=na(Na)(Nn)N2(N1)Var(x) = \sigma^2_x = \frac{na(N - a)(N - n)}{N^2(N - 1)}
  5. 超幾何分佈和二項分佈之近似
    • NN \rightarrow \infty 的時候,可以證明超幾何分佈和二項分佈 (n,p=aN)(n, p = \frac{a}{N}) 非常近似。
    • 當 N 很大,且 nN10n\le \frac{N}{10} 時,可以利用二項分佈 (n,p=aN)(n, p = \frac{a}{N}) 來近似超幾何分佈之機率。

波瓦松分佈

波瓦松分佈是用來形容在某一特定時間或面積內稀有事件發生之機率。

  1. 定義:假設事件是隨機且彼此獨立的發生,其單位時間或面積的平均次數為 λ\lambda,令 X 表示一段特定時間(或面積)內事件發生的次數,則波瓦松機率函數如下:P(x)=(λt)xeλtx!=μxeμx!,x=0,1,2,P(x) = \frac{(\lambda t)^{x}e^{-\lambda t}}{x!} = \frac{\mu^x e^{-\mu}}{x!}, x = 0,1,2,\dots
  2. 平均數:Exp(x)=μ=λtExp(x) = \mu = \lambda t,變異數:Var(x)=σ2=λtVar(x) = \sigma^2 = \lambda t
  3. 波瓦松分佈與二項分佈之近似:二項分佈當n很大且 p 很小(或 np7np\le 7)時,可以利用波瓦松分佈來近似二項分佈。
統計學(5)
https://blog.kynix.tw/posts/1731079779065/
作者
Adrian Chen
建檔時間
2024 年 5 月 4 日
協議
BY-NC-SA 4.0
姓名標示-非商業性-相同方式分享 4.0 國際