這篇文章緊接第二篇文章,講雙變數中的描述指標。
二元變數資料
在進行研究調查時,我們常需要蒐集及分析多個變數的資料,以探究變數間的關聯性。
衡量二元變數資料的量化指標
這些指標用於描述二元變數之間的關聯性強弱及方向。
共變異數(Cov)
- 群體共變異數:Cov(x,y)=σx,y=NΣi=1N(xi−μx)(yi−μy)
- 樣本共變異數:Cov(x,y)=sx,y=n−1Σi=1N(xi−x)(yi−y)=n−1Σxy−n(Σx)(Σy)
共變異數帶單位,使用正負號表示關聯的方向,數值越大,關聯性越強。
相關係數
- 群體相關係數:ρ=σxσyCov(x,y)=σxσyσxy
- 樣本相關係數:r=sxsyCov(x,y)=sxsysxy
數值取值在 0~1,越靠近 1 代表線性相關性越強。
回歸方程式
x-y 二組數據間如有線性關係,則可適配一條直線方程式,又稱迴歸方程式或最小平方線。
y^=a+bx
b=r×(sxsy),a=y−bx
回歸通常用於預測。一般來說,只有相關係數 ≥0.6 即具有比較強的直線相關性時,回歸才有意義。
統計學(3)
https://blog.kynix.tw/posts/1731078826896/
姓名標示-非商業性-相同方式分享 4.0 國際