學生t檢驗

司徒頓t 檢驗（英語：Student's t-test）是指虛無假設成立時的任一檢驗統計有司徒頓t分佈的統計假設檢定，屬於參數統計。司徒頓t檢驗常作為檢驗一群來自正態分配總體的獨立樣本之期望值是否為某一實數，或是二（兩）群來自正態分配總體的獨立樣本之期望值的差是否為某一實數。舉個簡單的例子，在某個學校中我們可以從某個年級中隨機抽樣一群男生，以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值。

由來

司徒頓t檢驗是威廉·戈塞為了觀測釀酒品質於1908年所提出的，「司徒頓 (student)」則是他的筆名。^[1]^[2]^[3]^[4] 基於克勞德·健力士（Claude Guinness）聘用從牛津大學和劍橋大學出來的最好的畢業生，^[2]以將生物化學及統計學應用到健力士工業流程的創新政策，戈塞受僱於都柏林的健力士釀酒廠擔任統計學家。戈塞提出了t檢驗以降低啤酒重量監控的成本。戈塞於1908年在《Biometrika（英語：Biometrika）》期刊上公佈t檢驗，但因其老闆認為其為商業機密而被迫使用筆名，統計學論文內容也跟釀酒無關。實際上，其他統計學家是知道戈塞真實身份的。

應用

常見的應用有：

單樣本檢驗：檢驗一個正態分佈的總體的均值是否在滿足虛無假設的值之內，例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線。
獨立樣本t檢驗（雙樣本）：其虛無假設為兩個正態分佈的總體的均值之差為某實數，例如檢驗二群人之平均身高是否相等。若兩總體的方差是相等的情況下（同質方差），自由度為兩樣本數相加再減二；若為異方差（總體方差不相等），自由度則為Welch自由度，此情況下有時被稱為Welch檢驗。
配對樣本t檢驗（成對樣本t檢驗）：檢驗自同一總體抽出的成對樣本間差異是否為零。例如，檢測一位病人接受治療前和治療後的腫瘤尺寸大小。若治療是有效的，我們可以推定多數病人接受治療後，腫瘤尺寸將縮小。
檢驗一迴歸模型的偏迴歸系數是否顯著不為零，即檢驗解釋變量X是否存在對被解釋變量Y的解釋能力，其檢驗統計量稱之為t-比例（t-ratio）。

前提假設

大多數的t檢驗之統計量具有t = Z/s的形式，其中Z與s是已知資料的函數。Z通常被設計成對於對立假設有關的形式，而s是一個比例參數使t服從於t分佈。以單樣本t檢驗為例， $Z={\bar {X}}/(\sigma /{\sqrt {n}})$ ，其中 ${\bar {X}}$ 為樣本平均數， $n$ 為樣本數， $\sigma$ 為總體標準差。至於s在單樣本t檢驗中為 ${\hat {\sigma }}/\sigma$ ，其中 ${\hat {\sigma }}$ 為樣本的標準差。在符合零假說的條件下，t檢驗有以下前提：

Z 服從標準正態分佈
(n - 1)s² 服從自由度(n - 1)的卡方分佈
Z與s互相獨立

計算

單樣本t檢驗

檢驗虛無假設為一群來自正態分配獨立樣本x_i之總體期望值μ為μ₀可利用以下統計量

t={\frac {{\overline {x}}-\mu _{0}}{s/{\sqrt {n}}}}

其中 $i=1\ldots n$ ， ${\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}$ 為樣本平均數， $s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}$ 為樣本標準差，n為樣本數。該統計量t在虛無假設：μ = μ₀為真的條件下服從自由度為n − 1的t分佈。

配對樣本t檢驗

配對樣本t檢驗可視為單樣本t檢驗的擴展，不過檢驗的對象由一群來自正態分配獨立樣本更改為兩配對樣本之觀測值之差。

若兩配對樣本x_1i與x_2i之差為d_i = x_1i − x_2i獨立且來自正態分配，則d_i之總體期望值μ是否為μ₀可利用以下統計量

t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}

其中 $i=1\ldots n$ ， ${\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}$ 為配對樣本差值之平均數， $s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}$ 為配對樣本差值之標準差，n為配對樣本數。該統計量t在虛無假設：μ = μ₀為真的條件下服從自由度為n − 1的t分佈。

獨立雙樣本t檢驗

同質方差假設 (Homoscedasticity)、樣本數相等

若兩獨立樣本x_1i與x_2i具有相同之樣本數n，且來自兩個總體方差相同（同質方差假設）的正態分配，則兩總體之期望值差μ₁ - μ₂是否為μ₀可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {2s_{p}^{2}/n}}}

其中 $i=1\ldots n$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n$ 及 ${\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n$ 為兩樣本各自的平均數， $s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2})/(2n-2)$ 為樣本之共同方差。該統計量t在虛無假設：μ₁ - μ₂ = μ₀為真的條件下服從自由度為2n − 2的t分佈。

同質方差假設 (Homoscedasticity)、樣本數不相等

若兩獨立樣本x_1i與x_2j具有不相同之樣本數n₁與n₂，且來自兩個總體方差相同（同質方差假設）的正態分配，則兩總體之期望值之差μ₁ - μ₂是否為μ₀可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}}}

其中 $i=1\ldots n_{1}$ ，其中 $j=1\ldots n_{2}$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n$ 及 ${\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n$ 為兩樣本各自的平均數， $s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)$ 為兩樣本共同之方差。該統計量t在虛無假設：μ₁ - μ₂ = μ₀為真的條件下服從自由度為n₁ + n₂ − 2的t分佈。

異方差假設 (Heteroscedasticity)

若兩獨立樣本x_1i與x_2j具有相同或不相同之樣本數n₁與n₂，且兩者總體方差不相等（異方差假設）的正態分配，則兩總體之期望值之差μ₁ - μ₂是否為μ₀可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}

其中 $i=1\ldots n_{1}$ ，其中 $j=1\ldots n_{2}$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}$ 及 ${\overline {x}}_{2}=(\sum _{j=1}^{n_{2}}x_{2j})/n$ 為兩樣本各自的平均數， $s_{1}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2})/(n_{1}-1)$ 及 $s_{2}^{2}=(\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{2}-1)$ 分別為兩樣本之方差。該統計量t在虛無假設：μ₁ - μ₂ = μ₀為真的條件下服從自由度為

df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}

之t分佈。這種方法又常稱為Welch檢驗。

其它相關檢驗

偏迴歸系數是否為零之檢驗

以簡單線性迴歸為例

模型假設：

y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},

其中x_i，i = 1, ..., n為已知，α與β為未知系數，ε_i為殘差獨立且服從期望值0且方差σ²未知的正態分佈，y_i，i = 1, ..., n為觀測值。我們可以檢驗迴歸系數β是否相等於特定的β₀，通常使β₀ = 0以檢驗x_i對y_i是否存在解釋能力，在此例（簡單線性迴歸模型）即為檢驗迴歸式之斜率是否為零。

令 ${\widehat {\alpha }}$ 與 ${\widehat {\beta }}$ 為最小平方法之估計值， $SE_{\widehat {\alpha }}$ 與 $SE_{\widehat {\beta }}$ 為最小平方法估計值之標準誤差，則

t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}

在虛無假設為β = β₀的情況下服從自由度為n − 2之t分佈，此檢驗統計量被稱作「t比率 (t-ratio)」，其中

SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}

由於 ${\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})$ 為殘差（即估計誤差），而 ${\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}$ 為殘差之離均平方和，我們可改寫t為

t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {{\text{SSR}}/\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}

另請參閱：F檢驗

電腦軟件

大多數的試算表軟件及統計軟件，諸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1]（頁面存檔備份，存於互聯網檔案館）)、PSPP、Minitab等，都可以進行t檢驗運算。

程式語言/軟件程序	函數	註釋
Microsoft Excel 2010 之前的版本	`TTEST(array1, array2, tails, type)`	參見 [2]
Microsoft Excel 2010 及更高版本	`T.TEST(array1, array2, tails, type)`	參見 [3]（頁面存檔備份，存於互聯網檔案館）
LibreOffice	`TTEST(Data1; Data2; Mode; Type)`	參見 [4]（頁面存檔備份，存於互聯網檔案館）
Google Sheets	`TTEST(range1, range2, tails, type)`	參見 [5]（頁面存檔備份，存於互聯網檔案館）
Python	`scipy.stats.ttest_ind(a, b, axis=0, equal_var=True)`	參見 [6]（頁面存檔備份，存於互聯網檔案館）
Matlab	`ttest(data1, data2)`	參見 [7]（頁面存檔備份，存於互聯網檔案館）
Mathematica	`TTest[{data1,data2}]`	參見 [8]（頁面存檔備份，存於互聯網檔案館）
R	`t.test(data1, data2)`
SAS	`PROC TTEST`	參見 [9]
Java	`tTest(sample1, sample2)`	參見 [10]（頁面存檔備份，存於互聯網檔案館）
Julia	`EqualVarianceTTest(sample1, sample2)`	參見 [11]
Stata	`ttest data1 == data2`	See [12]（頁面存檔備份，存於互聯網檔案館）

參見

參考文獻

^ Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
^ ^2.0 ^2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜, Gosset, MacTutor數學史檔案（英語）
^ Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437.
^ 存档副本 (PDF). [2013-08-10]. （原始內容 (PDF)存檔於2017-05-16）.

[1] Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.

[Gossett-2] 2.0 ^2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜, Gosset, MacTutor數學史檔案（英語）

[3] Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437.

[4] 存档副本 (PDF). [2013-08-10]. （原始內容 (PDF)存檔於2017-05-16）.

[1]

[2]

[3]

[4]