跳至內容

貝葉斯多元線性回歸

維基百科,自由的百科全書

統計學中,貝葉斯多元線性回歸是一種多元線性回歸(預測結果為相關隨機變量向量,而非純量隨機變量的線性回歸)的貝葉斯推斷方法。這種方法的更一般論述見最小均方誤差

細節

[編輯]

考慮一回歸問題,其中需要預測的自變量不是實純量而是相關實數組成的m維向量。與標準回歸設置一樣,有n個觀測值,其中每個觀測i包含k−1個解釋變量,歸為k維向量(添加值為1的虛擬變量,以允許截距係數)。對每個觀測i,可以視作m個相關回歸問題: 其中誤差集都是相關的。等價地,也可以視作單一回歸問題,其中結果是行向量,回歸係數向量排在一起:

係數矩陣B矩陣,其中每個回歸問題的係數向量垂直排列在一起:

每個觀測i的噪聲向量服從聯合常態分布,因此給定觀測的結果是相關的:

可以將整個回歸問題寫成矩陣形式: 其中YE矩陣。設計矩陣X矩陣,觀測如標準線性回歸垂直排列:

經典頻率學派線性最小二乘英語Linear least squares解利用摩爾-彭若斯廣義逆,簡單地估計回歸係數矩陣

求貝葉斯解,要先指定條件似然,再找到適當的共軛先驗。與線性貝葉斯回歸不同,可以指定一個自然的條件共軛先驗(與規模相關)。

把條件似然寫成[1] 誤差表為,則有

尋找一個自然共軛先驗——聯合密度,其泛函形式與似然相同。由於似然在中是二次的,因此我們重寫似然使其在(與經典樣本估計的差)是正態的。 用與貝葉斯線性回歸英語Bayesian linear regression相同的技術,可用矩陣形式的平方和分解指數項。不過此處還要用到矩陣微分(克羅內克積向量化變換)。

首先,應用平方和得到新的似然表達式:

我們想開發一種先驗的條件形式: 其中服從逆威沙特分布是矩陣中某種形式的常態分布。這是通過向量化變換實現的,它將似然從矩陣的函數變換為向量的函數。

其中表示矩陣AB克羅內克積,其是外積的推廣。

產生的似然在中正態。

有了更易理解的似然,就可以找到自然的(條件)共軛先驗了。

共軛先驗分布

[編輯]

由向量化的得到的自然共軛先驗形式為[1] 其中

後驗分布

[編輯]

利用上述先驗與似然,可得到後驗[1] 其中。 記,涉及的項可以分類為 其中

現在可以用更有用的形式來寫後驗:

其形式為逆威沙特分布乘以矩陣常態分布

此後驗的參數由下式給出

另見

[編輯]

參考文獻

[編輯]
  1. ^ 1.0 1.1 1.2 Peter E. Rossi, Greg M. Allenby, Rob McCulloch. Bayesian Statistics and Marketing. John Wiley & Sons, 2012, p. 32.