統計學中,貝葉斯多元線性回歸是一種多元線性回歸(預測結果為相關隨機變量向量,而非純量隨機變量的線性回歸)的貝葉斯推斷方法。這種方法的更一般論述見最小均方誤差。
考慮一回歸問題,其中需要預測的自變量不是實純量而是相關實數組成的m維向量。與標準回歸設置一樣,有n個觀測值,其中每個觀測i包含k−1個解釋變量,歸為k維向量(添加值為1的虛擬變量,以允許截距係數)。對每個觀測i,可以視作m個相關回歸問題:
其中誤差集都是相關的。等價地,也可以視作單一回歸問題,其中結果是行向量,回歸係數向量排在一起:
係數矩陣B是矩陣,其中每個回歸問題的係數向量垂直排列在一起:
每個觀測i的噪聲向量服從聯合正態分佈,因此給定觀測的結果是相關的:
可以將整個回歸問題寫成矩陣形式:
其中Y、E是矩陣。設計矩陣X是矩陣,觀測如標準線性回歸垂直排列:
經典頻率學派線性最小二乘解利用摩爾-彭若斯廣義逆,簡單地估計回歸係數矩陣:
求貝葉斯解,要先指定條件似然,再找到適當的共軛先驗。與線性貝葉斯回歸不同,可以指定一個自然的條件共軛先驗(與規模相關)。
把條件似然寫成[1]
誤差表為,則有
尋找一個自然共軛先驗——聯合密度,其泛函形式與似然相同。由於似然在中是二次的,因此我們重寫似然使其在(與經典樣本估計的差)是正態的。
用與貝葉斯線性回歸相同的技術,可用矩陣形式的平方和分解指數項。不過此處還要用到矩陣微分(克羅內克積和向量化變換)。
首先,應用平方和得到新的似然表達式:
我們想開發一種先驗的條件形式:
其中服從逆威沙特分佈,是矩陣中某種形式的正態分佈。這是通過向量化變換實現的,它將似然從矩陣的函數變換為向量的函數。
令
其中表示矩陣A、B的克羅內克積,其是外積的推廣。
則
產生的似然在中正態。
有了更易理解的似然,就可以找到自然的(條件)共軛先驗了。
由向量化的得到的自然共軛先驗形式為[1]
其中
利用上述先驗與似然,可得到後驗[1]
其中。
記,涉及的項可以分類為
其中
現在可以用更有用的形式來寫後驗:
其形式為逆威沙特分佈乘以矩陣正態分佈:
此後驗的參數由下式給出
- ^ 1.0 1.1 1.2 Peter E. Rossi, Greg M. Allenby, Rob McCulloch. Bayesian Statistics and Marketing. John Wiley & Sons, 2012, p. 32.