條件機率分布(Conditional Probability Distribution,或者 條件分布,Conditional Distribution )是現代機率論中的概念。已知兩個相關的隨機變數X 和Y,隨機變數Y 在條件{X =x}下的條件機率分布是指當已知X 的取值為某個特定值x之時,Y 的機率分布。 如果Y 在條件{X =x}下的條件機率分布是連續分布,那麼其密度函數稱作Y 在條件{X =x}下的條件機率密度函數(條件分布密度、條件密度函數)。與條件分布有關的概念,常常以「條件」作為前綴,如條件期望、條件方差等等。
如果骰子一側是6點,朝上的可能是4點,但不可能是6點或1點。
假設在桌子上拋擲一枚普通的骰子,則其點數結果的機率分布是集合
的均勻分布:每個點數出現的機率都是均等的六分之一。然而,如果據某個坐在桌邊的人觀察,向著他的側面是6點,那麼,在此條件下,向上的一面不可能是6點,也不可能是6點對面的1點。因此,在此條件下,拋骰子的點數結果是集合
的均勻分布:有四分之一的可能性出現
四種點數中的一種。可以看出,增加的條件或信息量(某個側面是6點)導致了點數結果的機率分布的變化。這個新的機率分布就是條件機率分布。
更為嚴格清晰的定義需要用到數學語言。當隨機變數是離散或連續時,條件機率分布有不同的表達方法。
對於離散型的隨機變數X 和Y(取值範圍分別是
和
),隨機變數Y 在條件{X =x}下的條件機率分布是:
(
)
同樣的,X 在條件{Y=y}下的條件機率分布是:
(
)
其中,
是X 和Y 聯合分布機率,即「
,並且
發生的機率」。如果用
表示
的值:
那麼隨機變數X 和Y 的邊際分布就是:
![{\displaystyle P(X=i)=p_{i.}=\sum _{j\in {\mathcal {J}}}p_{ij}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5277ade3a450908140e13b90c220b33cfcd96241)
![{\displaystyle P(Y=j)=p_{.j}=\sum _{i\in {\mathcal {I}}}p_{ij}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a345340c56c2e77b8ad04191cc48f672b5f86f2a)
因此, 隨機變數Y 在條件{X =x}下的條件機率分布也可以表達為:
(
)
同樣的,X 在條件{Y=y}下的條件機率分布也可以表達為:
(
)
對於連續型的隨機變數X 和Y,
,因此對離散型隨機變數的條件分布定義不適用。假設其聯合密度函數為
,X 和Y 的邊際密度函數分別是
和
,那麼Y 在條件{X =x}下的條件機率密度函數是:
![{\displaystyle f_{Y|X}(y|x)=f_{Y}(y\mid X=x)={\frac {f(x,y)}{f_{X}(x)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4de102b437884e217836da5c2861741b7e0f1565)
同樣的,X 在條件{Y=y}下的條件機率密度函數是:
![{\displaystyle f_{X|Y}(x|y)=f_{X}(x\mid Y=y)={\frac {f(x,y)}{f_{Y}(y)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/13e08af5aed6b27d5f45d0c3a7a3699a6cd17ee6)
在一定意義上,條件分布和獨立分布是相對的。如果兩個隨機變數X 和Y 是獨立分布的,那麼不論是否已知某個關於X 的條件,都不會影響Y 的機率分布。用數學語言來說,就是:
![{\displaystyle P(Y=y\mid X=x)=P(Y=y)=p_{Y}(y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c6eebfb6cd3749c985052afcceda1ae514f7db99)
這與獨立分布的定義是相合的,事實上,隨機變數X 和Y 相互獨立分布,則:
![{\displaystyle P(Y=y,X=x)=P(Y=y)\cdot P(X=x).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bf9147f84053c20707d6579c4593e4bf36e79467)
因此
![{\displaystyle P(Y=y)={\frac {P(Y=y,X=x)}{P(X=x)}}=P(Y=y\mid X=x).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c74e308913ed24a76930d77493ca17febdff449a)
- 趙衡秀. 《概率论与数理统计》. 清華大學出版社. 2005.