똑바른 날개

[확률과 통계 17] Continuous Multiple RVs - Introduction 본문

공부/확률과 통계

[확률과 통계 17] Continuous Multiple RVs - Introduction

Upright_wing 2026. 1. 9. 15:34
반응형

00_서론


discrete random variable을 다룰 때 Joint Distribution에서 특정 변수 하나에 대한 Marginal Probability를 구하는 과정은 비교적 직관적이다. 관심 없는 변수에 대해 가능한 모든 경우의 확률을 합하면 원하는 결과를 얻을 수 있기 때문이다. 이러한 합 연산은 discrete한 표본 공간을 전제로 하며, 결합 확률을 단순히 누적하는 방식으로 이해된다.

continuous random variable의 경우 동일한 논리가 유지되지만 연산 방식이 달라진다. 이산적인 합은 연속적인 합의 극한으로 확장되며, 이는 자연스럽게 적분으로 표현된다. Continuous Multiple RVs를 이해하는 핵심은 이 전환이 개념의 변화가 아니라 표현 방식의 변화라는 점을 명확히 인식하는 데 있다.

01_두개의 변수의 Joint CDF와 Joint PDF


두 개의 continuous random variable ${X}$와 ${Y}$가 주어졌을 때 Joint CDF는 다음과 같이 정의된다.

$$
F_{XY}(x,y)=P(X\le x,Y\le y)
$$

이 표현은 2차원 평면에서 점 ${(x,y)}$를 기준으로 왼쪽 아래 영역 전체에 대한 누적 확률을 의미한다. Joint CDF는 확률의 누적 분포를 나타내며, 이를 통해 Joint PDF가 정의된다.

Joint PDF는 Joint CDF를 각 변수에 대해 편미분하여 얻는다.

$$
\begin{aligned}
f_{XY}(x,y)&=\frac{\partial^2}{\partial x \partial y}F_{XY}(x,y) \\
F_{XY}(x, y)
&= \int_{-\infty}^{x} \int_{-\infty}^{y}
f_{XY}(u, v)\, du\, dv
\end{aligned}

$$

여기서 중요한 점은 PDF 값 자체는 확률이 아니라는 사실이다. PDF는 확률의 밀도를 나타내며, 실제 확률은 특정 영역에 대해 Joint PDF를 적분함으로써 계산된다.

N개로의 확장

N개의 continuous random variable이 주어졌을 때 Joint CDF는 다음과 같이 정의된다.

$$
\begin{aligned}F(x_1, x_2, \ldots, x_n)&= P(X_1 \le x_1,; X_2 \le x_2,; \ldots,; X_n \le x_n)\end{aligned}
$$

Joint PDF와 Joint CDF의 계산

$$
\begin{aligned}f(x_1, x_2, \ldots, x_n)&= \frac{\partial^n}{\partial x_1 \partial x_2 \cdots \partial x_n}F(x_1, x_2, \ldots, x_n), \\[6pt]F(x_1, x_2, \ldots, x_n)&= \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n}f(t_1, t_2, \ldots, t_n)\,dt_1\, dt_2 \cdots dt_n\end{aligned}
$$

02_Marginal PDF


Marginal PDF는 여러 변수가 얽힌 Joint Distribution에서 특정 변수 하나만의 확률 분포를 추출한 결과이다. Discrete random variable의 경우 Marginal Probability는 다음과 같이 정의된다.

$$
\begin{aligned}
P_X(x)
&= \sum_{y} P_{XY}(x, y), \\
P_Y(y)
&= \sum_{x} P_{XY}(x, y)
\end{aligned}

$$

Continuous random variable에서는 이 합 연산이 적분으로 대체된다. ${X}$에 대한 Marginal PDF는 다음과 같이 정의된다.

$$
\begin{aligned}
f_X(x)
&= \int_{-\infty}^{\infty} f_{XY}(x, y)\, dy, \\
f_Y(y)
&= \int_{-\infty}^{\infty} f_{XY}(x, y)\, dx
\end{aligned}
$$

이 식은 특정 ${x}$값을 고정한 상태에서 ${y}$가 가질 수 있는 모든 가능성을 적분을 통해 제거하는 과정을 의미한다. 즉 Marginalization은 관심 없는 변수를 적분을 통해 소거하는 연산이며, Joint Distribution을 단일 변수의 분포로 축약하는 핵심 도구이다.

Independent한 경우

두개의 변수가 서로 독립이라 영향을 주지않는다면 다음과 같이 정의된다.

$$
\begin{aligned}f_{XY}(x, y) = f_X(x), f_Y(y)\end{aligned}
$$

N개로의 확장

N개의 continous random variable이 주어졌을때, 적분이 n-1개로 늘어난다.

$$
\begin{aligned}f(x_1)&= \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty}f(x_1, x_2, \ldots, x_n),dx_2 \cdots dx_n\end{aligned}
$$

모든 variable은 서로 independent할때, Joint PDF는 각 Marginal PDF의 곱으로 표현된다

$$
\begin{aligned}f(x_1, x_2, \ldots, x_n)&= f_{X_1}(x_1), f_{X_2}(x_2), \cdots, f_{X_n}(x_n)=\prod_{i=1}^n f_{X_i}(x_i)\end{aligned}
$$

03_예제: 전기차 충전 문제


문제정의

두 대의 전기차가 0분부터 50분 사이에 독립적으로 균일한 확률로 충전기에 도착한다고 가정한다. 각 차량의 도착 시각을 각각 continuous random variable ${X}$와 ${Y}$로 정의하고, 충전 시간은 10분으로 동일하다고 한다.

두대의 전기차가 충전 도중에 마주칠 확률은?

해설

  • ${X}$와 ${Y}$는 구간 ${[0,50]}$에서 Uniform Distribution을 따른다.
  • 각 변수의 Marginal PDF는 다음과 같다.

$$
f_X(x)=\frac{1}{50},\quad f_Y(y)=\frac{1}{50},\quad 0\le x,y\le50
$$

  • 두 변수는 independent이므로 Joint PDF는 Marginal PDF의 곱으로 표현된다.

$$
f_{XY}(x,y)=\frac{1}{2500},\quad 0\le x,y\le50
$$

두 차량이 마주친다는 사건은 도착 시각 차이가 10분 이내인 경우이며 이는 $P(|X-Y|\le10)$으로 표현된다. Joint PDF가 상수이므로 해당 사건의 확률은 조건을 만족하는 영역의 면적을 전체 영역 ${50\times50}$으로 나눈 값과 동일하다. 계산 결과 두 차량이 마주칠 확률은 ${9/25}$이다.

04_예제 : 적분 범위가 얽힌 경우


조건

$$
\begin{aligned}f_{XY}(x, y)&= 2 e^{-(x+y)}, \quad 0 \le x \le y,\quad 0 \le y\end{aligned}
$$

문제1 : X의 Marginal PDF 계산

${X}$의 Marginal PDF를 구하기 위해 ${y}$에 대해 적분을 수행한다.

  1. 적분 변수는 ${y}$이며 ${x}$는 상수로 취급한다.
  2. 정의역 ${y\ge x}$에 따라 적분 범위는 ${y=x}$부터 ${\infty}$까지이다.

$$
f_X(x)=\int_x^{\infty}2e^{-(x+y)},dy=2e^{-2x},\quad x\ge0
$$

이 결과는 전체 구간에 대해 적분하면 1이 되므로 올바른 PDF이다.

문제2 : Marginal PDF 계산

이번에는 ${x}$를 적분 변수로 선택한다.

  1. ${y}$를 상수로 고정한 상태에서 ${x}$의 범위를 결정한다.
  2. 정의역 ${x\ge0}$, ${x\le y}$에 따라 적분 범위는 ${0}$부터 ${y}$까지이다.

$$
f_Y(y)=\int_0^y2e^{-(x+y)},dx=2e^{-y}(1-e^{-y}),\quad y\ge0
$$

이 결과 역시 전체 구간에 대해 적분하면 1이 되어 올바른 PDF임을 확인할 수 있다.

문제 3: joint PDF의 전체구간이 1임을 증명해라

$$
\begin{aligned}\text{Verify }\quad\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f_{XY}(x, y), dx, dy= 1\end{aligned}
$$

해보면된다.

적분 순서와 변수 소거의 핵심 원칙

Marginalization에서 가장 중요한 원칙은 다음과 같다.

  • 내부 적분의 범위는 외부 변수의 함수로 결정될 수 있다.
  • 적분이 끝난 변수는 결과식에서 반드시 사라져야 한다.
  • ${y}$로 적분하면 결과는 ${x}$의 함수가 되고, ${x}$로 적분하면 결과는 ${y}$의 함수가 된다.

결과에 소거하려던 변수가 남아 있다면 Marginal Distribution을 완전히 추출하지 못한 것이다.

 

https://www.youtube.com/watch?v=5nAZFYV_dGo

 

반응형