▶ Likelihood
- 확률분포의 모수($\theta$)가 어떤 확률 변수의 표본과 일관되는 정도를 나타내는 값이다.
--> 표본(x)을 설명할 수 있으려면, 모수($\theta$)는 어떻게 되어야 하는지 가능성을 나타낸다.
- 구체적으로, 표본에 대한 모수의 Likelihood는 이 모수를 따르는 분포가 주어진 관측값에 대하여 부여하는 확률이다.
-->표본(x)가 주어졌을때 이를 설명할 수 있는 모수($\theta$)의 Likelihood는 이 모수를 따르는 분포가 주어진 관측값(X = x)에 대하여 부여하는 확률이다.
Ex1)
동전을 던져 앞면(H)이 나오는 확률을 $p_H$라 하자. 만약 $p_H = 0.5$일때, HH(앞면 두번) 나올 확률은 (곱의 법칙에 의해) 0.25이다(수식 오른쪽).
이를 통해, 동전의 관측결과가 HH(앞면 두번)라면(표본(x)), $p_H = 0.5$(모수 $\theta$)의 가능도는 0.25라고 할 수 있다(수식 왼쪽).
수식으로는
$$ L(p_H=0.5 | HH) = P(HH | p_H = 0.5) = 0.25 $$
말로 표현하면, 앞면 두번이 등장했을 때 "동전은 앞이 나올 확률은 0.5야!!"라는 주장의 타당성은 0.25라고 해석할 수 있다.
Ex2)
34gram을 뽑았을때, 주어진 모수가 (평균=32, 표준편차=2.5)일 가능성은 0.12이다.
▶ Likelihood in Normal Distribution(정규 분포)
▶ Log Likelihood
- Likelihood에 로그를 취한 것. 미분을 쉽게 하기 위함이다.
▶ 정리하면
확률(Probability)은 모수와 주어진 확률 밀도 함수(PDF)에서(분포가 고정되어 있다) 면적으로 나타낼 수 있고,
--> 표본 추출 전에 값을 구할 수 있다.
가능도(Likelihood)는 표본(x)이 주어지고(데이터가 고정되어 있다) 모수의 확률 밀도 함수의 y값이 된다.
--> 먼저 표본을 추출해야 값을 구할 수 있다.
▶ 최대 우도 추정(Maximum Likelihood Method)
참고로 최대 우도 추정 방법은 앞에서 살펴본 Likelihood $L(\theta)$를 최대로 하는 모수를 추정하는 방법이다.
$$ \hat{\theta} = argmax_{\theta}L(\theta) $$
[Reference]
ko.wikipedia.org/wiki/%EA%B0%80%EB%8A%A5%EB%8F%84
www.youtube.com/watch?v=sOtkPm_1GYw
www.youtube.com/watch?v=pYxNSUDSFH4&feature=youtu.be
'데이터 과학 > 확률론' 카테고리의 다른 글
Scipy 함수 정리 (0) | 2021.05.25 |
---|---|
결합 확률 분포, 주변 확률 분포 (Joint / Marginal Probability Distribution) (0) | 2021.02.13 |
다변량 가우시안 분포(Multivariate Gaussian Distribution) (0) | 2021.02.12 |
최대 우도 추정법(MLE) (0) | 2021.01.06 |
Gaussian Mixture Model(GMM) (0) | 2021.01.02 |