Processing math: 100%
본문 바로가기
ML

[ML] 최대 우도 추정법(Maximum Likelihood Estimation, MLE)

by 어떻게든 되겠지~ 2024. 6. 7.

최대 우도 추정법(Maximum Likelihood Estimation, MLE)

최대 우도 추정법(Maximum Likelihood Estimation,  MLE)는 확률변수에서 추출한 표본 값(관측 데이터)들을 토대로 우도(Likelihood)를 최대화하는 방향으로 확률변수의 모수(파라미터)를 추정한다

이 때 Likelihood를 최대화하는 parameter는 얻은 샘플로부터 모집단의 분포를 추정하였을 때 가장 적합한 parameter이다

 

그럼 여기서 우도(Likelihood)란 무엇인가?

 

우도 확률(Likelihood Probability, P(X|w))

  • 모델 파라미터(모수) 값을 잘 모르지만 안다고 가정했을 때, 주어진 데이터의 분포
  • 따라서, 모델 파라미터(w)에 대한 함수로 데이터의 분포를 표현
  • 각 샘플이 i.i.d(independent and identical distributed)하다고 가정 후, PDF(Probabilty Density Function, 확률 밀도함수)의 곱으로 표현
ex) 정규분포를 따르는 데이터에 대한 우도 확률

w=μ(),σ()
PDF:1σ2πe12(xμσ)2
Likelihood=i1σ2πe12(xiμσ)2
L(w|X)=P(X|w)=iP(xk|w)

 

※ 확률(Probability) vs 우도(Likelihood)

  • 확률 : 관측값이 확률 분포 안에서 얼마의 확률로 존재하는가를 나타내는 값 
  • 우도 : 특정한 값을 관측했을 떄, 이 관측치가 어떠한 확률분포에서 나왔는가 에 관한 값

왼쪽이 확률, 오른쪽이 우도 에 대한 설명

 

 


이제 다시 MLE 설명으로 돌아오겠습니다 !
최대 우도 추정법(Maximum Likelihood Estimation,  MLE)는 확률변수에서 추출한 표본 값(관측 데이터)들을 토대로 우도(Likelihood)를 최대화하는 방향으로 확률변수의 모수(파라미터)를 추정한다

 

  • 즉, 현재의 데이터 분포가 가장 나올 확률이 가장 높은 파라미터를 추정한다
  • ˆw=argmaxcP(X|w)
  • 매운 간단해 보이는 파라미터 추정법이지만, 데이터에 따라 값이 민감하게 변화한다(즉, 데이터가 많을수록 좋다)

ex) 정규분포에서 독립추출한 표본

X=x1,x2,,xn

fμ,σ2(xk)=1σ2πe12(xkμσ)2L(w|X)=P(X|w)=iP(xk|w)=i1σ2πe12(xiμσ)2log(L(w|X))=i1σ2πe12(xiμσ)2=i(xkμ)22σ2log(σ2π)

 

여기서 log(L(w|X))를 최대화하는 모수(μ,σ)를 추정해야한다

  1. Lμ=0=ixkμσ2 ==> ˆμ=1nixk 
  2. Lσ=0=i(xkmu)2σ21σ ==> ˆσ2=1ni(xkμ)2 

위의 결과를 보면 모평균, 모분산과 같다

반응형