DataScience/Data

[Data processing] Smooth Bootstrap & Parametric Bootstrap

KoTiv 2022. 1. 25. 15:58
반응형
SMALL

Smooth Bootstrap

Smooth Bootstrap은 Normally한 Distribution에서 적은 양의 Zero-centered Random nosie가 각 Resampling된 observation data에 추가가 된 방식이다. 즉 데이터의 Kernel density estmate를 Sampling 하는것과 같다고 할수 있다.

 

observation data set X = { X1 , .... Xn}은 density f의 잘 알지 못하는 어떤 continuous distribution F로부터의 Random Samplie이라고 가정해보자.

 

α(F)는  α(F^) 

K가 Unit Variance를 가지는 Symmetric Kernel Density function이라고 가정하면 아래의 첫번째 식과 같아진다. 

h가 smoothing parameter라고 하면 F^(x)는 distribution function estimator로써 작동하게 된다.

 

REFERENCE

WANG, SUOJIN (1995). "Optimizing the smoothed bootstrap". Ann. Inst. Statist. Math

 

Parametric Bootsrap

Parametric 은 Fixed된 Parameter의 Set이 존재하는 Probability Distribution으로 부터 Modeling할 수 있는 Population으로 Sample data를 가져오는 것으로 가정하는 통계학의 한 분야이다.

Parametric Bootstrap에서는 Origin data set가 특정 Parameter θ의 Distribution에서 Random Sample을 Realization에 기초하여 Maximum likelihood parameter θ에 의해 적합된 모델에서 Random number의 Sample을 추출하게 된다.

 

보통 추출된 Sample은 Origin data와 동일한 Sample의 크기를 가지게 되며 Origin function F의 Estimation은 F^ =Fθ^으로 표현할 수 있게 된다.[ 여기서 Sampling 방식은 타 Bootstrap과 동일하게 여러번 반복적으로 이루어 지게 된다. ]

 

이때 Centered Sample Mean을 고려해본다면 , Random Sample 의 Origin Distribution function Fθ는 Bootstrap Random Sample Function Fθ^으로  대체된다.

또한 Probability Distribution

에 근사하게 되는데 

수식의 u* = u^φ에 해당하는 Expectation Value 이다 .

 

 

반응형
LIST