본문 바로가기

AI

bootstrap 부트스트랩이란? 어원 및 통계적 의미

 

부트스트랩의 어원부터 알아보겠습니다.

boots에 붙은 strap을 생각하면 되는데요,

 

이 용어는 영어 관용구 "pulling oneself up by one's bootstraps"에서 유래되었습니다.

이 관용구는 개인이 자신의 힘으로 어려운 상황을 극복하거나 성공을 이뤄내는 것을 의미합니다.

그러나 이 관용구는 실제로 불가능한 일을 뜻하며,

이는 신체적으로 자신의 부츠 끈을 잡아당기면서 공중에 떠오를 수 없다는 묘사에서 비롯되었습니다.

 

 

 

Bootstrapping은 통계학 및 컴퓨터 과학에서 사용되는 개념으로, 통계적 추론이나 머신러닝에서 많이 활용됩니다.

이는 샘플 데이터에서 모집단에 대한 통계적 추론을 수행하는 데 사용되는 방법입니다.

 


보통 우리가 가지고 있는 데이터는 실제 모집단의 전체 데이터를 포함하지 않고, 그 중에서 추출한 일부인 표본(sample)입니다.

Bootstrapping은 이러한 표본 데이터로부터 모집단의 통계적 특성을 추정하는 방법을 제공합니다.

 


Bootstrapping은 복원추출(resampling with replacement)을 통해 표본 데이터를 생성하는 과정입니다.

즉, 원래의 표본 데이터에서 데이터를 선택한 후, 선택한 데이터를 다시 원래의 표본 데이터에 넣고 다시 추출하는 과정을 여러 번 반복합니다.

이렇게 생성된 여러 개의 부트스트랩 표본들을 이용하여 모집단의 분포나 통계적 추론을 수행할 수 있습니다.

 


Bootstrapping을 사용하면, 모집단에 대한 가정이나 분포에 대한 가정 없이도

표본 데이터로부터 모집단의 평균, 분산, 신뢰구간 등을 추정할 수 있습니다.

또한, Bootstrapping을 통해 변수의 중요도나 예측 오차를 평가하는 등 다양한 통계적 분석을 수행할 수 있습니다.


이러한 특징으로 인해 Bootstrapping은 통계적 추론이나 머신러닝에서 효과적인 방법 중 하나로 널리 사용되고 있습니다.

 

 

 

 

추가로 컴퓨터의 부팅 과정에서도 해당 용어가 사용되는데요

 

부팅 과정을 부트스트랩이라고 하기도 하는데 이 단어가 줄어서 생긴 말이 부팅입니다.

부트스트랩(Bootstrap)이란, 일반적으로 한 번 시작되면 알아서 진행되는 일련의 과정을 뜻하기 때문입니다.

 

 

오늘은 bootstrapping에 대해 알아 보았습니다.

감사합니다.