본문 바로가기
AI (Artificial Intelligence)/DL (Deep Learning)

[AI/DL] 배깅(Bagging) 앙상블 기법의 개념 및 절차, 특징 알아보기

by jangThang 2025. 4. 4.
반응형

 앙상블 기법은 여러 개의 예측 모델을 조합해서 하나의 최종 예측 모델을 만드는 방식으로, 배깅은 여러 예측 모델의 결과값을 평균 혹은 다수결의 원칙에 따라 최종 도출하는 방식입니다. 이러한 배깅 기법에 대해서 자세히 알아보겠습니다. 

 

 

 

1. 배깅 (Bagging, Bootstrap Aggregating)

부트스트랩 데이터를 기반으로 여러 모델을 학습시키고, 그 결과를 평균(또는 다수결)해서 예측하는 기법

 

 배깅은 'Bootstrap(부트스트랩)''Aggregating(합산)'의 합성어로, 부트스트랩 데이터로 여러 모델에 각각 학습시키고 그 결과를 합산하는 기법입니다.

 다양한 데이터로 여러 모델에 학습하는 앙상블 기법 중 하나로, 대체로 성능이 준수한 편입니다. 다만 여러 모델에 학습시키기 위해서는 많은 데이터가 필요한데, 이는 아래 부트스트랩 기법을 사용해서 뻥튀기합니다.


 

 

 

2. 부트스트랩(Bootstrap)

원본 데이터에서 중복을 허용해서 랜덤하게 샘플링한 데이터셋을 뽑아내는 기법

 

 빅데이터의 시대라고 하지만, 사람이 선별한 검증된 데이터셋은 적은 편입니다. 그렇기에 검증 데이터셋의 양을 확보하는 게 중요한데, 부트스트랩은 샘플 다양성 확보에 유용합니다.

 또한 부트스트랩으로 여러 샘플을 다양하게 만들어서, 그걸로 학습한 모델들의 평균 혹은 다수결을 내므로 더 안정적인 예측이 가능합니다. (분산이 줄어드는 효과)

 

 

반응형

 

3. 배깅 기법의 특징

1) 평균 혹은 다수결 결정

 결과값이 연속형 변수(ex 주가 예측)일 경우에는 평균값을, 범주형 변수(ex 분류 예측)일 경우에는 다수결에 따라 최종 예측값을 결정합니다.

 

 

2) 계산 복잡도가 높음

 데이터를 부트스트랩으로 부풀리고, 부풀린 데이터를 각각 다른 모델로 학습하고, 이를 합산하는 과정을 거치므로 계산 복잡도가 높은 편입니다.

 

 

star가 되고나서 Tistory

반응형

댓글