앙상블 기법은 여러 개의 예측 모델을 조합해서 하나의 최종 예측 모델을 만드는 방식으로, 배깅은 여러 예측 모델의 결과값을 평균 혹은 다수결의 원칙에 따라 최종 도출하는 방식입니다. 이러한 배깅 기법에 대해서 자세히 알아보겠습니다.
[ Contents ]
1. 배깅 (Bagging, Bootstrap Aggregating)

부트스트랩 데이터를 기반으로 여러 모델을 학습시키고, 그 결과를 평균(또는 다수결)해서 예측하는 기법
배깅은 'Bootstrap(부트스트랩)'과 'Aggregating(합산)'의 합성어로, 부트스트랩 데이터로 여러 모델에 각각 학습시키고 그 결과를 합산하는 기법입니다.
다양한 데이터로 여러 모델에 학습하는 앙상블 기법 중 하나로, 대체로 성능이 준수한 편입니다. 다만 여러 모델에 학습시키기 위해서는 많은 데이터가 필요한데, 이는 아래 부트스트랩 기법을 사용해서 뻥튀기합니다.
2. 부트스트랩(Bootstrap)
원본 데이터에서 중복을 허용해서 랜덤하게 샘플링한 데이터셋을 뽑아내는 기법
빅데이터의 시대라고 하지만, 사람이 선별한 검증된 데이터셋은 적은 편입니다. 그렇기에 검증 데이터셋의 양을 확보하는 게 중요한데, 부트스트랩은 샘플 다양성 확보에 유용합니다.
또한 부트스트랩으로 여러 샘플을 다양하게 만들어서, 그걸로 학습한 모델들의 평균 혹은 다수결을 내므로 더 안정적인 예측이 가능합니다. (분산이 줄어드는 효과)
3. 배깅 기법의 특징
1) 평균 혹은 다수결 결정
결과값이 연속형 변수(ex 주가 예측)일 경우에는 평균값을, 범주형 변수(ex 분류 예측)일 경우에는 다수결에 따라 최종 예측값을 결정합니다.
2) 계산 복잡도가 높음
데이터를 부트스트랩으로 부풀리고, 부풀린 데이터를 각각 다른 모델로 학습하고, 이를 합산하는 과정을 거치므로 계산 복잡도가 높은 편입니다.

'AI (Artificial Intelligence) > DL (Deep Learning)' 카테고리의 다른 글
[AI/DL] 부스팅(Boosting) 앙상블 기법의 개념과 절차, 특징 알아보기 (0) | 2025.04.04 |
---|---|
[AI/DL] 매개변수 최적화 기법 종류: 확률적 경사 하강법(SGD), 모멘텀, AdaGrad, Adam (0) | 2025.04.04 |
[AI/DL] 혼동 행렬 평가지표: 정확도, 정밀도, 재현율, 특이도, 조화 평균(F1 Score) (0) | 2025.04.03 |
[AI/DL] 활성화 함수의 개념과 종류 (시그모이드, ReLU, 계단, 부호, tanh 함수) (0) | 2025.03.31 |
[AI/DL] 딥러닝(Deep Learning)이란? 뉴런과 신경망 (0) | 2022.04.09 |
댓글