배깅, 부스팅 모델의 종류, 랜덤 포레스트, XG 부스팅(앙상블)

안녕하세요!
지난번엔 앙상블에 대해 소개해 드렸었는데, 오늘은 앙상블 중에서 배깅과 부스팅 모델의 종류에 대해 소개해 드리겠습니다!

Table of Contents

📍 배깅, 부스팅 모델의 종류

앙상블에 간단한 설명을 드리자면 단일 모델에 비해 높은 성능과 신뢰성을 얻을 수 있고 데이터의 양이 적지만 충분한 학습 효과를 거둘 수 있는 장점을 가지고 있어요!

모델의 종류는 배깅의 랜덤 포레스트, 부스팅의 GradientBoosting, Ada Boosting 등이 있습니다.

주요 매개변수(hyperparameter)

랜덤 포레스트 특징

동작원리

가중치 부여(Weighting)
- 모든 데이터 포인트에 초기 가중치를 부여하고 동일한 가중치가 할당됩니다.
약한 학습기 학습(Weak Learner Training)
- 초기에 약한 학습으로 간단한 모델을 선택하고 학습을 진행합니다
- 약한 학습은 분류 작업을 수행하고, 분류가 잘못된 데이터 포인트에 더 큰 가중치를 부여합니다.
가중치 갱신(Weight Update)
- 학습된 약한 학습기의 성능을 기반으로, 각 데이터 포인트의 가중치가 조정됩니다.
- 잘못 분류된 데이터 포인트의 가중치가 증가하고 다음 약한 학습기가 더 잘 학습할 수 있도록 유도합니다.
약한 학습기 결합(Combining Weak Learners)
- 반복적으로 약한 학습기를 추가하고 가중치를 갱신하여 이전 학습기들과 결합합니다.
- 각각의 약한 학습기들은 이전 학습기의 성능에 따라 가중치가 부여되고 결합하여 강력한 학습기를 형성합니다.

주요 매개변수(Hyperparameter)

XGBoost는 많은 특징을 가진 강력한 그래디언트 부스팅 중 하나입니다.

특징

주요 매개변수(Hyperparameter)

Light GBM은 그래디언트 부스팅 중 하나로 트리 기반 학습 방법을 사용하여 빠르고 효율적으로 대규모 데이터 셋에 대한 학습을 수행하는데 특화되어 있는 방식입니다.

장점

단점

여기까지 앙상블 모델 중에서 Bagging과 Boosting 모델의 종류였습니다!