Machine Learning
Baseline Model (기준모델)
mimi_Bo
2021. 3. 2. 19:57
Baseline Model (기준모델)
Predictive model(예측 모델)을 만들기 전에 간단하면서 직관적이며 최소한의 성능을 나타내는 기준이 되는 모델
Baseline Model의 장점
- 1/10 미만의 시간이 걸리고 결과의 90%까지 정보를 제공한다
- 기준모델을 활용하면 병목현상(bottlenecks)을 먼저 해결할 수 있다
더보기
병목현상(bottlenecks)
"전체 시스템의 성능이나 용량이 하나의 구성요소로 인해 제한을 받는 현상 (출처: 위키백과)"
얼마나 많은 데이터를 동시에 처리할 수 있느냐의 문제로, 한 번에 처리할 수 있는 데이터의 양보다 처리할 수 있는 능력이 충분하지 않을 경우 발생하는 문제를 의미합니다.
1. Regression
보통 target의 평균값을 기준모델로 삼는다.
# 집값을 예측하는 회귀문제에서 target을 집값(SalePrice)로 설정
import matplotlib.pyplot as plt
import seaborn as sns
## SalePrice의 확률밀도함수를 그려보겠습니다
sns.displot(df['SalePrice'], kde=True)
## 평균과, 중간값의 수직선
plt.axvline(df['SalePrice'].mean(), color='blue')
plt.axvline(df['SalePrice'].median(), color='red');
2. Classification
보통 target의 최빈클래스를 기준모델로 삼는다.
# 타이타닉 생존여부를 분류하는 문제에서 Survived를 Target으로 설정
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
sns.countplot(x=y_train);
3. 시계열 회귀
이전 타임스탬프의 값을 기준모델로 삼는다