Machine Learning

Baseline Model (기준모델)

mimi_Bo 2021. 3. 2. 19:57

Baseline Model (기준모델)

Predictive model(예측 모델)을 만들기 전에 간단하면서 직관적이며 최소한의 성능을 나타내는 기준이 되는 모델

Baseline Model의 장점

  • 1/10 미만의 시간이 걸리고 결과의 90%까지 정보를 제공한다
  • 기준모델을 활용하면 병목현상(bottlenecks)을 먼저 해결할 수 있다
더보기

병목현상(bottlenecks)

"전체 시스템의 성능이나 용량이 하나의 구성요소로 인해 제한을 받는 현상 (출처: 위키백과)"

얼마나 많은 데이터를 동시에 처리할 수 있느냐의 문제로, 한 번에 처리할 수 있는 데이터의 양보다 처리할 수 있는 능력이 충분하지 않을 경우 발생하는 문제를 의미합니다.

1. Regression

보통 target의 평균값을 기준모델로 삼는다.

# 집값을 예측하는 회귀문제에서 target을 집값(SalePrice)로 설정

import matplotlib.pyplot as plt
import seaborn as sns

## SalePrice의 확률밀도함수를 그려보겠습니다
sns.displot(df['SalePrice'], kde=True)

## 평균과, 중간값의 수직선
plt.axvline(df['SalePrice'].mean(), color='blue')
plt.axvline(df['SalePrice'].median(), color='red');

2. Classification

보통 target의 최빈클래스를 기준모델로 삼는다.

# 타이타닉 생존여부를 분류하는 문제에서 Survived를 Target으로 설정

import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline

sns.countplot(x=y_train);

3. 시계열 회귀

이전 타임스탬프의 값을 기준모델로 삼는다