Introduction

Cryptocurrency Price Forecasting Using XGBoost Regressor and Technical Indicators에서 시작…

본 논문에서는 XGBoost 회귀 모델과 다양한 경제 지표를 이용하여 비트코인 예측하여 매우 낮은 오차율(MAE, RMSE)과 거의 1에 가까운 결정 계수를 달성했다고 보고하였다.

논문에서는 2021-2022년 데이터 이용하였다.

실험 목적:

데이터의 기간을 늘려 이 회귀 모델 예측 방법이 의미가 있는지 확인. 예측을 그래도 잘 한다면 트레이딩 봇 만들기

스펙:

모델: GPU 없이 빠르게 모델 트레이닝이 가능한 XGBoost Regressor 채택

데이터 수집: 논문이 15분 간격의 데이터를 사용한 것과 동일하게, 바이낸스 거래소의 BTC/USDT 15분 데이터를 수집했습니다 → 나중에 빗썸 BTC/KRW으로 변경

Feature(경제 지표): 논문에서 언급된 주요 기술 지표들(EMA, MACD, RSI 등)을 계산하여 모델의 input feature로 사용

예측 대상: 논문의 접근 방식에 따라, 모델이 다음 15분 뒤의 **절대 가격(Close Price)**을 예측하도록 설정 → 나중에 **가격 변화량(price difference)**로 변경

결과:

모델은 새로운 시장 추세를 전혀 따라가지 못하고, 과거 훈련 데이터의 평균 가격대에서만 머물러있는 “Flat Line” 예측을 보였습니다.

XGBoost Regression으로 train된 모델의 예측

XGBoost Regression으로 train된 모델의 예측

원인 분석:

2021.02-2022.02 데이터는

  1. 박스권 장세 (Range-bound Market)의 특징: 해당 기간의 데이터는 강력한 단방향 추세를 보이기보다는, 특정 가격 범위 내에서 등락을 반복하는 **'박스권 장세'**의 특성을 보였습니다.
  2. 데이터의 안정성 (Relative Stationarity): 이처럼 가격이 특정 평균값 주변으로 회귀하려는 경향이 있는 시장은 통계학적으로 더 '안정적(Stationary)'이라고 볼 수 있습니다. 이러한 환경에서는 모델이 '특정 가격대' 자체를 학습하고 예측하기가 훨씬 쉽습니다.

2021.02~2022.02 BTC 가격

2021.02~2022.02 BTC 가격