https://github.com/endermaru/hasha-trading/blob/main/lstm_reinforcement.ipynb

목적

전략

강화학습

알고리즘: PPO (Proximal Policy Optimization)

데이터 - 기존과 동일

구현

거래 환경