99.99% 드로다운이 트레이딩 봇 구축에 대해 가르쳐 준 것
내가 처음 실전 계좌에 투입한 트레이딩 봇은 거의 전부를 잃었다. 승률 25%, 최대 낙폭 99.99%. 시장이 잔인해서 터진 게 아니다. 대부분의 사람이 첫 봇을 만드는 방식 그대로 — 내 주관으로 얼기설기 엮은 프로토타입으로 — 만들었기 때문에 터졌다.
이건 그다음 시스템에서 내가 왜 모든 수동 규칙을 지웠는지, 그리고 그 결정이 자동화 전략에서 인간의 판단이 실제로 들어가야 할 자리에 대해 무엇을 가르쳐 줬는지에 관한 이야기다.
실데이터가 아닌 예시. 붕괴는 한 번의 잘못된 거래가 아니었다 — 작고 확신에 찬 잘못된 결정 수천 개였다.
편안한 착각
처음 시작할 때, 하드코딩된 규칙은 통제권처럼 느껴진다. 손절 -3%. 익절은 적당히 둥근 숫자. 포지션 사이징은 블로그에서 읽은 공식. 규칙 하나하나는 따로 보면 신중해 보인다. 그런데 그것들이 합쳐지면, 곧 마주칠 상황을 한 번도 본 적 없는 취약한 기계가 된다.
내 첫 시스템은 이런 규칙으로 가득했다. 게다가 계산도 일회용 스크립트처럼 CPU에서 루프로 돌렸다. 깨끗하고 우호적인 데이터로 백테스트하는 동안에는 그 무엇도 문제가 되지 않았다. 그러나 실제 조건 — 수수료, 슬리피지, 청산 가능성 — 이 등장하는 순간 전부가 문제가 됐다. 종이 위에서는 절도 있어 보이던 -3% 하드 손절은, 막상 작은 노이즈에도 매도하며 어떤 가설도 숨 쉴 틈을 주지 않는 기계가 된다. 드로다운은 한 번의 파국적 거래가 아니었다. 작고, 확신에 차고, 틀린 결정 수천 개였다.
불편한 교훈
교훈은 “손절 값을 더 잘 튜닝하라”가 아니었다. 내가 병목이었다는 것이다. 하드코딩된 임계값 하나하나는, 내 추측을 시스템에 얼려 넣고 미래더러 거기에 따르라고 강요한 것이었다.
그래서 다음 시스템에서는 규칙에 대한 규칙을 세웠다. 실제로 학습하는 영역 안에는 수동 규칙을 하나도 두지 않는다. 손절도, 익절도, 포지션 사이징도, 레버리지도. 전략이 어떻게 행동할지에 영향을 주는 결정이라면, 모델이 행동의 결과로부터 스스로 학습해야 한다 — 내 직관에서 물려받는 게 아니라. (노출 한도·킬 스위치 같은 시스템 차원의 안전장치는 별개 레이어로 남는다. 사라지는 건 내가 거래를 손으로 적는 일이다.)
극단적으로 들리고, 실제로 극단적이다. 동시에 이건 초보가 흔히 겪는 실패 몇 가지를 조용히 줄여 주는 규율을 강제한다:
- 프로토타입 금지. 프로토타입은 “나중에 고치겠다”는 약속이고, 그 “나중”이 바로 99.99% 드로다운이 사는 곳이다. 모든 것을 처음부터 실전 품질로 쓴다.
- 매직 넘버 금지. 학습되지 않은 값은 코드에 파묻힌 정체불명의 숫자가 아니라, 내가 보고·버전 관리하고·근거를 댈 수 있는 설정(config) 파일에 산다.
- 백테스트는 아파야 한다. 수수료·슬리피지·청산을 모두 반영한다. 실제 계좌가 잃는 방식대로 잃을 수 없는 백테스트는 그저 듣기 좋은 시뮬레이션일 뿐이다.
인간이 여전히 있어야 할 자리
수동 규칙을 없앤다고 인간이 사라지는 건 아니다. 자리를 옮길 뿐이다. 나는 더 이상 특정 순간에 모델이 무엇을 하는지를 정하지 않는다. 대신 무엇이 “좋은” 결과인지 — 즉 목적함수, 학습 조건, 그리고 반영해야 할 비용 — 를 정한다. 그 목적을 설계하는 일이야말로 이 모든 작업에서 가장 인간적인 부분이고, 그것을 잘못 잡는 것이 어떤 단일 거래의 실수보다 훨씬 위험하다. 모델은 당신이 의도한 것이 아니라 당신이 요청한 것을 정확히 최적화하기 때문이다.
내가 매번 다시 내릴 선택은 이것이다. 미래의 모든 상태에 대한 결정을 내가 손으로 적을 수 있다는 착각을 버리고, 그 노력을 시스템이 학습하는 세계를 정의하는 데 쓰는 것.
핵심 정리
99.99% 드로다운은 비싼 스승이지만, 분명한 스승이다. 그 봇은 규칙이 없어서 실패한 게 아니다. 내 규칙 — 경직되고, 현실에 검증된 적 없고, 학습을 가능케 하는 대신 학습을 대체해 버린 규칙 — 을 가졌기 때문에 실패했다.
첫 시스템을 만들고 있다면, 지울 수 있는 가장 유용한 것은 당신 자신의 확신이다.
이 글은 강화학습 트레이딩 시스템을 만드는 익명 연재의 1편입니다. 시그널이 아니라 방법과 실수에 관한 글이며, 투자 자문이 아니고 어떤 전략 세부도 공개하지 않습니다.