构建 RL 交易系统的工程笔记
一份关于为加密市场构建强化学习交易系统的匿名手记——关于方法、基础设施与诚实的失败。不提供信号、不承诺收益,也不构成投资建议。
早停(early stopping)本应帮你省下算力,避免在一个已经学完的模型上继续浪费计算。然而在很长一段时间里,它恰恰是那个在烧我自己算力的东西——因为它在那些优秀的智能体变得优秀之前,就把它们扼杀了。
2026-06-11 · 构建一套交易 RL 系统我第一个上线到实盘账户的交易机器人几乎亏光了一切。胜率:25%。最大回撤:99.99%。它爆仓并不是因为市场残酷,而是因为我用大多数人构建第一个机器人的方式来构建它——把它当成一个靠自己的主观判断拼凑起来的原型。
2026-06-10 · 构建交易 RL 系统