一个工科生从亏 30% 到跑通 AI 量化策略，他踩的坑比方法更有价值

前阵子看到一个工科学生分享自己的量化投资转型经历，从 2022 年接触技术分析，到 2024 年用 XGBoost 跑通因子策略。两年时间，从”看K线图猜涨跌”到”用数据和概率做决策”。

他说得最好的一句话是：**”赚钱不靠预测涨跌，而靠风险暴露。”**

这句话让我想了很久。不只是投资，做研究、做项目、选方向，很多事情的底层逻辑其实是一样的。

他的起点：一门选修课

第一章配图

故事的起点很朴素。他在学校选了一门《数学与投资》的课，学了技术分析——K线图、头肩顶，金叉死叉那些。

学完之后他发现了一个问题：同一张 K 线图，不同的分析师能给出完全相反的结论。有人说”下跌中继”，有人说”已经见底”，有人说”震荡整理”。

主观分析没有客观标准。 这让他很困惑，也成了他转向量化的起点。

第二章配图

2023 年，他做了第一个实盘策略——BTC 的 ATR 通道突破策略。回测表现极好：年化收益 150%，最大回撤 15%，胜率 65%。

然后他上了实盘。三个月，亏了 30%。

原因很经典：市场从单边趋势转成了震荡，固定参数失效了，策略过度拟合了历史数据。

回测漂亮不代表实盘能赚钱。 这个教训他说用真金白银买的。

我虽然不做量化，但这个道理在研究里也一样。在固定数据集上跑出来的高精度，到了真实场景里可能完全不是那么回事。我自己做违章建筑检测的时候也遇到过类似的问题：实验室里 mAP 很高，拿到真实航拍图上漏检一堆。

第三章配图

2024 年，他读了石川博士的《因子投资方法与实践》，认知发生了一个质的转变。

以前他一直在想”明天涨还是跌”。读完这本书之后他意识到：量化投资的核心不是预测涨跌，而是挖掘”因子”——那些能系统性地解释资产收益差异的变量。

赚的不是”猜对了”的钱，而是”承担了某种风险”的回报。

这个转变听起来抽象，但它从根本上改变了他的策略思路。以前是找买卖点，现在是挖因子、管风险暴露、动态调整组合。

第四章配图

他选的核心模型是 XGBoost，而不是更复杂的深度神经网络。原因很务实：对量价数据来说，树模型比深度网络更稳定，不容易过拟合。

因子构建的思路来自一篇机构研报的”因子切割论”——把波动效率分成上涨效率和下跌效率，提升信息增益。然后用取对数、计算相关系数、rank 组合这些算子处理因子。

他还提到了一个很真实的问题：那些公开的经典因子（比如阿尔法101因子），在 A 股市场上已经从阿尔法因子退化成了风险因子——因为用的人太多了。所以他不直接用公开因子，而是基于理论自己构建。

第五章配图

他给想入门量化的人提了几条建议，我觉得说得很实在。

数学基础得有。 线性代数、概率统计、微积分——没有这些，工具就只是玩具。这一点我感同身受，做目标检测的时候，不懂数学推导就只能调参，不理解为什么调。

先跑通再优化。 不要一上来就追求完美策略。先用最简单的模型（哪怕是逻辑回归）跑通整个流程，再一步步迭代。

理论和实践结合。 他说《因子投资》这本书第一遍读的时候觉得晦涩，先去读了几篇机构研报，回头再读这本书，发现”字里行间都是黄金”。

多参与社区。 他推荐了几个资源：小红书上一个解读前沿论文的博主、”信号与噪声”公众号、潘达 AI 社区。闭门造车效率太低。

第六章配图

我不做量化投资，但他的经历让我想到几件事。

第一，所有”从入门到放弃”的故事，转折点都是认知升级。他从”猜涨跌”到”管风险暴露”，这个认知转变比任何技术都值钱。做研究也一样——方法层面的改进是线性的，认知层面的突破才是跳跃式的。

第二，**”回测很美但实盘翻车”这件事，在所有领域都在发生**。在固定条件下验证有效的东西，放到真实环境里不一定有效。这个教训值得所有做实验研究的人记住。

第三，**”先跑通再优化”是一个被低估的策略**。很多人（包括我）总想一步到位，结果什么都没做出来。先用最简单的方法把流程走通，然后再一个环节一个环节地改进——这个思路在写论文、做项目、搭系统上都适用。

一个普通工科生用两年时间完成的这条路，不一定每个人都走得通。但他踩的坑和想通的道理，对任何正在做复杂系统性工作的人都有参考价值。

本文来自「研路炼钢」