封面

前阵子看到一个工科学生分享自己的量化投资转型经历,从 2022 年接触技术分析,到 2024 年用 XGBoost 跑通因子策略。两年时间,从”看K线图猜涨跌”到”用数据和概率做决策”。

他说得最好的一句话是:**”赚钱不靠预测涨跌,而靠风险暴露。”**

这句话让我想了很久。不只是投资,做研究、做项目、选方向,很多事情的底层逻辑其实是一样的。


他的起点:一门选修课

第一章配图

故事的起点很朴素。他在学校选了一门《数学与投资》的课,学了技术分析——K线图、头肩顶,金叉死叉那些。

学完之后他发现了一个问题:同一张 K 线图,不同的分析师能给出完全相反的结论。有人说”下跌中继”,有人说”已经见底”,有人说”震荡整理”。

主观分析没有客观标准。 这让他很困惑,也成了他转向量化的起点。


第一个策略:回测很美,实盘亏了 30%

第二章配图

2023 年,他做了第一个实盘策略——BTC 的 ATR 通道突破策略。回测表现极好:年化收益 150%,最大回撤 15%,胜率 65%。

然后他上了实盘。三个月,亏了 30%。

原因很经典:市场从单边趋势转成了震荡,固定参数失效了,策略过度拟合了历史数据。

回测漂亮不代表实盘能赚钱。 这个教训他说用真金白银买的。

我虽然不做量化,但这个道理在研究里也一样。在固定数据集上跑出来的高精度,到了真实场景里可能完全不是那么回事。我自己做违章建筑检测的时候也遇到过类似的问题:实验室里 mAP 很高,拿到真实航拍图上漏检一堆。


认知转折:从”预测涨跌”到”管理风险”

第三章配图

2024 年,他读了石川博士的《因子投资方法与实践》,认知发生了一个质的转变。

以前他一直在想”明天涨还是跌”。读完这本书之后他意识到:量化投资的核心不是预测涨跌,而是挖掘”因子”——那些能系统性地解释资产收益差异的变量。

赚的不是”猜对了”的钱,而是”承担了某种风险”的回报。

这个转变听起来抽象,但它从根本上改变了他的策略思路。以前是找买卖点,现在是挖因子、管风险暴露、动态调整组合。


他最终跑通的方法

第四章配图

他选的核心模型是 XGBoost,而不是更复杂的深度神经网络。原因很务实:对量价数据来说,树模型比深度网络更稳定,不容易过拟合。

因子构建的思路来自一篇机构研报的”因子切割论”——把波动效率分成上涨效率和下跌效率,提升信息增益。然后用取对数、计算相关系数、rank 组合这些算子处理因子。

他还提到了一个很真实的问题:那些公开的经典因子(比如阿尔法101因子),在 A 股市场上已经从阿尔法因子退化成了风险因子——因为用的人太多了。所以他不直接用公开因子,而是基于理论自己构建。


他的建议

第五章配图

他给想入门量化的人提了几条建议,我觉得说得很实在。

数学基础得有。 线性代数、概率统计、微积分——没有这些,工具就只是玩具。这一点我感同身受,做目标检测的时候,不懂数学推导就只能调参,不理解为什么调。

先跑通再优化。 不要一上来就追求完美策略。先用最简单的模型(哪怕是逻辑回归)跑通整个流程,再一步步迭代。

理论和实践结合。 他说《因子投资》这本书第一遍读的时候觉得晦涩,先去读了几篇机构研报,回头再读这本书,发现”字里行间都是黄金”。

多参与社区。 他推荐了几个资源:小红书上一个解读前沿论文的博主、”信号与噪声”公众号、潘达 AI 社区。闭门造车效率太低。


我的想法

第六章配图

我不做量化投资,但他的经历让我想到几件事。

第一,所有”从入门到放弃”的故事,转折点都是认知升级。他从”猜涨跌”到”管风险暴露”,这个认知转变比任何技术都值钱。做研究也一样——方法层面的改进是线性的,认知层面的突破才是跳跃式的。

第二,**”回测很美但实盘翻车”这件事,在所有领域都在发生**。在固定条件下验证有效的东西,放到真实环境里不一定有效。这个教训值得所有做实验研究的人记住。

第三,**”先跑通再优化”是一个被低估的策略**。很多人(包括我)总想一步到位,结果什么都没做出来。先用最简单的方法把流程走通,然后再一个环节一个环节地改进——这个思路在写论文、做项目、搭系统上都适用。

一个普通工科生用两年时间完成的这条路,不一定每个人都走得通。但他踩的坑和想通的道理,对任何正在做复杂系统性工作的人都有参考价值。


本文来自「研路炼钢」