Lisa Forex 是一位資料科學家轉型的量化交易員。在過去三年中,她利用 StrategyQuant 軟體生成並測試了數百個自動交易策略。在這支影片中,她分享了從這 500 多個策略中提煉出的一個最關鍵的獲利秘訣:樣本內(In-Sample)與樣本外(Out-of-Sample)數據的黃金比例。
對於任何想要開發穩健交易機器人(EA)的人來說,這是一個反直覺但至關重要的發現。
核心問題:該用多少數據來「訓練」策略?
當我們擁有 10 年的歷史數據(例如 2015-2025)時,傳統做法是將大部分數據用於「構建(Build)」階段,少部分用於「驗證(Test)」階段。
傳統思維:
使用 70% 的數據(7 年)來訓練策略,讓策略有足夠的樣本去學習市場規律;然後用剩下的 30%(3 年)來驗證它是否過擬合。
Lisa 的實驗:
她嘗試了不同的比例分配:
- 70% Build / 30% Test(傳統做法)
- 50% Build / 50% Test(各半)
- 少量 Build / 大量 Test(反直覺做法)
驚人的發現:越少越好?
經過數百次測試,Lisa 發現了一個清晰的規律:使用「少量數據構建」配合「大量數據驗證」的策略,在實盤中表現最好。
Small In-Sample(少量樣本內):只用較短的時間段(如 2-3 年)來讓軟體尋找策略邏輯。
Large Out-of-Sample(大量樣本外):用剩餘的大部分時間段(如 7-8 年)來進行嚴格的壓力測試。
為什麼這樣做更有效?
如果一個策略只看過 2 年的市場行情,卻能在接下來完全未知的 8 年數據中持續獲利,代表它捕捉到了市場的核心本質(Fundamental Edge),而不是僅僅記住了某段特定時間的價格走勢(Overfitting)。
相反,如果給它看太多數據,它很容易「背答案」,導致回測完美但實盤虧損。
實盤驗證:126 天的真實績效
為了證明這個理論,Lisa 展示了她的一個測試帳戶(Strategy Pool):
- 運行時間:126 天。
- 起始資金:$1,000 美元(真倉)。
- 表現:資金曲線穩定緩步上升。
策略組成:
- 趨勢策略(Trend Following):在 4 月份開發完成,經歷了幾個月的回撤期後,目前在實盤表現良好。
- 均值回歸策略(Mean Reversion):同樣經過嚴格的樣本外測試,目前表現穩健。
Lisa 強調,這個測試帳戶的目的不是為了賺大錢,而是作為一個**「篩選器」**。她預期這裡面會有:
- 少數表現極佳的策略(Winner)
- 多數表現普通的策略(Average)
- 少數表現不佳的策略(Loser)
只要「贏家 > 輸家」,且整體帳戶是獲利的,就證明這套開發流程(Small IS / Large OOS)是有效的。
結論與建議
對於量化開發者,Lisa 的建議很明確:不要害怕減少你的訓練數據。 試著將更多的數據留給驗證階段,讓你的策略在未知的數據海洋中證明自己。這比任何復雜的指標或過度優化都更能保證策略在未來的存活率。
相關資源與工具整理
| 項目名稱/說明 | 網址 |
|---|---|
| 教學影片 | I Made 500+ Trading Strategies. Here's What I Learned... |
| 合作計畫 | Work With Me (Lisa 的課程與諮詢) |
| 資金平台 | Xrading (提供獲利交易員晉升機會) |
| 策略生成軟體 | Strategy Quant (折扣碼 lisaforex) |
| 分析工具 | Quant Analyzer |
| 經紀商 | BlackBull Markets |
| VPS 服務 | DipGate |
留言區重點整理
- 樣本外數據的定義:資深量化網友 @Andreas-sd4pr 提出一個技術性觀點:「如果你基於 OOS 的表現來挑選策略,那麼這段 OOS 其實也變成了 IS。」這是一個經典的資料探勘陷阱(Selection Bias)。最好的做法是保留一段真正的「保留數據(Hold-out Data)」,在最終決定上線前才看一次。
- 數據源的重要性:有網友詢問 Lisa 使用什麼數據源。她回覆使用的是 Dukascopy 的高品質 Tick Data。
- Xrading 評價:網友關心她在 Xrading 的考核進度與出金狀況。Lisa 回覆目前進展是「緩慢但穩定(Slow and steady)」。
- 長期績效證明:網友 @mastercraft8615 希望看到 Lisa 長期的績效證明以驗證其可信度。Lisa 簡單回應她定位自己為「Algo Trader(演算法交易員)」而非「Quant(量化分析師)」,並邀請大家參考她公開分享的真實帳戶歷程(播放列表連結)。