用資料科學打造穩健交易策略:量化研究員 Martí Castany 的不確定性思維
Martí Castany 是西班牙量化研究員與投資組合經理,具有超過 十年系統化投資實務經驗,長期專注在統計模型、資料清理與量化風險管理領域。身為 Darwin KV 背後的交易員,他將**資料科學完整導入策略開發流程**:從假設驗證、合成資料生成,到非參數 bootstrap 估計不確定性,目標不是追求最漂亮的回測,而是打造在現實世界中「活得久」的策略。
從電機工程到量化研究:把時間序列思維搬進金融市場
Martí 的背景是電機工程與數位訊號處理(DSP)。他將「從雜訊中萃取訊號」的思維自然延伸到金融時間序列上。
真正踏入交易,是因為朋友介紹,一開始三人一起做裁量交易,卻常對同一張圖得出完全不同結論。這讓他深刻意識到:如果不把決策流程**系統化、科學化**,單靠感覺與討論,很難建立可長期依賴的交易方法。
策略開發流程:從學術文獻到可實盤執行的系統
Martí 把策略開發比喻成「研發新藥」,採用嚴謹的流程:
- **想法來源:從學術與研究開始**:到 SSRN 等學術平台閱讀趨勢追蹤、均值回歸等策略研究,以獲取「市場行為假設」。
- **先驗證假設,再談策略設計**:
- 若要做趨勢策略,會先用自相關(autocorrelation)檢查時間序列結構。
- 若要做均值回歸,會檢驗序列是否具平穩性或共整合關係(如用 ADF、Johansen 檢定)。
- **確認有「可被利用的結構」後,才開始設計交易規則**:規則盡量保持簡單,並同時交易多組參數以降低過度最佳化風險。
這種做法確保策略是針對真實存在的市場特徵,而不是為了 fit 某段歷史曲線。
合成資料與框架建構:解決「只有一條歷史」的根本困境
為什麼必須用合成資料(Synthetic Data)?
金融市場的一大問題是:所有人都用同一條歷史路徑做回測與研究,容易導致樣本污染與嚴重過度最佳化。Martí 因此大量使用合成資料來做策略設計與校準:
Martí 使用合成資料的方法包括:用簡單模型模擬報酬序列,或將歷史時間序列切成區段再重新排列組合成新序列。這樣做是為了將**真實市場資料留到最後**,只用來做「最終驗證」與「跨資產泛化測試」。
自建基礎架構:研究與實盤共用同一份程式碼
為了解決研究與實盤程式碼分離、移植容易出錯的問題,Martí 團隊投資 6 個月,自建一套**事件驅動(event-driven)的回測+實盤框架**:
- 完全以 Python 實作,並嚴格設計成「研究端與實盤端共用同一組核心程式碼」。
- 採用**六角架構**(hexagonal architecture),讓策略邏輯與底層執行(MT5、API)解耦(decouple)。
- 框架內建避免 look-ahead bias 的資料流設計。
用「不確定性」做決策:非參數 Bootstrap 與抽樣分佈
Martí 最強調的觀念是:對所有績效指標,都應搭配**不確定性估計**,而不是只看單一數字。
非參數 Bootstrap:用一條回測估計一整個分佈
以 Sharpe ratio 為例,他使用**非參數 bootstrap**:
- 將原始報酬序列視為「來自某個未知隨機過程的一次實現」。
- 以「有放回抽樣」的方式,重複產生數萬條模擬「可能的歷史」。
- 將所有 bootstrap Sharpe 組成一個抽樣分佈,觀察:原始回測的 Sharpe 在這個分佈中位於哪個位置,以及**有多少比例情況下,績效可能低於某個門檻**。
這樣做的目的,是回答:「如果同樣邏輯在另一個平行宇宙重複執行,績效可能差到什麼程度?」
在資產與組合層級的應用
這套思維延伸到資產配置層面。例如,當兩個標的經 bootstrap 後,Sharpe 抽樣分佈高度重疊,統計上難以區分時,Martí 不會「只選擇表現較好的一個」,而是**同時交易兩個標的**或只做輕微權重調整。這種「在不確定性下做決策」的思維,也用在評估實盤回撤是否仍在統計預期範圍內。
對交易員的啟示:資料科學能帶來哪些實際提升?
從 Martí 的經驗中,可以提煉出幾個實用重點:
- **策略開發要先有「可檢驗的假設」**,再寫程式,避免花時間在「不存在的 edge」上。
- **大量使用合成資料**,保護真實歷史樣本,減少樣本污染。
- **研究與實盤共用同一份程式碼**,降低人為錯誤。
- **對每一個績效指標,都問一句:「它的不確定性有多大?」**並將這些不確定性用在標的選擇與權重決策。
- **接受市場的隨機性**:即便流程嚴謹,也可能短期「運氣不好」,耐心與韌性才是長期勝出的條件。
Martí 的做法提供了一個具體範本:先用科學方法釐清市場結構,再用工程化框架實作,最後用統計方法量化不確定性,讓每一個決策都不只是「看起來不錯」,而是「在風險與機率上站得住腳」。
相關資源與工具整理
| 項目名稱/說明 | 網址 |
|---|---|
| 訪談影片 | Leveraging Data Science for Robust Trading Strategies(Market Masters 與 Martí Castany 專訪) |
| 量化研究公司 | KomaLogic 官方網站(Martí 的研究與服務) |
| 公司 LinkedIn | KomaLogic LinkedIn 官方頁面 |
| 公司 X(Twitter) | KomaLogic 在 X / Twitter 的帳號 |
| Darwin 平台與系列 | Darwinex 官方網站與 Market Masters 播放清單 |