機器學習選股系列研究之二:基于Dask計算圖的遺傳規劃高頻因子挖掘框架.pdf
- 上傳者:b**
- 時間:2026/03/13
- 熱度:92
- 0人點贊
- 舉報
機器學習選股系列研究之二:基于Dask計算圖的遺傳規劃高頻因子挖掘框架。遺傳規劃(Genetic Programming,GP)是更廣泛的進化計算領域的一個子 領域,其根源可追溯至遺傳算法(Genetic Algorithm,GA)。然而,與主 要用于優化參數的傳統遺傳算法不同,遺傳規劃旨在進化出算式本身作為 問題的解決方案。遺傳規劃的核心可以概括為“隨機性”和“方向性”的權 衡,算法既要保證種群往更好的方向進化迭代,又要保證其種群的多樣性與 進化的隨機性,防止陷入局部最優解。 為實現日頻與分鐘頻數據混合輸入的高頻因子自動化挖掘,本文基于遺傳 規劃庫 gplearn 與分布式計算庫 dask 進行深度重構,構建了一套高效且硬 件友好的高頻因子挖掘框架。借助 dask 的分布式計算圖與惰性求值機制, 分鐘頻數據得以分塊存儲、按需加載,在突破內存限制的同時,保持了高性 能計算,為混合頻率因子挖掘提供了堅實的技術底座。 在框架優化方面,通過將分鐘數據封裝為 dask array,使其以分塊形式高 效參與遺傳規劃迭代;基于 dask 算子對遺傳規劃分鐘頻算子進行重構,使 得因子表達式的執行可映射為 dask 計算圖,進而實現了高效的并行調度; 此外,通過擴充算子庫、引入覆蓋度與多樣性控制機制、設計多元化適應度 函數,有效提升了挖掘效率與因子多樣性,使算法更聚焦于增量信息的發 現。 基于上述框架,本文初步挖掘了 10 個低相關性的遺傳規劃因子。單因子 20 日 Rank IC最高達 8.91%,ICIR 達5.10,多空組合年化收益率最高為 19.13%, 信息比率達 2.26。將遺傳規劃因子與既有因子群等權合成后,合成因子 20 日 Rank IC 提升至 13.24%,ICIR 為 4.61,多空組合年化收益率達 38.41%, 信息比率達 2.40。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 量化投資-基于機器學習:FOF投資量化策略.pdf 1095 6積分
- 人工智能機器學習戰略計劃.pdf 504 6積分
- 人工智能在選股與ETF輪動上應用.pdf 464 6積分
- 決策樹與隨機森林.pptx 357 12積分
- 機器、符號、神經網絡學習與知識發現.pptx 339 10積分
- SDCC2015機器學習在美團用戶畫像中的應用付晴川V2.pptx 297 9積分
- 金融工程2023年回顧及2024年展望:市場底部特征已明顯,高頻因子低頻化樣本外表現出色.pdf 262 6積分
- 遠矚咨詢:2022年全球人工智能機器學習細分市場分析.pdf 226 6積分
- IMF-結構改革與經濟增長:機器學習方法(英).pdf 187 6積分
- 第十章 統計回歸模型.pptx 181 12積分
- 2025年技術雷達:AI推理、機器學習編排與代理型AI工具及平臺研究報告(英文版).pdf 133 6積分
- 量化投資專題報告:把握爆品脈搏,新消費量化洞察與選股.pdf 104 6積分
- 高頻選股因子周報:高頻因子走勢分化,多粒度因子顯著回撤。AI增強組合均大幅度回撤.pdf 96 6積分
- 2026年銀行業板塊投資策略:從業務與業績角度看穩健性;兩條選股主線.pdf 96 6積分
- 機器學習選股系列研究之二:基于Dask計算圖的遺傳規劃高頻因子挖掘框架.pdf 93 5積分
- 國海金工機器學習系列專題2:高波背景下的信息挖掘與風險優化.pdf 59 3積分
- 因子復合與選股實踐——市場微觀結構系列研究(二).pdf 29 4積分
- 長短信號與市場狀態結合下的深度學習模型改進——機器學習系列十一.pdf 18 4積分
