量化投資是數據科學在金融行業的應用。
2023年,量化行業的超額收益開始收斂,量化私募如何形成自身核心競爭力?
和鯨拜訪客戶鯤山科技(深圳),揭示其“彎道超車”的獨家秘訣。
群體作戰
年初至今,鯤騰投資(鯤山科技全資子公司)在各類實盤大賽上屢屢上榜,漂亮的收益率曲線也讓鯤騰成為了業內令人矚目的一匹黑馬。但 CEO 劉亮告訴我們,沒太大必要關注收益率,因為根據馬爾科維茨的理論,想做多高的收益使用對應的杠桿就行,收益率的本質是杠桿。對于鯤騰的發展,劉亮覺得過去做得最正確、未來也要繼續堅持的,是采取“集中優勢兵力的群狼戰術”。
群體作戰,指人
“狼從來不是單獨出擊,而是群體作戰,頭狼統一指揮,團隊互相配合。”劉亮如是說。按照“投資就是投人”的標準搭建團隊,迄今為止,鯤騰已薈聚超40+名優秀成員,海內外頂尖院校的學歷背景對于量化行業而言確實只能算敲門磚,鯤騰對于成員的要求是——除了智商高,也要能證明自己能很好地利用智商解決現實中的問題。
·研究總監欒峰教授在頂級刊物 Science 上發表過兩篇光通訊方面的文章;
·CEO 劉亮在學生時代拿過信息產業部科技進步一等獎,也是香港工商業獎科技成就大獎獲得者;
·投資總監羅宇翔博士在美國頂級對沖基金 Gramham Capital 有超過十年的核心量化研究員經驗,管理規模超150億美金;
·技術總監李昌鋒李總是中國最早做支付的人之一, 也因為做支付很早便實現了財富自由;
·海外合伙人林霄漢博士是 MIT 的博士,曾獨立為德州政府管理教育及退休基金。
除了人才招募,劉亮同時關注人才的培育,“校企合作是量化領域的常見模式,我們只是給這種模式的落地提供了更多形式”。成立至今,鯤騰與國內一眾985高校、雙一流高校建立了長期合作,從定期的量化講座到量化實戰課堂,從量化實驗室的共建到人才聯合培養,在助力量化行業構建人才生態的同時,也能為企業內部注入源源不斷的“新鮮血液”。
鯤騰團隊的大合影
群體作戰,更指策略
頭狼定義組織的深度,狼群定義組織的廣度,策略亦然。商品期貨、股票量化主流策略全覆蓋,不斷拓寬策略的廣度,同時增加研究的深度,劉亮說,這是鯤騰面對問題的措施,也是發展的路徑。
廣度上,CTA 策略與股票策略協同發力、齊頭并進,目前鯤騰的策略體系包括了核心優勢的 CTA 策略、指數增強策略、市場中性策略,還有具有特色的混合策略(CTA+股票),策略的豐富度保證了收益來源的多元化,也能在風險可控的前提下創造更高收益。深度上,單策略的精細程度一部分取決于 IT 團隊的質量和規模,另一部分取決于投研團隊的經驗。目前,鯤騰穩健創新的 IT 團隊已建立起集回測、實盤、算法交易、風控、監控于一體的完善系統,精英管理的投研團隊也具備高效率的策略迭代優勢,可以有預見性地避免大部分實盤的坑。
鯤騰CTA+中性策略-磐石2號產品業績
策略的優勢使得鯤騰的產品在近期獲得了多家實盤大賽的獎項。僅2023年8月的一個月,所獲獎項便包括「廣發證券私募實盤大賽-指數增強(新銳組)」冠軍、「第十八屆-中國私芽基金風云榜-管理期貨」冠軍、「第一屆“星云杯”私募大賽-其他策略10-20億管理規模」冠軍等的總計6個冠軍、4個亞軍、3個季軍及19個榜單十強。隨著8月底政策組合拳帶來的市場反彈,劉亮也表示期待下半年能有更亮眼的超額表現。
引入ModelWhale 平臺
“超額的收斂是歷史的必然,就是這個過程有點快。”針對市場近況,劉亮如是說。長期看,市場有效性提升、量化超額下降是大趨勢,但管理人的策略迭代可以在這個趨勢的各個階段,以合適的方式,最大限度地實現超額收益。所有私募都在做迭代更新,讓自己的策略不斷適應市場的變化,在此背景下,鯤騰與和鯨展開了合作。
數據:面向策略研究的數據支持
效率的提升可以增厚產品的超額收益,前提是要走過數據這段“坎坷路”。當前,越來越多大型量化私募機構正效仿券商與銀行做法,想要構建自己的量化數據中臺。數據的完備性、準確性,數據的存儲、應用都會直接對優化量化投資算法模型起到關鍵作用。
引入和鯨的數據科學協同平臺 ModelWhale 以后,鯤騰做的第一件事就是讓數據更快地流動起來。
首先做的是提高數據預處理的效率。多源頭數據統一匯入 ModelWhale 后,數據接口與數據的清洗、處理、分析實現了統一,既能降低系統復雜度也能增強數據加工能力。數據需要每日更新,ModelWhale 會每日定時獲取數據庫新產出的數據,然后員工可按照業務邏輯對數據進行預處理,當然這一步還是更依賴于業務理解,需要在保證數據質量的同時提高效率。對此,員工可以將較為成熟的數據預處理或數據分析的步驟封裝為標準工作流,尤其是具有投資決策參考價值的“中間指標”或“常用指標”,利用離線任務每日定時運行并推送,方便投研團隊與交易風控團隊更快了解行情。
數據定期清洗并寫回數據庫展示
其次便要提高數據使用的效率。預處理后的數據既可以寫回數據庫,也能保存在平臺的共享空間,供特定的投研人員隨取隨用(此處涉及的權限管理將在后文作具體說明)。為了便于因子挖掘以及后期對歷史行情數據進行二次加工,平臺上的每一個數據集都配備了數據文檔記錄數據標簽及數據說明,并可回溯到任一歷史版本。ModelWhale 兼顧數據管理與數據應用,之后不管是通用的數據還是需要喂給特定模型的數據,投研人員都能更便捷地使用。
數據集概述展示
策略:指數級加速策略迭代
策略的迭代分為兩個維度,一是日常的漸進式創新,二是跨越式創新,但迭代的頻次總是不固定的,為了保持策略在市場上的領先地位,最有效的方法就是不斷測試,就像挖礦一樣不斷探索。為了進一步提高測試的效率,鯤騰將部分策略回測與策略分析的工作遷移至了 ModelWhale 平臺。
并行回測
投研人員完成策略的開發后,即可在 ModelWhale 平臺上選擇相應的回測框架進行回測。除了數據外,快速回測驗證還需要大量 GPU 、CPU 、內存資源,ModelWhale 將鯤騰本地的計算硬件接入云端,投研人員可以根據需求拆分算力共享使用或將多機多卡的 GPU 組成集群算力使用。回測過程中,大家通常都會希望在一定時間內作更多嘗試,因此圍繞相似的回測可能需要跑很多遍。在平臺的加持下,投研人員既可以針對同一模型配置多組參數同時去跑,也可以同時運行多個回測任務并行計算,任務之間相互獨立、互不影響。這樣一來,原本運行多個回測任務的總時間被壓縮到了單個最大任務的時間,效率得到指數倍的提高。
并行計算示例
多維協同
新舊策略交替,一邊維護老策略一邊開發新策略是常態。鯤騰的研究總監欒峰教授曾提出:“相較于用 Git 管理策略,ModelWhale Notebook 的項目管理方式才是對于策略人員更加友好的。”
不管是修改了掛載的數據、文件還是策略代碼,總之項目內的任何調整都可以生成新的版本,但并不妨礙投研人員隨時查看歷史版本或回溯到歷史版本重新做,不同版本間可以相互對比了解“增、刪、改”情況。部分新策略的開發可能需要多人合作進行策略研究、編程實現和模型優化,利用 ModelWhale 的版本管理,投研人員間也能減少低效率的相互確認——已與他人分享的數據和項目若有修改,對方會同步獲得更新;未與他人共享的則仍屬于自己的私密“財產”(此處涉及的權限管理亦在后文作具體說明)。另外,數據、標準的工作流、策略,或是團隊待學習的項目都可以存儲在團隊的共享空間,方便大家隨時使用。
Notebook 版本列表展示
權限:多級別、全要素的權限管理
保密工作對于量化行業來說幾乎是首要考慮的問題。多一個人使用同樣的算法策略,利潤空間就少一分,因此任何有可能曝光算法的信息渠道都應被嚴加看管。
外部合作方面,鯤騰長期協助高校開展人才聯合培養工作,在校內表現優異的學生將有機會到鯤騰短期實習,在投研團隊的帶教下通過實戰快速鍛煉選股、研究、策略開發等多方面能力。從一開始普遍做數據處理工作,到后面隨著能力的積累慢慢接觸到新因子的挖掘、新模型的開發等更深層的工作內容,相關權限需要逐級開放。
接觸到 ModelWhale 平臺后,投研團隊發現通過基礎設施的配置可以更便捷地實現這一需求,數據、策略、模型等各種資產也能得到多重保障。數據方面,管理員可以同時管理數據的訪問權限(管理單位至個人)和數據的下載權限,也就是可以實現數據僅在平臺處理而無法下載至本地,既提高效率也保障數據不外泄。策略方面,承載策略的 Notebook 同樣可以“開啟訪問權限”的形式分享,但訪問并不等于可復制/可將代碼下載至本地。簡而言之,任何涉及權限的行為在平臺上都有對應的管理動作加以監控。
權限相關的管理還涉及到了算力資源、鏡像環境等,鯤騰內部的各類權限也都基于平臺進行了優化。
Notebook 權限管理展示
一直努力在路上
從 2022 年與鯤騰合作至今,和鯨最大的感受就是務實而進取,CEO 劉亮對公司發展的每一步都做好了規劃,踏實地走好每一步,一直努力在路上。“就像我們爬珠穆朗瑪峰,你爬到頂上之后,四面望一下,會發現無論是從哪個面爬上去,看到的風景都是一樣的。所以市場最終一定會寡頭化,我相信我們每家頭部量化在這個過程中,能力都是不斷地跟上市場節奏。”
量化 4.0 時代,什么樣的量化公司能夠持續具備競爭力,鯤騰的答案是:尊重科學、追求效率、敬畏市場。作為一款先進的數字化基礎設施,和鯨 ModelWhale 數據科學協同平臺希望能為每一位從事數據創新研究的開拓者及其團隊提供支持。任何相關需求,都歡迎您搜索并進入ModelWhale 產品官網注冊體驗、與我們展開交流。