【ITBEAR科技資訊】9月18日消息,騰訊近日在其公眾號“騰訊開源”中宣布了一項重要消息,旗下的開源項目Fast-Causal-Inference正式登陸GitHub平臺。這一項目由騰訊微信團隊研發,致力于解決數據科學領域中的性能瓶頸問題,為因果推斷和統計分析提供了全新的解決方案。
據悉,Fast-Causal-Inference是一款基于分布式向量化的統計分析和因果推斷計算庫,其最大特點之一是采用SQL交互方式,這使得用戶可以通過SQL語言更輕松地進行數據分析和因果推斷。與此同時,該項目還充分利用了向量化OLAP執行引擎,如ClickHouse和StarRocks,以實現海量數據的秒級執行能力,為用戶提供了卓越的性能體驗。
官方表示,Fast-Causal-Inference的首個版本已經支持多項重要特性。其中包括基礎因果推斷工具,例如基于deltamethod的ttest和CUPED。此外,該項目還提供了OLS工具,能夠處理億行數據并在亞秒級內完成分析。在進階因果推斷工具方面,Fast-Causal-Inference支持IV、WLS等高級算法,同時還在孵化中加入了諸如GLS、DID、合成控制和mediation等功能。對于大規模數據,這個項目還支持Uplift建模,并提供了Bootstrap和Permutation等數據模擬框架,解決了方差估計問題,提高了統計推斷的可靠性。
據ITBEAR科技資訊了解,Fast-Causal-Inference已經在騰訊內部的多個業務中進行了應用,包括微信視頻號和微信搜一搜等。這標志著這一開源項目在實際生產環境中得到了驗證,并且為數據科學家和分析師提供了一個強大的工具,幫助他們更有效地進行因果推斷和統計分析,尤其是在處理大規模數據時。騰訊的開源舉措將有望為數據科學領域帶來更多創新和進步。