你想知道的,都在這里!本文是神策數據「十問十答」科普系列文章的第二期,圍繞 A/B 測試展開。
1
Q:什么是 A/B 測試?
A:A/B 測試作為互聯網企業的核心增長手段之一,其價值已在實際應用中被多次驗證。它通過為用戶線上業務旅程制定兩套或多套方案,在保證各套方案對應用戶群的特征相同(相似)的情況下,觀察關鍵的效果指標的差異,并運用科學的統計學檢驗來判斷哪個方案更加有效,從而幫助企業做出更科學的決策,驅動精細化用戶增長。
2
Q:哪些場景可以使用 A/B 測試?
A:A/B 測試通常應用在產品正式迭代發版階段,將 Web 或 App 界面/流程以同一個目的制定兩個或多個方案,在同一時間維度,將用戶流量對應分成若干組,在保證每組用戶特征相同或相似的前提下,展示給用戶不同的設計方案,收集各組用戶的體驗數據和業務數據,最后分析評估出最優版本,驅動決策落地。比如:UI、文案層的 A/B 測試;信息架構的 A/B 測試;流程交互的 A/B 測試;功能范疇的 A/B 測試。
3
Q:如何選擇 A/B 測試平臺?
A:參照 Google 重疊試驗框架——更多、更好、更快地試驗,并結合神策 A/B 測試服務數十家客戶的實踐,我們從不同維度總結出企業選擇 A/B 測試平臺的標準:
功能:支持豐富的試驗人群定向和指標管理配置,同時進行多個試驗的可擴展性、靈活性
性能:A/B 測試的性能越高,對實際業務造成的延遲越小,C 端客戶的體驗越好
穩定:A/B 測試平臺要保證足夠高的 SLA,A/B 故障不應該影響正常業務運行
效率:降低試驗的實施和分析成本,通過標準化的試驗指標計算快速發現、終止不符合預期的試驗
易用:降低試驗的實施門檻,幫助沒有 A/B 測試基礎的小白快速上手、避免踩坑
4
Q:A/B 測試怎么做?
A:神策數據結合數百場 A/B 測試的服務及交付經驗,總結、沉淀出了建立假設、確定評價指標、設計試驗、運行試驗并獲取數據、結果分析、最終決策六大環節,幫助企業順利落地 A/B 測試,為客戶帶來價值。
5
Q:A/B 測試如何實現流量復用?
A:A/B 測試需要基于一定樣本量才能有效體現結果,但對于業務流量較小的企業來說,很難確定多個試驗的效果是否會相互影響,因此無法同時上線多個試驗。神策數據的 A/B 測試功能采用正交分流,實現同一試驗層內的流量互斥,不同試驗層內的流量正交,達到流量復用的目的。
6
Q:如何降低 A/B 測試的延遲?
A:公網傳輸耗時是 App 使用過程中不可避免的,企業要想在 A/B 測試期間降低延遲,根本在于降低分流服務的處理耗時和規避試驗請求的公網傳輸耗時。
7
Q:A/B 測試如何建立假設?
A:A/B 測試最核心的原理是假設檢驗。我們在建立假設的過程中需要注意兩點:第一,A/B 測試屬于因果推斷,所以需要先確定原因和結果;第二,假設必須是可衡量的,需要有相應的評價指標來檢驗假設是否成立。
8
Q:如何通過置信區間法評估 A/B 測試的試驗結果?
A:置信區間法是企業評估 A/B 測試結果顯著性的常用方法。置信區間是一個范圍,最常見的是 95% 的置信區間。也就是說,對于一個隨機變量,95% 的概率包含總體均值的范圍,就叫做 95% 的置信區間。也可以簡單理解為總體數據有 95% 的可能性在這個范圍內。
在 A/B 測試中,我們會計算兩組指標的差異值,如果計算得出的差異值置信區間不含 0,那么就可以拒絕零假設,認為兩組結果差異顯著;反之則接受零假設,認為兩組結果差異不顯著。
9
Q:產品 A/B 測試怎么做?
A:以游戲產品為例。在游戲產品研發與運營過程中,企業可以通過 A/B 測試工具測試美術設計,如按鈕用什么顏色、什么形狀,NPC 用什么造型、技能特效、抽卡表現等;測試新手引導,調整新手階段的節奏、難度和特定的關卡設計;測試界面布局,如商城界面布局,包括順序、大小、顏色和邊框等;測試產品定價,確定哪些定價的硬通貨或者禮包對玩家更有吸引力;測試變現入口,確定合適的變現入口,使得既可以獲得可觀的收益又不影響玩家體驗;測試玩法機制,找到更吸引玩家的玩法,如調整 PVE 通關獎勵領取方式能否提升玩家體驗深度,副本增加隨機隱藏 BOSS 能否吸引玩家再次挑戰,PVP 不同匹配策略對玩家參與積極性有什么影響。
10
Q:神策數據 A/B 測試有哪些優勢?
A:在神策分析云中,迭代優化后的 A/B 測試能夠為企業提供完整的試驗創建能力和試驗分流能力,可以滿足流量分層、試驗互斥等更高級測試需求,為產品迭代、運營策略的優化提供決策依據。
搜索神策數據進入官網,即可免費體驗 A/B 測試。