什么是數據解析?
數據解析是一門專注于從數據中獲取洞察力的學科。它包含數據分析(data analysis)和管理的流程、工具和技術,包括數據的收集、組織和存儲。數據解析的主要目的是在數據上應用統計分析和技術,以發現趨勢和解決問題。數據解析作為分析和塑造業務流程、改進決策和業務成果的一種手段,在企業中的重要性日益增加。
數據解析利用一系列學科(包括計算機編程、數學和統計學)對數據進行分析,以努力描述、預測和提高績效。為確保分析的穩健性,數據解析團隊會利用一系列數據管理技術,包括數據挖掘、數據清理、數據轉換、數據建模等。
數據解析的四種類型是什么?
解析大致分為四種類型:描述性解析,試圖描述特定時間內發生的事情;診斷性解析,評估事情發生的原因;預測性解析,確定未來發生事情的可能性;規范性解析,提供實現預期結果的建議行動。
更具體地說,描述性解析使用多種來源的歷史和當前數據,通過識別趨勢和模式來描述當前狀態或特定的歷史狀態。在商業解析中,這屬于商業智能(BI)的范疇。診斷性解析使用數據(通常通過描述性解析生成)來發現過去績效的因素或原因。預測解析將統計建模、預測和機器學習(ML)等技術應用到描述性解析和診斷性解析的輸出中,對未來結果進行預測。預測性解析通常被視為“高級解析”的一種,經常依賴于 ML 和/或深度學習。而規范性解析也是高級解析的一種,涉及應用測試和其他技術來推薦可實現預期結果的具體解決方案。在業務中,規范性解析使用 ML、業務規則和算法。
數據解析方法和技術
數據解析師使用多種方法和技術來分析數據。根據 CareerFoundry 的執行編輯 Emily Stevens 的說法,最常用的方法包括以下七種:
回歸分析:一套統計過程,用于估計變量之間的關系,以確定一個或多個變量的變化會如何影響另一個變量--例如,社交媒體支出會如何影響銷售額。
Monte Carlo模擬:一種常用于風險分析的數學技術,依靠重復隨機抽樣來確定由于輸入的不確定性而無法輕易預測的事件的各種結果的概率。
因子分析:一種統計方法,用于將海量數據集縮小到更小、更易于管理的數據集,以發現隱藏的模式,例如,用于分析客戶忠誠度。
隊列分析:將數據集分成具有共同特征的群體或隊列進行分析的一種分析形式。例如,用于了解客戶群。
聚類分析:一種統計方法,將項目分類并組織成稱為聚類的組,以揭示數據結構。例如,保險公司可能會使用聚類分析來調查為什么某些地點與特定的保險理賠有關。
時間序列分析:一種統計技術,通過分析設定時間段或時間間隔內的數據來識別隨時間變化的趨勢,如每周銷售數字或每季度銷售預測。
情感分析:一種使用自然語言處理、文本分析、計算語言學和其他工具來了解數據中表達的情感的技術,例如根據客戶論壇中的回復來了解客戶對品牌或產品的感受。
前六種方法旨在分析定量數據(可測量的數據),而情感分析則是通過將所有數據整理成主題,對定性數據進行解釋和分類。
數據分析工具
數據分析師使用一系列工具來幫助他們從數據中獲得洞察力。其中最受歡迎的包括
Apache Spark:處理大數據和創建集群計算引擎的開源數據科學平臺
Domo Analytics:商業智能 SaaS 平臺,用于收集和轉換數據
Excel:微軟的電子表格軟件,用于數學分析和表格報告
Klipfolio 基于云的網絡應用程序,用于自助式商業智能和報告
Looker:谷歌的數據解析和 BI 平臺、谷歌數據分析和商業智能平臺
Power BI:微軟的數據可視化和分析工具,用于創建和發布報告和儀表盤
Python/ target=_blank class=infotextkey>Python 數據科學家中流行的開源編程語言,用于提取、匯總和可視化數據
Qlik 用于探索數據和創建數據可視化的工具套件
QuickSight 亞馬遜提供的解析服務,旨在與云數據源集成
R:用于統計分析和圖形建模的開源數據解析工具
RapidMiner:包括可視化工作流設計器的數據科學平臺
SAP 解析云:基于云的解析和規劃解決方案
SAS:用于商業智能和數據挖掘的解析平臺
Sisense 流行的自助式商業智能平臺
Tableau:來自 Salesforce 的數據分析軟件,用于創建數據儀表盤和可視化效果
Talend 數據工程師、數據架構師、分析師和開發人員使用的 ETL 工具
Zoho Analytics:自助式商業智能和數據解析平臺
數據解析與數據科學
數據解析是數據科學的一個組成部分,用于了解一個組織的數據是什么樣子的。一般來說,數據解析的輸出是報告和可視化。數據科學利用解析的輸出來研究和解決問題。
數據解析和數據科學之間的區別往往在于時間尺度。數據解析描述現實的當前或歷史狀態,而數據科學則利用這些數據來預測和/或了解未來。
數據解析與數據分析
雖然數據解析和數據分析這兩個術語經常交替使用,但數據分析是數據解析的一個子集,涉及檢查、清理、轉換和建模數據以得出結論。數據解析包括用于執行數據分析的工具和技術。
數據解析與業務解析
業務解析是數據解析的另一個子集。它使用數據解析技術(包括數據挖掘、統計分析和預測建模)來推動更好的業務決策。Gartner 將業務解析定義為“用于建立分析模型和模擬的解決方案,以創建情景、了解現實和預測未來狀態”。
數據解析實例
各行各業的企業都利用數據解析來改善運營、增加收入和促進數字化轉型。以下是三個例子:
Fresenius Medical Care公司利用預測性解析預測并發癥:專門提供腎透析服務的Fresenius Medical Care公司率先將近乎實時的物聯網數據和臨床數據結合起來使用,以預測腎透析患者何時會出現一種可能危及生命的并發癥,這種并發癥被稱為“血液透析內低血壓”(IDH)。
UPS 通過預測性解析提供彈性和靈活性:跨國航運公司 UPS 創建了統一企業解析工具 (HEAT),幫助其采集和分析客戶數據、運營數據和計劃數據,以跟蹤每個包裹在其網絡中移動時的實時狀態。該工具可幫助公司跟蹤每天運送的大約 2100 萬個包裹。
預測性解析幫助Owens Corning 公司開發渦輪葉片:制造商Owens Corning 在其卓越解析中心的幫助下,利用預測性解析技術簡化了風力渦輪機葉片玻璃纖維織物的粘合劑測試過程。解析技術幫助該公司將任何一種新材料的測試時間從 10 天縮短到大約2小時。
數據解析崗位工資
根據 PayScale 的數據,數據分析師的平均年薪為 66,310 美元,薪資范圍為 48,000 美元至 91,000 美元。類似職位的薪資數據包括
職位名稱 工資范圍 平均工資
解析經理 74,000 美元至 136,000 美元 104,540 美元
業務分析師 50,000 美元至 88,000 美元 66,898 美元
IT 業務分析師 54,000 美元至 104,000 美元 73,893 美元
數據分析師 48 000 美元至 91 000 美元 66 310 美元
市場研究分析員 44 000 美元至 80 000 美元 59 103 美元
運營研究分析員 51 000 美元至 120 000 美元 82 833 美元
定量分析員 65 000 美元至 142 000 美元 92 089 美元
高級業務分析師 67 000 美元至 121 000 美元 89 595 美元
統計員 59,000 美元至 126,000 美元 86,349 美元
PayScale 還確定了數據分析師薪酬高于全國平均水平的城市。這些城市包括舊金山(30.8%)、紐約(10.7%)和華盛頓(10%)。
來源:www.cio.com