課程目標
大數據Spark基礎+Spark中級架構原理、運行流程圖+Spark內核分析解密視頻課程
適用人群
學生 大數據從業人員 Spark開發人員 大數據開發人員
課程簡介
想學習Spark進入大數據領域的同學,花一個小時了解Spark大數據計算引擎在整個大數據生態圈的地位,并且跟跟著老師完成Spark學習環境的搭建,對常見的Spark運用場景進行實戰操作。為學習Spark Sql、Spark Streaming、Spark圖計算、Spark機器學習建立好環境基礎!帶領大家全面了解Spark的內核,從整體把握Spark系統的構架方式及設計思想
本課程全面講解Spark內核的各大組件及調度方式。Spark基于彈性分布式數據集構建的具有容錯、位置感知、自動平很負載、水平擴展的分布式內存計算引擎,其核心思想是RDD。本課程會講解Spark集群環境的安裝、RDD抽象的概念、RDD上常見的transformation操作、action操作、作業的調度、調度模塊、存儲模塊、執行模塊、Shuffle模塊、內存管理模塊、RPC通信模塊、Zookeeper構建HA等Spark核心的內容進行詳細的結合源碼的講解。帶大家走進Spark的源碼世界!