2017最新某團(tuán)購(gòu)網(wǎng)站的大型離線電商數(shù)據(jù)分析平臺(tái)的實(shí)戰(zhàn)演練視頻教程配套軟件文檔齊全 138課目錄
第一章 大數(shù)據(jù)集群搭建
1.1、課程介紹.mp4
1.2、CentOS 6.4集群搭建-1.mp4
1.3、CentOS 6.4集群搭建-2.mp4
1.4、hadoop-2.5.0-cdh5.3.6集群搭建.mp4
1.5、hive-0.13.1-cdh5.3.6安裝.mp4
1.6、zookeeper-3.4.5-cdh5.3.6集群搭建.mp4
1.7、kafka_2.9.2-0.8.1集群搭建.mp4
1.8、flume-ng-1.5.0-cdh5.3.6安裝.mp4
1.9、離線日志采集流程介紹.mp4
1.10、實(shí)時(shí)數(shù)據(jù)采集流程介紹.mp4
1.11、Spark 1.5.1客戶端安裝以及基于YARN的提交模式.mp4
第二章 用戶訪問session分析
2.1、模塊介紹.mp4
2.2、基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)以及大數(shù)據(jù)平臺(tái)架構(gòu)介紹.mp4
2.3、需求分析.mp4
2.4、技術(shù)方案設(shè)計(jì).mp4
2.5、數(shù)據(jù)表設(shè)計(jì).mp4
2.6、Eclipse工程搭建以及工具類說明.mp4
2.7、開發(fā)配置管理組件.mp4
2.8、JDBC原理介紹以及增刪改查示范.mp4
2.9、數(shù)據(jù)庫(kù)連接池原理.mp4
2.10、單例設(shè)計(jì)模式.mp4
2.11、內(nèi)部類以及匿名內(nèi)部類.mp4
2.12、開發(fā)JDBC輔助組件(上).mp4
2.13、開發(fā)JDBC輔助組件(下).mp4
2.14、JavaBean概念講解.mp4
2.15、DAO模式講解以及TaskDAO開發(fā).mp4
2.16、工廠模式講解以及DAOFactory開發(fā).mp4
2.17、JSON數(shù)據(jù)格式講解以及fastjson介紹.mp4
2.18、Spark上下文構(gòu)建以及模擬數(shù)據(jù)生成.mp4
2.19、按session粒度進(jìn)行數(shù)據(jù)聚合.mp4
2.20、按篩選參數(shù)對(duì)session粒度聚合數(shù)據(jù)進(jìn)行過濾.mp4
2.21、session聚合統(tǒng)計(jì)之自定義Accumulator.mp4
2.22、session聚合統(tǒng)計(jì)之重構(gòu)實(shí)現(xiàn)思路與重構(gòu)session聚合.mp4
2.23、session聚合統(tǒng)計(jì)之重構(gòu)過濾進(jìn)行統(tǒng)計(jì).mp4
2.24、session聚合統(tǒng)計(jì)之計(jì)算統(tǒng)計(jì)結(jié)果并寫入MySQL.mp4
2.25、session聚合統(tǒng)計(jì)之本地測(cè)試.mp4
2.26、session聚合統(tǒng)計(jì)之使用Scala實(shí)現(xiàn)自定義Accumulator.mp4
2.27、session隨機(jī)抽取之實(shí)現(xiàn)思路分析.mp4
2.28、session隨機(jī)抽取之計(jì)算每天每小時(shí)session數(shù)量.mp4
2.29、session隨機(jī)抽取之按時(shí)間比例隨機(jī)抽取算法實(shí)現(xiàn).mp4
2.30、session隨機(jī)抽取之根據(jù)隨機(jī)索引進(jìn)行抽取.mp4
2.31、session隨機(jī)抽取之獲取抽取session的明細(xì)數(shù)據(jù).mp4
2.32、session隨機(jī)抽取之本地測(cè)試.mp4
2.33、top10熱門品類之需求回顧以及實(shí)現(xiàn)思路分析.mp4
2.34、top10熱門品類之獲取session訪問過的所有品類.mp4
2.35、top10熱門品類之計(jì)算各品類點(diǎn)擊、下單和支付的次數(shù).mp4
2.36、top10熱門品類之join品類與點(diǎn)擊下單支付次數(shù).mp4
2.37、top10熱門品類之自定義二次排序key.mp4
2.38、top10熱門品類之進(jìn)行二次排序.mp4
2.39、top10熱門品類之獲取top10品類并寫入MySQL.mp4
2.40、top10熱門品類之本地測(cè)試.mp4
2.41、top10熱門品類之使用Scala實(shí)現(xiàn)二次排序.mp4
2.42、top10活躍session之開發(fā)準(zhǔn)備以及top10品類RDD生成.mp4
2.43、top10活躍session之計(jì)算top10品類被各sessoin點(diǎn)擊的次數(shù).mp4
2.44、top10活躍session之分組取TopN算法獲取top10活躍session.mp4
2.45、top10活躍session之本地測(cè)試以及階段總結(jié).mp4
第三章 企業(yè)級(jí)性能調(diào)優(yōu)、troubleshooting經(jīng)驗(yàn)與數(shù)據(jù)傾斜解決方案
3.1、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中分配更多資源.mp4
3.2、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中調(diào)節(jié)并行度.mp4
3.3、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中重構(gòu)RDD架構(gòu)以及RDD持久化.mp4
3.4、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中廣播大變量.mp4
3.5、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中使用Kryo序列化.mp4
3.6、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中使用fastutil優(yōu)化數(shù)據(jù)格式.mp4
3.7、性能調(diào)優(yōu)之在實(shí)際項(xiàng)目中調(diào)節(jié)數(shù)據(jù)本地化等待時(shí)長(zhǎng).mp4
3.8、JVM調(diào)優(yōu)之原理概述以及降低cache操作的內(nèi)存占比.mp4
3.9、JVM調(diào)優(yōu)之調(diào)節(jié)executor堆外內(nèi)存與連接等待時(shí)長(zhǎng).mp4
3.10、Shuffle調(diào)優(yōu)之原理概述.mp4
3.11、Shuffle調(diào)優(yōu)之合并map端輸出文件.mp4
3.12、Shuffle調(diào)優(yōu)之調(diào)節(jié)map端內(nèi)存緩沖與reduce端內(nèi)存占比.mp4
3.13、Shuffle調(diào)優(yōu)之HashShuffleManager與SortShuffleManager.mp4
3.14、算子調(diào)優(yōu)之MapPartitions提升Map類操作性能.mp4
3.15、算子調(diào)優(yōu)之filter過后使用coalesce減少分區(qū)數(shù)量.mp4
3.16、算子調(diào)優(yōu)之使用foreachPartition優(yōu)化寫數(shù)據(jù)庫(kù)性能.mp4
3.17、算子調(diào)優(yōu)之使用repartition解決Spark SQL低并行度的性能問.mp4
3.18、算子調(diào)優(yōu)之reduceByKey本地聚合介紹.mp4
3.19、troubleshooting之控制shuffle reduce端緩沖大小以避免OOM.mp4
3.20、troubleshooting之解決JVM GC導(dǎo)致的shuffle文件拉取失敗.mp4
3.21、troubleshooting之解決YARN隊(duì)列資源不足導(dǎo)致的application直接失敗.mp4
3.22、troubleshooting之解決各種序列化導(dǎo)致的報(bào)錯(cuò).mp4
3.23、troubleshooting之解決算子函數(shù)返回NULL導(dǎo)致的問題.mp4
3.24、troubleshooting之解決yarn-client模式導(dǎo)致的網(wǎng)卡流量激增問題.mp4
3.25、troubleshooting之解決yarn-cluster模式的JVM棧內(nèi)存溢出問題.mp4
3.26、troubleshooting之錯(cuò)誤的持久化方式以及checkpoint的使用.mp4
3.27、數(shù)據(jù)傾斜解決方案之原理以及現(xiàn)象分析.mp4
3.28、數(shù)據(jù)傾斜解決方案之聚合源數(shù)據(jù)以及過濾導(dǎo)致傾斜的key.mp4
3.29、數(shù)據(jù)傾斜解決方案之提高shuffle操作reduce并行度.mp4
3.30、數(shù)據(jù)傾斜解決方案之使用隨機(jī)key實(shí)現(xiàn)雙重聚合.mp4
3.31、數(shù)據(jù)傾斜解決方案之將reduce join轉(zhuǎn)換為map join.mp4
3.32、數(shù)據(jù)傾斜解決方案之sample采樣傾斜key單獨(dú)進(jìn)行join.mp4
3.33、數(shù)據(jù)傾斜解決方案之使用隨機(jī)數(shù)以及擴(kuò)容表進(jìn)行join.mp4
第四章 頁(yè)面單跳轉(zhuǎn)化率統(tǒng)計(jì)
4.1、模塊介紹.mp4
4.2、需求分析、技術(shù)方案設(shè)計(jì)、數(shù)據(jù)表設(shè)計(jì).mp4
4.3、編寫基礎(chǔ)代碼.mp4
4.4、面切片生成以及頁(yè)面流匹配算法實(shí)現(xiàn).mp4
4.5、計(jì)算頁(yè)面流起始頁(yè)面的pv.mp4
4.6、計(jì)算頁(yè)面切片的轉(zhuǎn)化率.mp4
4.7、將頁(yè)面切片轉(zhuǎn)化率寫入MySQL.mp4
4.8、本地測(cè)試.mp4
4.9、生產(chǎn)環(huán)境測(cè)試.mp4
4.10