15周全 大數(shù)據(jù)的統(tǒng)計(jì)學(xué)基礎(chǔ)視頻教程 煉數(shù)成金大數(shù)據(jù)基礎(chǔ)課程
近年來,存儲(chǔ)設(shè)備的單位成本以驚人的速度下降,我們可以輕而易舉地積累起大量的數(shù)據(jù)。電信 運(yùn)營(yíng)商,可以記錄用戶通話、短消息、無線上網(wǎng)產(chǎn)生的每一條信令,省級(jí)運(yùn)營(yíng)商一小時(shí)寫入存儲(chǔ)設(shè)備的數(shù)據(jù)量可以達(dá)到幾百G。電子商務(wù)網(wǎng)站,可以記錄用戶的每一 次交易,甚至每一次點(diǎn)擊,可以復(fù)原用戶的完整訪問路徑找出用戶的興趣點(diǎn)。城市監(jiān)控體系,在各個(gè)重要路口,高速公路上的攝像頭,每秒鐘都在產(chǎn)生海量的視頻數(shù) 據(jù)。在生命科學(xué)領(lǐng)域,對(duì)人體的DNA分析,一個(gè)個(gè)體就能產(chǎn)生幾個(gè)G數(shù)據(jù),可以想象如果一個(gè)生物信息數(shù)據(jù)庫(kù)里包含了成千萬的個(gè)體數(shù)據(jù),信息量將會(huì)是怎樣一個(gè) 規(guī)模,如此等等,不勝枚舉。我們毫無疑問,正處于一個(gè)信息爆炸的時(shí)代。
不幸的是,我們得到的這些數(shù)據(jù)中的絕大部分,在它的生命周期里基本上都被閑置著,從來沒有考慮過產(chǎn)生任何的價(jià)值,唯一的用途就是“保存?zhèn)洳?rdquo;。盡管“啤酒與尿布”的故事,已經(jīng)寫入教科書有10多年了,幾乎每一個(gè)接受過專業(yè)教育的同仁都知道數(shù)據(jù)挖掘能產(chǎn)生的價(jià)值,但是直到今天,我們對(duì)數(shù)據(jù)的處理依然很低。造成這種情況的原因有很多。其中之一是,在各公司里保管數(shù)據(jù)的大多是IT人員,他們通常都缺乏必要的數(shù)學(xué)素質(zhì)和知識(shí)基礎(chǔ)去進(jìn)行建模和深入的分析工作,即使是業(yè)務(wù)人員也鮮有對(duì)數(shù)據(jù)有深入認(rèn)識(shí)者。我們推出大數(shù)據(jù)系列(包括Hadoop,NoSQL,Mahout等)和數(shù)據(jù)分析系列(包括R,SAS等)課程后,觀察學(xué)員(特別是IT工作者和業(yè)務(wù)人員)的學(xué)習(xí)狀況,發(fā)現(xiàn)他們中的大多數(shù)嚴(yán)重缺乏進(jìn)一步挖掘數(shù)據(jù)價(jià)值所需的數(shù)學(xué)素養(yǎng)。本門課程的目標(biāo),正是要打破這種鴻溝,為大家鞏固基礎(chǔ),為進(jìn)一步在數(shù)據(jù)領(lǐng)域前進(jìn)提供更強(qiáng)動(dòng)力。統(tǒng)計(jì)學(xué),被譽(yù)為是數(shù)據(jù)金字塔的“基礎(chǔ)之基礎(chǔ)”,統(tǒng)計(jì)學(xué)知識(shí)扎實(shí),無論學(xué)習(xí)R,SAS,機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,大數(shù)據(jù)分析等領(lǐng)域知識(shí)都會(huì)得心應(yīng)手,省去回頭補(bǔ)課的麻煩。
授課對(duì)象:
這是一門數(shù)學(xué)課程,適合有志于轉(zhuǎn)往大數(shù)據(jù)分析領(lǐng)域的非數(shù)學(xué)專業(yè)人士(例如IT人,業(yè)務(wù)人員等)補(bǔ)強(qiáng)數(shù)學(xué)基礎(chǔ),以更好地學(xué)習(xí)更高級(jí)的數(shù)據(jù)分析,數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)課程
收獲預(yù)期:
可以大幅度提高學(xué)員的數(shù)學(xué)基礎(chǔ),使其學(xué)習(xí)其它大數(shù)據(jù)分析課程時(shí)覺得更加簡(jiǎn)單,得心應(yīng)手
課程內(nèi)容:
第1課 面向小白的統(tǒng)計(jì)學(xué):描述性統(tǒng)計(jì)(均值,中位數(shù),眾數(shù),方差,標(biāo)準(zhǔn)差,與常見的統(tǒng)計(jì)圖表)
第2課 賭博設(shè)計(jì):概率的基本概念,古典概型
第3課 每人腦袋里有個(gè)貝葉斯:條件概率與貝葉斯公式,獨(dú)立性
第4課 啊!微積分:隨機(jī)變量及其分布(二項(xiàng)分布,均勻分布,正態(tài)分布)
第5課 萬事皆由分布掌握:多維隨機(jī)變量及其分布
第5課 磚家的統(tǒng)計(jì)學(xué):隨機(jī)變量的期望,方差與協(xié)方差
第6課 上帝之手,統(tǒng)計(jì)學(xué)的哲學(xué)基礎(chǔ):大數(shù)定律、中心極限定理與抽樣分布
第8課 點(diǎn)數(shù)成金,從抽樣推測(cè)規(guī)律之一:參數(shù)估計(jì)之點(diǎn)估計(jì)
第9課 點(diǎn)數(shù)成金,從抽樣推測(cè)規(guī)律之二:參數(shù)估計(jì)之區(qū)間估計(jì)
第10課 對(duì)或錯(cuò)?告別拍腦袋決策:基于正態(tài)總體的假設(shè)檢驗(yàn)
第11課 扔掉正態(tài)分布:秩和檢驗(yàn)
第12課 預(yù)測(cè)未來的技術(shù):回歸分析
第13課 抓住表象背后那只手:方差分析
第14課 沿著時(shí)間軸前進(jìn),預(yù)測(cè)電子商務(wù)業(yè)績(jī):時(shí)間序列分析簡(jiǎn)介
第15周 PageRank的背后:隨機(jī)過程與馬爾科夫鏈簡(jiǎn)介
作業(yè)+PDF+stat_h.a06+07