人工智能,下一場(chǎng)互聯(lián)網(wǎng)革命!2017年機(jī)器學(xué)習(xí)工程師正在成為IT行業(yè)需求缺口最大的崗位,機(jī)器學(xué)習(xí)平均年薪較其他崗位平均年薪高。并且隨著從業(yè)年限遞增,機(jī)器學(xué)習(xí)從業(yè)人員平均薪酬漲幅高。機(jī)器學(xué)習(xí)從業(yè)人員平均月薪分布,超過(guò)70%從業(yè)者月薪為20K-50K。 【課程內(nèi)容】 —————-數(shù)學(xué)基礎(chǔ)—————- 本階段主要從數(shù)據(jù)分析、概率論和線(xiàn)性代數(shù)及矩陣和凸優(yōu)化這四大塊講解基礎(chǔ),旨在訓(xùn)練大家邏輯能力,分析能力。擁有良好的數(shù)學(xué)基礎(chǔ),有利于大家在后續(xù)課程的學(xué)習(xí)中更好的理解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的相關(guān)算法內(nèi)容。同時(shí)對(duì)于AI研究尤為重要,例如人工智能中的智能很大一部分依托“概率論”實(shí)現(xiàn)的。 一、數(shù)據(jù)分析 1)常數(shù)e 二、概率論 1)微積分與逼近論 三、線(xiàn)性代數(shù)及矩陣 1)線(xiàn)性空間及線(xiàn)性變換 四、凸優(yōu)化 1)凸優(yōu)化基本概念 —————-python基礎(chǔ)與高級(jí)應(yīng)用—————- 隨著AI時(shí)代的到來(lái)以及其日益蓬勃的發(fā)展,Python作為AI時(shí)代的頭牌語(yǔ)言地位基本確定,機(jī)器學(xué)習(xí)是著實(shí)令人興奮,但其復(fù)雜度及難度較大,通常會(huì)涉及組裝工作流和管道、設(shè)置數(shù)據(jù)源及內(nèi)部和云部署之間的分流而有了Python庫(kù)后,可幫助加快數(shù)據(jù)管道,且Python庫(kù)也在不斷更新發(fā)布中,所以本階段旨在為大家學(xué)習(xí)后續(xù)的機(jī)器學(xué)習(xí)減負(fù)。 一、容器 1)列表:list 二、函數(shù) 1)lambda表達(dá)式 三、常用庫(kù) 1)時(shí)間庫(kù) 四、爬蟲(chóng) 1)正則表達(dá)式 —————-機(jī)器學(xué)習(xí)—————- 機(jī)器學(xué)習(xí)利用算法去分析數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù),隨后對(duì)現(xiàn)實(shí)世界情況作出判斷和預(yù)測(cè)。因此,與預(yù)先編寫(xiě)好、只能按照特定邏輯去執(zhí)行指令的軟件不同,機(jī)器實(shí)際上是在用大量數(shù)據(jù)和算法去“自我訓(xùn)練”,從而學(xué)會(huì)如何完成一項(xiàng)任務(wù)。 所以本階段主要從機(jī)器學(xué)習(xí)概述、數(shù)據(jù)清洗和特征選擇、回歸算法、決策樹(shù)、隨機(jī)森林和提升算法、SVM、聚類(lèi)算、EM算法、貝葉斯算法、隱馬爾科夫模型、LDA主題模型等方面講解一些機(jī)器學(xué)習(xí)的相關(guān)算法以及這些算法的優(yōu)化過(guò)程,這些算法也就是監(jiān)督算法或者無(wú)監(jiān)督算法。 一、機(jī)器學(xué)習(xí) 1)機(jī)器學(xué)習(xí)概述 二、監(jiān)督學(xué)習(xí) 1)邏輯回歸 三、非監(jiān)督學(xué)習(xí) 1)高斯混合模型 四、數(shù)據(jù)處理與模型調(diào)優(yōu) 1)特征提取 —————-數(shù)據(jù)挖掘與項(xiàng)目實(shí)戰(zhàn)—————- 本階段主要通過(guò)音樂(lè)文件分類(lèi)和金融反欺詐模型訓(xùn)練等項(xiàng)目,幫助大家對(duì)于上階段的機(jī)器學(xué)習(xí)做更深入的鞏固,為后續(xù)深度學(xué)習(xí)及數(shù)據(jù)挖掘提供項(xiàng)目支撐。 項(xiàng)目一:百度音樂(lè)系統(tǒng)文件分類(lèi) 音樂(lè)推薦系統(tǒng)就是利用音樂(lè)網(wǎng)站上的音樂(lè)信息,向用戶(hù)提供音樂(lè)信息或者建議,幫助用戶(hù)決定應(yīng)該聽(tīng)什么歌曲。而個(gè)人化推薦則是基于音樂(lè)信息及用戶(hù)的興趣特征、聽(tīng)歌歷史行為,向用戶(hù)推薦用戶(hù)可能會(huì)感興趣的音樂(lè)或者歌手。推薦算法主要分為以下幾種:基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于關(guān)聯(lián)規(guī)則推薦、基于效用推薦、基于知識(shí)推薦等;推薦系統(tǒng)常用于各個(gè)互聯(lián)網(wǎng)行業(yè)中,比如音樂(lè)、電商、旅游、金融等。 項(xiàng)目二:千萬(wàn)級(jí)P2P金融系統(tǒng)反欺詐模型訓(xùn)練 目前比較火的互聯(lián)網(wǎng)金融領(lǐng)域,實(shí)質(zhì)是小額信貸,小額信貸風(fēng)險(xiǎn)管理,本質(zhì)上是事前對(duì)風(fēng)險(xiǎn)的主動(dòng)把控,盡可能預(yù)測(cè)和防范可能出現(xiàn)的風(fēng)險(xiǎn)。本項(xiàng)目應(yīng)用GBDT、Randomforest等機(jī)器學(xué)習(xí)算法做信貸反欺詐模型,通過(guò)數(shù)據(jù)挖掘技術(shù),機(jī)器學(xué)習(xí)模型對(duì)用戶(hù)進(jìn)行模型化綜合度量,確定一個(gè)合理的風(fēng)險(xiǎn)范圍,使風(fēng)險(xiǎn)和盈利達(dá)到一個(gè)平衡的狀態(tài)。 —————-深度學(xué)習(xí)—————- 深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù),同時(shí)深度學(xué)習(xí)也帶來(lái)了機(jī)器學(xué)習(xí)的許多實(shí)際應(yīng)用,拓展了AI的使用領(lǐng)域,本階段主要從TensorFlow、BP神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)概述、CNN卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)、自動(dòng)編碼機(jī),序列到序列網(wǎng)絡(luò)、生成對(duì)抗網(wǎng)絡(luò),孿生網(wǎng)絡(luò),小樣本學(xué)習(xí)技術(shù)等方面講解深度學(xué)習(xí)相關(guān)算法以,掌握深度學(xué)習(xí)前沿技術(shù),并根據(jù)不同項(xiàng)目選擇不同的技術(shù)解決方案。針對(duì)公司樣本不足,采用小樣本技術(shù)和深度學(xué)習(xí)技術(shù)結(jié)合,是項(xiàng)目落地的解決方案。 1)TensorFlow基本應(yīng)用 —————-自然語(yǔ)言處理—————- 自然語(yǔ)言處理(NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它已成為人工智能的核心領(lǐng)域。自然語(yǔ)言處理解決的是“讓機(jī)器可以理解自然語(yǔ)言”這一到目前為止都還只是人類(lèi)獨(dú)有的特權(quán),被譽(yù)為人工智能皇冠上的明珠,被廣泛應(yīng)用。本階段從NLP的字、詞和句子全方位多角度的學(xué)習(xí)NLP,作為NLP的基礎(chǔ)核心技術(shù),對(duì)NLP為核心的項(xiàng)目,如聊天機(jī)器人,合理用藥系統(tǒng),寫(xiě)詩(shī)機(jī)器人和知識(shí)圖譜等提供底層技術(shù)。通過(guò)學(xué)習(xí)NLP和深度學(xué)習(xí)技術(shù),掌握NLP具有代表性的前沿技術(shù)。 1)詞(分詞,詞性標(biāo)注)代碼實(shí)戰(zhàn) —————-圖像處理—————- 數(shù)字圖像處理(Digital Image Processing)是通過(guò)計(jì)算機(jī)對(duì)圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等處理的方法和技術(shù)。廣泛的應(yīng)用于農(nóng)牧業(yè)、林業(yè)、環(huán)境、軍事、工業(yè)和醫(yī)學(xué)等方面,是人工智能和深度學(xué)習(xí)的重要研究方向。深度學(xué)習(xí)作為當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域最熱門(mén)的技術(shù)之一,已經(jīng)在圖像處理領(lǐng)域獲得了應(yīng)用,并且展現(xiàn)出巨大的前景。本階段學(xué)習(xí)了數(shù)字圖像的基本數(shù)據(jù)結(jié)構(gòu)和處理技術(shù),到前沿的深度學(xué)習(xí)處理方法。掌握前沿的ResNet,SSD,Faster RCNN等深度學(xué)習(xí)模型,對(duì)圖像分類(lèi),目標(biāo)檢測(cè)和模式識(shí)別等圖像處理主要領(lǐng)域達(dá)到先進(jìn)水平。實(shí)際工作中很多項(xiàng)目都可以轉(zhuǎn)化為本課程的所學(xué)的知識(shí)去解決,如行人檢測(cè),人臉識(shí)別和數(shù)字識(shí)別。 一、圖像基礎(chǔ) 二、圖像操作及算數(shù)運(yùn)算 三、圖像顏色空間運(yùn)算 四、圖像幾何變換 五、圖像形態(tài)學(xué) 六、圖像輪廓 七、圖像統(tǒng)計(jì)學(xué) 八、圖像濾波 —————-企業(yè)項(xiàng)目實(shí)戰(zhàn)—————- AI大數(shù)據(jù)互聯(lián)網(wǎng)電影智能推薦(第一季) 隨著科技的發(fā)展,現(xiàn)在視頻的來(lái)源和類(lèi)型多樣性,互聯(lián)網(wǎng)視頻內(nèi)容充斥著整個(gè)網(wǎng)絡(luò),如果僅僅是通過(guò)翻頁(yè)的方法來(lái)尋找自己想看的視頻必然會(huì)感到疲勞,現(xiàn)在急需一種能智能推薦的工具,推薦系統(tǒng)通過(guò)分析用戶(hù)對(duì)視頻的評(píng)分分析,對(duì)用戶(hù)的興趣進(jìn)行建模,從而預(yù)測(cè)用戶(hù)的興趣并給用戶(hù)進(jìn)行推薦。 Python是一種面向?qū)ο蟮慕忉屝陀?jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,Python具有豐富和強(qiáng)大的庫(kù)。它常被昵稱(chēng)為膠水語(yǔ)言,而大數(shù)據(jù)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,企業(yè)面臨海量數(shù)據(jù)的到來(lái),大多選擇把數(shù)據(jù)從本地遷移至云端,云端將成為最大的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)場(chǎng)所。本項(xiàng)目主要以客戶(hù)咨詢(xún)?yōu)檩d體,分析客戶(hù)的群體,分布,旨在挖掘客戶(hù)的內(nèi)在需求,幫助企業(yè)實(shí)現(xiàn)更有價(jià)值的營(yíng)銷(xiāo)。 一、教務(wù)管理系統(tǒng)業(yè)務(wù)介紹 1)教務(wù)管理系統(tǒng)框架講解 二、大數(shù)據(jù)需求分析 1)明確數(shù)據(jù)需求 三、構(gòu)建分布式大數(shù)據(jù)框架 1)Hadoop分布式集群配置 四、基于教務(wù)管理系統(tǒng)大數(shù)據(jù)分析 1)業(yè)務(wù)數(shù)據(jù)分析指標(biāo)設(shè)定 五、大數(shù)據(jù)可視化 1)可視化技術(shù)選型 AI法律咨詢(xún)大數(shù)據(jù)分析與服務(wù)智能推薦實(shí)戰(zhàn)項(xiàng)目(第一季) 本項(xiàng)目結(jié)合目前流行的大數(shù)據(jù)框架,在原有成熟業(yè)務(wù)的前提下,進(jìn)行大數(shù)據(jù)分析處理,真實(shí)還原企業(yè)應(yīng)用,讓學(xué)員身臨其境的感受企業(yè)大數(shù)據(jù)開(kāi)發(fā)的整個(gè)流程。 項(xiàng)目的業(yè)務(wù)系統(tǒng)底層主要采用JAVA架構(gòu),大數(shù)據(jù)分析主要采用Hadoop框架,其中包括Kettle實(shí)現(xiàn)ETL、SQOOP、Hive、Kibana、HBASE、Spark以及人工智能算法等框架技術(shù);采用真實(shí)大數(shù)據(jù)集群環(huán)境的搭建,讓學(xué)員切身感受企業(yè)項(xiàng)目的從0到1的過(guò)程。 一、系統(tǒng)業(yè)務(wù)介紹 1)底層業(yè)務(wù)實(shí)現(xiàn)框架講解 二、系統(tǒng)架構(gòu)設(shè)計(jì) 1)總體架構(gòu)分析 三、詳盡實(shí)現(xiàn) 1)原始數(shù)據(jù)處理 四、數(shù)據(jù)可視化 1)采用Highcharts插件展示客戶(hù)偏好曲線(xiàn)圖 五、項(xiàng)目?jī)?yōu)化 1)ZooKeeper實(shí)現(xiàn)HA |