首先呢,我們學習Python的目的絕不是為了“驚艷到所有人”,完全是為了更好地開展自身工作。
其次呢,除了買書,在我這花錢學習Python是完全不可能的。
再者呢,學習最忌諱的就是沒有學習框架和計劃。其中,計劃是需要個人來定的,但框架本文可以給一個建議方案——熟悉下文的大綱,然后結合網站內容進行實踐學習。
Python數據分析大綱
千言萬語不如一張圖,先上圖。圖中的大綱都是去掉了數據分析中不常見的部分,掌握了這些,進行一遍全流程的數據分析完全不在話下。
接觸過R語言的人肯定對眾多的庫感到很頭疼,雖然Python庫也不少,但入門其實你就只需要掌握圖中的幾個庫就夠了。等你掌握了圖中的庫,你也就熟悉了Pyhton思想,接下來如何專研也就有自己的想法了。
那要如何學習圖中的這些知識點呢?對于喜歡直接看書的人,我在《建立數據分析體系的完整書單,書不在多而在于精,尤其是第一本》一文中列出來Python/ target=_blank class=infotextkey>Python的兩本書單:《利用Python進行數據分析》和《Python學習手冊》。我所列書單的原則都是只推薦通識導讀類書籍,至于具體細節的知識靠搜索引擎會更有效。
那對于不喜歡看書,也不想花錢買書的人要怎么辦呢?
別急,我推薦兩個很經典很有用的網站,尤其是第一個。
Python學習網站
(1)阿里天池
阿里天池是數據愛好者集中地,它里面雖然核心是舉辦機器學習競賽的平臺,但里面也有著很多整理好好的學習資料。
正如圖中所列,在天池的學習平臺,有著一條路線清晰的學習路徑。如果只是想學習Python做數據分析,那學習完它里面的數據分析入門、數據分析進階、數據可視化、數據分析實戰這四部分就可以出師了。
阿里天池相比下文要介紹的Kaggle的優勢之處在于,一它是中文網站,閱讀會無障礙;二是學習內容整理的非常有邏輯,按照順序學完你就完全入門了。
(2)Kaggle
這個平臺也是為人所熟知的一個數據競賽平臺,但它有些不太適合的地方就是這是國外的網站,網站內容是全英文。如果英語閱讀不成問題,那完全可以多進去看看,像經典的泰坦尼克號生存預測就是出自這里面的入門學習競賽。
Kaggle有著大量的數據集和參賽者的代碼,當你想練手時,一是可以直接在里面找數據,二是可以通過觀看其他人的代碼來學習大家的分析思路和代碼用法,絕對可以讓你受益匪淺的。
不管是進行數據分析的進階還是機器學習的實踐,Kaggle絕對是一個不容錯過的選擇!
搜索
搜索其實不用多說的,因為你想了解哪個點就搜索哪個點。譬如,等學習完Python基礎知識后,發現要了解下類、生成器、迭代器等概念時,百度或知乎搜索就夠了。
但是呢,需要額外指出的是,在學習某些庫時,可以先直接搜索進去該庫的主頁,例如機器學習Scikit-learn庫的主頁就有很多知識點可以學習。
總之呢,善用搜索引擎。
結語
除了買書,倘若還需要花錢學習類似于Python的工具軟件,我是極力反對的。沒那個必要,一本通識導讀類經典書籍和搜索引擎完全足矣。