最近看到網上有很多初學編程的小伙伴在問有哪些程序員必須要掌握算法,并且這些算法在面試的時候會被經常問到呢?如何能夠系統性的學習算法?看著樣子估計是要想往算法工程師方向努力了。那么下面我們就來帶著這些問題來進行分享了。
比較重要的幾個算法
深度優先搜索算法
深度優先搜索本質上其實是要從一個樹狀或者是網狀的結構中去搜索到自己所需要的數據。深度優先的意思就是說按照一條線路一直往最深的地方查找,直到查找到最深處的時候發現沒有繼續往下的節點了,就回頭,回到上一個岔路口,順著新的岔路口繼續往下按照同樣的方式繼續往最深處進行查找。
通過這種方式就可以將所有的最深節點的路徑都走一遍,也就可以訪問到整個樹狀結構或者是圖狀結構的所有節點。雖然算法是針對于樹或者是圖進行設計的,但是在實際問題中也有很多的體現。
這些實際的問題表面上與樹或者是圖沒有太大的關系,但是依然采用的是深度優先搜索算法的思路。例如很多比較實際的數學問題,例如八皇后問題、數獨等等。
那么我們如何將一個實際遇到的問題轉化成深度優先搜索問題進行求解呢?
這就是在面試中問道算法有關問題的核心的考察內容,也是在學習一個算法的時候,需要去鍛煉的點。很多的面試者都是對算法本身掌握的非常好了,但是一遇到面試官問道的實際問題,就不知道該如何應對了。
廣度優先搜索
說完深度優先搜索就不得不說到與之對應的廣度優先搜索了,與深度優先搜索一樣,也是在樹結構或者是圖結構中進行應用,與深度優先不同的是,廣度優先搜索在一開始進行遍歷的時候,首先會將當前節點所連接的所有的節點都找到,然后在按照規則進行下一輪的查找。
也就是說廣度優先搜索是一層一層的進行搜索,只有將當前節點所連接的最近的一層節點都走完了,才會繼續去查找下一層的節點。然后持續迭代的走下去。
這有點像是剝開洋蔥一樣,你需要一層一層的剝開,要是想跳過一層的話就會導致洋蔥損壞。
如果我們將深度優先和廣度優先分別應用到查找迷宮的問題上,其區別也是非常明顯的。深度優先,就是一直走,直到遇到墻的時候,回到岔路的位置繼續進行查找。而廣度優先則是首先在起點的時候就將所有的可能的路口都探尋一遍,然后找到最有可能有路口的路繼續進行下一層次的探索。
這個時候就有人要問了,這兩種算法到底哪種算法更好呢?只能說兩種算法各有優缺點吧!廣度優先最大的優點就是能夠保證找到最短的路徑,而深度優先不能。從迷宮問題就可以看出來,實際上在很多的著名的尋路算法中,很大一部分都是從廣度優先搜索算法進行的擴展。例如著名的迪杰斯特拉算法、地圖應用規劃路徑的算法等。
廣度優先相比較于深度優先的缺點就是由于要存儲上層節點信息,所以可能在就更容易占用內存。
但是在一般的面試過程中遇到這種問題的時候,一般樹或者圖的深度都不是太大,所以一般就不考慮這問題。
二分查找算法
說完廣度,接下要說的就是二分查找算法,這個算法適用在一個已經排好序的結構中例如在一個Storted Array 或者是在一個二叉查找樹中。在搜索的過程中需要先取判斷中間的節點是否是我們要找的數據,如果是的話那么正好找到,如果不是的話就需要判斷該節點的數據與當前要查找的數據的大小,如果比該節點數據大那么從后半段進行查找,還是按照第一次查找的方式進行,如果比節點數據小那么就從前半段,按照第一次查找的方式進行查找。
通過這種遞歸的方式進行,就可以快速的找到需要的節點數據了。這個算法也是一種比較常用的算法,在JAVA中的TreeMap和TreeSet它們所用到的查找算法就是二分查找,又比如,在數據庫中使用到的B+樹索引,文件系統中的文件索引等等都用到了二分查找算法。
分治算法
這個算法與二分查找法的共同的特點就是將輸入的內容分成兩部分來分別進行處理,但是與二分查找法不同的是,分治算法會將分而治之的兩部分按照同樣的規則進行處理。也就是說兩部分是都需要進行處理的,而二分法是指處理滿足要求的一半。
分治算法的經典應用就是歸并排序算法,理解非常簡單,就是想要給一個大的數組進行排序的話,首先我們可以將其分成兩個小的數組,然后分別對這兩個小的數組進行排序,然后在對兩個小數組按照規則進行最終的排序。
當然除了在排序算法中見到分治的身影,其實在分布式系統中,也會經常用到分治算法相關的思想。其中最著名的應用就是在MapReduce中的應用,通過對輸入數據拆分成多個小份讓這些小份被多個機器進行并行處理,然后將最終結果的合并,從而最終實現對大數據的處理。
如何學習算法?
以上,是在面試中經常會被問到的一些算法,其實,在實際開發過程中,我們可能遇到的數據結構的種類,或者是碰到的算法會更多,例如List、Queue、Stack、HashTable、Binary Tree、Graph、Heap,還有一些高級的數據機構Union Find、Trie等等。
我們在學習這些算法數據結構的時候,只從理論上出發的話是遠遠不夠的,例如你知道二叉樹的一些特征,一些實現原理、一些計算方式的時候,其實并不能代表你就會使用它。還是要從實際的編程語言中入手。
例如在Java中最為經典的也是在面試中會經常會被問到的HashMap的底層實現邏輯?在HashMap的底層采用了紅黑樹結構,如果只是將紅黑樹的理論知識背的滾瓜爛熟,在實際使用的時候不會用還是不會用。
所以我們要結合實際出發,通過實際的使用來提升自己對于數據結構的理解。
例如在很多的算法書籍中,提到的深度優先和廣度優先用到的不是同一種數據結構。一個用到的是Stock、一個用到的是Queue。但是如果你對Java語言了解的話,在Java中是可以將一個Stock轉換成一個Queue的,這個時候,你可能會對Stack和Queue兩種數據結構有更加深刻的認識。什么意思呢?在理論上來講,兩種數據結構有著不同的定義,但是從代碼實現的角度上,我們可以將一個Stock結構轉換成一個Queue結構來使用。這就是理論與實踐的差距。
總結
上面介紹了幾種面試中常用的算法,以及如何能夠有效的學習算法的方式。說白了,在學習算法的時候,一定要理論結合實踐的方式來深入的理解算法。而不是生搬硬套的去背誦算法。一定要在理解的基礎上然后去應用,而不是從書本上學來就直接進行套用,在這個多元化的氛圍中,套用必然會被淘汰,只有不斷的創新,靈活應用才是王道。