兩篇文章,主要向大家展示了算法對于計算機來說有多重要,多神奇,性能提升效果顯著。那二進制算法的思路是如何形成的呢?
我們先從一道有趣的題目開始。
有100瓶藥水,其中一瓶是毒藥,只要一小滴,就足以讓小白鼠24小時內死亡。請問怎么在1天內用最少的老鼠找出這瓶毒藥?
先從暴力破解的方法來看,100瓶,每一瓶對應一只小白鼠,即使用100只小白鼠可以找到那一瓶毒藥。這種解法,可以看做是將100瓶毒藥放到了一條直線的維度,因此,想要減少小白鼠的個數,很簡單,提升維度即可。
第二種方法,就是將100瓶毒藥,按照橫向10,豎向10排列成一個正方形,即二維,此時只需要使用10+10只小白鼠,就可以定位出哪一個位置的是毒藥。
按照上述邏輯,想要再減少小白鼠的個數,就需要繼續升高維度,我們下面寫一下維度與個數的關系表。
維度 |
100開維度數的方根 |
個數 |
1 |
100 |
100 |
2 |
10 |
10+10=20 |
3 |
4.64 |
5+5+4=14 |
4 |
3.16 |
3+3+3+4=13 |
5 |
2.51 |
2+2+3+3+3=13 |
6 |
2.15 |
2+2+2+2+3+3=14 |
7 |
1.93 |
2+2+2+2+2+2+2=14 |
由上面的表可以看出,并不是一直提升維度就可以減少小白鼠個數,這是因為每增加一個維度,這個維度上至少需要兩只小白鼠,否則沒有意義,過量的維度反而會導致小白鼠個數的增加。
那接下來該如何思考呢?
我們換一種思路來思考這個問題,上面我們是通過對100瓶的位置進行升維來實現減少小白鼠的個數,我們再從小白鼠這一邊來進行分析。
每一只小白鼠在喝了瓶內液體并經過24小時后,都只有兩種狀態,死或生。n只小白鼠,狀態會有2^n種。從信息論的觀點來看,確定毒藥所需要的信息量H(d) = -(p1 log p1+p2 log p2+.....p100 log p100),p1=p2=....=p100=1/100,小白鼠生死的信息量H(s) = -(p1 log p1+p2 log p2+.....p2^n log p2^n),p1=p2=....=p2^n=1/2^n,H(s) > H(d),即2^n > 100,n>6.64,所以至少需要7只小白鼠,才可以將那1瓶毒藥找出來。
具體方法就是將瓶子的編號1~100,用二進制來表示,二進制的每一位對應一只老鼠,第一只老鼠喝二進制編號的第一位為1的瓶子內的液體;第二只老師喝二進制編號的第二位為1的瓶子內的液體;依次類推。第二天看死掉老鼠在哪一位,將所有位置1,即可查到毒藥的位置。
由此可以看出,信息論的思考方法有多么神奇。我們回到之前分析100W注彩票的問題,彩票選號碼,實際每一個數也是只有兩種狀態,選中和未選中。我們從小白鼠的題目推演過來,1-33中選6個數,就可以用二進制來表示,而計算機存儲就是用二進制,所以這樣計算的效率非常高。