Base64編碼解碼算是網絡安全領域的很小而且很簡單的一個知識點了,雖然簡單但是應用場景卻極其廣泛,可以這樣說,開發者要是不懂Base64,基本上可以告別程序員生涯了。這篇文章從原理入手,并給出JAVA的Base64實現。方便你掌握Base64。
一、Base64由來
很早之前,電子郵件剛剛問世,那時候消息的傳遞都是英文,后來中國開通了互聯網之后,對郵件的使用量也大量增加,這時候電子郵件就有了中文的需求。但是中文在傳輸的時候不能被有效地處理,這時候Base就出來了,Base64通過對這些中文進行編碼,轉化為服務器和網關能夠識別的數據。這時候就能夠使用電子郵件有效地傳輸了。
上面的這個例子不是說Base64專門為電子郵件而生的,從其誕生之初,就開始在各大領域有了廣泛的應用。比如說網絡上傳遞圖片,我們可以Base64先對圖片進行處理,然后就可以有效的傳輸了。
OK,我們大致知道其用途,然后我們就好好的分析一下他的原理,到底是如何對這些數據進行編碼的。
二、Base64原理
1、Base64編碼
Base64的原理超級簡單,相信我們都知道ASCII 編碼,從A-Z、a-z、0-9和一些其他的特殊字符,這些字符都有唯一的一個數字來表示。比如說a是97,A是65。我們來截取一部分圖看一下:
同理Base64也有這樣一套編碼。范圍是”A-Z“、”a-z“、”0-9“、”+“、”/“一共64個字符。我們給出一個表格來看一下,這個比ASCII編碼要簡單多了,只有64個。
由于索引是從0開始,所以最后的索引是63。在編碼的時候Base64就是通過上面的進行轉換編碼的。下面我們就來看看Base64編碼的原理。
2、基本原理
比如說有一封郵件,我們想要對其使用Base64進行編碼。怎么辦呢?基本步驟如下:
(1)對郵件的數據進行切分,每三個字節一組,一共24個bit。
(2)對切分后的數據重組,24個bit重組為4組,每組6個bit。
(3)對重組后的數據處理,每組最前面添加兩個“0”,構成每組8個bit。此時一共32個bit。
(4)根據Base64編碼表,獲取相應的編碼值。
此時一封完整的郵件,被切分重組處理之后就變成了Base64編碼了。基本原理其實很簡單。不過你不理解也沒關系,我們直接上個實例來解釋一下。
3、實例驗證
比如說電子郵件里面出現了三個字母sky。我們要對這個三個字符使用Base64進行編碼。
(1)對郵件的數據進行切分,每三個字節一組,一共24個bit
(2)對切分后的數據重組,24個bit重組為4組,每組6個bit
(3)對重組后的數據處理,每組最前面添加兩個“0”,構成每組8個bit。由于在最前面添加的0,所以對數值不構成影響。
(4)根據Base64編碼表,獲取相應的編碼值
(5)完成編碼的轉換
到這我們基本上就是實現了Base64編碼機制從sky到c2t5的轉換。
有些地方需要我們去注意一下:
(1)在第三步中,最前面添加了兩個0,所以最終編碼之后要比之前多出三分之一的大小。
(2)上面的例子中,我們使用的是ASCII編碼,但是如果我們使用UTF-8,對應Base64編碼的結果是不一樣的。
(3)Base64只是進行了編碼,方便數據的傳輸而已。這可不是加密。
原理也搞清楚了,現在我們就實現一下。
三、代碼實現
你可以自己去實現一個編碼解碼的完整過程,但是java已經為我們封裝好了,我們直接只用別人造好的輪子多好。不管是自己寫還是使用別人的,原理搞清楚就OK了。
是不是很簡單。其實java實現的方式有很多種,其他的還有Commons Codec和Bouncy Castle。實現的過程和JDK提供的類似,我們只需要導入相應的jar包即可。
Base64算法的應用場景有E-Mail、密鑰、證書文件等等。這也只是入門,想要深入了解,可以看一些安全有關的書籍,不過很多都和數學有關,看的實在是難受,曾經看過,可惜沒堅持住。慚愧,書到用時方恨少。
OK。有問題還請指正。