基礎
1byte = 8bit (1字節等于8比特)
MySQL數據庫整數類型介紹
前言
前兩天寫了一篇文章,是介紹如何將32-byte的MD5轉為整型來保存,最后使用了兩個ubiging和一個uint來保存,共使用20個字節,有興趣的可以翻翻我的文章。在評論區里有各路大神提出建議和思路,令我豁然開朗,或許還有更簡便的方法,使用更少字節來保存32-byte的MD5。
在這篇文章里我將講解一下思路,最后可以將32-byte的MD5轉為兩個ubigint來保存,共16個字節。對文字沒有興趣的同學可以直接看github的demo,點擊文章最下方的“了解更多”可跳轉到我的github頁面,用golang實現的。
再識MD5
這里并不打算長篇大論地討論MD5的由來,只是簡單梳理一下。
MD5是一個128bit的大整數,而每8bit為1個字節,每個字節所能表示的最大范圍為[0,2^9-1=511]。
這超出了ascii碼所能表示的范圍,無法將MD5打印出來。因此將每個字節的高低位拆分一個字節,這樣每個字節所能表示的最大范圍為[0,2^5-1=31]。這樣一來,原本16個字節(128/8=16)的MD5就變成了32個字節(128/4=32)。
思路
認清了MD5的原貌,再來對他下手吧。
將32字節的MD5拆分為兩個16字節,再不斷地將兩個字節合并成一個字節,最后得到兩個大整型的數字。
詳細步驟
- 由于MySQL最大的整數類型為bigint,要考慮到轉換后的數字是否會溢出。將兩個字節合并為一個字節的過程是:先將上一步操作得到的結果左移8位,然后將下一個字節左移4位,作為高位,再下一個字節不變,作為低位,三個數相加得到結果,以此循環直到將32字節的MD5遍歷結束。因此最后得到的結果為(32/2)*8=128bit=16byte。而bigint占用8byte,因此需要用兩個bigint來存放。
- 合并的過程中,單個字符的處理為:將單個字符看成是一個十六進制數,再進行移位和合并。例如“AE43”用ascii的十進制表示為65,69,52,51。這里不使用ascii對應的數字進行運算,因為MD5是由數字和字母組成,使用65,69這樣大的數字,最后造成溢出。
圖解
由于我表達能力有限,可能無法表達出中心思想,最后給大家上一幅稿圖,也許思路能更清晰一點。
每兩個字符作為高低位合并
如果你有興趣,可以點擊下方的了解更多,可以到我的github查看demo和源碼。當然了,如果你的項目是用golang寫的,也可以直接獲取使用。