作者 | Andrew Israel
編譯 | 王瑞平
Rust作為長期以來被看好的網絡開發語言,更注重技術的穩定性,不掉鏈子,能夠將設備的性能發揮到極致,更講究精致。
相對于其它類型的語言來講,Rust是新成員。最早由Mozilla于2014年4月9日發布,是一款高級通用語言,能夠兼顧開發與執行效率。
雖然Rust并不是一個專屬的網絡應用開發語言,但是非常適合網絡開發。編譯器能就安全穩定方面的問題作出提醒。這使其具備了后端網絡開發的獨特優勢。
我曾在《用Rust創建一家初創公司》一書中提到:“初創公司應優先考慮開發人員所帶來的生產力而并非其能力。”對于一家創業公司創始人來講,這種觀點是明智的。也正因為如此,我喜歡使用Rust,并雇傭了同樣喜歡使用Rust的開發人員。
我必須提醒:如果你的團隊中沒有其他人會使用Rust,那么,教授所有同事使用Rust的成本將會很高。他們可能需要一段時間才能游刃有余地使用Rust,在此期間,你需要指導他們,工作效率會因此下降。明智的選擇是使用團隊其他人都知道的語言,除非你真正需要使用Rust。
幸運的是,我的隊友已經了解并喜歡上了使用Rust,并熟知如何讓代碼生成工具(如,Serde和Diesel)最大效能地發揮作用,以成為更好的Rust程序員。
1、用Rust語言建立數據泄露防護系統
我的團隊為Cloudflare建立了數據泄露防護系統。該系統通過對網絡流量進行“掃描”確保私人數據沒有被泄露。例如,它可以檢測并阻止黑客從你的數據庫中上傳數百萬個信用卡號碼到pastebin.org,或者阻止某人將帶有特定office標簽的word文檔發送到你的yahoo.com電子郵件。
實際上,我們可以將掃描網站以防止數據丟失的服務想象為數據泄露防護系統掃描儀。在此過程中,系統可能同時代理很多http請求,對性能敏感。
我們不希望用戶在打開數據泄露防護系統時,網頁瀏覽速度變慢,并因此提供了兩種構建后端API可供選擇的語言:Rust和Go。
無論使用哪種語言,構建出的后端API必須能夠與數據泄露防護系統進行互操作,并能夠共享一系列類型,如:表達用戶配置等。API服務器將用戶配置序列化為JSON,數據泄露防護系統將在需要掃描請求時反序列化該JSON。
在實際操作過程中,我更傾向于用Rust語言編寫所有序列化和反序列化程序。此外,我個人比較傾向于在系統的不同部分之間共享代碼,針對性能關鍵型服務和非性能敏感型服務使用Rust可以大大簡化整個代碼庫。
2、用Rust構建數據庫
雖然Rust在構建數據庫方面并不出色,但我還是認為它在此方面性能優良。
就拿Rust語言中的Diesel框架來說,它能夠從SQL數據庫語言之中遷移生成類型化SQL模式,從而生成所有SQL查詢。此外,當更新SQL模式時,Diesel將重新生成適當的Rust模型。
實際上,在Rust類型系統中構建SQL模型會導致一系列問題,包括:錯誤消息超過60行、毫無意義的錯誤信息、很難將公共代碼分解為共享函數等。
但總的來說,如果你的應用程序在很大程度上依賴于數據庫的許多功能,我認為有必要確保你的數據庫查詢獲得了正確的檢查類型。
數據庫查詢不是API后端中可選的額外內容,它們幾乎是你的整個代碼庫。所以確保它們正確是值得的。
3、用Rust進行業務建模
運用Rust語言中的Diesel和Serde框架,你可以在API中生成幾乎所有重要的代碼(讀取請求、執行數據庫查詢和編寫響應),從而使你有更多的時間來編寫業務程序、發布特性并進行業務建模。
重要的是,存儲用戶配置的后端API能夠在軟件中正確地模擬現實世界。如果用戶想在軟件中模擬辦公室布局,類型系統就能夠直接對辦公室建模,而不必讓用戶推送無效配置。
用戶往往希望在編譯時而不是在運行時檢測到無效的配置,從而盡量減少測試和錯誤代碼。例如,用戶的辦公室不可能同時位于兩個時區。那么,你的軟件模型就不應該能夠表示具有兩個時區的辦公室。
對了,Rust有兩個特性可以幫助你準確地進行業務建模:枚舉和不可克隆類型。
重點說下Rust的枚舉特性。它還可以被稱為“和類型”、“標記聯合”、“代數數據類型”或“帶有關聯值的枚舉”。這取決于你使用的語言。我個人比較喜歡求和類型,iphone開發者可以在Swift中使用。
準確地進行業務建模是我在構建高級API中非常關心的事情,正確性至關重要。如果需要確保我的軟件模型準確表現出現實世界,Rust比Go更好用。
現在談談Rust的“不可克隆類型”特性。在實際操作過程中,如果其中一個IP是“不健康”的,并斷開了Cloudflare連接,那么,Cloudflare需要避免重復使用這些IP,并使用一些以前沒有用過的IP。
應確保每個IP都有三種狀態:正在使用、未使用和以前使用過但現在“不健康”。這些IP中的每一個都可以分配給四個長時間TCP連接中的一個。
這聽起來像是一個很容易解決的問題,但在實際操作過程中很難對“每個IP地址最多只能分配給一個連接”的想法進行建模。我必須編寫大量單元測試程序,以找到兩個不同的連接獲取相同IP地址的邊緣情況。
Rust可以很容易地確保特定值只在一個地方使用。這需要確保使用該值的函數都必須引用它,或者確保你的類型沒有被強制Clone,并保證使用它的函數擁有該值的全部所有權。這樣,該值將能夠在移動時移動到函數中,函數可以在完成時返回該值。
所以,如果我想在Rust中實現上述操作系統,只需要保留我的10個IP地址的HashSet,也要確保IP沒有派生克隆出新類型。因此,Rust的“不可克隆類型”特性至關重要。
4、Rust的可靠性
對于你的初創公司來說,系統的可靠性很重要。我們提供的Rust后端服務的優點是它從不崩潰。在實踐中,Rust通常有更好的方法處理不同的選項。
而這種可靠性肯定會帶來開發人員的額外開銷,比如,考慮如何正確地匹配所有的Result和Option值。但對于許多領域來說,這種付出是有意義的。
值得注意的是,Rust不傾向于使用太多內存(如TCP連接或文件描述符)。因為當函數終止時,所有內容都會被刪除和清理。
在實際應用過程中,性能問題最終會變成可靠性問題。如果你的服務泄漏內存的時間足夠長,或者攝入了足夠多的數據,那么性能存在的瓶頸可能會導致服務器宕機。
5、是否應該選擇Rust
Rust作為高級系統編程語言做出了令人滿意的成績。當你在網絡開發時,它可以通過Serde和Diesel節省開發者時間。神奇的是,雖然類型系統簡化了業務建模過程,但是服務質量卻不會因此下降。
對于Rust語言的使用效果評價并不是絕對的,需要根據不用的情況進行判斷。如果你的團隊沒有過多的Rust使用經驗,在網絡開發時使用Rust可能會帶來非常糟糕的結果。Rust的使用難度極高,你應該根據具體情況引導團隊使用熟知的語言。
公司會根據不同的情況使用不同的語言。在Cloudflare, 我們執行大多數對性能敏感的服務過程中使用Rust,執行對性能寬松的服務(如,API后端)過程中則使用Go。我公司的團隊過去使用Go語言進行后端開發,由于上文提到的原因逐漸遷移至Rust語言。
對于使用Rust語言的不同權衡并非對每個團隊都有意義。這主要是由于學習Rust和在Rust中重寫核心業務庫需要耗費巨大成本。即便如此,仍有越來越多團隊愿意考慮使用Rust作為其在后端開發過程中使用的語言。
總之,不同公司應該根據自身的情況使用熟知的語言完成工作。如果你的團隊已經熟知Rust,那么,在完成高級項目過程中使用它絕對是明智的。
參考鏈接:??https://blog.adamchalmers.com/why-rust-on-backend/?