作者 | Serdar Yegulalp譯者 | 姜松浩,責編 | 屠敏轉載自 CSDN(ID:CSDNnews)
Python因其強大、靈活且易于使用等特性,而贏得了聲譽。這些優點使其在各種各樣的應用程序、工作流程和領域中得到了廣泛應用。但是就語言的設計,也就是它天然的解釋能力還有它的運行時的動態性而言,Python總是比C或C ++這樣的機器本地語言慢一個數量級。
多年來,開發人員已經為Python的速度限制提出了各種變通方法。例如你可以在C中編寫性能密集型任務并使用Python封裝它,許多機器學習庫正是這樣做的。或者你可以使用Cython,這個項目可以將Python種加上運行時類型信息以便編譯為C,通過這種方式來允許你使用Python代碼。
但變通辦法從來都不是理想的。如果我們能夠按原樣使用現有的Python程序并以更快的速度運行它,那不是很好嗎?這正是PyPy允許你做的事情。
PyPy與CPython
PyPy是Python解釋器CPython的直接替代品。CPython將Python編譯為中間字節碼然后由虛擬機解釋,而PyPy使用實時(JIT)編譯將Python代碼轉換為本地機器的匯編語言。
根據正在執行的任務,性能提升可能會非常顯著。平均而言,PyPy將Python加速了大約7.6倍,一些任務加速了50倍或更多。CPython解釋器根本不會執行與PyPy一樣的優化方式,并且可能永遠不會,因為這不是它的設計目標之一。
最好的部分是開發人員需要很少甚至不需要努力來解鎖PyPy提供的收益。只需將CPython替換為PyPy,并且大部分都已完成。下面討論了一些例外,但是PyPy的目標是運行現有的,并且未經修改的Python代碼并為其提供自動化的速度提升。
PyPy目前通過項目的不同版本支持Python 2和Python 3。換句話說,你需要下載不同版本的PyPy,具體取決于你運行的Python版本。 PyPy的Python 2分支已經存在了很長時間,但到目前為止,python 3版本的速度已經提高了很多。PyPy目前支持Python 3.5(發布版本)和Python 3.6(beta版本)。
除了支持所有核心Python語言外,PyPy還可以與Python生態系統中的絕大多數工具配合使用,例如用于打包的pip或用于虛擬環境的virtualenv。大多數Python軟件包,即使是那些帶有C模塊的軟件包,都會按照原樣運行。當然,也存在一些限制,我們將在下面介紹一些限制。
PyPy如何工作
PyPy使用其他即時編譯器中的動態語言優化技術。它分析運行的Python程序,以確定在程序中創建和使用對象時的類型信息,然后使用該類型信息作為指導來加快速度。例如,如果Python函數僅使用一種或兩種不同的對象類型,PyPy會生成機器代碼來處理這些特定情況。
PyPy的優化是在運行時自動處理,因此你通常不需要調整其性能。高級用戶可能會嘗試使用PyPy的命令行選項來為特殊情況生成更快的代碼,但這種情況通常很少需要。
PyPy也脫離了CPython處理一些內部函數的方式,但它同時試圖保留兼容的行為。例如PyPy處理垃圾回收的方式與CPython不同。并非所有對象一旦超出范圍就立即回收,所以在PyPy下運行的Python程序可能比在CPython下運行時顯示占用更大的內存。但你仍然可以使用通過gc模塊公開的Python高級垃圾回收控件,例如gc.enable(),gc.disable()和gc.collect()等等。
如果你想在運行時獲得有關PyPy的JIT(實時)行為的信息,PyPy包含一個模塊pypyjit,它向你的Python應用程序公開了許多JIT關聯信息。如果你的某個功能或模塊在JIT上表現不佳,那么pypyjit可以讓你獲得有關它的詳細統計信息。
另一個特定于PyPy的模塊,__pypy__暴露了PyPy特有的其他功能,因此對于編寫利用這些功能的應用程序非常有用。由于Python的運行的動態性,有可能構建在PyPy存在時使用這些功能的Python應用程序,而在不存在時忽略它們。
PyPy的限制
可能看PyPy起來像魔法一樣神奇,但其實它并不神奇。 PyPy同樣具有某些限制,可以削弱或消除某些程序的有效性。唉,PyPy不是CPython運行時的完全的通用替代品。
PyPy最適合純Python的應用程序
PyPy在“純”Python應用程序中表現最佳,換句話說也就是用Python編寫的沒有夾雜其他語言的應用程序中表現最佳。由于PyPy模仿CPython的本機二進制接口的方式,與C庫(如NumPy)接口的Python包也沒有那么出類拔萃了。
PyPy的開發人員已經解決了這個問題,并使PyPy與大多數依賴于C擴展的Python包更加兼容。例如Numpy現在與PyPy兼容的非常好。但是,如果你希望與C的擴展最大程度地兼容,請使用CPython。
PyPy適用于運行時間較長的程序
PyPy優化Python程序的一個副作用是,運行時間較長的程序通過PyPy的優化獲益最多。程序運行的時間越長,PyPy可以收集的運行時類型信息就越多,它可以進行的優化就越多。一勞永逸的Python腳本不會從這種事情中受益。例如受益的Python應用程序通常具有長時間循環運行的行為,或者在Web框架的后臺中連續運行。
PyPy沒有預編譯
PyPy編譯Python代碼,但它不是Python代碼的編譯器。由于PyPy執行其優化的方式和Python的固有動態特點,因此無法將生成的JITted代碼作為獨立二進制文件發出并重新使用它。每次運行都必須編譯每個程序。如果你想將Python編譯成可以作為獨立應用程序運行的更快的代碼,那么還是請使用Cython、Numba或當前實驗性的Nuitka項目。
原文:
https://www.infoworld.com/article/3385127/what-is-pypy-faster-python-without-pain.html