一、Python全局解釋器鎖GIL(Global Interpreter Lock)
簡單來說,Python全局解釋器鎖(Global Interpreter Lock)或GIL是一個互斥鎖,它只允許一個線程來控制Python解釋器。
這意味著在任何時間點只有一個線程可以處于執行狀態。執行單線程程序的開發人員感受不到GIL的影響,但它可能是CPU限制型和多線程代碼中的性能瓶頸。
由于即使在具有多個CPU核心的多線程架構中,GIL一次只允許一個線程執行,因此GIL已經成為Python“臭名昭著”的特性。
GIL為Python解決了什么問題
Python使用引用計數進行內存管理。這意味著在Python中創建的對象具有引用計數變量,該變量用于跟蹤指向該對象的引用數。當此計數達到零時,釋放對象占用的內存。
讓我們看一個簡短的代碼示例來演示引用計數的工作原理:
>>>?
>>> import sys
>>> a = []
>>> b = a
>>> sys.getrefcount (a)
3
在上面的示例中,空列表對象的引用計數為3。列表對象由a,b引用并且參數傳遞給sys.getrefcount()。
回到GIL:
問題是這個引用計數變量需要保護競爭條件。如果其中兩個線程同時增加或減少其值,如果發生這種情況,它可能導致從未釋放的內存泄漏,或者更糟糕的是,在對該對象的引用仍然存在時錯誤地釋放內存。這可能會導致Python程序中出現崩潰或其他“怪異”錯誤。通過向跨線程共享的所有數據結構添加鎖,可以保持此引用計數變量的安全性,從而不會對它們進行不一致的修改。
但是為每個對象或對象組添加一個鎖意味著將存在多個鎖,這可能導致另一個問題 – 死鎖(死鎖只有在有多個鎖時才會發生)。另一個副作用是由于重復獲取和釋放鎖而導致性能下降。
GIL是解釋器本身的單個鎖,它增加了一條規則,即執行任何Python字節碼都需要獲取解釋器鎖。這可以防止死鎖(因為只有一個鎖)并且不會引入太多的性能開銷。但它有效地使任何受CPU限制的Python程序都是單線程的。
GIL雖然被解釋器用于其他語言(如Ruby),但并不是解決此問題的少數方法。有些語言通過使用除引用計數之外的方法(例如垃圾收集)來避免GIL對線程安全內存管理的要求。
另一方面,這意味著這些語言通常需要通過添加其他性能提升性能(如JIT編譯器)來彌補GIL單線程性能優勢的損失。
為什么選擇GIL作為解決方案
那么,為什么在Python中使用的方法看似如此阻礙呢?這是Python開發人員的糟糕決定嗎?
好吧,用Larry Hastings的話來說, GIL的設計決定是讓Python像今天一樣受歡迎的原因之一。
自從操作系統沒有線程概念以來,Python就已存在。Python的設計易于使用,以便更快地開發,越來越多的開發人員開始使用它。
開發人員正在為Python需要的功能編寫許多C庫擴展。為了防止不一致的更改,這些C擴展需要GIL提供的線程安全內存管理。
GIL易于實現,很容易添加到Python中。它為單線程程序提供了性能提升,因為只需要管理一個鎖。
非線程安全的C擴展變得更容易集成。這些C擴展成為不同社區愿意采用Python的原因之一。
正如您所看到的,GIL是一個實用的解決方案,可以解決CPython開發人員在Python生命中早期面臨的一個難題。
對多線程Python程序的影響
當您查看典型的Python程序或任何計算機程序時,那些在性能上受CPU限制的程序與受I / O限制的程序之間存在差異。
CPU綁定程序是那些將CPU推向極限的程序。這包括進行數學計算的程序,如矩陣乘法,搜索,圖像處理等。
I / O綁定程序是花費時間等待輸入/輸出的程序,它可以來自用戶,文件,數據庫,網絡等。I / O綁定程序有時需要等待很長時間才能完成從源獲取他們需要的東西,因為源可能需要在輸入/輸出準備好之前進行自己的處理,例如,用戶考慮輸入什么輸入提示或在其中運行的數據庫查詢自己的過程。
延伸閱讀:
二、什么是Python
Python是一種跨平臺的計算機程序設計語言。 是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。最初被設計用于編寫自動化腳本(shell),隨著版本的不斷更新和語言新功能的添加,越多被用于獨立的、大型項目的開發。