python3的變數作用域規則和nonlocal關鍵字

来源:https://www.cnblogs.com/apocelipes/archive/2019/02/20/10408836.html
-Advertisement-
Play Games

也許你已經覺得自己可以熟練使用python並能勝任許多開發任務,所以這篇文章是在浪費你的時間。不過彆著急,我們先從一個例子開始: 猜猜看輸出是什麼?你會說不就是0,1,1麽,真的是這樣嗎? 這是為什麼?如果你還不清楚產生錯誤的原因,那就請繼續往下閱讀吧! 本文索引 LEGB原則 名字隱藏和暫時性死區 ...


也許你已經覺得自己可以熟練使用python並能勝任許多開發任務,所以這篇文章是在浪費你的時間。不過彆著急,我們先從一個例子開始:

i = 0
def f():
  print(i)
  i += 1
  print(i)

f()
print(i)

猜猜看輸出是什麼?你會說不就是0,1,1麽,真的是這樣嗎?

> python test.py
Traceback (most recent call last):
  File "a.py", line 7, in <module>
    f()
  File "a.py", line 3, in f
    print(i)
UnboundLocalError: local variable 'i' referenced before assignment

這是為什麼?如果你還不清楚產生錯誤的原因,那就請繼續往下閱讀吧!

本文索引

LEGB原則

變數的作用域,這是一個老生常談的問題了。

在python中作用域規則可以簡單的歸納為LEGB原則,也就是說,對於一個變數name,首先會從當前的作用域開始查找,如果它不在函數里那就從global開始,沒找到就查找builtin作用域,如果它位於函數中,就先從local作用域查找,接著如果當前的函數是一個閉包,那麼就查找外層閉包的作用域,也就是規則中的E,接著是global和builtin,如果都沒找到name這個變數,則拋出NameError

那麼我們來看一段代碼:

i = 100
def f():
  print(i)

在這段代碼中,print位於builtin作用域,i位於global,那麼:

  1. 在函數f中找不到這兩個名字,所以從local向上查找,
  2. 首先f不是閉包,因此跳過閉包作用域的查找,
  3. 然後查找global,找到了i,但print還未找到,
  4. 然後查找builtin,找到了print的builtin模塊里的一個函數。

至此名字查找結束,調用找到的函數,輸出結果100。

現在你可能更加疑惑了,既然查找規則按照LEGB的方向進行,那麼test.py中的f不就應該找到i為global中的變數嗎,為什麼會報錯呢?

名字隱藏和暫時性死區

在揭曉答案之前,我們先複習一下名字隱藏。

它是指一個聲明在局部作用中的名字會隱藏外層作用域中的同名的對象。許多語言都遵守這一特性,python也不例外。

那麼暫時性死區是什麼呢?這是es6的一個概念,當你在局部作用域中定義了一個非全局的名字時,這個名字會綁定在當前作用域中,並將外部作用域的同名對象隱藏:

var i = 'hello'
function f() {
  i = 'world'
  let i
}

這段代碼中函數中的i被綁定在局部作用域(也就是函數體內)中,在綁定的作用域中可見,並將外部的名字隱藏,而對一個未聲明的局部變數賦值會導致錯誤,所以上面的代碼會引發ReferenceError: i is not defined

對於python來說也是一樣的問題,python代碼在執行前首先會被編譯成位元組碼,這就會導致某些時候實際執行的程式會和我們看到的產生出入。不過我們有dis模塊幫忙,它可以輸出python對象的位元組碼,下麵我們就來看下經過編譯後的f

> dis(f)

2           0 LOAD_GLOBAL              0 (print)
            2 LOAD_FAST                0 (i)
            4 CALL_FUNCTION            1
            6 POP_TOP

3           8 LOAD_CONST               1 ('a')
           10 STORE_FAST               0 (i)

4          12 LOAD_GLOBAL              0 (print)
           14 LOAD_FAST                0 (i)
           16 CALL_FUNCTION            1
           18 POP_TOP
           20 LOAD_CONST               0 (None)
           22 RETURN_VALUE

位元組碼的解釋在這裡

其中LOAD_FASTSTORE_FAST是讀取和存儲local作用域的變數,我們可以看到,i變成了局部作用域的變數!而對i的賦值早於i的定義,所以報錯了。

產生這種現象的原因也很簡單,python對函數的代碼是獨立編譯的,如果未加說明而在函數內對一個變數賦值,那麼就認為你定義了一個局部變數,從而把外部的同名對象屏蔽了。這麼做無可厚非,畢竟python沒有獨立的聲明一個局部變數的語法,但結果就會造成我們看到的類似暫時性死區的現象。所以請允許我把es6的概念套用在python身上。

消除暫時性死區

既然知道問題的癥結在於python無法區分局部變數的聲明和定義,那麼我們就來解決它。

對於一個可以區分聲明和定義的語言來說是沒有這種煩惱的,比如c:

int i = 0;
void f(void)
{
  i++;
  printf("%d\n", i); // 1
  const char *i = "hello";
  printf("%s\n", i); // "hello"
}

python中不能這麼做,但是我們可以換一個思路,聲明一個變數是全局作用域的,這樣不就解決了嗎?

global運算符就是為了這個目的而存在的,它聲明一個變數始終是全局作用域的變數,因此只要存在global聲明,那麼當前作用域里的這個名字就是一個對同名全局變數的引用。改進後的函數如下:

def f():
  global i
  print(i)
  i += 1
  print(i)

現在運行程式就會是你想要的結果了:

> python test.py
0
1
1

如果你還是不放心,那麼我們再來看看位元組碼:

> dis(f)

3           0 LOAD_GLOBAL              0 (print)
            2 LOAD_GLOBAL              1 (i)
            4 CALL_FUNCTION            1
            6 POP_TOP

4           8 LOAD_CONST               1 ('a')
           10 STORE_GLOBAL             1 (i)

5          12 LOAD_GLOBAL              0 (print)
           14 LOAD_GLOBAL              1 (i)
           16 CALL_FUNCTION            1
           18 POP_TOP
           20 LOAD_CONST               0 (None)
           22 RETURN_VALUE

對於i的存取已經由LOAD_GLOBALSTORE_GLOBAL接手了,沒問題。

當然global也有它的局限性:

  • 一旦聲明global,那麼這個名字始終是global作用域的一個變數,不可以再是局部變數
  • 名字必須存在於global里,因為python在運行時進行名字查找,所以你的變數在global里找不到的話對它的引用將會出錯
  • 接上一條,因為global限定了名字查找的範圍,所以像閉包作用域的變數就找不到了

事實上需要引用非global名字的需求是極其常見的,因此為瞭解決global的不足,python3引入了nonlocal

使用nonlocal聲明閉包作用域變數

假設我們有一個需求,一個函數需要知道自己被調用了多少次,最簡單的實現就是使用閉包:

def closure():
  count = 0
  def func():
    # other code
    count += 1
    print(f'I have be called {count} times')

  return func

還是老問題,這樣寫對嗎?

答案是不對,你又製造暫時性死區啦!

>>> f=closure()
>>> f()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 5, in func
UnboundLocalError: local variable 'count' referenced before assignment

這時候就要nonlocal出場了,它聲明一個名字位於閉包作用域中,如果閉包作用域中未找到就報錯。

所以修正後的函數如下:

def closure():
  count = 0
  def func():
    # other code
    nonlocal count
    count += 1
    print(f'I have be called {count} times')

  return func

測試一下:

>>> f=closure()
>>> f()
I have be called 1 times
>>> f()
I have be called 2 times
>>> f()
I have be called 3 times
>>> f2=closure()
>>> f2()
I have be called 1 times

現在可以正常使用和修改閉包作用域的變數了。

總結

當然,在函數里修改外部變數往往會導致潛在的缺陷,但有時這樣做又是對的,所以希望你在好好瞭解作用域規則的前提下合理地利用它們。

作用域規則可以總結為下:

  1. 名字查找按照LEGB規則進行,如果當前代碼在global中則從global作用域開始查找,否則從local開始
  2. builtin作用域中是內置類型和函數,所以它們總是能被找到,前提是不要在局部作用域中對它們賦值
  3. global中存放著所有定義在當前模塊和導入的名字
  4. local是局部作用域,存放在形成局部作用於的代碼中有賦值行為的名字
  5. 閉包作用域是閉包函數的外層作用域,裡面可以存放一些自定義的狀態
  6. global聲明一個名字在global作用域中
  7. nonlocal聲明一個名字在閉包作用域中
  8. 最重要的一條,當你在能產生局部作用域的代碼中對一個名字進行賦值,那麼這個名字就會被認為是一個local作用域的變數從而屏蔽其他作用域中的同名對象

只要記住這些規則你就可以和因作用域引起的各種問題說再見了。而且理解了這些規則還會為你探索更深層次的python打下堅實的基礎,所以請將它牢記於心。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 我一直都有一個疑問,豐巢業務服務的生產環境jvm參數設置是禁止system.gc的,也就是開啟設置:-XX:+DisableExplicitGC,但是生產環境卻從來沒有出現過堆外記憶體溢出的情況。說明一下,豐巢使用了阿裡開源的dubbo,而dubbo底層通信預設情況下使用了3.2.5.Final版本的 ...
  • 在實際開發過程中,我們有時候會遇到主線程調用子線程,要等待子線程返回的結果來進行下一步動作的業務。 那麼怎麼獲取子線程返回的值呢,我這裡總結了三種方式: Entity類 主線程等待(這個一看代碼便知曉,沒什麼問題) Join方法阻塞當前線程以等待子線程執行完畢 通過實現Callable介面 這裡又分 ...
  • 一、冒泡排序 冒泡排序(Bubble Sort)是一種交換排序,它的基本思想是:兩兩比較相鄰記錄的關鍵字,如果反序則交換,直到沒有反序的記錄為止。 進一步理解為(假設由小到大排序):對於給定的n個記錄,從第一個記錄開始依次對相鄰的兩個記錄進行比較,當前面的記錄大於後面的記錄時,交換位置,進行一輪比較 ...
  • BUG觸發時的完整報錯內容(本地無關路徑用已經用 隱去): 在解析HTML時,標簽開始部分使用形如 的瀏覽器判斷標識符,結束時結束標簽 (正確的開始和結束標簽應該為 和 )無法正常匹配關閉即可觸發。 觸發BUG的示例代碼如下: 在 Python 3.7.0 版本中,觸發BUG部分的代碼存在於 中的 ...
  • 題目1.7 1 列印沙漏 (20 分) 本題要求你寫個程式把給定的符號列印成沙漏的形狀。例如給定17個“ ”,要求按下列格式列印 所謂“沙漏形狀”,是指每行輸出奇數個符號;各行符號中心對齊;相鄰兩行符號數差2;符號數先從大到小順序遞減到1,再從小到大順序遞增;首尾符號數相等。 給定任意N個符號,不一 ...
  • 1. __new__ 和 __init__ 的區別 python 2.x 老式類(預設繼承type) 老式類中沒有__new__類方法(也就是說定義也不會執行,它不是老式類的類方法),__Init__ 作為構造函數,創建實例對象,並初始化。 過程: 類 => __init__() => 實例(sel ...
  • 題意 "題目鏈接" Sol 神仙題Orz 尾碼自動機 + 線段樹合併。。。 首先可以轉化一下模型(想不到qwq):問題可以轉化為統計$B$中每個首碼在$A$中出現的次數。(畫一畫就出來了) 然後直接對$A$串建SAM,線段樹合併維護一下siz就行了 cpp include using namespa ...
  • python多線程與多進程 多線程: 案例:掃描給定網路中存活的主機(通過ping來測試,有響應則說明主機存活) 普通版本: 運行效果如下: 在python裡面,線程的創建有兩種方式,其一使用Thread類創建導入Python標準庫中的Thread模塊 from threading import T ...
一周排行
    -Advertisement-
    Play Games
  • C#TMS系統代碼-基礎頁面BaseCity學習 本人純新手,剛進公司跟領導報道,我說我是java全棧,他問我會不會C#,我說大學學過,他說這個TMS系統就給你來管了。外包已經把代碼給我了,這幾天先把增刪改查的代碼背一下,說不定後面就要趕鴨子上架了 Service頁面 //using => impo ...
  • 委托與事件 委托 委托的定義 委托是C#中的一種類型,用於存儲對方法的引用。它允許將方法作為參數傳遞給其他方法,實現回調、事件處理和動態調用等功能。通俗來講,就是委托包含方法的記憶體地址,方法匹配與委托相同的簽名,因此通過使用正確的參數類型來調用方法。 委托的特性 引用方法:委托允許存儲對方法的引用, ...
  • 前言 這幾天閑來沒事看看ABP vNext的文檔和源碼,關於關於依賴註入(屬性註入)這塊兒產生了興趣。 我們都知道。Volo.ABP 依賴註入容器使用了第三方組件Autofac實現的。有三種註入方式,構造函數註入和方法註入和屬性註入。 ABP的屬性註入原則參考如下: 這時候我就開始疑惑了,因為我知道 ...
  • C#TMS系統代碼-業務頁面ShippingNotice學習 學一個業務頁面,ok,領導開完會就被裁掉了,很突然啊,他收拾東西的時候我還以為他要旅游提前請假了,還在尋思為什麼回家連自己買的幾箱飲料都要叫跑腿帶走,怕被偷嗎?還好我在他開會之前拿了兩瓶芬達 感覺感覺前面的BaseCity差不太多,這邊的 ...
  • 概述:在C#中,通過`Expression`類、`AndAlso`和`OrElse`方法可組合兩個`Expression<Func<T, bool>>`,實現多條件動態查詢。通過創建表達式樹,可輕鬆構建複雜的查詢條件。 在C#中,可以使用AndAlso和OrElse方法組合兩個Expression< ...
  • 閑來無聊在我的Biwen.QuickApi中實現一下極簡的事件匯流排,其實代碼還是蠻簡單的,對於初學者可能有些幫助 就貼出來,有什麼不足的地方也歡迎板磚交流~ 首先定義一個事件約定的空介面 public interface IEvent{} 然後定義事件訂閱者介面 public interface I ...
  • 1. 案例 成某三甲醫預約系統, 該項目在2024年初進行上線測試,在正常運行了兩天後,業務系統報錯:The connection pool has been exhausted, either raise MaxPoolSize (currently 800) or Timeout (curren ...
  • 背景 我們有些工具在 Web 版中已經有了很好的實踐,而在 WPF 中重新開發也是一種費時費力的操作,那麼直接集成則是最省事省力的方法了。 思路解釋 為什麼要使用 WPF?莫問為什麼,老 C# 開發的堅持,另外因為 Windows 上已經裝了 Webview2/edge 整體打包比 electron ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...