Django筆記十一之外鍵查詢優化select_related和prefetch_related

来源:https://www.cnblogs.com/hunterxiong/archive/2023/03/29/17270664.html
-Advertisement-
Play Games

點右上角加星標,江湖要事早知道 前幾天在脈脈上看到一個熱議話題“23年找工作的心酸歷程” 大家都知道近幾年互聯網大環境不好,找工作變得越來越捲了、 就算是BAT這種大廠出來的,也不見得就有多好找工作,可想而知,如果你的背景和能力不是特別強,很有可能練簡歷關都過不了。 特別是工作時間久的老程式員,總包 ...


本篇筆記目錄如下:

  1. select_related
  2. prefetch_related

在介紹 select_related 和 prefetch_related 這兩個函數前,我們先來看一個例子。

對於,Entry 和 Blog 這兩個 model,前面介紹過,Blog 是 Entry 的外鍵,如下:

class Blog(models.Model):
    name = models.CharField(max_length=100)
    tagline = models.TextField()


class Entry(models.Model):
    blog = models.ForeignKey(Blog, on_delete=models.CASCADE)
    headline = models.CharField(max_length=255)
    body_text = models.TextField()
    pub_date = models.DateField()
    mod_date = models.DateField()
    authors = models.ManyToManyField(Author)
    number_of_comments = models.IntegerField()
    number_of_pingbacks = models.IntegerField()
    rating = models.IntegerField()

比如我們需要獲取 Entry 的前十條數據,然後列印出關聯的 Blog 的 name 欄位信息。

我們一般會如此操作:

for entry in Entry.objects.all()[:10]
	if entry.blog:
		print(entry.blog.name)
	else:
		print("沒有關聯 blog 數據")

但是這樣會有一個問題,那就是,這個 for 迴圈的操作會查詢數據十一次,一次查詢 Entry 數據,十次是查詢每個 entry_obj 關聯的 blog 數據。

這個設計對於系統來說是不合理的,想一想如果我們查詢的數據是一千條,一萬條,無論是系統介面的等待時間,還是資料庫的訪問壓力,都是不可接受的。

因此我們可以引入 外鍵 和 ManyToManyTo 的一種能夠減少資料庫的訪問次數的方式:select_related,prefetch_related。

當我們在使用的時候,如果有需要獲取的外鍵數據,比如 Entry 關聯的 Blog 數據,則可以將其欄位名作為參數傳入,這樣在獲取數據的時候就可以一次性將所有關聯的 Blog 數據也取出來,而不用單獨再去查詢一遍資料庫。

如下,批量操作

for entry in Entry.objects.select_related("blog").all():
	print(e.blog)  # 這個操作不會額外再去查詢資料庫

當然也適用於單條數據

e = Entry.objects.get(id=5).select_related("blog")

為了驗證 select_related() 確實會只查詢一遍資料庫,有兩種方法:
一種是在資料庫層面列印出來所有查詢的 SQL語句,
另一種可以從側面表示,那就是在系統層面列印出我們的查詢條件轉化的 SQL 語句。

比如:

Entry.objects.select_related("blog").all().query.__str__()

可以看到會輸出一個 關聯了 Blog 表的 inner join 的 SQL 語句。

SELECT `blog_entry`.`id`, `blog_entry`.`blog_id`, `blog_entry`.`headline`, `blog_entry`.`body_text`, `blog_entry`.`pub_date`, `blog_entry`.`mod_date`, `blog_entry`.`number_of_comments`, `blog_entry`.`number_of_pingbacks`, `blog_entry`.`rating`, `blog_blog`.`id`, `blog_blog`.`name`, `blog_blog`.`tagline` FROM `blog_entry` INNER JOIN `blog_blog` ON (`blog_entry`.`blog_id` = `blog_blog`.`id`)

鏈式獲取外鍵數據

比如下麵的 model:

class City(models.Model):
    pass


class Person(models.Model):
    hometown = models.ForeignKey(
        City, on_delete=models.SET_NULL, blank=True, null=True)


class Book(models.Model):
    author = models.ForeignKey(Person, on_delete=models.CASCADE)

我們可以通過以下語句來將 Book 關聯的 Person,以及該條 Person 數據關聯的 City 數據一起查詢出來:

book = Book.objects.select_related("author__hometown").get(id=4)
person = book.author
city = person.hometown

因為我們在第一步查詢的時候,通過雙下劃線將兩個外鍵欄位連接在一起取了出來,所以在第二步和第三步取 Person 數據和 City 數據的時候,就不需要再次查詢資料庫了。

同時獲取多個外鍵關聯欄位

如果一個 model 有兩個外鍵欄位 foo 和 bar,那麼下麵的兩種寫法都將這兩個外鍵欄位關聯取出:

select_related("foo", "bar")
select_related("foo").select_related("bar")

需要註意的是,這個鏈式的操作和 order_by() 的結果是不一樣的哦,前面提到的 order_by() 的鏈式操作會導致後面的覆蓋前面的,但是取外鍵數據的時候會同時取出。

註意: select_related() 僅作用於 ForeignKey 和 OneToOne,如果是 ManyToMany 欄位,則需要用到下麵的 prefetch_related() 函數。

prefetch_related() 和 select_related() 作用類似,都是通過減少查詢的次數,來實現查詢優化。

但 prefetch_related() 是針對 ManyToMany 的操作。

舉個例子:

from django.db import models


class Topping(models.Model):
    name = models.CharField(max_length=30)


class Pizza(models.Model):
    name = models.CharField(max_length=50)
    toppings = models.ManyToManyField(Topping)


    def __str__(self):
        return "%s (%s)" % (
            self.name,
            ", ".join(topping.name for topping in self.toppings.all()),
        )

當我們執行:

Pizza.objects.all()

的時候,因為每一條 Pizza 數據實例化的時候,都會調用 str() 函數,而這個函數會再次去請求一遍資料庫,所以多條 Pizza 數據會導致查詢多次資料庫。

因為我們可以使用 prefetch_related() 函數來達到減少查詢的目的:

Pizza.objects.prefetch_related('toppings').all()

這樣的話,對資料庫的查詢會減少到兩次,一次是查詢出所有的 Pizza 數據,一次是根據所有的 pizza_id 找到所有關聯的 topping 數據。

如果有興趣,可以比對下麵兩條語句在 shell 中執行的時候,MySQL 伺服器接收到的 SQL 查詢語句:

Pizza.objects.all()

Pizza.objects.prefetch_related('toppings').all()

下麵一種情況需要註意哦:

pizzas = Pizza.objects.prefetch_related('toppings')
[list(pizza.toppings.filter(spicy=True)) for pizza in pizzas]

因為第二步操作里,會對 toppings 數據進行一次新的 filter 過濾操作,所以會導致每次該語句重新去查詢資料庫,也就是說,我們的 prefetch_related() 操作是失效的。

以上就是本篇筆記全部內容,接下來會介紹查詢里的 defer 和 only 函數。

本文首發於本人微信公眾號:Django筆記。

原文鏈接:Django筆記十一之外鍵查詢優化select_related和prefetch_related

如果想獲取更多相關文章,可掃碼關註閱讀:
image


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 定義 觀察者模式屬於行為型模式,它定義了對象間的一種一對多的依賴關係,當一個對象的狀態發生改變時,所有依賴於它的對象都將得到通知,並自動更新。 一種一對多的關係中一稱為被觀察者也叫目標對象Subject而多則稱為觀察者對象Observer 觀察者模式中通常有兩個模型,一個觀察者(observer)和 ...
  • UML 類圖 1 類圖的結構 用動物園的類圖結構來舉例,先抽象化動物類如圖所示: 一個類圖包括類名、屬性和行為,類名不用解釋,在介紹屬性和行為前,先瞭解一下訪問許可權: ‘ - ’ private:只有類內部的成員才能訪問 ‘ + ’ public:類內部和類外部都能訪問 ‘ # ’ protecte ...
  • XSS攻擊是什麼? XSS攻擊是指攻擊者利用網站中的漏洞,向頁面中註入惡意腳本,從而獲取用戶的信息或者控制用戶的電腦。 舉一個通俗的例子,早期使用JSP頁面渲染頁面的項目,如果將用戶名改成nick<alert>1</alert>,則當用戶打開頁面時,就會彈出一個警告框,而這個警告框可以被惡意腳本所 ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 SkipHeapFreeLeaks 的使用方法。 ...
  • 文章目錄 限流基本概念 QPS和連接數控制 傳輸速率 黑白名單 分散式環境 限流方案常用演算法 令牌桶演算法 漏桶演算法 滑動視窗 常用的限流方案 Nginx限流 中間件限流 限流組件 合法性驗證限流 Guava限流 網關層限流 從架構維度考慮限流設計 具體的實現限流的手段: Tomcat限流 限流基本概 ...
  • 1.魔法函數 python中常見的內置類型 什麼是魔法函數? python的魔法函數總被雙下劃線包圍,它們可以給你的類增加特殊的方法。如果你的對象實現了這些方法中的一個,那麼這個方法就會在特殊情況下被調用,你可以定義想要 的行為,而這一切都是自動發生的。 魔法函數一覽 魔法函數舉例 1.1.__ge ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 TraceInternalFrames 的使用方法。 ...
  • 分數 20 本題要求你從任意給定的兩個 1 位數字 a1​ 和 a2​ 開始,用乘法口訣生成一個數列 {an​},規則為從 a1​ 開始順次進行,每次將當前數字與後面一個數字相乘,將結果貼在數列末尾。如果結果不是 1 位數,則其每一位都應成為數列的一項。 輸入格式: 輸入在一行中給出 3 個整數,依 ...
一周排行
    -Advertisement-
    Play Games
  • 1、預覽地址:http://139.155.137.144:9012 2、qq群:801913255 一、前言 隨著網路的發展,企業對於信息系統數據的保密工作愈發重視,不同身份、角色對於數據的訪問許可權都應該大相徑庭。 列如 1、不同登錄人員對一個數據列表的可見度是不一樣的,如數據列、數據行、數據按鈕 ...
  • 前言 上一篇文章寫瞭如何使用RabbitMQ做個簡單的發送郵件項目,然後評論也是比較多,也是準備去學習一下如何確保RabbitMQ的消息可靠性,但是由於時間原因,先來說說設計模式中的簡單工廠模式吧! 在瞭解簡單工廠模式之前,我們要知道C#是一款面向對象的高級程式語言。它有3大特性,封裝、繼承、多態。 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 介紹 Nodify是一個WPF基於節點的編輯器控制項,其中包含一系列節點、連接和連接器組件,旨在簡化構建基於節點的工具的過程 ...
  • 創建一個webapi項目做測試使用。 創建新控制器,搭建一個基礎框架,包括獲取當天日期、wiki的請求地址等 創建一個Http請求幫助類以及方法,用於獲取指定URL的信息 使用http請求訪問指定url,先運行一下,看看返回的內容。內容如圖右邊所示,實際上是一個Json數據。我們主要解析 大事記 部 ...
  • 最近在不少自媒體上看到有關.NET與C#的資訊與評價,感覺大家對.NET與C#還是不太瞭解,尤其是對2016年6月發佈的跨平臺.NET Core 1.0,更是知之甚少。在考慮一番之後,還是決定寫點東西總結一下,也回顧一下.NET的發展歷史。 首先,你沒看錯,.NET是跨平臺的,可以在Windows、 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 添加節點(nodes) 通過上一篇我們已經創建好了編輯器實例現在我們為編輯器添加一個節點 添加model和viewmode ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...
  • 類型檢查和轉換:當你需要檢查對象是否為特定類型,並且希望在同一時間內將其轉換為那個類型時,模式匹配提供了一種更簡潔的方式來完成這一任務,避免了使用傳統的as和is操作符後還需要進行額外的null檢查。 複雜條件邏輯:在處理複雜的條件邏輯時,特別是涉及到多個條件和類型的情況下,使用模式匹配可以使代碼更 ...
  • 在日常開發中,我們經常需要和文件打交道,特別是桌面開發,有時候就會需要載入大批量的文件,而且可能還會存在部分文件缺失的情況,那麼如何才能快速的判斷文件是否存在呢?如果處理不當的,且文件數量比較多的時候,可能會造成卡頓等情況,進而影響程式的使用體驗。今天就以一個簡單的小例子,簡述兩種不同的判斷文件是否... ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...