MongoDB聚合(aggregate)

来源:https://www.cnblogs.com/kungfupanda/archive/2020/04/04/12630198.html
-Advertisement-
Play Games

https://www.cnblogs.com/wt7018/p/11929359.html MongoDB聚合(aggregate) 一、基礎 1、什麼是聚合? 聚合是基於數據處理的聚合管道,每個文檔通過一個有多個階段(stage)組成的管道可以對每個階段的管道進行分組、過濾等功能,然後經過一系列 ...


 

https://www.cnblogs.com/wt7018/p/11929359.html

MongoDB聚合(aggregate)

 

一、基礎

1、什麼是聚合?

聚合是基於數據處理的聚合管道,每個文檔通過一個有多個階段(stage)組成的管道
可以對每個階段的管道進行分組、過濾等功能,然後經過一系列的處理,輸出相應的結果

db.集合名稱.aggregate({管道: {表達式}})

有點像Django中ORM聚合的語法

2、常用管道

複製代碼
$group: 將集合中的文檔分組,用於統計結果
$match: 過濾數據,只輸出符合條件的文檔
$project: 修改輸入文檔的結構,如重命名、增加、刪除欄位、創建計算結果

$sort: 將輸入文檔排序後輸出
$limit: 限制聚合管道返回的文檔數
$skip: 跳過指定數量的文檔,並返回餘下的文檔
$unwind(): 將列表(數組)類型的欄位進行拆分
複製代碼

3、常用表達式

複製代碼
處理輸入文檔,並輸出
語法: 表達式:'$列名'
常用表達式
$sum: 計算總和, $sum:1 表示以一倍計數
$avg: 計數平均值
$min: 獲取最小值
$max: 獲取最大值
$push: 在結果文檔中插入值到一個數組中
$first: 根據資源文檔的排序獲取第一個文檔數據
$last: 根據資源文檔的排序獲取最後一個文檔數據
複製代碼

二、常用管道用法

1、$group

複製代碼
作用: 將集合中的文檔分組,可用於統計結果
_id表示分組的依據,使用某個欄位的格式為'$欄位'
格式
db.集合名稱.aggregate({$group:{ _id: '$欄位', 自定義欄位: {表達式: '$欄位'}}})

db.stu.aggregate({$group: {_id: '$gender'}})
db.stu.aggregate({$group: {_id: '$gender', count: {$sum: 1}}})
db.stu.aggregate({$group: {_id: '$gender', avg_age: {$avg: '$age'}}})
db.stu.aggregate({$group: {_id: '$hometown', min_age: {$min: '$age'}, count: {$sum: 1}}})

註意: 
    _id後面的值,表示按照什麼分組,格式'$欄位'
    count, avg_count是自定義的欄位
    表達式的值是'$欄位'
複製代碼

Group by null

將集合中所用文檔分為一組,即該集合就是一個組
# 求學生的總量和平均年齡
db.stu.aggregate({$group: {_id: null, count:{$sum: 1}, avg_age:{$avg: '$age'}}})

補充

複製代碼
# 插入數據

db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "b"})
db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "c"})
db.test.insert({country: "china", province: "bj", userid: "da"})
db.test.insert({country: "china", province: "bj", userid: "fa"})

# 1.去重
能夠同時按照多個鍵進行分組,若文檔中的每個欄位都進行分組,那麼可以實現去重的功能
db.test.aggregate({$group: {_id: {country: '$country', province: '$province'}}})
# 2.取字典嵌套的字典中的值 
_id: {contry: '$_id.country'}
例子
db.test.aggregate(
{$group: {_id: {country: '$country', province: '$province', userid: '$userid'}}},  
{$group: {_id: {country: '$_id.country', province: '$_id.province'}, count: {$sum: 1}}}, 
{$project: {country: '$_id.country', province: '$_id.province', count: '$count', _id: 0}}
)
複製代碼

2、$project

複製代碼
作用:修改輸入文檔的結構,如重命名、增加(顯示)、刪除(隱藏)欄位,創建計算結果
1.顯示和隱藏
格式: 
db.集合名稱.aggregate({$project: {_id: 0, 欄位:1}})
值為0,是隱藏
值為1,是顯示
示例
db.stu.aggregate({$project: {_id: 0, name: 1, hometown: 1, age: 1, gender: 1}})
註意: 顯示、隱藏欄位和投影差不多
2.重命名
例子
db.stu.aggregate({$group: {_id: '$gender', count: {$sum: 1}, avg: {$avg: '$age'}}}, {$project: {_id: 0,gender: '$_id', counter: '$count', avg_age: '$avg'}})
註意: 
重命名欄位格式 {新的欄位名: '$舊的欄位名稱'}
管道符之間用逗號隔
複製代碼

3、$match

複製代碼
作用: 用於過濾數據,只輸出符合條件的文檔
註意: match是管道命令,能將結果交給下一個管道,find不可以
例子
db.stu.aggregate({$match: {age: {$lte: 18}}})
# 過濾->分組->重命名、顯示
db.stu.aggregate({$match: {age: {$lte: 18}}}, {$group: {_id: '$gender', count: {$sum: 1}}}, {$project: {gender: '$_id', _id: 0, count: 1}})
複製代碼

 4、$limit和$skip

複製代碼
$limit
限制聚合管道返回的文檔數
例子
db.stu.aggregate({$limit: 2})

$skip
跳過指定數量的聚合管道文檔。並返回剩下的文檔
例子
db.stu.aggregate({$skip: 2})
db.stu.aggregate({$limit: 2}, {$skip: 3})
註意順序:先寫skip,再寫limit
複製代碼

5、$unwind

複製代碼
# unwind 解開,鬆開
作用: 將文檔中的某一個數組類型欄位拆分成多條,每條包含數組中的一個值
格式:
db.集合名稱.aggregate({$unwind: '$欄位名稱'})
例子
db.t2.insert({_id: 1, item:'t-shirt', size: ['S', 'M', 'L']})
db.t2.aggregate({$unwind: '$size'})
結果:
{ "_id" : 1, "item" : "t-shirt", "size" : "S" }
{ "_id" : 1, "item" : "t-shirt", "size" : "M" }
{ "_id" : 1, "item" : "t-shirt", "size" : "L" }

# 補充

db.集合名稱.aggregate({
    $unwind: {
        path: '$欄位名稱',
        preserveNullAndEmptyArrays: <boolean>  # 防止數據丟失
    }
})
屬性preserveNullAndEmptyArrays值
為false表示拋棄屬性值為空的文檔
為true表示保留屬性值為空的文檔

例子
db.t3.aggregate({$unwind: {path: '$size', preserveNullAndEmptyArrays: false}})

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • VCL(varnish configuration lanuage)是“域”專有類型的配置語言,主要用於編寫緩存策略的,VCL有多個狀態引擎,狀態之間存在相關性,但狀態引擎彼此互相隔離;每個狀態引擎可使用return(X)指明至那個下一級引擎;每個狀態引擎對應於vcl文件中的一個配置端,即為sub... ...
  • 有時候,我們在使用 Linux 系統時,會出現下麵這樣的情景: 1. 一個命令或程式需要很長時間才能運行完畢,在這過程中,系統可能會假死,我們做任何操作都沒用,只好重啟系統; 2. 我們僅僅想讓命令或程式運行指定的時間,到了時間點就讓命令/程式中止; 3. Log 刷新很快,但我們只需要 10 秒鐘 ...
  • 一 CSI存儲機制 1.1 CSI簡介 Kubernetes從1.9版本開始引入容器存儲介面Container Storage Interface(CSI)機制,用於在Kubernetes和外部存儲系統之間建立一套標準的存儲管理介面,通過該介面為容器提供存儲服務。 1.2 CSI的設計背景 Kube ...
  • 一 StoragClass 1.1 StorageClass概述 StorageClass作為對存儲資源的抽象定義,對用戶設置的PVC申請屏蔽後端存儲的細節,一方面減少了用戶對於存儲資源細節的關註,另一方面減輕了管理員手工管理PV的工作,由系統自動完成PV的創建和綁定,實現了動態的資源供應。 基於S ...
  • Cannot connect to the Docker daemon. Is the docker daemon running on this host? 原因: 沒有啟動docker服務 service docker start 效果: docker stop showdoc # 停止容器 d ...
  • 在目錄下創建新文件時出現 ,原因是用戶許可權不足。 解決方法是給用戶添加修改許可權,在根目錄執行以下命令: Linux/Unix 的文件調用許可權分為三級 : 文件擁有者、群組、其他。利用 chmod 可以藉以控制文件如何被他人所調用。 語法為: R : 對目前目錄下的所有文件與子目錄進行相同的許可權變更( ...
  • MySQL是一個開放源碼的小型關聯式資料庫管理系統,開發者為瑞典MySQL AB公司, 目前屬於Oracle公司,MySQL被廣泛地應用在Internet上的中小型網站中。由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網站為了降低網站總體擁有成本而選擇了MySQL作為網站數 ...
  • 1、 Linux操作系統簡介 Linux具有如下優點: 穩定、免費或者花費少 安全性高 多任務,多用戶 耗資源少 由於內核小,所以它可以支持多種電子產品,如:Android手機、PDA等。 2、 Linux發展趨勢 隨著IT產業的不斷發展,用戶對網站體驗要求也越來越高,目前主流網站後端承載系統都是L ...
一周排行
    -Advertisement-
    Play Games
  • GoF之工廠模式 @目錄GoF之工廠模式每博一文案1. 簡單說明“23種設計模式”1.2 介紹工廠模式的三種形態1.3 簡單工廠模式(靜態工廠模式)1.3.1 簡單工廠模式的優缺點:1.4 工廠方法模式1.4.1 工廠方法模式的優缺點:1.5 抽象工廠模式1.6 抽象工廠模式的優缺點:2. 總結:3 ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 本章將和大家分享ES的數據同步方案和ES集群相關知識。廢話不多說,下麵我們直接進入主題。 一、ES數據同步 1、數據同步問題 Elasticsearch中的酒店數據來自於mysql資料庫,因此mysql數據發生改變時,Elasticsearch也必須跟著改變,這個就是Elasticsearch與my ...
  • 引言 在我們之前的文章中介紹過使用Bogus生成模擬測試數據,今天來講解一下功能更加強大自動生成測試數據的工具的庫"AutoFixture"。 什麼是AutoFixture? AutoFixture 是一個針對 .NET 的開源庫,旨在最大程度地減少單元測試中的“安排(Arrange)”階段,以提高 ...
  • 經過前面幾個部分學習,相信學過的同學已經能夠掌握 .NET Emit 這種中間語言,並能使得它來編寫一些應用,以提高程式的性能。隨著 IL 指令篇的結束,本系列也已經接近尾聲,在這接近結束的最後,會提供幾個可供直接使用的示例,以供大伙分析或使用在項目中。 ...
  • 當從不同來源導入Excel數據時,可能存在重覆的記錄。為了確保數據的準確性,通常需要刪除這些重覆的行。手動查找並刪除可能會非常耗費時間,而通過編程腳本則可以實現在短時間內處理大量數據。本文將提供一個使用C# 快速查找並刪除Excel重覆項的免費解決方案。 以下是實現步驟: 1. 首先安裝免費.NET ...
  • C++ 異常處理 C++ 異常處理機制允許程式在運行時處理錯誤或意外情況。它提供了捕獲和處理錯誤的一種結構化方式,使程式更加健壯和可靠。 異常處理的基本概念: 異常: 程式在運行時發生的錯誤或意外情況。 拋出異常: 使用 throw 關鍵字將異常傳遞給調用堆棧。 捕獲異常: 使用 try-catch ...
  • 優秀且經驗豐富的Java開發人員的特征之一是對API的廣泛瞭解,包括JDK和第三方庫。 我花了很多時間來學習API,尤其是在閱讀了Effective Java 3rd Edition之後 ,Joshua Bloch建議在Java 3rd Edition中使用現有的API進行開發,而不是為常見的東西編 ...
  • 框架 · 使用laravel框架,原因:tp的框架路由和orm沒有laravel好用 · 使用強制路由,方便介面多時,分多版本,分文件夾等操作 介面 · 介面開發註意欄位類型,欄位是int,查詢成功失敗都要返回int(對接java等強類型語言方便) · 查詢介面用GET、其他用POST 代碼 · 所 ...
  • 正文 下午找企業的人去鎮上做貸後。 車上聽同事跟那個司機對罵,火星子都快出來了。司機跟那同事更熟一些,連我在內一共就三個人,同事那一手指桑罵槐給我都聽愣了。司機也是老社會人了,馬上聽出來了,為那個無辜的企業經辦人辯護,實際上是為自己辯護。 “這個事情你不能怪企業。”“但他們總不能讓銀行的人全權負責, ...