Rust的Cow類型有什麼用?詳解Cow及其用途

来源:https://www.cnblogs.com/cinea/p/18040997
-Advertisement-
Play Games

Rust的智能指針有哪些?大多數人都能馬上答出Box<T>、Rc<T>和Arc<T>、Ref<T>和在非同步編程中很常見的Pin<P>等等。不過,有一個可能經常被大多數人遺忘的類型,它功能強大,利用好了可以節省很多複製開銷;它就是這篇文章的主角:Cow<B>。 什麼是COW(Copy-On-Write ...


Rust的智能指針有哪些?大多數人都能馬上答出Box<T>Rc<T>Arc<T>Ref<T>和在非同步編程中很常見的Pin<P>等等。不過,有一個可能經常被大多數人遺忘的類型,它功能強大,利用好了可以節省很多複製開銷;它就是這篇文章的主角:Cow<B>

什麼是COW(Copy-On-Write)?

在開始之前,有必要先介紹一下COW(Copy-On-Write,寫時複製)的概念。COW是一種用於資源管理的優化策略,在操作系統中應用非常廣泛。COW的核心思想是當多個任務需要讀取同一個資源(比如記憶體中的數據、文件)的時候,它們會共用同一份資源副本,而不是為每個任務複製一份資源副本。只有當某個任務需要修改這個資源時,才會為這個任務創建一份資源副本。

需要註意的是,上述的整個過程對任務(也就是程式員編寫的用戶程式)來說都是不可見的;對程式員來說,他並不知道他所使用的資源在發生寫操作時才被真正地複製了一份,自始至終他仿佛就像在獨占整份資源一樣。

COW在文件系統、虛擬記憶體管理中都有非常成熟的應用;在編程語言中,也被廣泛應用於優化字元串、集合的處理。

Cow:定義

Rust的Cow<B>是一個枚舉類型,包含兩個成員:BorrowedOwned。不過,我們幾乎不會直接用到它的成員,因為Cow<B>實現了Deref特征,這使得我們可以通過Deref轉換這一語法糖來便捷地直接使用Cow<B>中的內容。有關Deref轉換可以閱讀我之前的文章。

pub enum Cow<'a, B>
where
    B: 'a + ToOwned + ?Sized,
{
    Borrowed(&'a B),
    Owned(<B as ToOwned>::Owned),
}

需要註意一下Cow的模板參數。Cow接受一個生命周期和一個類型B,其中類型B需要實現ToOwned特征;ToOwned特征的介紹可以看之前的文章,這裡僅僅提一下所有實現了Clone的類型都會自動實現ToOwned自身。除此以外,成員Owned的內容類型不是類型B本身,而是類型BToOwned的目標類型(例如對str來說,這個類型是String)。

使用方法

這裡是一段Cow<B>的簡單使用範例:

use std::borrow::Cow;

fn main() {
    let foo = "Hello World";
    let mut bar: Cow<str> = Cow::from(foo);
    println!("{bar}");      // 這裡沒有發生複製
    
    bar.to_mut().push_str(" Rust");  // 這裡發生了複製
    println!("{bar}");
    
    println!("{foo}");      // 原來的字元串foo仍然可用,而且沒有變化
}

Cow的構造

Cow<B>是一個枚舉,所以首先它是可以直接從它的成員BorrowedOwned來構造的:

use std::borrow::Cow;

fn main() {
    let str_ = "Hello World";
    let string = String::from("Hello World!");
    
    let foo: Cow<str> = Cow::Borrowed(str_);
    let bar: Cow<str> = Cow::Owned(string);
    
    // 這裡string不再可用
    // println!("{string}");
}

除此以外,標準庫中的五對實現了ToOwned的類型(str/String[T]/Vec<T>CStr/CStringOsStr/OsStringPath/PathBuf)也可以使用From::from來構造Cow<B>

use std::borrow::Cow;

fn main() {
    let str_ = "Hello World";
    let string = String::from("Hello World!");
    
    let foo: Cow<str> = Cow::from(str_);	// from -> Borrowed
    let bar: Cow<str> = Cow::from(string);	// from -> Owned
    
    // 這裡string不再可用
    // println!("{string}");
}

使用From::from時,Rust會自動為我們匹配正確的類型(&'a str/String等),一般情況下推薦使用from來構造Cow,而不是手動指定Borrowed/Owned

deref和to_mut

前面提到過,Cow<B>實現了Deref<B>特征,這意味著我們不需要做任何操作就可以享受Deref轉換的語法糖:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello World";
    let cow: Cow<str> = Cow::from(str1);
    let str2: &str = &cow;  // 註意看,我們把&Cow<str>賦給了&str
    
    println!("{str2}"); // Hello World
    println!("{cow}");  // Hello World
    println!("{str1}"); // Hello World
}
use std::borrow::Cow;

fn main() {
    let str1 = "Hello World";
    let cow: Cow<str> = Cow::from(str1);
    
    cow.split(" ").for_each(|s|println!("{s}"));	// 使用str的方法split也不在話下
}

不過,Cow<B>並沒有實現DerefMut;這意味著我們對Cow的修改不會影響到底層的內容,相反地,當我們試圖修改Cow時,Cow會生成一個副本,並且修改這個擁有所有權的副本:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow += " World";
    
    println!("cow = {cow}");	// cow = Hello World
    println!("str1 = {str1}");	// str1 = Hello 
}

我們可以多加一點輸出代碼,來看看具體發生了什麼:

#![feature(cow_is_borrowed)]
use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    println!("cow = {cow}, borrowed = {}", cow.is_borrowed());	// cow = Hello, borrowed = true
    
    cow += " World";
    
    println!("cow = {cow}, borrowed = {}", cow.is_borrowed());	// cow = Hello World, borrowed = false
    println!("str1 = {str1}");									// str1 = Hello
}

修改了cow變數後,它不再處於借用狀態,而是擁有了這段字元串的所有權——這也是它能夠安全地修改這段字元串的關鍵。


除了直接對Cow<str>使用str中實現的方法來修改字元串之外,還可以使用to_mut()來獲取&String來使用String中實現的方法來修改字元串:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow.to_mut().push_str(" World");
    
    println!("cow = {cow}");	// cow = Hello World
    println!("str1 = {str1}");	// str1 = Hello 
}

再重覆一遍:使用to_mut()修改和直接修改Cow<B>的不同在於,to_mut()返回的是&mut <B as ToOwned>::Owned(例如String),可以使用BOwned類型(例如String)中額外實現的方法(例如String::push_str);修改Cow<B>的時候,只能使用B中實現的方法(例如上面的+=,也就是str::add_assign)。

消費Cow

在不再需要使用Cow,或者想要完整取得Cow中的對象的所有權的時候,我們可以使用Cow::into_owned方法來消費掉Cow。方法返回的是BOwned類型(例如String)。

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow.to_mut().push_str(" World");
    
    let owned: String = cow.into_owned();
    
    println!("{owned}");    // Hello World
    println!("{str1}");	    // Hello 
}

在消費掉Cow之後,Cow將不再可用,但它之前借用的原數據不受影響。

用途

說了這麼多,Cow到底有什麼用呢?少複製幾次數據真的那麼重要嗎?讓我們看看標準庫中的String::from_utf8_lossy方法吧。

String::from_utf8_lossy是一個把一個位元組切片(&[u8])按照UTF-8轉換成&str的方法,並且會用“�”字元來替換掉位元組切片中UTF-8不支持的字元。舉個例子:

// 不包含錯誤位元組的情況
fn main() {
    let hello = vec![72, 69, 76, 76, 79];
    let hello = String::from_utf8_lossy(&hello);
    assert_eq!("HELLO", hello);
}

以及:

// 包含錯誤位元組的情況
fn main() {
    let input = b"Hello \xF0\x90\x80World";
    let output = String::from_utf8_lossy(input);
    assert_eq!("Hello �World", output);
}

現在假設我們是Rust標準庫API的設計師,我們要為from_utf8_lossy方法選擇一個恰當的返回類型。

返回&str可以嗎?

最直接的想法就是返回一個&str,就像這樣:

fn from_utf8_lossy<'a>(v: &'a [u8]) -> &'a str {
   todo!()
}

這種方案可以嗎?仔細想想,當位元組切片中有UTF-8中不支持的錯誤字元時,錯誤字元需要被替換成“�”;直接返回&str的話是做不了對字元串內容的修改的。

返回String呢?

順著剛纔的思路,因為我們可能需要修改字元串,所以我們就需要返回&str的棧上類型String,合情合理:

fn from_utf8_lossy(v: &[u8]) -> String {
   todo!()
}

不過,另一個問題冒出來了:雖然返回String完美地解決了修改字元串之後會導致新字元串無處存放的問題,但是如果舊的字元串(位元組切片)不需要修改的話,也需要被覆制到String中,這無形中增加了很多不必要的消耗;而且,位元組切片中有錯誤字元是概率很小的事件,為了小概率事件影響拖累大概率發生的正常情況的性能,這值得嗎?

這時,我一拍大腿:在需要修改時返回String,不需要修改時返回&str不就好了?

返回(Option<&str>, Option<String>)(或者Either<&str, String>

這樣,上面所描述的性能和功能矛盾就解決了:

fn from_utf8_lossy<'a>(v: &'a [u8]) -> (Option<&'a str>, Option<String>) {
   todo!()
}

但這種解決方式也不是沒問題的:太複雜了……而且需要用戶判斷返回的是&str還是String。不過,這個要麼返回借用的&str、要麼返回有所有權的String的東西,是不是感覺有點眼熟?

這不就是Cow<str>嘛!

最終方案:返回Cow<str>

經過一番艱難而複雜的思考,我們最終得到了最恰當的結果:

fn from_utf8_lossy(v: &[u8]) -> Cow<'_, str> {
    todo!()
}

使用了Cow<str>之後,它不僅可以在需要修改字元串時克隆並返回新數據,更可以在絕大多數普通情況之下直接借用數據;更妙的是,它可以享受Deref轉換的語法糖,可謂十分完美!

總結

Cow是Rust中非常有用的一個類型,雖然日常開發中幾乎用不到它,但是某些性能敏感的場景下善用Cow說不定會有奇效喔~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 一、錯誤類型 任何一個框架,對於錯誤的處理都是一種必備的能力 在Vue 中,則是定義了一套對應的錯誤處理規則給到使用者,且在源代碼級別,對部分必要的過程做了一定的錯誤處理。 主要的錯誤來源包括: 後端介面錯誤 代碼中本身邏輯錯誤 二、如何 ...
  • accent-color 是從 Chrome 93 開始被得到支持的一個不算太新屬性。之前一直沒有好好介紹一下這個屬性。直到最近在給一些系統整體切換主題色的時候,更深入的瞭解了一下這個屬性。 簡單而言,CSS accent-color 支持使用幾行簡單的 CSS 為表單元素著色,是的,只需幾行代碼就 ...
  • 寫在前面 我知道自己現在的狀態很不好,以為放個假能好好放鬆下心情,結果昨晚做夢還在工作,調試代碼,和領導彙報工作。 天吶,明明是在放假,可大腦還在考慮工作的事,我的天那,這是怎麼了? Vue頁面參數傳遞 1、任務拆解 頁面跳轉時帶上當前電子書id參數ebookId 新增/編輯文檔時,讀取電子書id參 ...
  • 1. 有人說 Python 性能沒那麼 Low? 這個我用 pypy 2.7 確認了下,確實沒那麼差, 如果用 NumPy 或其他版本 Python 的話,性能更快。但 pypy 還不完善,pypy3 在 beta, 所以一般情況,我是說一般情況下,這點比較讓人不爽。 2. 有人說怎麼沒有 C#、R ...
  • 歡迎來到從零開始學Spring Boot的旅程!在Spring Boot中,返回JSON數據是很常見的需求,特別是當我們構建RESTful API時。我們對上一篇的Hello World進行簡單的修改。 添加依賴 首先,確保你的build.gradle文件中已經包含了Spring Web的依賴,因為 ...
  • 現在免費證書只能申請三個月(之前還能申請十二個月),擁有acme能力對於小的站點來說就比較需要,可以比較好的部署也不用關心TLS帶來的煩惱。 ...
  • ORM,全稱為Object-Relational Mapping,即對象關係映射,是一種程式技術,用於實現面向對象編程語言里不同類型系統的數據之間的轉換。從效果上說,它其實是創建了一個可在編程語言里使用的“虛擬對象資料庫”。 ORM技術位於應用和資料庫之間,作為一層中間件,用於實體對象(例如 POJ ...
  • Java 包和 API Java 中的包 用於將相關的類分組在一起。可以將其視為文件目錄中的一個文件夾。我們使用包來避免名稱衝突,並編寫更易於維護的代碼。 包分為兩類: 內置包(來自 Java API 的包) 用戶定義的包(創建自己的包) 內置包 Java API 是一個預先編寫的類庫,可以在 Ja ...
一周排行
    -Advertisement-
    Play Games
  • 下麵是一個標準的IDistributedCache用例: public class SomeService(IDistributedCache cache) { public async Task<SomeInformation> GetSomeInformationAsync (string na ...
  • 這個庫提供了在啟動期間實例化已註冊的單例,而不是在首次使用它時實例化。 單例通常在首次使用時創建,這可能會導致響應傳入請求的延遲高於平時。在註冊時創建實例有助於防止第一次Request請求的SLA 以往我們要在註冊的時候實例單例可能會這樣寫: //註冊: services.AddSingleton< ...
  • 最近公司的很多項目都要改單點登錄了,不過大部分都還沒敲定,目前立刻要做的就只有一個比較老的項目 先改一個試試手,主要目標就是最短最快實現功能 首先因為要保留原登錄方式,所以頁面上的改動就是在原來登錄頁面下加一個SSO登錄入口 用超鏈接寫的入口,頁面改造後如下圖: 其中超鏈接的 href="Staff ...
  • Like運算符很好用,特別是它所提供的其中*、?這兩種通配符,在Windows文件系統和各類項目中運用非常廣泛。 但Like運算符僅在VB中支持,在C#中,如何實現呢? 以下是關於LikeString的四種實現方式,其中第四種為Regex正則表達式實現,且在.NET Standard 2.0及以上平... ...
  • 一:背景 1. 講故事 前些天有位朋友找到我,說他們的程式記憶體會偶發性暴漲,自己分析了下是非托管記憶體問題,讓我幫忙看下怎麼回事?哈哈,看到這個dump我還是非常有興趣的,居然還有這種游戲幣自助機類型的程式,下次去大玩家看看他們出幣的機器後端是不是C#寫的?由於dump是linux上的程式,剛好win ...
  • 前言 大家好,我是老馬。很高興遇到你。 我們為 java 開發者實現了 java 版本的 nginx https://github.com/houbb/nginx4j 如果你想知道 servlet 如何處理的,可以參考我的另一個項目: 手寫從零實現簡易版 tomcat minicat 手寫 ngin ...
  • 上一次的介紹,主要圍繞如何統一去捕獲異常,以及為每一種異常添加自己的Mapper實現,並且我們知道,當在ExceptionMapper中返回非200的Response,不支持application/json的響應類型,而是寫死的text/plain類型。 Filter為二方包異常手動捕獲 參考:ht ...
  • 大家好,我是R哥。 今天分享一個爽飛了的面試輔導 case: 這個杭州兄弟空窗期 1 個月+,面試了 6 家公司 0 Offer,不知道問題出在哪,難道是杭州的 IT 崩盤了麽? 報名面試輔導後,經過一個多月的輔導打磨,現在成功入職某上市公司,漲薪 30%+,955 工作制,不咋加班,還不捲。 其他 ...
  • 引入依賴 <!--Freemarker wls--> <dependency> <groupId>org.freemarker</groupId> <artifactId>freemarker</artifactId> <version>2.3.30</version> </dependency> ...
  • 你應如何運行程式 互動式命令模式 開始一個互動式會話 一般是在操作系統命令行下輸入python,且不帶任何參數 系統路徑 如果沒有設置系統的PATH環境變數來包括Python的安裝路徑,可能需要機器上Python可執行文件的完整路徑來代替python 運行的位置:代碼位置 不要輸入的內容:提示符和註 ...