根據詞頻生成詞雲(Python wordcloud實現)

来源:https://www.cnblogs.com/sxpujs/archive/2020/02/21/12343358.html
-Advertisement-
Play Games

網上大多數詞雲的代碼都是基於原始文本生成,這裡寫一個根據詞頻生成詞雲的小例子,都是基於現成的函數。 安裝詞雲與畫圖包 word_cloud.py(生成詞雲的程式) record.txt文件示例,第1列是單詞,第2列是頻率,空格分隔 運行後得到如下結果: ...


網上大多數詞雲的代碼都是基於原始文本生成,這裡寫一個根據詞頻生成詞雲的小例子,都是基於現成的函數。

安裝詞雲與畫圖包

pip3 install wordcloud
pip3 install matplotlib

word_cloud.py(生成詞雲的程式)

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 生成詞雲
def create_word_cloud():
    frequencies = {}
    for line in open("./record.txt"):
        arr = line.split(" ")
        frequencies[arr[0]] = float(arr[1])
    # 支持中文, SimHei.ttf可從以下地址下載:https://github.com/cystanford/word_cloud
    wc = WordCloud(
        font_path="./SimHei.ttf",
        max_words=100,
        width=2000,
        height=1200,
    )
    word_cloud = wc.generate_from_frequencies(frequencies)
    # 寫詞雲圖片
    word_cloud.to_file("wordcloud2.jpg")
    # 顯示詞雲文件
    plt.imshow(word_cloud)
    plt.axis("off")
    plt.show()

# 根據詞頻生成詞雲
create_word_cloud()

record.txt文件示例,第1列是單詞,第2列是頻率,空格分隔

中文 100
英文 2
日語 3

運行後得到如下結果:


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、DFT之前言部分 由於matlab已提供了內部函數來計算DFT、IDFT,我們只需要會調用fft、ifft函數就行; 二、函數說明: fft(x):計算N點的DFT。N是序列x的長度,即N=length(x); fft(x,L):計算L點的DFT。若LN,則將原序列x補0至L點,然後通過計算其L ...
  • 一、 功能: 尋找非零元素的索引和值 二、相關函數語法: 1. ind = find(X) 2. ind = find(X, k) 3. ind = find(X, k, 'first') 4. ind = find(X, k, 'last') 5. [row,col] = find(X, ...) ...
  • 一、A為3行4列的矩陣,B為一個行數大於3的矩陣,寫出MATLAB命令。 (1)刪除A的第1、3兩列。 (2)刪除B的倒數第3行。 (1)刪除A的第1、3列 ​A=rand(3,4) ​A(:,[1,3])=[] 輸出: A = 0.9572 0.1419 0.7922 0.0357 0.4854 ...
  • python3-cookbook中每個小節以問題、解決方案和討論三個部分探討了Python3在某類問題中的最優解決方式,或者說是探討Python3本身的數據結構、函數、類等特性在某類問題上如何更好地使用。這本書對於加深Python3的理解和提升Python編程能力的都有顯著幫助,特別是對怎麼提高Py ...
  • Dart類Getters和Setter Getters和Setter(也稱為訪問器和更改器)允許程式分別初始化和檢索類欄位的值。 使用get關鍵字定義getter或訪問器。Setter或存取器是使用set關鍵字定義的。 預設的getter/setter與每個類相關聯。 但是,可以通過顯式定義sett ...
  • 手把手教您下載安裝Python的運行環境,本文雖然寫於2020年Python穩定的版本是3.8,Windows流行的版本是Win10,學會方法50年管用,本教程會在電腦上安裝2套Python環境,1-3節安裝原生環境,第4節安裝Visual Studio Code的環境。 ...
  • 一. 測試代碼 @RestController @RequestMapping("/book") public class BookController { @PostMapping("add") public JsonResponse<Integer> add(@Valid @RequestBod ...
  • 接第二篇 第二篇裡面, 看到容器創建的是 AnnotationConfigServletWebServerApplicationContext 類型. 一 .類圖 二. 構造 public GenericApplicationContext() { //創建 bean 工廠 this.beanFac ...
一周排行
    -Advertisement-
    Play Games
  • 概述:本文代碼示例演示瞭如何在WPF中使用LiveCharts庫創建動態條形圖。通過創建數據模型、ViewModel和在XAML中使用`CartesianChart`控制項,你可以輕鬆實現圖表的數據綁定和動態更新。我將通過清晰的步驟指南包括詳細的中文註釋,幫助你快速理解並應用這一功能。 先上效果: 在 ...
  • openGauss(GaussDB ) openGauss是一款全面友好開放,攜手伙伴共同打造的企業級開源關係型資料庫。openGauss採用木蘭寬鬆許可證v2發行,提供面向多核架構的極致性能、全鏈路的業務、數據安全、基於AI的調優和高效運維的能力。openGauss深度融合華為在資料庫領域多年的研 ...
  • openGauss(GaussDB ) openGauss是一款全面友好開放,攜手伙伴共同打造的企業級開源關係型資料庫。openGauss採用木蘭寬鬆許可證v2發行,提供面向多核架構的極致性能、全鏈路的業務、數據安全、基於AI的調優和高效運維的能力。openGauss深度融合華為在資料庫領域多年的研 ...
  • 概述:本示例演示了在WPF應用程式中實現多語言支持的詳細步驟。通過資源字典和數據綁定,以及使用語言管理器類,應用程式能夠在運行時動態切換語言。這種方法使得多語言支持更加靈活,便於維護,同時提供清晰的代碼結構。 在WPF中實現多語言的一種常見方法是使用資源字典和數據綁定。以下是一個詳細的步驟和示例源代 ...
  • 描述(做一個簡單的記錄): 事件(event)的本質是一個委托;(聲明一個事件: public event TestDelegate eventTest;) 委托(delegate)可以理解為一個符合某種簽名的方法類型;比如:TestDelegate委托的返回數據類型為string,參數為 int和 ...
  • 1、AOT適合場景 Aot適合工具類型的項目使用,優點禁止反編 ,第一次啟動快,業務型項目或者反射多的項目不適合用AOT AOT更新記錄: 實實在在經過實踐的AOT ORM 5.1.4.117 +支持AOT 5.1.4.123 +支持CodeFirst和非同步方法 5.1.4.129-preview1 ...
  • 總說周知,UWP 是運行在沙盒裡面的,所有許可權都有嚴格限制,和沙盒外交互也需要特殊的通道,所以從根本杜絕了 UWP 毒瘤的存在。但是實際上 UWP 只是一個應用模型,本身是沒有什麼許可權管理的,許可權管理全靠 App Container 沙盒控制,如果我們脫離了這個沙盒,UWP 就會放飛自我了。那麼有沒... ...
  • 目錄條款17:讓介面容易被正確使用,不易被誤用(Make interfaces easy to use correctly and hard to use incorrectly)限制類型和值規定能做和不能做的事提供行為一致的介面條款19:設計class猶如設計type(Treat class de ...
  • title: 從零開始:Django項目的創建與配置指南 date: 2024/5/2 18:29:33 updated: 2024/5/2 18:29:33 categories: 後端開發 tags: Django WebDev Python ORM Security Deployment Op ...
  • 1、BOM對象 BOM:Broswer object model,即瀏覽器提供我們開發者在javascript用於操作瀏覽器的對象。 1.1、window對象 視窗方法 // BOM Browser object model 瀏覽器對象模型 // js中最大的一個對象.整個瀏覽器視窗出現的所有東西都 ...