Java 機器學習 工具 & 庫

来源:http://www.cnblogs.com/8hao/archive/2016/03/02/5235339.html
-Advertisement-
Play Games

下麵是25個Java機器學習的工具&&庫列表: 1.Weka是一個數據挖掘任務機器學習演算法的集合。這些演算法可以直接應用於數據集或者在你自己的Java代碼中調用。Weka 包含數據預處理、分類、回歸、聚類、關聯規則、可視化 等工具。 2.Massive Online Analysis(MOA) 是一個


下麵是25個Java機器學習的工具&&庫列表:

1.Weka是一個數據挖掘任務機器學習演算法的集合。這些演算法可以直接應用於數據集或者在你自己的Java代碼中調用。Weka 包含數據預處理、分類、回歸、聚類、關聯規則、可視化 等工具。

2.Massive Online Analysis(MOA) 是一個非常流行的數據挖掘方面的開源框架,它有一個非常活躍的社區。它包括一組機器學習演算法(分類、回歸、聚類、異常檢測、概念漂移檢測和推薦系統)和評估工具。同WEKA 項目一樣,MOA 也是用Java編寫的,但卻擴展的更高。

3.MEKA項目提供了多標記學習和評價方法的一個開源實現。在多標記分類中,我們要為每個輸入實例預測多個輸出變數。這不同於僅涉及單個目標變數的“標準”的情況。 MEKA是基於WEKA機器學習工具包。

4.Advanced Data mining And Machine learning System(ADAMS) 是一種新型的,靈活的工作引擎,旨在快速構建和維護現實世界,複雜的知識流程,基於GPLv3發佈。

5.Environment for Developing KDD-Applications Supported by Index-Structure(ELKI) 是用Java編寫的開源的(AGPLv3) 數據挖掘軟體。ELKI 的重點是研究unsupervised methods in cluster analysis and outlier detection演算法。

6.Mallet是一個Java文本文檔的機器學習工具包。Mallet 支持最大熵、naive bayes以及決策樹分類演算法。

7.Encog是一種先進的機器學習框架,支持 Support Vector Machines,人工神經網路,遺傳編程,貝葉斯網路,Hidden Markov Models,遺傳編程和遺傳演算法。

8.Datumbox是一個用Java編寫的開源機器學習框架,允許快速開發機器學習和統計應用。該框架的主要重點是,包括大量的機器學習演算法和統計測試,並能夠處理中等規模的數據集。

9.Deeplearning4j是第一個使用Java和Scala編寫的商業級的、開源的、分散式深度學習庫。它的目的是在商業環境中使用,而不是作為一種研究工具。

10.Mahout是一個帶有內置演算法的機器學習框架,Mahout-Samsara 幫助人們創建自己的數學,同時提供一些現成的演算法實現。

11.Rapid Miner是由德國的多特蒙德大學開發的。它為用戶創建自己的應用提供了圖形用戶界面和Java API。它提供了數據處理,可視化和機器學習演算法建模。

12.Apache SAMOA是一個機器學習框架。包含了一個分散式流媒體編程抽象ML演算法,使開發新的ML演算法不用直接處理複雜的底層分散式流處理引擎(DSPEe, 如 Apache Storm, Apache S4, 和 Apache Samza)。它的用戶可以一次開發分散式流媒體ML演算法,並執行多個DSPEs。

13.Neuroph通過提供支持創建、培訓並保存神經網路的Java神經網路簡化了神經網路的發展。

14.Oryx 2 是一個建立在Apache Spark 和 Apache Kafka之上,但專業化的實時大規模機器學習的lambda 架構。它是一個創建應用的框架,但同時提供了包,以及協同過濾、分類、回歸和聚類的終端到終端的應用程式。

15.Stanford Classifier是一個機器學習工具,得到數據並把它們分成 K 類。這個軟體是一個Java實現的最大熵分類器。

16.Cortical.io是一個快速、精確、像大腦一樣的Retina API 。

17.JSAT是一個機器學習快速入門的庫。它是我業餘時間開發的,可以在GPL 3下使用。庫的一部分是自我教育,因此,所有的代碼是自包含的。JSAT是純Java的,沒有外部的依賴。

18.N-Dimensional Arrays for Java(ND4J) 是一個 JVM 的科學計算庫。它們是用來在生產環境中使用的,這意味著程式的設計是以最小的記憶體需求來運行的。

19.Java Machine Learning Library是一組機器學習演算法的參考實現。這些演算法都是有記錄的,包括源代碼,都記錄在文檔網站。它主要是用Java編寫的。

20.Java-ML是一個Java API,是一個Java實現的機器學習演算法的集合。它只提供了一個標準的演算法介面。

21.MLlib (Spark)是一個Apache Spark 擴展的機器學習庫。雖然是Java,但該庫提供Java, Scala 以及 Python 綁定。庫是新的,並且演算法的列表很長。

22.H2O是一個智能應用的機器學習 API。它擴展了統計、機器學習以及大數據的運算。H2O 是可擴展的。

23.WalnutiQ是一個理論上與部分人腦有共同學習演算法的面向對象的模型(工作目標是一個簡單的帶有情感的人工智慧模型)。

24.RankLib是一個排序學習演算法庫。目前已經實現了八種流行的演算法。

25.htm.java(Hierarchical Temporal Memory implementation in Java) 是智能學習平臺 Numenta 的一個Java埠。

問啊-定製化IT教育平臺,牛人一對一服務,有問必答,開發編程社交頭條 官方網站:www.wenaaa.com

QQ群290551701 聚集很多互聯網精英,技術總監,架構師,項目經理!開源技術研究,歡迎業內人士,大牛及新手有志於從事IT行業人員進入!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在我們的程式中,經常會有一些耗時較長的運算,為了保證用戶體驗,不引起界面不響應,我們一般會採用多線程操作,讓耗時操作在後臺完成,完成後再進行處理或給出提示,在運行中,也會時時去刷新界面上的進度條等顯示,必要時還要控制後臺線程中斷當前操作。 以前,類似的應用會比較麻煩,需要寫的代碼較多,也很容易出現異
  • 函數功能:該函數將指定的消息發送到一個或多個視窗。此函數為指定的視窗調用視窗程式,直到視窗程式處理完消息再返回。該函數是應用程式和應用程式之間進行消息傳遞的主要手段之一。 函數原型:LRESULT SendMessage(HWND hWnd,UINT Msg,WPARAM wParam,LPARAM
  • 完成Model中的findAll/updateAll/deleteAll/insert/update和delete方法~~
  • // 字串含中文 by Aone function IsIncludeChinese(Str: String): Boolean; var i: Integer; UCS4Str: UCS4String; begin Result := False; UCS4Str := UnicodeString
  • 如果要應聘高級開發工程師職務,僅僅懂得Java的基礎知識是遠遠不夠的,還必須懂得常用數據結構、演算法、網路、操作系統等知識。因此本文不會講解具體的技術,筆者綜合自己應聘各大公司的經歷,整理了一份大公司對Java高級開發工程師職位的考核綱要,希望可以幫助到需要的人。 當前,市面上有《Java XX寶典》
  • http://fanli7.net/a/JAVAbiancheng/ANT/20101003/43604.html 級別: 中級 Roderick W. Smith ,顧問和作家 2008 年6 月02 日 Ext4 是眾多Linux? 文件系統中的最新版本,它將像以前的版本一樣重要和流行。作為Li
  • LeetCode QJ 是一個很好的刷題網站.有一天和同事交流一道有意思的題目. 在這裡分享一下. 是一個在重覆數組中查找不重覆的兩個.
  • 一、引言 前幾天面試,被大師虐殘了,好多基礎知識必須得重新拿起來啊。閑話不多說,進入正題。 二、為什麼要線程同步 因為當我們有多個線程要同時訪問一個變數或對象時,如果這些線程中既有讀又有寫操作時,就會導致變數值或對象的狀態出現混亂,從而導致程式異常。舉個例子,如果一個銀行賬戶同時被兩個線程操作,一個
一周排行
    -Advertisement-
    Play Games
  • 前言 插件化的需求主要源於對軟體架構靈活性的追求,特別是在開發大型、複雜或需要不斷更新的軟體系統時,插件化可以提高軟體系統的可擴展性、可定製性、隔離性、安全性、可維護性、模塊化、易於升級和更新以及支持第三方開發等方面的能力,從而滿足不斷變化的業務需求和技術挑戰。 一、插件化探索 在WPF中我們想要開 ...
  • 歡迎ReaLTaiizor是一個用戶友好的、以設計為中心的.NET WinForms項目控制項庫,包含廣泛的組件。您可以使用不同的主題選項對項目進行個性化設置,並自定義用戶控制項,以使您的應用程式更加專業。 項目地址:https://github.com/Taiizor/ReaLTaiizor 步驟1: ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • Channel 是乾什麼的 The System.Threading.Channels namespace provides a set of synchronization data structures for passing data between producers and consume ...
  • efcore如何優雅的實現按年分庫按月分表 介紹 本文ShardinfCore版本 本期主角: ShardingCore 一款ef-core下高性能、輕量級針對分表分庫讀寫分離的解決方案,具有零依賴、零學習成本、零業務代碼入侵適配 距離上次發文.net相關的已經有很久了,期間一直在從事java相關的 ...
  • 前言 Spacesniffer 是一個免費的文件掃描工具,通過使用樹狀圖可視化佈局,可以立即瞭解大文件夾的位置,幫助用戶處理找到這些文件夾 當前系統C盤空間 清理後系統C盤空間 下載 Spacesniffer 下載地址:https://spacesniffer.en.softonic.com/dow ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • 一、ReZero簡介 ReZero是一款.NET中間件 : 全網唯一開源界面操作就能生成API , 可以集成到任何.NET6+ API項目,無破壞性,也可讓非.NET用戶使用exe文件 免費開源:MIT最寬鬆協議 , 一直從事開源事業十年,一直堅持開源 1.1 純ReZero開發 適合.Net Co ...
  • 一:背景 1. 講故事 停了一個月沒有更新文章了,主要是忙於寫 C#內功修煉系列的PPT,現在基本上接近尾聲,可以回頭繼續更新這段時間分析dump的一些事故報告,有朋友微信上找到我,說他們的系統出現了大量的http超時,程式不響應處理了,讓我幫忙看下怎麼回事,dump也抓到了。 二:WinDbg分析 ...
  • 開始做項目管理了(本人3年java,來到這邊之後真沒想到...),天天開會溝通整理需求,他們講話的時候忙裡偷閑整理一下常用的方法,其實語言還是有共通性的,基本上看到方法名就大概能猜出來用法。出去打水的時候看到外面太陽好好,真想在外面坐著曬太陽,回來的時候好兄弟三年前送給我的鍵盤D鍵不靈了,在打"等待 ...