JavaRush /Java Blog /Random-TW /前 5 個 Java 機器學習庫

前 5 個 Java 機器學習庫

在 Random-TW 群組發布
公司正在爭奪能夠編寫機器學習和深度學習程式碼的程式設計師。如果您對這些主題感興趣,也許您應該看看當今最好的機器學習 Java 庫?
前 5 個 Java 機器學習庫 - 1

迷你詞彙表

機器學習是一種人工智慧最初並不知道如何解決特定問題,而是透過解決類似問題來學習這個過程的方法。使用各種數學方法來建立關係。 深度學習是機器學習的子集,最常使用模仿人類決策的神經網路。深度學習通常需要大量的訓練資料。例如,如果您需要設定一種演算法來識別薩克斯風,則程式不僅必須提供薩克斯風的圖像,還必須提供其他類似的銅管樂器的圖像,以便演算法將來不會將它們混淆。

這樣有希望嗎?

人工智慧發展的漫長寒冬已經結束。機器學習現在是技術領域最熱門的技能之一,對了解主題的專家的需求很大。到目前為止,還沒有一種語言成為機器學習領域的絕對領導者,但 Java 顯然是最受歡迎的語言之一。因此,如果您對科學感興趣並且想要進行研究而不僅僅是編碼,我們建議您查看用於機器學習程式設計的前五個 Java 程式庫。
前 5 個 Java 機器學習庫 - 2

韋卡

圖書館連結: https://www.cs.waikato.ac.nz/ml/weka/index.html Weka 絕對是我們的最愛,這並不奇怪。該產品被認為是開發機器學習方法並將其應用於真實數據的現代環境,這種環境將使機器學習方法廣泛使用。借助 Weka,應用科學家可以使用機器學習技術直接從可能非常大的數據中提取有用的知識。Weka 3 是用 Java 寫的免費軟體。該產品可以很好地整合到其他程式碼中,因為它可以直接存取其中實現的演算法庫。也就是說,你將能夠使用用Java實現的其他系統中已經編寫的演算法。此外,Weka有自己的Explorer使用者介面,即知識流組件介面,但你也可以使用命令列。此外,Weka 還開發了一個 Experimenter 應用程序,用於比較機器學習演算法對一組給定問題的預測能力。
前 5 個 Java 機器學習庫 - 3
「Weka 的優勢在於分類。因此它非常適合需要自動資料分類的應用程式。Weka 也執行聚類、預測、特徵選擇和異常檢測任務。」紐西蘭懷卡託大學電腦科學教授 Eibe Frank 說。Weka 的機器學習演算法套件可以直接應用於資料庫或從您自己的 Java 程式碼中呼叫。它支援多種標準資料探勘任務,包括資料預處理、分類、聚類、視覺化、迴歸分析和特徵選擇。 將 Weka 與 Java 程式碼結合使用的範例: https: //weka.wikispaces.com/Use+WEKA+in+your+Java+code

大規模線上分析 (MOA)

庫連結: https ://moa.cms.waikato.ac.nz/ MOA(大規模線上分析)是一個用於開發資料流的框架。它包括評估工具和一組節省時間和記憶體的機器學習演算法。這個開源庫直接用於機器學習和即時從資料流中收集資訊。MOA是用Java編寫的,因此可以輕鬆地與Weka一起使用來解決大規模複雜的問題。MOA 的機器學習演算法和評分引擎套件可用於迴歸分析、分類、異常值偵測、聚類、推薦系統。MOA 對於更改資料集和串流以及物聯網 (IoT) 裝置產生的資料也很有用。
前 5 個 Java 機器學習庫 - 4
MOA中的工作流程遵循一個簡單的方案:先選擇並配置資料流(通道、產生器),然後選擇演算法(例如分類器)並設定其參數。第三步,選擇評估方法或措施,然後得出結果。
前 5 個 Java 機器學習庫 - 5
要使用 MOA 運行實驗,使用者可以選擇圖形使用者介面 (GUI) 或命令列。

深度學習4

庫連結: https: //deeplearning4j.org/ Deeplearning4j 是為 Java 生態系統帶來重大創新的創新貢獻者之一。這是一個非常高品質的函式庫,一個 Java 和 Scala 的開源項目,由優秀的人(和半智慧機器人!)Skymind 向我們提供。Deep;earning4j 背後的想法是將深度神經網路和深度學習結合起來應用於商業環境。
前 5 個 Java 機器學習庫 - 6
Deeplearning4j 對於使用 Hadoop 的 Java、Scala 和 Clojure 程式設計師來說是一個很棒的 DIY 工具,Hadoop 是一個用於開發和運行在具有數千個節點的叢集上運行的分散式程式的框架。Hadoop 擁有強大的運算能力,能夠處理幾乎無限數量的平行任務。深度神經網路和深度強化學習能夠進行模式識別和有針對性的機器學習。這意味著 Deeplearning4j 對於識別語音、音訊和文字中的模式和情緒非常有用。此外,該庫還可用於檢測時間序列資料(例如金融交易)中的異常情況。

庫連結: http: //mallet.cs.umass.edu/ MALLET 是一個開源 Java 工具包,由 Andrew McCallum 以及 UMASS 和 UPenn 的學生創建。該庫主要設計用於使用機器學習進行文字處理。庫名稱說明 - MAchine Learning for LanguageE Toolkit。
前 5 個 Java 機器學習庫 - 7
該軟體包支援統計自然語言處理、聚類、文件分類、資訊檢索、建模和其他高級學習應用程式。MALLET 的主要優勢是用於文件分類的現代工具,例如用於文字轉換的高效標準程序。它支援多種演算法,包括樸素貝葉斯、決策樹、最大決策樹和最大熵,以及分類器效能分析程式碼。

愛爾基

庫連結: https: //elki-project.github.io/ ELKI 的全名為Environment for Developing KDD-Applications Supported by Index Structures,可以翻譯為「用於開發索引結構支援的KDD應用程式的環境」。反過來,KDD(資料庫中的知識發現)是一個縮寫,隱藏了從資料中大規模提取知識的可能性。ELKI 的重點是演算法研究,重點是聚類分析和異常值檢測中的無監督方法。為了實現高效能和可擴展性,ELKI提供了R*樹等資料索引結構(此類資料結構用於索引空間資訊),這可以提供顯著的效能提升。ELKI易於擴展,旨在提供大量高度參數化的演算法,以實現輕鬆、公平的演算法評估。
前 5 個 Java 機器學習庫 - 8
這意味著 ELKI 在數據科學領域非常有用。該工具被用來研究抹香鯨的聲音、太空飛行和交通預測。也許您知道另一個尚未涉及的 Java 機器學習庫?在評論中與我們分享,找出我們可能錯過的內容很有趣! 基於jaxenter 的材料
留言
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION