weka tutorial how download
In diesem WEKA-Tutorial wird erklärt, was das Weka Machine Learning-Tool ist, welche Funktionen es bietet und wie die Weka Machine Learning-Software heruntergeladen, installiert und verwendet wird:
In dem Vorheriges Tutorial Wir haben etwas über Support Vector Machine in ML und zugehörige Konzepte wie Hyperplane, Support Vectors & Applications of SVM gelernt.
Maschinelles Lernen ist ein Bereich der Wissenschaft, in dem Maschinen als künstlich intelligentes System fungieren. Die Maschinen können selbst lernen, ohne dass eine explizite Codierung erforderlich ist. Es ist ein iterativer Prozess, der auf Daten zugreift, von selbst lernt und das Ergebnis vorhersagt. Für die Ausführung von maschinellen Lernaufgaben werden viele Tools und Skripte benötigt.
WEKA ist eine Plattform für maschinelles Lernen, die aus vielen Tools besteht, die viele Aktivitäten für maschinelles Lernen ermöglichen.
=> Lesen Sie die komplette Schulungsreihe zum maschinellen Lernen durch
Was ist Alpha-Test beim Testen von Software?
Was du lernen wirst:
- Was ist WEKA?
- Fazit
Was ist WEKA?
Weka ist ein Open-Source-Tool, das von Wissenschaftlern / Forschern der University of Waikato, Neuseeland, entworfen und entwickelt wurde. WEKA steht für Waikato Environment for Knowledge Analysis. Es wird von der internationalen wissenschaftlichen Gemeinschaft entwickelt und unter der kostenlosen GNU GPL-Lizenz vertrieben.
WEKA ist vollständig in Java entwickelt. Es bietet die Integration in die SQL-Datenbank mithilfe der Java-Datenbankkonnektivität. Es bietet viele Algorithmen für maschinelles Lernen zur Implementierung von Data Mining-Aufgaben. Diese Algorithmen können entweder direkt mit dem WEKA-Tool oder mit anderen Anwendungen unter Verwendung der Programmiersprache Java verwendet werden.
Es bietet zahlreiche Tools für die Datenvorverarbeitung, Klassifizierung, Clusterbildung, Regressionsanalyse, Erstellung von Zuordnungsregeln, Merkmalsextraktion und Datenvisualisierung. Es ist ein leistungsstarkes Tool, das die Entwicklung neuer Algorithmen für maschinelles Lernen unterstützt.
Warum das WEKA Machine Learning Tool verwenden?
Mit WEKA stehen die Algorithmen für maschinelles Lernen den Benutzern zur Verfügung. Mit diesen Methoden können die ML-Spezialisten nützliche Informationen aus großen Datenmengen extrahieren. Hier können die Spezialisten eine Umgebung schaffen, um neue Methoden des maschinellen Lernens zu entwickeln und diese in reale Daten umzusetzen.
WEKA wird von Forschern des maschinellen Lernens und der angewandten Wissenschaften zu Lernzwecken verwendet. Es ist ein effizientes Tool zur Ausführung vieler Data Mining-Aufgaben.
WEKA Download und Installation
# 1) Laden Sie die Software von herunter Hier .
Überprüfen Sie die Konfiguration des Computersystems und laden Sie die stabile Version von WEKA (derzeit 3.8) von dieser Seite herunter.
#zwei) Öffnen Sie nach erfolgreichem Download den Speicherort der Datei und doppelklicken Sie auf die heruntergeladene Datei. Der Step Up-Assistent wird angezeigt. Klicken Sie auf Weiter.
#3) Die Bedingungen der Lizenzvereinbarung werden geöffnet. Lesen Sie es sorgfältig durch und klicken Sie auf 'Ich stimme zu'.
# 4) Wählen Sie entsprechend Ihren Anforderungen die zu installierenden Komponenten aus. Die vollständige Installation der Komponenten wird empfohlen. Klicken Sie auf Weiter.
# 5) Wählen Sie den Zielordner und klicken Sie auf Weiter.
# 6) Dann beginnt die Installation.
# 7) Wenn Java nicht im System installiert ist, wird zuerst Java installiert.
# 8) Nach Abschluss der Installation wird das folgende Fenster angezeigt. Klicken Sie auf Weiter.
# 9) Aktivieren Sie das Kontrollkästchen Weka starten. Klicken Sie auf Fertig stellen.
# 10) Das Fenster WEKA Tool and Explorer wird geöffnet.
#elf) Das WEKA-Handbuch kann von heruntergeladen werden Hier.
Grafische Benutzeroberfläche von WEKA
Die GUI von WEKA bietet fünf Optionen: Explorer, Experimentator, Wissensfluss, Workbench und einfache CLI. Lassen Sie uns diese einzeln verstehen.
# 1) Einfache CLI
Einfache CLI ist Weka Shell mit Befehlszeile und Ausgabe. Mit „Hilfe“ wird die Übersicht aller Befehle angezeigt. Die einfache CLI bietet Zugriff auf alle Klassen wie Klassifizierer, Cluster und Filter usw.
Einige der einfachen CLI-Befehle sind:
- Brechen: So stoppen Sie den aktuellen Thread
- Ausgang: Beenden Sie die CLI
- Hilfe() : Gibt die Hilfe für den angegebenen Befehl aus
- -java weka.classifiers.trees.J48 -t c: /temp/iris.arff: Um eine WEKA-Klasse aufzurufen, müssen Sie Java voranstellen. Dieser Befehl weist WEKA an, die Klasse zu laden und mit den angegebenen Parametern auszuführen. In diesem Befehl wird der J48-Klassifizierer für das IRIS-Dataset aufgerufen.
# 2) Explorer
Die WEKA Explorer-Fenster zeigen verschiedene Registerkarten, beginnend mit der Vorverarbeitung. Zu Beginn ist die Registerkarte Vorverarbeitung aktiv, da zuerst der Datensatz vorverarbeitet wird, bevor Algorithmen auf ihn angewendet und der Datensatz untersucht werden.
Die Registerkarten lauten wie folgt:
- Vorverarbeitung: Wählen und ändern Sie die geladenen Daten.
- Klassifizieren: Wenden Sie Trainings- und Testalgorithmen auf die Daten an, die die Daten klassifizieren und zurückführen.
- Cluster: Bilden Sie Cluster aus den Daten.
- Assoziieren: Meine Assoziationsregel für die Daten abbauen.
- Attribute auswählen: Attributauswahlmaßnahmen werden angewendet.
- Visualisieren: Eine 2D-Darstellung von Daten wird angezeigt.
- Statusleiste: Der unterste Abschnitt des Fensters zeigt die Statusleiste. Dieser Abschnitt zeigt, was gerade in Form einer Nachricht geschieht, z. B. wenn eine Datei geladen wird. Klicken Sie mit der rechten Maustaste darauf. Erinnerung Information kann gesehen werden, und auch Lauf Müll Kollektor um Speicherplatz freizugeben, kann ausgeführt werden.
- Protokollschaltfläche: Es speichert ein Protokoll aller Aktionen in Weka mit dem Zeitstempel. Protokolle werden in einem separaten Fenster angezeigt, wenn Sie auf die Schaltfläche Protokoll klicken.
- WEKA Bird Icon: In der unteren rechten Ecke ist der WEKA-Vogel dargestellt, der die Anzahl der gleichzeitig ausgeführten Prozesse darstellt (um x). Wenn der Prozess läuft, bewegt sich der Vogel.
# 3) Experimentator
Mit der Schaltfläche WEKA-Experimentator können Benutzer verschiedene Schemata in einem Experiment für einen Datensatz erstellen, ausführen und ändern. Der Experimentator hat zwei Arten von Konfigurationen: Einfach und fortgeschritten. Mit beiden Konfigurationen können Benutzer Experimente lokal und auf Remotecomputern ausführen.
- Die Schaltflächen 'Öffnen' und 'Neu' öffnen ein neues Experimentierfenster, das Benutzer ausführen können.
- Ergebnisse: Legen Sie die Ergebniszieldatei aus der ARFF-, JDFC- und CSV-Datei fest.
- Versuchstyp: Der Benutzer kann zwischen Kreuzvalidierung und prozentualer Aufteilung von Zug und Test wählen. Der Benutzer kann basierend auf dem verwendeten Datensatz und Klassifizierer zwischen Klassifizierung und Regression wählen.
- Datensätze: Der Benutzer kann hier Datensätze durchsuchen und auswählen. Das Kontrollkästchen für den relativen Pfad ist aktiviert, wenn auf verschiedenen Computern gearbeitet wird. Das Format der unterstützten Datasets ist ARFF, C4.5, CSV, libsvm, bsi und XRFF.
- Wiederholung: Die Standard-Iterationsnummer ist auf 10 festgelegt. Datensätze zuerst und Algorithmen zuerst helfen beim Umschalten zwischen Datensatz und Algorithmen, sodass Algorithmen für alle Datensätze ausgeführt werden können.
- Algorithmen: Neue Algorithmen werden durch 'New Button' hinzugefügt. Der Benutzer kann einen Klassifikator auswählen.
- Speichern Sie das Experiment mit der Schaltfläche Speichern.
- Führen Sie das Experiment mit der Schaltfläche Ausführen aus.
# 4) Wissensfluss
Der Wissensfluss zeigt eine grafische Darstellung der WEKA-Algorithmen. Der Benutzer kann die Komponenten auswählen und einen Workflow zur Analyse der Datensätze erstellen. Die Daten können stapelweise oder inkrementell verarbeitet werden. Parallele Workflows können entworfen werden und werden jeweils in einem separaten Thread ausgeführt.
Die verschiedenen verfügbaren Komponenten sind Datenquellen, Datenserver, Filter, Klassifizierer, Cluster, Auswertung und Visualisierung.
# 5) Werkbank
WEKA verfügt über ein Workbench-Modul, das alle GUIs in einem einzigen Fenster enthält.
Funktionen von WEKA Explorer
# 1) Datensatz
Ein Datensatz besteht aus Elementen. Es repräsentiert ein Objekt zum Beispiel: In der Marketingdatenbank werden Kunden und Produkte dargestellt. Die Datensätze werden durch Attribute beschrieben. Der Datensatz enthält Datentupel in einer Datenbank. Ein Dataset verfügt über Attribute, die nominal, numerisch oder string sein können. In Weka wird der Datensatz durch dargestellt weka.core.Instances Klasse.
Darstellung des Datensatzes mit 5 Beispielen:
@Daten
sonnig, FALSCH, 85,85, nein
sonnig, WAHR, 80,90, nein
bewölkt, FALSCH, 83,86, ja
regnerisch, FALSCH, 70,96, ja
regnerisch, FALSCH, 68,80, ja
Was ist ein Attribut?
Ein Attribut ist ein Datenfeld, das die Eigenschaft eines Datenobjekts darstellt. Beispielsweise, In einer Kundendatenbank lauten die Attribute customer_id, customer_email, customer_address usw. Attribute haben unterschiedliche Typen.
Diese möglichen Typen sind:
A) Nennattribute: Attribut, das sich auf einen Namen bezieht und vordefinierte Werte wie Farbe, Wetter hat. Diese Attribute werden aufgerufen kategoriale Attribute . Diese Attribute haben keine Reihenfolge und ihre Werte werden auch als Aufzählungen bezeichnet.
@attribute Ausblick {sonnig, bewölkt, regnerisch}: Deklaration des nominalen Attributs.
B) Binäre Attribute: Diese Attribute stellen nur die Werte 0 und 1 dar. Dies sind die Typen von nominalen Attributen mit nur 2 Kategorien. Diese Attribute werden auch als Boolean bezeichnet.
C) Ordnungsmerkmale: Die Attribute, die eine gewisse Reihenfolge oder Rangfolge beibehalten, sind Ordnungsattribute. Aufeinanderfolgende Werte können nicht vorhergesagt werden, sondern nur die Reihenfolge wird beibehalten. Beispiel: Größe, Klasse usw.
D) Numerische Attribute: Attribute, die messbare Größen darstellen, sind numerische Attribute. Diese werden durch reelle Zahlen oder ganze Zahlen dargestellt. Beispiel: Temperatur Feuchtigkeit.
@attribute Luftfeuchtigkeit real: Deklaration eines numerischen Attributs
E) String-Attribute: Diese Attribute stellen eine Liste von Zeichen dar, die in doppelten Anführungszeichen dargestellt werden.
# 2) ARFF-Datenformat
WEKA bearbeitet die ARFF-Datei zur Datenanalyse. ARFF steht für Attribute Relation File Format. Es hat 3 Abschnitte: Beziehung, Attribute und Daten. Jeder Abschnitt beginnt mit '@'.
ARFF-Dateien verwenden die Datenattribute Nominal, Numeric, String, Date und Relational. Einige der bekannten Datensätze zum maschinellen Lernen sind in WEKA als ARFF vorhanden.
Format für ARFF ist:
@Beziehung
@Attribut
@Daten
Ein Beispiel für eine ARFF-Datei ist:
@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes
# 3) XRFF-Datenformat
XRFF steht für das XML-Attribut Relation File Format. Es stellt Daten dar, in denen Kommentare, Attribute und Instanzgewichte gespeichert werden können. Es hat die Erweiterung .xrff und die Dateierweiterung .xrff.gz (komprimiertes Format). Die XRFF-Dateien stellten Daten im XML-Format dar.
# 4) Datenbankkonnektivität
Mit WEKA ist es einfach, mithilfe eines JDBC-Treibers eine Verbindung zu einer Datenbank herzustellen. JDBC-Treiber ist erforderlich, um eine Verbindung zur Datenbank herzustellen. Beispiel:
MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)
Orakel (oracle.jdbc.driver.OracleDriver)
# 5) Klassifikatoren
Um die Ausgabedaten vorherzusagen, enthält WEKA Klassifizierer. Die zum Lernen verfügbaren Klassifizierungsalgorithmen sind Entscheidungsbäume, Support-Vektor-Maschinen, instanzbasierte Klassifizierer und logistische Regression sowie Bayes'sche Netzwerke. Abhängig von der Anforderung durch Ausprobieren kann der Benutzer einen geeigneten Algorithmus für die Analyse von Daten finden. Klassifizierer werden verwendet, um die Datensätze basierend auf den Merkmalen der Attribute zu klassifizieren.
# 6) Clustering
WEKA verwendet die Registerkarte Cluster, um die Ähnlichkeiten im Dataset vorherzusagen. Basierend auf dem Clustering kann der Benutzer die für die Analyse nützlichen Attribute herausfinden und andere Attribute ignorieren. Die verfügbaren Algorithmen für das Clustering in WEKA sind k-means, EM, Cobweb, X-means und FarhtestFirst.
# 7) Verein
Der einzige in WEKA verfügbare Algorithmus zum Herausfinden von Assoziationsregeln ist Apriori.
# 8) Attributabschnitt Maßnahmen
WEKA verwendet zwei Ansätze zur Auswahl der besten Attribute für Berechnungszwecke:
- Verwenden des Suchmethodenalgorithmus: Best-First, Vorauswahl, zufälliger, erschöpfender, genetischer Algorithmus und Ranking-Algorithmus.
- Verwenden von Bewertungsmethodenalgorithmen: Korrelationsbasiert, Wrapper, Informationsgewinn, Chi-Quadrat.
# 9) Visualisierung
WEKA unterstützt die 2D-Darstellung von Daten, 3D-Visualisierungen mit Rotation und die 1D-Darstellung einzelner Attribute. Es verfügt über die Option 'Jitter' für nominelle Attribute und 'versteckte' Datenpunkte.
Weitere Hauptmerkmale von WEKA sind:
- Es ist ein Open-Source-Tool mit grafischer Benutzeroberfläche in Form von „Explorer“, „Experimenter“ und „Knowledge Flow“.
- Es ist plattformunabhängig.
- Es enthält 49 Datenvorverarbeitungswerkzeuge.
- 76 Klassifizierungs- und Regressionsalgorithmen, 8 Clustering-Algorithmen sind in WEKA vorhanden
- Es verfügt über 15 Attributauswahlalgorithmen und 10 Merkmalsauswahlalgorithmen.
- Es verfügt über 3 Algorithmen zum Auffinden von Assoziationsregeln.
- Mit WEKA können Benutzer benutzerdefinierten Code für maschinelles Lernen entwickeln.
Fazit
In diesem WEKA-Tutorial haben wir eine Einführung in die Open-Source-Software WEKA Machine Learning gegeben und Schritt für Schritt den Download- und Installationsprozess erläutert. Wir haben auch die fünf verfügbaren Optionen für die grafische Benutzeroberfläche von Weka gesehen, nämlich Explorer, Experimentator, Wissensfluss, Workbench und einfache CLI.
Wir haben auch anhand von Beispielen die Funktionen von WEKA kennengelernt. Die Funktionen umfassen Datensatz, ARFF-Datenformat, Datenbankkonnektivität usw.
=> Besuchen Sie hier für die exklusive maschinelle Lernserie
Literatur-Empfehlungen
- WEKA-Datensatz, Klassifikator und J48-Algorithmus für den Entscheidungsbaum
- WEKA Explorer: Visualisierung, Clustering, Assoziationsregel-Mining
- 11 beliebtesten Software-Tools für maschinelles Lernen im Jahr 2021
- Eine vollständige Anleitung zum künstlichen neuronalen Netzwerk beim maschinellen Lernen
- Data Mining gegen maschinelles Lernen gegen künstliche Intelligenz gegen tiefes Lernen
- Tutorial für maschinelles Lernen: Einführung in ML und seine Anwendungen
- Top 13 der BESTEN Unternehmen für maschinelles Lernen (Aktualisierte Liste 2021)
- Was ist Support Vector Machine (SVM) beim maschinellen Lernen?