types machine learning
Dieses Tutorial erklärt die Arten des maschinellen Lernens, d. H. Überwachtes, unbeaufsichtigtes, verstärkendes und halbüberwachtes Lernen, anhand einfacher Beispiele. Sie werden auch Unterschiede zwischen überwachtem und unbeaufsichtigtem Lernen lernen:
In dem Vorheriges Tutorial Wir haben etwas über maschinelles Lernen, seine Funktionsweise und Anwendungen gelernt. Wir haben auch einen Vergleich von maschinellem Lernen mit künstlicher Intelligenz gesehen.
Maschinelles Lernen ist ein Bereich der Wissenschaft, der sich mit Computerprogrammen befasst, die durch Erfahrung lernen und die Ausgabe vorhersagen.
Das Hauptmerkmal von ML ist das Lernen aus Erfahrung. Das Lernen findet statt, wenn das mit Trainingseingabedaten gespeiste System Änderungen an seinen Parametern vornimmt und sich selbst anpasst, um die gewünschte Ausgabe zu erzielen. Die Ausgabe ist der in den Trainingsdaten definierte Zielwert.
=> Lesen Sie die komplette Schulungsreihe zum maschinellen Lernen durch
Was du lernen wirst:
- Arten des maschinellen Lernens
- Beispiel aus der Praxis für überwachtes und unbeaufsichtigtes Lernen
- Unterschied zwischen überwachtem und unbeaufsichtigtem Lernen
- Halbüberwachtes Lernen
- Fazit
Arten des maschinellen Lernens
Programme für maschinelles Lernen werden wie unten gezeigt in drei Typen eingeteilt.
- Überwacht
- Unbeaufsichtigt
- Verstärkungslernen
Lassen Sie uns jedes davon im Detail verstehen !!
# 1) Betreutes Lernen
Betreutes Lernen findet in Gegenwart eines Betreuers statt, genau wie das Lernen, das ein kleines Kind mit Hilfe seines Lehrers durchführt. Wenn ein Kind unter Aufsicht eines Lehrers darin geschult wird, Früchte, Farben und Zahlen zu erkennen, wird diese Methode beim Lernen überwacht.
Bei dieser Methode wird jeder Schritt des Kindes vom Lehrer überprüft und das Kind lernt aus den Ergebnissen, die es produzieren muss.
Wie funktioniert überwachtes Lernen?
Im überwachten ML-Algorithmus ist die Ausgabe bereits bekannt. Es gibt eine Zuordnung der Eingabe zur Ausgabe. Um ein Modell zu erstellen, wird die Maschine daher mit vielen Trainingseingabedaten gespeist (wobei die Eingabe und die entsprechende Ausgabe bekannt sind).
Die Trainingsdaten helfen dabei, ein Genauigkeitsniveau für das erstellte Datenmodell zu erreichen. Das erstellte Modell kann jetzt mit neuen Eingabedaten gespeist und die Ergebnisse vorhergesagt werden.
Was ist ein beschrifteter Datensatz?
Der Datensatz mit Ausgaben, die für eine bestimmte Eingabe bekannt sind, wird als beschrifteter Datensatz bezeichnet. Beispielsweise, ein Bild von Früchten zusammen mit dem Fruchtnamen ist bekannt. Wenn also ein neues Bild von Früchten angezeigt wird, wird es mit dem Trainingssatz verglichen, um die Antwort vorherzusagen.
Überwachtes Lernen ist ein schneller Lernmechanismus mit hoher Genauigkeit. Die überwachten Lernprobleme umfassen Regressions- und Klassifizierungsprobleme.
Einige der überwachten Lernalgorithmen sind:
fire TV stick VPN kostenlos
- Entscheidungsbäume,
- K-nächster Nachbar,
- Lineare Regression,
- Support Vector Machine und
- Neuronale Netze.
Beispiel für betreutes Lernen
- Im ersten Schritt wird dem maschinellen Lernalgorithmus ein Trainingsdatensatz zugeführt.
- Mit dem Trainingsdatensatz passt sich die Maschine selbst an, indem Änderungen an den Parametern vorgenommen werden, um ein logisches Modell zu erstellen.
- Das erstellte Modell wird dann für einen neuen Datensatz verwendet, um das Ergebnis vorherzusagen.
Arten von überwachten Lernalgorithmen
- Einstufung: Bei solchen Problemen prognostizieren wir die Antwort als bestimmte Klassen, z. B. 'Ja' oder 'Nein'. Wenn nur 2 Klassen vorhanden sind, spricht man von einer binären Klassifikation. Bei mehr als 2 Klassenwerten wird dies als Klassifizierung mehrerer Klassen bezeichnet. Die vorhergesagten Antwortwerte sind diskrete Werte. Beispielsweise, Ist es das Bild der Sonne oder des Mondes? Der Klassifizierungsalgorithmus unterteilt die Daten in Klassen.
- Regression: Regressionsprobleme sagen die Antwort als kontinuierliche Werte voraus, beispielsweise als Vorhersage eines Wertes, der von -infinity bis unendlich reicht. Es kann viele Werte annehmen. Beispielsweise, Der angewandte lineare Regressionsalgorithmus sagt die Kosten des Hauses basierend auf vielen Parametern wie Standort, nahe gelegenem Flughafen, Größe des Hauses usw. voraus.
# 2) Unbeaufsichtigtes Lernen
Unbeaufsichtigtes Lernen geschieht ohne die Hilfe eines Vorgesetzten, genau wie ein Fisch lernt, alleine zu schwimmen. Es ist ein unabhängiger Lernprozess.
In diesem Modell sind die Zielwerte unbekannt / unbeschriftet, da der Eingabe keine Ausgabe zugeordnet ist. Das System muss aus den eingegebenen Daten selbst lernen und die verborgenen Muster erkennen.
Was ist ein unbeschrifteter Datensatz?
Ein Datensatz mit unbekannten Ausgabewerten für alle Eingabewerte wird als unbeschrifteter Datensatz bezeichnet.
Wie funktioniert unbeaufsichtigtes Lernen?
Da keine Ausgabewerte bekannt sind, mit denen ein logisches Modell zwischen Eingabe und Ausgabe erstellt werden kann, werden einige Techniken verwendet, um Datenregeln, Muster und Datengruppen mit ähnlichen Typen abzubauen. Diese Gruppen helfen den Endbenutzern, die Daten besser zu verstehen und eine aussagekräftige Ausgabe zu finden.
Die eingespeisten Eingaben haben nicht die Form einer geeigneten Struktur, wie dies bei Trainingsdaten der Fall ist (beim überwachten Lernen). Es kann Ausreißer, verrauschte Daten usw. enthalten. Diese Eingänge werden zusammen dem System zugeführt. Während des Trainings des Modells werden die Eingaben zu Clustern organisiert.
Die unbeaufsichtigten Lernalgorithmen umfassen Clustering- und Assoziationsalgorithmen wie:
- Apriori,
- K-bedeutet Clustering und andere Assoziationsregel-Mining-Algorithmen.
Wenn dem Modell neue Daten zugeführt werden, wird das Ergebnis als Klassenbezeichnung vorhergesagt, zu der die Eingabe gehört. Wenn die Klassenbezeichnung nicht vorhanden ist, wird eine neue Klasse generiert.
Während des Erkennens von Mustern in den Daten passt das Modell seine Parameter selbst an und wird daher auch als selbstorganisierend bezeichnet. Die Cluster werden gebildet, indem die Ähnlichkeiten zwischen den Eingaben herausgefunden werden.
Zum Beispiel, Wenn beim Online-Kauf von Produkten Butter in den Warenkorb gelegt wird, wird empfohlen, Brot, Käse usw. zu kaufen. Das unbeaufsichtigte Modell überprüft die Datenpunkte und sagt die anderen Attribute voraus, die dem Produkt zugeordnet sind.
Beispiel für unbeaufsichtigtes Lernen
Arten von unbeaufsichtigten Algorithmen
- Clustering-Algorithmus : Die Methode zum Ermitteln der Ähnlichkeiten zwischen Datenelementen wie Form, Größe, Farbe, Preis usw. und zum Gruppieren zu einem Cluster ist die Clusteranalyse.
- Ausreißererkennung : Bei dieser Methode ist der Datensatz die Suche nach Unähnlichkeiten und Anomalien in den Daten. Beispielsweise, Eine hochwertige Transaktion auf Kreditkarte wird vom System zur Betrugserkennung erkannt.
- Association Rule Mining : Bei dieser Art des Mining werden die am häufigsten vorkommenden Elementmengen oder Zuordnungen zwischen Elementen ermittelt. Verbände wie „oft zusammen gekaufte Produkte“ usw.
- Autoencoder: Die Eingabe wird in eine codierte Form komprimiert und neu erstellt, um verrauschte Daten zu entfernen. Diese Technik wird verwendet, um die Bild- und Videoqualität zu verbessern.
# 3) Reinforcement Learning
Bei dieser Art des Lernens lernt der Algorithmus durch Rückkopplungsmechanismus und vergangene Erfahrungen. Es ist immer erwünscht, dass jeder Schritt im Algorithmus ausgeführt wird, um ein Ziel zu erreichen.
Wenn also der nächste Schritt unternommen werden soll, erhält er das Feedback des vorherigen Schritts sowie das Lernen aus der Erfahrung, um vorherzusagen, was der nächstbeste Schritt sein könnte. Dieser Prozess wird auch als Versuch und Irrtum bezeichnet, um das Ziel zu erreichen.
Reinforcement Learning ist ein langfristiger iterativer Prozess. Je mehr Rückmeldungen vorhanden sind, desto genauer wird das System. Grundlegendes Lernen zur Verstärkung wird auch als Markov-Entscheidungsprozess bezeichnet.
Beispiel für Verstärkungslernen
Ein Beispiel für Reinforcement Learning sind Videospiele, bei denen die Spieler bestimmte Level eines Spiels abschließen und Belohnungspunkte verdienen. Das Spiel gibt dem Spieler Feedback durch Bonusbewegungen, um seine Leistung zu verbessern.
Reinforcement Learning wird zum Trainieren von Robotern, selbstfahrenden Autos, zur automatischen Bestandsverwaltung usw. verwendet.
Einige beliebte Algorithmen des Reinforcement Learning umfassen:
- Q-Learning,
- Deep Adversarial Networks
- Zeitlicher Unterschied
Die folgende Abbildung beschreibt den Feedback-Mechanismus des Reinforcement Learning.
- Die Eingabe wird vom Agenten beobachtet, der das AI-Element ist.
- Dieser KI-Agent wirkt gemäß der getroffenen Entscheidung auf die Umgebung.
- Die Antwort der Umgebung wird in Form einer Belohnung als Feedback an die KI zurückgesendet.
- Status und in der Umgebung ausgeführte Aktionen werden ebenfalls gespeichert.
(Bild Quelle ))
Beispiel aus der Praxis für überwachtes und unbeaufsichtigtes Lernen
Für betreutes Lernen:
# 1) Nehmen wir ein Beispiel für einen Gemüsekorb mit Zwiebeln, Karotten, Radieschen, Tomaten usw., und wir können sie in Form von Gruppen anordnen.
#zwei) Wir erstellen eine Trainingsdatentabelle, um das überwachte Lernen zu verstehen.
Die Trainingsdatentabelle charakterisiert das Gemüse basierend auf:
- Gestalten
- Farbe
- Größe
Gestalten | Farbe | Größe | Gemüse |
---|---|---|---|
Es ist genauer als unbeaufsichtigtes Lernen, da Eingabedaten und entsprechende Ausgaben bekannt sind und die Maschine nur Vorhersagen geben muss. | Es hat eine geringere Genauigkeit, da die Eingabedaten unbeschriftet sind. Daher muss die Maschine zuerst die Daten verstehen und beschriften und dann Vorhersagen treffen. | ||
Runden | Braun | Groß | Zwiebel |
Runden | Netz | Mittel | Tomate |
Zylindrisch | Weiß | Groß | Rettich |
Zylindrisch | Netz | Mittel | Karotte |
Wenn diese Trainingsdatentabelle der Maschine zugeführt wird, erstellt sie ein logisches Modell unter Verwendung der Form, Farbe, Größe des Gemüses usw., um das Ergebnis (Gemüse) vorherzusagen.
Wenn diesem Modell eine neue Eingabe zugeführt wird, analysiert der Algorithmus die Parameter und gibt den Namen der Frucht aus.
Für unbeaufsichtigtes Lernen:
Beim unbeaufsichtigten Lernen werden Gruppen oder Cluster basierend auf Attributen erstellt. Im obigen Beispieldatensatz sind die Parameter für Gemüse:
# 1) Form
Das Gemüse wird nach Form gruppiert.
- Runden: Zwiebel und Tomate.
- Zylindrisch: Rettich und Karotte.
Nehmen Sie einen anderen Parameter wie Größe.
# 2) Größe
Das Gemüse wird nach Größe und Form gruppiert:
- Mittlere Größe und runde Form: Tomate
- Große Größe und runde Form: Zwiebel
Beim unbeaufsichtigten Lernen haben wir keinen Trainingsdatensatz und keine Ergebnisvariable, während beim überwachten Lernen die Trainingsdaten bekannt sind und zum Trainieren des Algorithmus verwendet werden.
Unterschied zwischen überwachtem und unbeaufsichtigtem Lernen
Überwacht | Unbeaufsichtigt |
---|---|
Bei überwachten Lernalgorithmen ist die Ausgabe für die gegebene Eingabe bekannt. | Bei unbeaufsichtigten Lernalgorithmen ist die Ausgabe für die angegebene Eingabe unbekannt. |
Die Algorithmen lernen aus beschrifteten Datensätzen. Diese Daten helfen bei der Bewertung der Genauigkeit von Trainingsdaten. | Der Algorithmus wird mit unbeschrifteten Daten bereitgestellt, in denen versucht wird, Muster und Assoziationen zwischen den Datenelementen zu finden. |
Es ist eine prädiktive Modellierungstechnik, die die zukünftigen Ergebnisse genau vorhersagt. | Es ist eine beschreibende Modellierungstechnik, die die reale Beziehung zwischen den Elementen und der Geschichte der Elemente erklärt. |
Es enthält Klassifizierungs- und Regressionsalgorithmen. | Es enthält Lernalgorithmen für Clustering- und Assoziationsregeln. |
Einige Algorithmen für überwachtes Lernen sind lineare Regression, naive Bayes und neuronale Netze. | Einige Algorithmen für unbeaufsichtigtes Lernen sind k-means Clustering, Apriori usw. |
Diese Art des Lernens ist relativ komplex, da beschriftete Daten erforderlich sind. | Es ist weniger komplex, da keine Daten verstanden und gekennzeichnet werden müssen. |
Es ist ein Online-Prozess der Datenanalyse und erfordert keine menschliche Interaktion. | Dies ist eine Echtzeitanalyse von Daten. |
Halbüberwachtes Lernen
Der halbüberwachte Lernansatz erfordert sowohl die Eingabe von gekennzeichneten als auch von nicht gekennzeichneten Trainingsdaten. Diese Art des Lernens ist nützlich, wenn es schwierig ist, nützliche Funktionen aus unbeschrifteten Daten zu extrahieren (überwachter Ansatz) und Datenexperten Schwierigkeiten haben, die Eingabedaten zu kennzeichnen (unbeaufsichtigter Ansatz).
Nur eine kleine Menge beschrifteter Daten in diesen Algorithmen kann zur Genauigkeit des Modells führen.
Beispiele Zum halbüberwachten Lernen gehören CT-Scans und MRTs, bei denen ein medizinischer Experte einige Punkte in den Scans für jede Krankheit kennzeichnen kann, während es schwierig ist, alle Scans zu kennzeichnen.
Fazit
Die maschinellen Lernaufgaben werden grob in überwachte, unbeaufsichtigte, halbüberwachte und verstärkte Lernaufgaben unterteilt.
Überwachtes Lernen ist Lernen mit Hilfe von beschrifteten Daten. Die ML-Algorithmen werden mit einem Trainingsdatensatz gespeist, in dem für jede Eingabedaten die Ausgabe bekannt ist, um zukünftige Ergebnisse vorherzusagen.
Dieses Modell ist sehr genau und schnell, erfordert jedoch viel Fachwissen und Zeit für die Erstellung. Außerdem müssen diese Modelle neu erstellt werden, wenn sich die Daten ändern. ML-Aufgaben wie Regression und Klassifizierung werden in einer überwachten Lernumgebung ausgeführt.
Interview Fragen zu Rest Web Services Java
Unbeaufsichtigtes Lernen findet ohne die Hilfe eines Betreuers statt. Die den ML-Algorithmen zugeführten Eingabedaten sind unbeschriftet, d. H. Für jeden Eingang ist kein Ausgang bekannt. Der Algorithmus selbst ermittelt die Trends und Muster in den Eingabedaten und stellt eine Zuordnung zwischen den verschiedenen Attributen der Eingabe her.
Diese Art des Lernens ist nützlich, um Muster in Daten zu finden, Datencluster zu erstellen und Echtzeitanalysen durchzuführen. Aufgaben wie Clustering, KNN-Algorithmen usw. fallen unter unbeaufsichtigtes Lernen.
Semi-Supervised Learning-Aufgaben bieten den Vorteil von überwachten und nicht überwachten Algorithmen, indem die Ergebnisse anhand von beschrifteten und unbeschrifteten Daten vorhergesagt werden. Reinforcement Learning ist eine Art Rückkopplungsmechanismus, bei dem die Maschine aus ständigen Rückmeldungen aus der Umgebung lernt, um ihr Ziel zu erreichen.
Bei dieser Art des Lernens führen die KI-Agenten einige Aktionen für die Daten aus, und die Umgebung gibt eine Belohnung. Reinforcement Learning wird von Multiplayer-Spielen für Kinder, selbstfahrende Autos usw. verwendet.
Besuchen Sie unser bevorstehendes Tutorial, um mehr über maschinelles Lernen und künstliches neuronales Netzwerk zu erfahren!
=> Besuchen Sie hier für die exklusive maschinelle Lernserie
Literatur-Empfehlungen
- Data Mining gegen maschinelles Lernen gegen künstliche Intelligenz gegen tiefes Lernen
- 11 beliebtesten Software-Tools für maschinelles Lernen im Jahr 2021
- Tutorial für maschinelles Lernen: Einführung in ML und seine Anwendungen
- Python-Datentypen
- C ++ - Datentypen
- Arten von Risiken in Softwareprojekten
- Arten von Migrationstests: Mit Testszenarien für jeden Typ
- 15 besten Lernmanagementsysteme (LMS des Jahres 2021)