Maschinelles Lernen/überwachtes Lernen

Einleitung

Bearbeiten

Der Algorithmus lernt eine Funktion aus gegebenen Paaren von Ein- und Ausgaben. Dabei stellt während des Lernens ein „Lehrer“ den korrekten Funktionswert zu einer Eingabe bereit. Ziel beim überwachten Lernen ist, dass dem Netz nach mehreren Rechengängen mit unterschiedlichen Ein- und Ausgaben die Fähigkeit antrainiert wird, Assoziationen herzustellen.

Veranschaulichung

Bearbeiten
 
Eingabe-Verarbeitung-Ausgabe und Training

Beispiel - Automatische Klassifizierung

Bearbeiten

Ein Teilgebiet des überwachten Lernens ist die automatische Klassifizierung. Ein Anwendungsbeispiel wäre die Handschrifterkennung. Dabei bekommt das System Bildinformationen über geschrieben Buchstaben oder ganze Wörter und erhält gleichzeitig die Information, welche Buchstaben in dem Bild kodiert waren. Die Klassifizierung hat als Eingaberaum dann Bilder und als Ausgaberaum Buchstaben bzw. Buchstabenfolgen.

Zeitliche Veränderung eines Systems

Bearbeiten

In dem Begriff des "überwachten maschinelles Lernens" eines System   steckt bereits eine zeitliche Veränderung des Systems in der Zeit, wobei die Ausgabe überwacht wird und z.B. die Abweichung von einem Sollwert aus den Trainingsdaten für die Anpassung der Lernparameter verwendet wird. In der folgenden Lernressource wird daher ein Maschinelles Lernsystem (kurz ML-System)   mit einem Zeitindex   versehen, das den Zustand des ML-Systems   zum Zeitpunkt  .

Maschinelles Lernen als Funktionenfolge

Bearbeiten

In dieser Lernressource wird Maschinelles Lernen (ML) als eine Funktionenfolge   betrachtet, das sich in der Zeit   verändert.   ist zu jedem Zeitpunkt   eine Abbildung von einem Definitionsbereich   in den Wertebereich  .

Verallgemeinerungsfähigkeit

Bearbeiten

Ein künstliches System, das aus Beispielen lernt, kann "verallgemeinern", wenn nicht nur für die Trainingsdaten (z.B. Ein-Ausgabepaare   aus dem Ein-Ausgabegrundraum) korrekt Ausgaben produziert werden, sondern auch für neue unbekannte Eingaben korrekte bzw. akzeptabel gute Ausgaben produziert werden.

Ein-Ausgabepaare beim überwachtes Lernen

Bearbeiten

Wenn man Ein-Ausgabepaare   als Trainingsdaten verwendet, spricht man von überwachtem Lernen. Die   entspricht den erwarteten/empfohlenen Ausgaben einer "lehrenden" bzw. trainierenden Instanz. In der Trainingsphase bekommt das System   Daten der Form der Ein-Ausgabepaare   und in der Testphase.

Unterkategorien für Überwachtes Lernen

Bearbeiten

Es lassen sich noch einige Unterkategorien für Überwachtes Lernen identifizieren, die in der Literatur häufiger erwähnt werden:

  • Teilüberwachtes Lernen (englisch semi-supervised learning) Nur für einen Teil der Eingaben sind die dazugehörigen Ausgaben bekannt.[1]
  • Aktives Lernen (englisch active learning) Der Algorithmus hat die Möglichkeit, für einen Teil der Eingaben die korrekten Ausgaben zu erfragen. Dabei muss der Algorithmus die Fragen bestimmen, welche einen hohen Informationsgewinn versprechen, um die Anzahl der Fragen möglichst klein zu halten.[2]
  • Selbständiges Lernen (englisch self-training) Dieser Algorithmus kann in zwei wesentliche Komponenten eingeteilt werden. Die erste Algorithmuskomponente (Lehrer) leitet aus einem bestehenden gelabelten Datensatz weitere Datensätze mit Pseudolabeln her. Die zweite Algorithmuskomponente lernt nun aus dem erweiterten gelabelten Datensatz und wendet gefundene Muster für ihr eigenes Modell an.[3]

Siehe auch

Bearbeiten

Quellennachweise

Bearbeiten
  1. Ralf Mikut: Data Mining in der Medizin und Medizintechnik. KIT Scientific Publishing, 2008, ISBN 978-3-86644-253-5, S. 34 (Google books).
  2. Paul Fischer: Algorithmisches Lernen. Springer-Verlag, 2013, ISBN 978-3-663-11956-2, S. 6–7 (Google books).
  3. Self-training with Noisy Student improves ImageNet classification. In: Arxiv. Abgerufen am 20. Dezember 2019 (englisch).