Deep Learning
Ein Teilbereich des Machine Learning, der tiefe künstliche neuronale Netze mit vielen Schichten nutzt, um komplexe Muster in großen Datenmengen zu erkennen.
Ein von biologischen Gehirnen inspiriertes Rechenmodell, das aus vernetzten künstlichen Neuronen besteht und Muster in Daten erkennen kann.
Ein neuronales Netz ist ein Computermodell, das lose vom menschlichen Gehirn inspiriert ist. Es besteht aus vielen kleinen Recheneinheiten – den künstlichen Neuronen – die in Schichten angeordnet und miteinander verbunden sind.
Aufbau eines neuronalen Netzes:
Wie lernt ein neuronales Netz?
Das ist wie Lernen durch Übung: Mit jedem Durchgang wird das Netz ein kleines bisschen besser.
Ein einzelnes Neuron berechnet:
output = activation(Σ(wi * xi) + bias)
Die Nichtlinearität ist entscheidend – ohne sie könnte das Netz nur lineare Zusammenhänge lernen, egal wie viele Schichten es hat.
Dense / Fully Connected:
Convolutional:
Recurrent:
Attention:
Backpropagation berechnet, wie stark jedes Gewicht zum Gesamtfehler beiträgt:
Optimierungsalgorithmen:
Vanishing Gradient:
Exploding Gradient:
Overfitting:
Ein neuronales Netz funktioniert wie eine Firma mit vielen Abteilungen: Die Eingangsdaten kommen in der Poststelle an, werden von Abteilung zu Abteilung weitergereicht und verarbeitet, bis am Ende eine Entscheidung herauskommt – jede Abteilung ist auf einen bestimmten Aspekt spezialisiert.
Besteht aus Schichten von künstlichen Neuronen, die Eingaben verarbeiten und weiterleiten
Lernt durch Anpassung der Verbindungsgewichte zwischen Neuronen (Backpropagation)
Grundbaustein für Deep Learning und moderne KI-Systeme
Mustererkennung
Erkennung von Handschrift, Gesichtern und Objekten in Bildern
Zeitreihenprognose
Vorhersage von Aktienkursen, Wetter oder Energieverbrauch
Sprachsynthese
Text-to-Speech-Systeme, die natürlich klingende Sprache erzeugen
Spielstrategien
KI-Systeme, die Schach, Go oder Videospiele auf übermenschlichem Niveau spielen
Ein künstliches Neuron empfängt mehrere Eingaben, multipliziert jede mit einem Gewicht, summiert alles auf und wendet eine Aktivierungsfunktion an. Ist das Ergebnis über einem Schwellenwert, 'feuert' das Neuron und gibt den Wert an die nächste Schicht weiter.
Das hängt von der Aufgabe ab. Einfache Probleme lassen sich mit 2-3 Schichten lösen. Komplexe Aufgaben wie Bilderkennung oder Sprachverarbeitung brauchen dutzende bis hunderte Schichten (Deep Learning).
Nur grob inspiriert. Biologische Neuronen sind wesentlich komplexer als künstliche. Moderne neuronale Netze funktionieren fundamental anders als das Gehirn – sie nutzen Backpropagation und Gradient Descent, Mechanismen, die es im Gehirn so nicht gibt.
Ein neuronales Netz ist die Grundarchitektur. Deep Learning bezeichnet den Einsatz von neuronalen Netzen mit vielen Schichten (typisch >3). Jedes Deep-Learning-Modell ist ein neuronales Netz, aber nicht jedes neuronale Netz ist 'deep'.