Was ist Machine Learning (ML)?
- Data Science
- machine learning
- 3 Min Lesezeit
Franziskus Heep
Was ist Machine Learning (ML)?
Innerhalb des breiten Feldes der künstlichen Intelligenz ist Machine Learning ein bedeutendes Teilgebiet, welches sich in zwei Hauptkategorien unterteilen lässt: supervised und unsupervised ML.
Supervised Learning
Im Supervised Machine Learning werden dem Algorithmus Trainingsdaten, welche sowohl die Eingangsinformationen als auch die entsprechenden Zielinformationen enthalten, als Input bereitgestellt.
Das Modell wird auf diesem gelabelten Datenset trainiert, Beziehungen und Zusammenhänge zwischen den Daten und der mitgegebenen Zielvariable zu erkennen.
Ein anschauliches Beispiel für Supervised Machine Learning ist die E-Mail-Klassifizierung in Spam oder Nicht-Spam. Dabei werden dem Algorithmus eine Vielzahl von E-Mails mit entsprechenden Labels („Spam“ oder „Nicht-Spam“) als Trainingsdaten übermittelt. Der Algorithmus lernt aus diesen Daten, Muster zu erkennen, und ist anschließend in der Lage, neue, nicht gekennzeichnete E-Mails automatisch als Spam oder Nicht-Spam zu klassifizieren.
Um den Klassifizierungsalgorithmus besser zu kalibrieren zu können, erfolgt eine Aufteilung der verfügbaren Daten in sogenannte Trainings-, Validierungs- und Testsets. Der Trainingsdatensatz wird genutzt, um das Modell zu trainieren, indem es Muster zwischen den Eingabedaten und den Zielwerten erlernt. Der Validierungsdatensatz ermöglicht die Feinabstimmung der Modellparameter und überwacht die Leistung während des Trainings, um Überanpassungen zu vermeiden.
Das Testset wird ausschliesslich dazu verwendet, um die endgültige Leistung des trainierten Modells auf unabhängigen Daten zu bewerten und sicherzustellen, dass es generalisierbare Vorhersagen trifft.
Die folgende Grafik zeigt eine Konfusionsmatrix, ein Werkzeug zur Evaluierung der Leistung eines Klassifizierungsmodells, indem sie die Anzahl der korrekt und inkorrekt klassifizierten Beispiele für jede Klasse darstellt.
Mithilfe dieser lassen sich die zwei wichtigsten Metriken einer Klassifikation berechnen: Recall und Precision.
Die Precision misst den Prozentsatz der korrekt klassifizierten Beispiele im Verhältnis zur Gesamtanzahl der Beispiele, während der Recall (auch Sensitivität genannt) den Prozentsatz der korrekt positiven Fälle im Verhältnis zur Gesamtanzahl der tatsächlichen positiven Fälle misst.
Am oben erwähnten Beispiel für die Klassifikation von Spam-Emails:
Unsupervised Learning
Im Unsupervised Machine Learning werden den Algorithmen Trainingsdaten bereitgestellt, die keine Zielinformationen enthalten (unlabeled). Das Modell erkennt automatisch Muster und Strukturen in den Daten, ohne dass eine Zielvariable bekannt oder vorgegeben ist. Diese Methode wird häufig zur Datensegmentierung und Entdeckung verborgener Zusammenhänge verwendet. Beispiele für Unsupervised Learning sind die Segmentierungsanalyse (Clustering) und Anomalieerkennung, bei der ungewöhnlichen oder abweichenden Muster in Daten identifiziert werden, die von normalen Verhaltensweisen abweichen könnten, wie beispielsweise die Erkennung von betrügerischen Transaktionen in Finanzdaten im Bankwesen.
Reinforcement Learning
Im Reinforcement Learning erfolgt das Lernen des Algorithmus durch Interaktion mit einer Umgebung, in der Belohnungen oder Bestrafungen für seine Aktionen bereitgestellt werden. Das Modell passt seine Strategien kontinuierlich an, um langfristige Belohnungen zu maximieren. Diese Methode findet in verschiedenen Bereichen Anwendung, darunter Robotik, Spiele und Entscheidungsfindung.
Weitere Informationen zum Unterschied zwischen Artificial Intelligence und Machine Learning finden Sie in diesem Wiki-Artikel.
Mehr wissen?
Sie möchten tiefer in das Thema Machine Learning einsteigen? Gerne sprechen wir persönlich mit Ihnen darüber – nehmen Sie einfach Kontakt mit uns auf!
Published by:
Franziskus Heep
Professional Analytics Consultant
Franziskus Heep
Wie hat Ihnen der Artikel gefallen?
Wie hilfreich war dieser Beitrag?
Klicken Sie auf einen Stern, um zu bewerten!
Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 22
Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!