Home Data Science Was ist Machine Learning (ML)?

Was ist Machine Learning (ML)?

Titelbild Wiki Was ist Machine Learning (ML)

Innerhalb des breiten Feldes der künstlichen Intelligenz ist Machine Learning ein bedeutendes Teilgebiet, welches sich in zwei Hauptkategorien unterteilen lässt: supervised und unsupervised ML.

Supervised Learning

Im Supervised Machine Learning werden dem Algorithmus Trainingsdaten, welche sowohl die Eingangsinformationen als auch die entsprechenden Zielinformationen enthalten, als Input bereitgestellt.
Das Modell wird auf diesem gelabelten Datenset trainiert, Beziehungen und Zusammenhänge zwischen den Daten und der mitgegebenen Zielvariable zu erkennen.
Ein anschauliches Beispiel für Supervised Machine Learning ist die E-Mail-Klassifizierung in Spam oder Nicht-Spam. Dabei werden dem Algorithmus eine Vielzahl von E-Mails mit entsprechenden Labels („Spam“ oder „Nicht-Spam“) als Trainingsdaten übermittelt. Der Algorithmus lernt aus diesen Daten, Muster zu erkennen, und ist anschließend in der Lage, neue, nicht gekennzeichnete E-Mails automatisch als Spam oder Nicht-Spam zu klassifizieren.

Schaubild ML Supervised Learning
Beispieldatenset mit Klassifizierungs-Zielinformationen (Label) Gehalt grösser gleich 60.000 Euro

Um den Klassifizierungsalgorithmus besser zu kalibrieren zu können, erfolgt eine Aufteilung der verfügbaren Daten in sogenannte Trainings-, Validierungs- und Testsets. Der Trainingsdatensatz wird genutzt, um das Modell zu trainieren, indem es Muster zwischen den Eingabedaten und den Zielwerten erlernt. Der Validierungsdatensatz ermöglicht die Feinabstimmung der Modellparameter und überwacht die Leistung während des Trainings, um Überanpassungen zu vermeiden.
Das Testset wird ausschliesslich dazu verwendet, um die endgültige Leistung des trainierten Modells auf unabhängigen Daten zu bewerten und sicherzustellen, dass es generalisierbare Vorhersagen trifft.

Schaubild ML Supervised Learning

Die folgende Grafik zeigt eine Konfusionsmatrix, ein Werkzeug zur Evaluierung der Leistung eines Klassifizierungsmodells, indem sie die Anzahl der korrekt und inkorrekt klassifizierten Beispiele für jede Klasse darstellt.

Schaubild ML Supervised Learning

Mithilfe dieser lassen sich die zwei wichtigsten Metriken einer Klassifikation berechnen: Recall und Precision.
Die Precision misst den Prozentsatz der korrekt klassifizierten Beispiele im Verhältnis zur Gesamtanzahl der Beispiele, während der Recall (auch Sensitivität genannt) den Prozentsatz der korrekt positiven Fälle im Verhältnis zur Gesamtanzahl der tatsächlichen positiven Fälle misst.
Am oben erwähnten Beispiel für die Klassifikation von Spam-Emails:

Calculation Recall and Precision Supervised Learning

Unsupervised Learning

Im Unsupervised Machine Learning werden den Algorithmen Trainingsdaten bereitgestellt, die keine Zielinformationen enthalten (unlabeled). Das Modell erkennt automatisch Muster und Strukturen in den Daten, ohne dass eine Zielvariable bekannt oder vorgegeben ist. Diese Methode wird häufig zur Datensegmentierung und Entdeckung verborgener Zusammenhänge verwendet. Beispiele für Unsupervised Learning sind die Segmentierungsanalyse (Clustering) und Anomalieerkennung, bei der ungewöhnlichen oder abweichenden Muster in Daten identifiziert werden, die von normalen Verhaltensweisen abweichen könnten, wie beispielsweise die Erkennung von betrügerischen Transaktionen in Finanzdaten im Bankwesen.

Reinforcement Learning

Im Reinforcement Learning erfolgt das Lernen des Algorithmus durch Interaktion mit einer Umgebung, in der Belohnungen oder Bestrafungen für seine Aktionen bereitgestellt werden. Das Modell passt seine Strategien kontinuierlich an, um langfristige Belohnungen zu maximieren. Diese Methode findet in verschiedenen Bereichen Anwendung, darunter Robotik, Spiele und Entscheidungsfindung.

Weitere Informationen zum Unterschied zwischen Artificial Intelligence und Machine Learning finden Sie in diesem Wiki-Artikel.

Mehr wissen?

Sie möchten tiefer in das Thema Machine Learning einsteigen? Gerne sprechen wir persönlich mit Ihnen darüber – nehmen Sie einfach Kontakt mit uns auf!

Ihre Ansprechpartnerin für Data Science Themen
Christiane Maria Kallfass ist Recruiting- und Marketing Specialist bei der s-peers AG
Christiane Kallfass
Recruiting- und Marketing Specialist

Published by:

Franziskus Heep

Professional Analytics Consultant

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 22

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

Business Content in der SAP Datasphere – Wiki Visual

Business Content in der SAP Datasphere – Best Practices für schnelle Fortschritte

SAP Datasphere bietet, ähnlich wie SAP BW oder SAP Analytics Cloud vordefinierten Business Content an. Dieser besteht aus Datenmodellen...

Optimized vs. Classic Mode in der SAP Analytics Cloud

Die SAP Analytics Cloud (SAC) bietet Nutzern aktuell zwei Hauptmodi...
Wiki_Banner_Using Sharepoint as a Datasource_2

SharePoint als Datenquelle für BW/DS

SharePoint ist eine weit verbreitete Plattform in Unternehmen und bietet...
Was kann das neue SAC Add-in for Microsoft PowerPoint (Composable Analytics)? Visual

Was kann das neue SAC Add-in for Microsoft PowerPoint (Composable Analytics)?

In diesem Wiki Artikel geht es um das neue SAP Analytics Cloud (SAC) Add-in für Microsoft PowerPoint, das eine...
Metadatenmanagement mit dem Data Catalog - Für Dein Mehrwert!

Von Ordnung zu Mehrwert: Metadatenmanagement mit dem Data Catalog

Der SAP Datasphere Data Catalog bietet ein zentrales Verzeichnis für Unternehmensdaten, das durch strukturierte Metadaten den Zugang und das...
Plandaten-Import-fuer-die-Personalkostenplanung-Wie-Google-Cloud-Success-Factors-und-SAP-Analytics-Cloud-verbindet-1.jpg Visual

Google Cloud und SAP: Erfolgreiche Integration von SuccessFactors und Analytics Cloud

Die SAP Analytics Cloud (SAC) ermöglicht Unternehmen eine flexible und...