fbpx
Home Data Science Was ist Machine Learning (ML)?

Was ist Machine Learning (ML)?

Innerhalb des breiten Feldes der künstlichen Intelligenz ist Machine Learning ein bedeutendes Teilgebiet, welches sich in zwei Hauptkategorien unterteilen lässt: supervised und unsupervised ML.

Supervised Learning

Im Supervised Machine Learning werden dem Algorithmus Trainingsdaten, welche sowohl die Eingangsinformationen als auch die entsprechenden Zielinformationen enthalten, als Input bereitgestellt.
Das Modell wird auf diesem gelabelten Datenset trainiert, Beziehungen und Zusammenhänge zwischen den Daten und der mitgegebenen Zielvariable zu erkennen.
Ein anschauliches Beispiel für Supervised Machine Learning ist die E-Mail-Klassifizierung in Spam oder Nicht-Spam. Dabei werden dem Algorithmus eine Vielzahl von E-Mails mit entsprechenden Labels („Spam“ oder „Nicht-Spam“) als Trainingsdaten übermittelt. Der Algorithmus lernt aus diesen Daten, Muster zu erkennen, und ist anschließend in der Lage, neue, nicht gekennzeichnete E-Mails automatisch als Spam oder Nicht-Spam zu klassifizieren.

Schaubild ML Supervised Learning
Beispieldatenset mit Klassifizierungs-Zielinformationen (Label) Gehalt grösser gleich 60.000 Euro

Um den Klassifizierungsalgorithmus besser zu kalibrieren zu können, erfolgt eine Aufteilung der verfügbaren Daten in sogenannte Trainings-, Validierungs- und Testsets. Der Trainingsdatensatz wird genutzt, um das Modell zu trainieren, indem es Muster zwischen den Eingabedaten und den Zielwerten erlernt. Der Validierungsdatensatz ermöglicht die Feinabstimmung der Modellparameter und überwacht die Leistung während des Trainings, um Überanpassungen zu vermeiden.
Das Testset wird ausschliesslich dazu verwendet, um die endgültige Leistung des trainierten Modells auf unabhängigen Daten zu bewerten und sicherzustellen, dass es generalisierbare Vorhersagen trifft.

Schaubild ML Supervised Learning

Die folgende Grafik zeigt eine Konfusionsmatrix, ein Werkzeug zur Evaluierung der Leistung eines Klassifizierungsmodells, indem sie die Anzahl der korrekt und inkorrekt klassifizierten Beispiele für jede Klasse darstellt.

Schaubild ML Supervised Learning

Mithilfe dieser lassen sich die zwei wichtigsten Metriken einer Klassifikation berechnen: Recall und Precision.
Die Precision misst den Prozentsatz der korrekt klassifizierten Beispiele im Verhältnis zur Gesamtanzahl der Beispiele, während der Recall (auch Sensitivität genannt) den Prozentsatz der korrekt positiven Fälle im Verhältnis zur Gesamtanzahl der tatsächlichen positiven Fälle misst.
Am oben erwähnten Beispiel für die Klassifikation von Spam-Emails:

Calculation Recall and Precision Supervised Learning

Unsupervised Learning

Im Unsupervised Machine Learning werden den Algorithmen Trainingsdaten bereitgestellt, die keine Zielinformationen enthalten (unlabeled). Das Modell erkennt automatisch Muster und Strukturen in den Daten, ohne dass eine Zielvariable bekannt oder vorgegeben ist. Diese Methode wird häufig zur Datensegmentierung und Entdeckung verborgener Zusammenhänge verwendet. Beispiele für Unsupervised Learning sind die Segmentierungsanalyse (Clustering) und Anomalieerkennung, bei der ungewöhnlichen oder abweichenden Muster in Daten identifiziert werden, die von normalen Verhaltensweisen abweichen könnten, wie beispielsweise die Erkennung von betrügerischen Transaktionen in Finanzdaten im Bankwesen.

Reinforcement Learning

Im Reinforcement Learning erfolgt das Lernen des Algorithmus durch Interaktion mit einer Umgebung, in der Belohnungen oder Bestrafungen für seine Aktionen bereitgestellt werden. Das Modell passt seine Strategien kontinuierlich an, um langfristige Belohnungen zu maximieren. Diese Methode findet in verschiedenen Bereichen Anwendung, darunter Robotik, Spiele und Entscheidungsfindung.

Weitere Informationen zum Unterschied zwischen Artificial Intelligence und Machine Learning finden Sie in diesem Wiki-Artikel.

Mehr wissen?

Sie möchten tiefer in das Thema Machine Learning einsteigen? Gerne sprechen wir persönlich mit Ihnen darüber – nehmen Sie einfach Kontakt mit uns auf!

Ihre Ansprechpartnerin für Data Science Themen
Nadine Matt_2
Nadine Matt
Customer Engagement & Communication Executive

Published by:

Franziskus Heep

Professional Analytics Consultant

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 22

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

SAP Analysis for Microsoft Office vs. SAP Analytics Cloud Excel Add-In: Funktionen und Unterschiede

Dieser Artikel vergleicht die Features und Einsatzmöglichkeiten von SAP Analysis for Microsoft Office (AfO) und dem SAP Analytics Cloud (SAC)…

Wiki Big Query SAP Warehousing

Google BigQuery vs. SAP Warehousing

In diesem Wiki-Artikel werden zwei führende Lösungen für die Datenverwaltung und -analyse in der modernen datengetriebenen Welt vorgestellt: Google BigQuery und SAP BW. Beide Systeme bieten leistungsstarke Funktionen, unterscheiden sich jedoch in ihren Ansätzen und Einsatzbereichen.

Wiki SAC GCP Excelimport

SAC & GCP Excel-Import

Der Artikel beschreibt die SAC & GCP Lösung, mit der Excel Plandaten einfach und komfortabel in SAP Analytics Cloud (SAC) Modelle importiert werden können. Mit Hilfe von Excel-Templates und einer benutzerfreundlichen Web-Applikation werden die Daten lokal aufbereitet und über die SAC Data Import API automatisiert in das SAC-Modell übertragen.

Titelbild Wiki Was ist Artificial Intelligence (AI) (1)

Was ist Artificial Intelligence (AI)?

Artificial Intelligence steht für Künstliche Intelligenz (KI). Und da es keine allgemein anerkannte philosophische Definition von Intelligenz gibt, lassen sich auch unterschiedliche Auffassungen darüber finden, was Künstliche Intelligenz ist…

Wiki How to R - Beginners Guide (1)

How to R – Beginner Guide Zeitreihenanalyse

Wir beschränken uns in diesem kleinen Tutorial darauf, die wesentlichen Schritte in der Zeitreihenanalyse kurz in der Programmiersprache R zu skizzieren…

EU Taxonomie Wiki

EU Taxonomie – Implentierung in einem SAP-Analytics-System

Von der KPI Definition bis zum Reporting: Bewerten Sie Ihre Unternehmens-Aktivitäten Umsatz, CapEx und OpEx gemäss den EU Taxonomie Kriterien. Wir begleiten Sie Schritt für-Schritt bei der erfolgreichen Umsetzung der EU Taxonomie Richtlinien…

Wiki SCT

Sustainability Control Tower (SCT)

In einer Zeit, in der nachhaltiges Wirtschaften unabdingbar ist, steht die Überwachung und Erfassung der eigenen Nachhaltigkeitsleistung durch präzise Daten immer mehr im Mittelpunkt. Eine umfassende Nachhaltigkeitslösung, die ein ganzheitliches Reporting ermöglicht, ist der SAP Sustainability Control Tower…

GDPR Cookie Consent with Real Cookie Banner