Accueil Science des données Qu'est-ce que le Machine Learning (ML) ?

Qu'est-ce que le Machine Learning (ML) ?

Page de couverture Wiki Qu'est-ce que l'apprentissage automatique (ML) ?

Dans le vaste domaine de l'intelligence artificielle, l'apprentissage automatique est un domaine important qui peut être divisé en deux catégories principales : supervised et unsupervised ML.

Apprentissage supervisé

Dans l'apprentissage automatique supervisé, des données d'apprentissage contenant à la fois les informations d'entrée et les informations cibles correspondantes sont fournies à l'algorithme en tant qu'entrée.
Le modèle est entraîné sur cet ensemble de données étiquetées à reconnaître les relations et les liens entre les données et la variable cible fournie.
Un exemple clair de Supervised Machine Learning est la classification des e-mails en spams ou non spams. Pour ce faire, l'algorithme reçoit un grand nombre d'e-mails avec des étiquettes correspondantes ("spam" ou "non spam") comme données d'entraînement. L'algorithme apprend à reconnaître des modèles à partir de ces données et est ensuite en mesure de classer automatiquement les nouveaux e-mails non étiquetés comme spam ou non spam.

Graphique ML Apprentissage supervisé
Exemple d'ensemble de données avec informations sur la cible de classification (label) Salaire supérieur ou égal à 60.000 euros

Afin de mieux calibrer l'algorithme de classification, les données disponibles sont divisées en ensembles d'apprentissage, de validation et de test. L'ensemble de données d'entraînement est utilisé pour former le modèle en apprenant des modèles entre les données d'entrée et les valeurs cibles. L'ensemble de données de validation permet d'affiner les paramètres du modèle et de surveiller les performances pendant l'entraînement afin d'éviter les surajustements.
L'ensemble de test est utilisé exclusivement pour évaluer les performances finales du modèle entraîné sur des données indépendantes et pour s'assurer qu'il effectue des prédictions généralisables.

Graphique ML Apprentissage supervisé

Le graphique suivant présente une matrice de confusion, un outil permettant d'évaluer la performance d'un modèle de classification en représentant le nombre d'exemples correctement et incorrectement classés pour chaque classe.

Graphique ML Apprentissage supervisé

Ces derniers permettent de calculer les deux principales métriques d'une classification : Recall et Precision.
La Precision mesure le pourcentage d'exemples correctement classés par rapport au nombre total d'exemples, tandis que le Recall (également appelé sensibilité) mesure le pourcentage de cas correctement positifs par rapport au nombre total de cas réellement positifs.
En prenant l'exemple mentionné ci-dessus pour la classification des spams :

Calcul du rappel et de la précision de l'apprentissage supervisé

Apprentissage non supervisé

Dans l'apprentissage automatique non supervisé, les algorithmes reçoivent des données d'apprentissage qui ne contiennent aucune information cible (unlabeled). Le modèle reconnaît automatiquement des modèles et des structures dans les données, sans qu'une variable cible ne soit connue ou prédéfinie. Cette méthode est souvent utilisée pour la segmentation des données et la découverte de corrélations cachées. Des exemples d'apprentissage non supervisé sont l'analyse de segmentation (clustering) et la détection d'anomalies, qui consiste à identifier des modèles inhabituels ou différents dans les données qui pourraient s'écarter des comportements normaux, comme la détection de transactions frauduleuses dans les données financières dans le secteur bancaire.

Apprentissage par renforcement

Dans l'apprentissage par renforcement, l'apprentissage de l'algorithme se fait par interaction avec un environnement dans lequel des récompenses ou des punitions sont fournies pour ses actions. Le modèle adapte continuellement ses stratégies afin de maximiser les récompenses à long terme. Cette méthode est utilisée dans différents domaines, notamment la robotique, les jeux et la prise de décision.

Pour en savoir plus sur la différence entre l'intelligence artificielle et l'apprentissage automatique, consultez cet article wiki.

En savoir plus ?

Vous souhaitez approfondir le thème du Machine Learning ? Nous nous ferons un plaisir d'en discuter avec vous personnellement. N'hésitez pas à nous contacter !

Votre interlocuteur pour les thèmes de la science des données
Christiane Maria Kallfass est spécialiste du recrutement et du marketing chez s-peers AG
Christiane Grimm
Ventes internes

Publié par :

Franziskus Heep

Consultant professionnel en analyse

autor:IN

Cet article vous a-t-il plu ?

Cet article vous a-t-il été utile ?

Cliquez sur une étoile pour évaluer !

Évaluation moyenne 5 / 5.
Nombre d'évaluations : 22

Aucun vote pour l'instant ! Soyez la première personne à noter ce post !

INFORMATIONS

Plus d'informations

Qu'est-ce que SAP S/4HANA ?

SAP S/4HANA est bien plus qu'une simple mise à niveau technique : il s'agit d'une transformation fondamentale du système. Dans cet article, vous découvrirez...

L'IA à la rencontre de la BI : le reporting moderne dans le Lakehouse de Databricks

Dans le monde informatique traditionnel, on observe souvent deux univers distincts : la Business Intelligence (BI), qui s'occupe de l'analyse des données historiques...
Image symbolique représentant les formats de données dans Databricks. Une icône illustre la structure en couches des fichiers Parquet avec une couche Delta Lake superposée.

Formats de données dans Databricks : guide sur Parquet, Delta Lake et les alternatives

Le choix du format de données approprié est un facteur critique, mais souvent sous-estimé, pour la performance et l'efficacité dans Databricks.
wiki_aperçu des méthodes d'intégration_SAp selon Databricks-

Données SAP vers Databricks : comparaison des 5 méthodes d'intégration

Comment cela fonctionne-t-il dans le partage de données avec SAP et Databricks ? Le partenariat stratégique entre SAP et Databricks permet une...
Wiki SAP Databricks

Zero Copy Delta Share chez Databricks : partager des données sans les copier – le principe Zero Copy expliqué simplement

Comment cela fonctionne-t-il dans le partage de données avec SAP et Databricks ? Le partenariat stratégique entre SAP et Databricks permet une...
9.1 Différences entre SAP Databricks et native Databricks

SAP Databricks vs. Native Databricks : la comparaison détaillée pour votre entreprise

SAP Databricks ou Native Databricks ? Il s'agit d'une décision stratégique à laquelle de nombreuses entreprises sont confrontées. Alors que SAP Databricks est une solution spécialisée...
20251127_Mise à jour des fonctionnalités

SAC Live Connect vers Snowflake – Explication étape par étape

Comment fonctionne SAC Live Connect avec Snowflake ? Dans ce guide, nous vous expliquons étape par étape comment créer une...