L'apprentissage automatique, qu'est-ce que c'est ?

Copier l'URL

L'apprentissage automatique (AA) est une sous-catégorie de l'intelligence artificielle (IA) qui utilise des algorithmes pour identifier des schémas et établir des prédictions dans un ensemble de données. Il peut s'agir de nombres, de texte et même d'images. Dans des conditions idéales, l'AA permet aux êtres humains d'interpréter des données plus rapidement et plus précisément qu'ils ne seraient capables de le faire eux-mêmes. Cette technologie est fondée sur des modèles mathématiques grâce auxquels les algorithmes apprennent à partir de données, font des prédictions et optimisent des modèles.

Découvrir Red Hat AI

L'IA est une forme d'intelligence virtuelle qui ressemble à celle d'un être humain, créée par l'homme dans une machine. Pour l'AA, les machines sont programmées afin de reproduire des fonctions cognitives précises qui sont naturelles chez l'homme, telles que la perception, l'apprentissage et la résolution des problèmes.

Pour qu'une machine pense comme un humain, il faut l'entraîner à créer son propre modèle prédictif. Ce modèle permet à la machine d'analyser des données afin de devenir une machine « capable d'apprendre ». Pour lancer ce processus, il faut fournir des données à l'ordinateur et choisir un modèle d'apprentissage afin d'indiquer à la machine comment elle doit traiter les données.

Découvrir comment l'IA peut aider les entreprises

Un modèle d'AA peut utiliser des données pour réaliser trois actions :

  • Décrire un événement
  • Prédire un événement
  • Formuler des suggestions concernant une action future à entreprendre

Le modèle d'apprentissage choisi pour entraîner la machine dépend de la complexité de la tâche et du résultat souhaité. Il existe trois méthodes d'apprentissage automatique : l'apprentissage supervisé, l'apprentissage non supervisé et l'apprentissage par renforcement.

Les algorithmes d'apprentissage supervisé sont entraînés à l'aide d'ensembles de données étiquetées. Ils sont utilisés pour des tâches telles que la reconnaissance d'images.

Les modèles d'apprentissage non supervisé analysent des données non étiquetées pour identifier des similitudes, des schémas et des tendances. Ils sont utilisés pour des tâches telles que la segmentation de clients, les systèmes de recommandation et l'exploration générale des données.

Les modèles d'apprentissage renforcé sont entraînés à l'aide d'un processus d'essais et d'erreurs dans le cadre d'un système de récompense établi. Ils sont par exemple utilisés pour entraîner un ordinateur à jouer à un jeu dans lequel les actions mènent à une victoire ou à une défaite.

Une fois que l'ordinateur a saisi la manière dont il doit interpréter les données (grâce au modèle d'apprentissage et aux données d'entraînement), il est en mesure d'établir des prédictions et de réaliser des tâches lorsque de nouvelles données lui sont présentées. Ses prédictions deviennent plus précises au fil de son apprentissage à partir de flux de données continus, et il devient capable de réaliser des tâches plus rapidement et précisément qu'un humain ne pourrait le faire.

Créer une plateforme de cloud hybride pour les charges de travail d'IA/AA

Ressources Red Hat

Durant la phase d'entraînement de l'AA, le modèle apprend à partir d'un ensemble de données, et les équipes de développement ajustent ses paramètres pour que les résultats contiennent moins d'erreurs. L'entraînement des modèles d'IA améliore la vitesse et la précision des inférences d'IA.

Pour ce faire, les équipes mettent en place un pipeline pour transmettre les données à travers le modèle et évaluer ses prédictions, qui seront ensuite utilisées afin d'améliorer le modèle. Généralement, le pipeline comprend les étapes suivantes :

  1. Collecte et préparation des données : les équipes recueillent, puis préparent les données en séparant les données d'entraînement des données de test, en supprimant les données indésirables et en les randomisant pour qu'elles soient distribuées de façon uniforme. Le processus qui consiste à réduire le nombre de variables d'entrée ou de caractéristiques dans un ensemble de données et à ne conserver que les informations utiles est appelé « réduction de dimensionnalité ».
  2. Sélection d'un modèle : les équipes de science des données et d'ingénierie ont créé des algorithmes d'AA pour différentes tâches, dont la reconnaissance vocale et d'images, ainsi que les prédictions.
  3. Entraînement : une fois préparées, les données d'entrée sont envoyées à travers le modèle afin d'identifier des schémas et de faire des prédictions.
  4. Évaluation : après l'entraînement, les résultats du modèle sont évalués à l'aide d'un ensemble de données n'ayant jamais servi.

Ajustement : les équipes de développement procèdent ensuite au réglage des paramètres pour améliorer le modèle en fonction des résultats de l'étape d'évaluation précédente.

Défis fréquents liés à l'entraînement et à l'évaluation

On observe un surentraînement lorsque le modèle offre de bons résultats avec les données d'entraînement, mais qu'il est moins performant avec les données de test : il apprend trop du bruit des données d'entraînement. Lorsqu'il est peu performant sur les deux ensembles de données, on dit qu'il est sous-entraîné, phénomène qui se produit lorsqu'il ne parvient pas à apprendre les schémas sous-jacents.

Les techniques de réglage fin LoRA et QLoRA aident à optimiser l'utilisation des ressources tout en évitant le surentraînement.

L'utilisation d'un ensemble distinct de données de validation permet d'éviter le surentraînement. Après chaque itération, les résultats du modèle sont évalués par rapport aux données de validation. Les équipes procèdent ensuite à l'ajustement de manière à éviter le surentraînement. Elles utilisent pour cela la réduction de dimensionnalité, en éliminant les données superflues de manière prudente pour éviter tout sous-entraînement.

Lorsque le modèle est sous-entraîné, les équipes de développement ajoutent des éléments d'information pour renforcer sa capacité à saisir les relations complexes dans les données.

Une fuite de données survient lorsque les informations de l'ensemble du test sont accidentellement introduites dans l'ensemble d'entraînement, ce qui conduit à un avantage inéquitable et à une surestimation des performances du modèle.

L'ajustement ainsi que l'ajout de caractéristiques et de données plus pertinentes peuvent réduire les erreurs lors des itérations suivantes. 

Les réseaux de neurones sont un type d'algorithme utilisé pour l'AA. Ils conviennent particulièrement aux tâches impliquant des relations complexes et non linéaires dans les données.Sous-ensemble de l'apprentissage automatique, l'apprentissage profond utilise des réseaux de neurones à plusieurs couches. Ces réseaux de neurones profonds sont structurés de manière à apprendre les schémas hiérarchiques des données. L'apprentissage profond se révèle donc très efficace pour des tâches telles que la reconnaissance d'images et vocale, ainsi que le traitement du langage naturel.

Les technologies d'AA et d'IA peuvent être utilisées pour améliorer l'expérience utilisateur, anticiper le comportement des clients et surveiller des systèmes pour détecter la fraude. Elles peuvent également aider les prestataires de soins de santé à détecter des maladies potentiellement mortelles. Dans notre quotidien, l'apprentissage automatique est très présent, notamment :

  • dans les algorithmes de recommandation qu'utilisent les services de streaming ;
  • dans les standards téléphoniques automatiques et les chatbots ;
  • dans les publicités ciblées ;
  • dans les devis automatisés qu'émettent les établissements financiers.

En savoir plus sur l'IA prédictive et l'IA générative

L'IA générative, sur laquelle reposent aujourd'hui de nombreux outils d'IA, existe grâce à l'apprentissage profond, une technique d'AA utilisée pour l'analyse et l'interprétation de grandes quantités de données. Les grands modèles de langage sont un sous-ensemble de l'IA générative. Il s'agit d'une application cruciale de l'AA qui démontre la capacité à comprendre et générer du langage humain à une échelle sans précédent.

L'apprentissage automatique devient une fonction incontournable pour de nombreuses entreprises, et les applications d'IA/AA transforment actuellement les secteurs de la santé, des services financiers, des télécommunications, des services publics et bien d'autres encore.

Découvrir des cas d'utilisation de l'IA générative
Découvrir des cas d'utilisation de l'IA prédictive

Parce que les modèles d'AA sont entraînés à partir d'historiques de données, ils apprennent des biais et des éléments discriminatoires implicites qui influencent la prise de décision des personnes. Par exemple, les données pourraient refléter des préjugés liés à l'origine ethnique, au genre ou au statut socioéconomique. Lorsque ces préjugés ne sont pas éliminés des données d'entraînement, le modèle peut les entretenir, voire les amplifier.

De la même manière, les groupes marginalisés peuvent faire l'objet de conséquences disproportionnées lorsque les modèles d'AA doivent prendre une décision concernant une approbation de prêt, un recrutement ou une condamnation pénale. Des cadres ont donc été mis en place afin d'assurer l'équité des résultats pour les différents groupes.

Les modèles d'AA peuvent être considérés comme des « boîtes noires » en raison du manque de visibilité ou de compréhension de leurs processus internes. Cette opacité, qui rend le processus de décision du modèle difficile à comprendre, peut entraîner de la méfiance chez les utilisateurs.

Lorsque le système d'AA prend une mauvaise décision (par exemple, si elle est discriminatoire), il peut s'avérer difficile d'identifier le responsable. La décision du modèle d'AA relève-t-elle de la responsabilité du développeur, de l'entreprise qui utilise le système ou du système lui-même ?

De vastes quantités de données sont utilisées pour assurer l'entraînement efficace des modèles d'AA. Les entreprises sont donc incitées à recueillir et stocker de grands volumes de données personnelles, ce qui suscite des inquiétudes quant à la confidentialité et une utilisation abusive.

De plus, le stockage de vastes ensembles de données contenant des informations personnelles augmente le risque de fuites de données, ce qui entraîne des conséquences néfastes sur les personnes, telles que l'usurpation d'identité, la fraude financière ou l'atteinte à la réputation.

Red Hat offre aux entreprises une base commune pour créer et déployer des applications d'IA et des modèles d'AA, de manière transparente et contrôlée.

La solution Red Hat® OpenShift® AI est une plateforme conçue pour l'entraînement, le réglage d'instructions génératives, le réglage fin et la distribution de modèles d'IA qui reposent sur les données de l'entreprise et sont adaptés à son cas d'utilisation.

Pour les déploiements à grande échelle, la solution Red Hat OpenShift offre une plateforme d'applications évolutive qui convient aux charges de travail d'IA, avec un accès aux principaux accélérateurs matériels.

De nouveaux services Red Hat s'appuient également sur l'AA, notamment Red Hat® Ansible® Lightspeed with IBM watsonx Code Assistant et Red Hat OpenShift Lightspeed, qui aident les professionnels de l'informatique à travailler plus efficacement.

Enfin, les solutions intégrées de nos partenaires ouvrent la voie à un écosystème d'outils d'IA fiables et compatibles avec les plateformes Open Source.

En savoir plus sur OpenShift AI

Se lancer avec l'IA en entreprise : guide pour les débutants

Consultez ce guide pour les débutants afin de savoir comment les solutions Red Hat OpenShift AI et Red Hat Enterprise Linux AI peuvent accélérer votre parcours d'adoption de l'IA.

Tous les essais de produits Red Hat

Profitez de nos essais gratuits de produits Red Hat pour renforcer votre expérience pratique, préparer une certification ou évaluer l'adéquation d'un produit avec les besoins de votre entreprise.

En savoir plus

Le deep learning, qu'est-ce que c'est ?

Le deep learning est une technique d'intelligence artificielle (IA) qui apprend aux ordinateurs à traiter des données en utilisant un algorithme qui s'inspire du cerveau humain.

L'IA générative, qu'est-ce que c'est ?

L'IA générative est une technologie d'intelligence artificielle capable de créer des contenus à partir de modèles d'apprentissage profond entraînés avec de grands ensembles de données.

Un grand modèle de langage, qu'est-ce que c'est ?

Un grand modèle de langage (LLM) est un type de modèle d'intelligence artificielle (IA) qui utilise des techniques d'apprentissage automatique (AA) pour comprendre et générer du langage humain.

IA/ML : ressources recommandées

Articles associés