Lors de récentes conversations avec des clients Red Hat, au moment où tout se tourne inévitablement vers l'IA, je me suis retrouvée à répéter souvent le même mantra : les plus petits peuvent être parfaits.
Laissez-moi vous expliquer. Avec l'IA, il peut être intéressant de voir les choses en grand. Cette technologie offre des possibilités considérables. Les clients sont tout à fait fondés sur des projets ambitieux et ambitieux pour saisir ces opportunités.
D'ailleurs, Aramco, l'un des plus grands acteurs intégrés du secteur de l'énergie et de la chimie, étudie actuellement de telles possibilités avec Red Hat. À travers un protocole d'accord, nous allons explorer ensemble la manière dont l'IA peut favoriser la formation et le développement des compétences pour les talents locaux. Cela vient s'ajouter à d'autres possibilités, telles que l'IA qui pourrait améliorer les performances et l'utilisation des ressources des outils d'infrastructure, ainsi qu'aux nouvelles stratégies visant à améliorer les mesures de cybersécurité des applications conteneurisées.
En parallèle, je constate qu'une multitude d'entreprises réalisent des gains rapides grâce à l'IA en recentrant leurs efforts sur l'automatisation. Qu'est-ce qu'ils ont en commun, c'est qu'ils se concentrent sur des défis très spécifiques au lieu de travail, et y parviennent à l'aide de Small Language Models (SLM).
Dans le contexte de l'IA, le terme « small » est relatif. Même si un grand modèle de langage peut se composer de centaines de milliards (voire de billions) de paramètres, un SLM peut tout de même être compris entre quelques millions et quelques milliards. Autrement dit, elle n'est pas si petite. C'est pour cette raison que j'aurai plus tendance à le comparer à un modèle de langage focalisé, ou FLM, si l'on me permet d'inventer un nouveau terme.
Compte tenu de leur taille, les SLM sont plus facilement personnalisables grâce à un ajustement, qui consiste à les entraîner à partir d'un ensemble limité de données relatives à l'expertise du secteur, voire de l'entreprise elle-même. En adoptant cette approche, les employés des entreprises intelligentes peuvent résoudre plus rapidement leurs problèmes métier et obtenir de meilleures informations sur la manière dont l'IA peut être appliquée à certains des goulets d'étranglement des processus métier auxquels leurs collègues et eux-mêmes peuvent être confrontés. ,
Quel que soit le nom qu'on lui donne, les SLM peuvent excellent dans des domaines bien précis. Par exemple, un prestataire de services financiers peut utiliser un SLM formé sur les données réglementaires pour détecter les transactions non conformes. Un prestataire de soins de santé peut utiliser un chatbot basé sur un système SLM entraîné sur des ensembles de données médicales pour injecter des connaissances spécifiques d'un domaine dans les réponses aux interrogations des patients concernant leur état de santé.
Cette approche est extrêmement efficace, car il n'est pas nécessaire d'entraîner un SLM sur des données qui n'ont pas de rapport direct avec le cas d'utilisation pour lequel il a été conçu. Il n'a pas besoin de s'encombrer d'informations superflues. Et le SLM n'est pas censé interpréter des requêtes très variées sur un vaste éventail de sujets, et y répondre.
C'est le travail d'un grand modèle de langage, et cela explique une grande partie de sa complexité écrasante et de ses gros besoins en ressources. En revanche, le temps nécessaire pour entraîner et ajuster un SLM est plus court, ses exigences matérielles sont bien moindres et sa propension à renvoyer des réponses erronées ou non pertinentes est nettement réduite.
L'IA pour combler le déficit de compétences
En 2025, il me semble que les SLM ont un rôle précieux à jouer pour résoudre bon nombre de problèmes métier auxquels nous sommes confrontés. Un exemple qui vient immédiatement à l'esprit est la crise persistante des compétences, exacerbée par l'approche à l'âge de la retraite pour les seniors d'une main-d'œuvre européenne qui se développe rapidement.
Un SLM se prête parfaitement à la réalisation de certaines tâches accomplies par des employés expérimentés et expérimentés, comme l'analyse de documents juridiques ou réglementaires ou l'analyse des commentaires des clients à la recherche de signes de plaintes récurrentes concernant un produit ou un service particulier. Lorsque les compétences d'ingénierie sont requises, les SLM peuvent être déployés pour analyser les données recueillies à partir de capteurs et d'appareils intelligents installés sur les machines et équipements, afin de prévoir les besoins de maintenance.
En bref, les SLM pourraient être un bon moyen pour les entreprises de faire avancer l'IA efficacement en 2025, et ce, de manière efficace, accessible et hautement personnalisable.
Par ailleurs, les technologies Open Source leur permettent de rationaliser davantage cette expérience grâce à des technologies Open Source développées dans le cadre d'efforts collaboratifs. Cela signifie qu'elles n'ont pas besoin de partir de zéro pour chaque projet d'IA et peuvent bénéficier des connaissances et des défis que d'autres équipes ont rencontrés avec les SLM.
De plus, ils ont la possibilité de créer leur propre système de gestion du cycle de vie des données (SLM) sur mesure, spécialement conçu pour les données et les connaissances propres à leur entreprise, et qui s'adapte à leur cas d'utilisation métier exactement comme ils le souhaitent.
À propos de l'auteur
Parcourir par canal
Automatisation
Les dernières nouveautés en matière d'automatisation informatique pour les technologies, les équipes et les environnements
Intelligence artificielle
Actualité sur les plateformes qui permettent aux clients d'exécuter des charges de travail d'IA sur tout type d'environnement
Cloud hybride ouvert
Découvrez comment créer un avenir flexible grâce au cloud hybride
Sécurité
Les dernières actualités sur la façon dont nous réduisons les risques dans tous les environnements et technologies
Edge computing
Actualité sur les plateformes qui simplifient les opérations en périphérie
Infrastructure
Les dernières nouveautés sur la plateforme Linux d'entreprise leader au monde
Applications
À l’intérieur de nos solutions aux défis d’application les plus difficiles
Virtualisation
L'avenir de la virtualisation d'entreprise pour vos charges de travail sur site ou sur le cloud