Le cerveau humain est une machine à prédire. Il perçoit des schémas, puis fait des prédictions à partir d’expériences antérieures. Cette partie de l’intelligence humaine a été essentielle à notre survie. Par exemple, il y a de nombreuses années, un cueilleur aurait pu manger une baie en particulier, être tombé malade et avoir ainsi appris les indices qui indiquent qu’une baie est toxique. Cela se produirait automatiquement : il aurait eu la nausée en revoyant cette baie, ce qui l’aurait incité à s’en éloigner. En d’autres termes, notre cerveau et notre système nerveux font une prédiction qui dicte nos résultats.
L’intelligence artificielle fonctionne de la même manière. Elle passe par un processus de formation, apprend par des essais et des erreurs (bien qu’elle puisse également utiliser d’autres techniques d’apprentissage profond), puis prédit les résultats. Tout comme nous apprenons à éviter les baies vénéneuses (ou à laisser refroidir le café afin d’éviter que nos papilles gustatives ne soient anéanties pendant une demi-journée), la formation de modèles d’IA apprend à un système d’IA comment réagir à un ensemble de conditions. Les organisations peuvent ainsi confier leurs tâches répétitives à l’IA. Associée à d’autres outils d’automatisation, l’IA peut soutenir un large éventail de processus métiers, de l’amélioration du service clientèle à l’accélération de la mise sur le marché des produits.
En formant correctement les modèles d’intelligence artificielle, vous pouvez transformer l’IA pour votre organisation. Ce billet présente les principales étapes de la formation des modèles d’IA, ainsi que les différentes approches de l’utilisation de l’intelligence artificielle en entreprise.
[La révolution de l’IA découle de la prolifération de l’IA générative et des grands modèles linguistiques. Découvrez la relation entre les deux : IA générative et grands modèles linguistiques (LLM) : Quelle est la différence ?]
Les méthodes de formation des modèles d’IA dépendent de plusieurs facteurs, tels que le cas d’usage, la portée et le type de données impliquées. Mais si les spécificités varient, les grandes lignes de la formation des modèles d’IA restent les mêmes, que vous soyez un amateur construisant un modèle personnel ou un professionnel créant une transformation numérique profonde de niveau entreprise, alimentée par l’IA.
Les données sont l’élément vital de l’IA. Des données solides sont synonymes de modèles solides. La construction d’un modèle d’IA robuste commence par le choix des sources de données, puis par leur collecte en un seul endroit.
Prenons l’exemple des services financiers : le traitement des risques et des prêts. Les sources de données peuvent être les suivantes :
Des données personnelles sur le demandeur (antécédents de crédit, adresses ou niveau de revenu, pour n’en citer que quelques-unes).
Le comportement financier, comme les transactions bancaires, les retraits importants d’argent liquide ou les gains exceptionnels.
Les données du marché et les facteurs économiques susceptibles d’affecter la capacité d’une personne à rembourser un prêt.
Des dossiers supplémentaires, tels que les antécédents judiciaires, les titres de propriété, les avis d’expulsion ou les privilèges de logement.
Des bases de données contenant les noms et les pseudonymes de criminels en col blanc et d’auteurs de fraudes connus.
Les données de l’entreprise sur l’historique des remboursements de prêts, pour vous aider à découvrir vos propres marqueurs de risque.
L’intégration de ces points de données permet d’entraîner le modèle à pondérer les marqueurs de risque individuels, afin qu’il puisse faire des suggestions et des prédictions lorsqu’une personne demandera un prêt à l’avenir.
[La collecte de données à partir de sources multiples peut rapidement devenir complexe. Une data fabric peut vous aider. Découvrez comment : L’avantage de la data fabric : éliminez les silos de données pour une innovation rapide.]
L’étape suivante consiste à préparer les données pour la formation. Si nous utilisons une analogie culinaire, la première étape consiste à rassembler les ingrédients et la deuxième à les découper en tranches pour les préparer à la cuisson. Le prétraitement implique les étapes suivantes :
Examiner les données pour s’assurer qu’elles sont appropriées et complètes.
Formater les données pour la formation (développer ce point).
Nettoyer les données (expliquer – pas sûr de ce que cela signifie).
Le prétraitement est essentiel. Les modèles d’IA nécessitent de multiples sources de données, souvent dans des formats très disparates. Le prétraitement permet à un système d’intelligence artificielle d’accéder plus facilement à ces éléments de données, de les traiter et de les utiliser pour se former.
Un conseil de pro : C’est le moment idéal pour prendre en compte les biais. Au cours de cette étape, supprimez tous les éléments de données susceptibles d’amener le modèle à faire des prédictions inexactes ou, pire, à opérer une discrimination. Par exemple, vérifiez que les sources de données ne contiennent pas d’informations susceptibles d’identifier une personne sur la base d’une caractéristique démographique protégée.
La dernière chose que vous souhaitez, c’est qu’un modèle d’IA prenne de mauvaises décisions sur la base de ces facteurs. Même si la partialité n’est généralement pas intentionnelle, les organisations peuvent être condamnées à des amendes et voir leur réputation entachée. Éviter les biais est un processus continu, mais cette étape pose des bases solides.
Les spécificités de la formation des modèles d’IA dépendent de votre cas d’usage. La sélection des modèles de formation avec apprentissage automatique est du ressort de l’expert en science des données. Les types de modèles de formation d’IA nécessiteraient un article à part entière, mais en voici quelques exemples.
Les modèles d’apprentissage par renforcement effectuent un certain nombre de simulations au cours desquelles l’IA tente de produire un résultat ou d’atteindre un objectif en procédant par des essais et des erreurs. Le modèle prend des mesures, puis reçoit un renforcement positif ou négatif en fonction du résultat.
Les modèles d’apprentissage profond utilisent des réseaux neuronaux pour apprendre à partir de données. Ils peuvent être alimentés en informations et, à chaque répétition, commencer à classer ces informations ainsi qu’à établir des distinctions. Par exemple, vous pouvez fournir des images à un modèle d’IA par apprentissage profond, et celui-ci pourra apprendre lors d’une première répétition qu’une image spécifique contient des meubles. Ensuite, dans un cycle d’apprentissage ultérieur, il peut commencer à établir des distinctions entre les types de meubles, comme apprendre la différence entre une chaise avec des coussins et une table.
Il existe de nombreux types de modèles d’IA à votre disposition. Le choix du bon modèle pour une tâche donnée dépendra de votre objectif. Dans l’exemple précédent, l’apprentissage par renforcement peut s’avérer plus judicieux pour la prévision des objectifs commerciaux, tandis que l’apprentissage profond est plus approprié pour la construction de modèles qui doivent reconnaître des éléments tels que des images, des documents ou du texte. Souvent, une tâche peut nécessiter l’utilisation de plusieurs méthodes.
Enfin, nous formons le modèle. Cela implique l’apprentissage automatique. Le déroulement de la formation dépend bien entendu du modèle d’apprentissage automatique que vous avez choisi à l’étape précédente. Mais en général, l’IA exécute une série de tests ou de simulations, fait des prédictions, puis compare ces prédictions à un objectif ou un résultat escompté. Après plusieurs cycles de formation, le modèle s’ajuste. Avec le temps, l’écart entre la prédiction et les résultats attendus devrait se réduire, ce qui permet d’obtenir des prédictions plus précises.
Après la formation, testez les résultats. Comme dans n’importe quel autre domaine d’activité, vous devrez assurer la qualité de l’IA. Essayez de tester le modèle sur un petit ensemble de tâches réelles, pour vous assurer qu’il fonctionne correctement. S’il est satisfaisant, vous pouvez le déployer dans un environnement plus important ; dans le cas contraire, il est utile de procéder à une nouvelle formation.
Mais l’évaluation des modèles n’est pas un événement ponctuel. Les organisations doivent évaluer en permanence les modèles d’IA pour s’assurer qu’ils produisent les bons résultats. Par exemple, plusieurs grandes compagnies d’assurance maladie américaines ont été critiquées et font l’objet de poursuites judiciaires en raison de refus excessifs de demandes de remboursement. Il est essentiel de disposer d’une surveillance humaine pour s’assurer que ces modèles ne prennent pas de mauvaises décisions, afin d’éviter des performances médiocres, des atteintes à la réputation, la baisse de la satisfaction des clients, voire des amendes pour non-respect de la réglementation.
J’ai mentionné à plusieurs reprises que la construction de ces modèles nécessite une expertise. Les entreprises disposent de trois méthodes pour obtenir les ressources nécessaires à l’élaboration de ces modèles.
Première méthode : Construire le tout en interne. Cette approche présente de nombreux avantages. Vous avez le contrôle total de vos modèles. Les modèles sont formés sur vos données, ce qui garantit leur précision. Vous pouvez facilement modifier les modèles en cas de biais. Et surtout, vos données restent confidentielles. Mais cette méthode est coûteuse. Vous aurez besoin d’une équipe d’ingénieurs en données, de scientifiques des données et de développeurs de logiciels, ainsi que d’un budget pour votre matériel, vos logiciels et votre infrastructure. Cette méthode est donc hors de portée des organisations pour lesquelles l’IA n’est pas essentielle.
Deuxième méthode : Faire appel à un grand fournisseur de cloud public (également connu sous le nom d’hyperscaler). Ces entreprises fournissent des modèles d’IA préexistants que vous pouvez appliquer à vos tâches. Cela permet de réduire les coûts liés à une grande équipe de gestion des données. Mais il y a un hic. Vous n’avez que peu de contrôle sur vos données. Cela signifie que les modèles ne seront pas adaptés à votre organisation et, pire encore, que le fournisseur peut utiliser vos données pour former ses propres algorithmes. Cela peut mettre en péril la confidentialité de vos données.
Troisième méthode : Faire appel à un fournisseur qui met l’accent sur l’IA privée. Il s’agit de grandes plateformes d’hyperautomatisation qui adoptent une approche d’IA privée. Vous pouvez créer vos propres modèles à l’aide d’outils low-code ou no-code, puis les intégrer dans un processus de bout en bout plus large qui transformera votre activité. Par exemple, vous pouvez charger un lot d’e-mails ou de documents, puis demander à la plateforme de former un modèle pour vous. À partir de là, vous pouvez examiner les résultats et les déployer en production. Vous pouvez même ajuster les modèles en permanence. Les données restent ainsi confidentielles sans que vous ayez à embaucher une équipe extrêmement coûteuse ou à acheter une quantité prohibitive de matériel et de systèmes à entretenir.
Vous voulez comprendre comment fonctionne cette approche de l’IA privée ? Approfondissez ces trois méthodes pour déterminer celle qui vous convient le mieux, et découvrez le fonctionnement des plateformes d’IA privée en consultant Mise en œuvre de l’IA privée : guide pratique.