AutoML : explication du machine learning automatisé
L'automatisation est devenue un mot à la mode dans la conversation en cours sur l'intelligence artificielle, car les logiciels montrent le potentiel de prendre en charge le travail des comptables, des ouvriers d'usine, des écrivains et même des thérapeutes. Aujourd'hui, l'IA commence même à s'automatiser dans un processus connu sous le nom d'apprentissage automatique.
L'apprentissage automatique automatisé, ou autoML en abrégé, fait essentiellement appel à des algorithmes pour prendre en charge le processus de création d'un modèle d'apprentissage automatique. Il gère les tâches les plus banales et répétitives de l'apprentissage automatique, avec la promesse d'accélérer à la fois le processus de développement de l'IA et de rendre la technologie plus accessible.
Ces dernières années, il y a eu un regain d'intérêt pour le potentiel d'autoML pour simplifier le monde autrement complexe de l'apprentissage automatique. DataRobot est souvent reconnu comme l'une des premières entreprises à l'avoir porté à la connaissance du public en 2013. Depuis lors, Meta a qualifié autoML de "colonne vertébrale" de son IA, et Salesforce a acquis la startup d'analyse de données BeyondCore pour créer sa propre bibliothèque Einstein AutoML. Pendant ce temps, de grands géants de la technologie comme Google, Microsoft et Amazon ont déployé leurs propres outils d'apprentissage automatique à faible code qui utilisent des techniques d'autoML.
Une telle adoption généralisée par l'industrie est importante étant donné que l'expertise nécessaire pour créer des systèmes d'IA de pointe est si rare, même dans des entreprises comme celles-ci.
"Pour moi, je ne vois pas d'autre voie à suivre, à l'exception de ces approches plus automatisées", a déclaré Sarah Aerni, vice-présidente de l'apprentissage automatique et de l'ingénierie chez Salesforce, à Built In. "Il y a trop d'opportunités pour l'IA et tout simplement pas assez de personnes pour intégrer l'entreprise, intégrer la technologie, la déployer en production, la surveiller et continuer à l'itérer. Pour moi, autoML est là où cela entre en tant que solution à la mise à l'échelle."
Bien que le concept d'apprentissage automatique automatisé existe depuis près d'une décennie, il reste un travail en cours. Si et quand l'IA créée par l'IA atteint son plein potentiel, elle pourrait être appliquée au-delà des frontières des entreprises technologiques, changeant la donne dans des domaines comme la santé, la finance et l'éducation.
"Pratiquement quiconque utilise l'apprentissage automatique utilisera également l'apprentissage automatique", a déclaré Lars Kotthoff, professeur adjoint et chercheur au département d'informatique de l'Université du Wyoming, à Built In. "À terme, cela sera vraiment déployé partout où l'apprentissage automatique et l'IA sont utilisés."
Plongez plus profondément L'automatisation aura des effets considérables sur l'économie. Voici ce à quoi vous pouvez vous attendre
À première vue, l'apprentissage automatique peut sembler un peu redondant. Après tout, l'apprentissage automatique consiste déjà à automatiser le processus d'identification des modèles dans les données pour faire des prédictions. Le processus, qui repose sur des algorithmes et des modèles statistiques, ne nécessite pas de programmation cohérente ou explicite. Une fois qu'un modèle d'apprentissage automatique est construit, il peut ensuite être optimisé par des essais et des erreurs et des commentaires, ce qui signifie que la machine peut apprendre par l'expérience et une exposition accrue aux données, tout comme le font les humains.
En pratique, une grande partie du travail nécessaire pour créer un modèle d'apprentissage automatique est plutôt laborieuse et nécessite que les scientifiques des données prennent de nombreuses décisions différentes. Ils doivent décider du nombre de couches à inclure dans les réseaux de neurones, des pondérations à donner aux entrées à chaque nœud, des algorithmes à utiliser, etc. C'est un gros travail, et il faut beaucoup de compétences spécialisées et d'intuition pour le faire correctement.
Plus le modèle est complexe, plus le travail est complexe. Et certains experts disent qu'il sera nécessaire d'automatiser une partie de ce travail à mesure que les systèmes d'IA deviennent plus complexes. Ainsi, autoML vise à éliminer les conjectures pour les humains en prenant en charge les décisions que les data scientists et les chercheurs doivent actuellement prendre lors de la conception de leurs modèles d'apprentissage automatique.
Finalement, l'objectif est d'arriver au point où une personne peut poser une question sur ses données, y appliquer un outil autoML et recevoir le résultat qu'elle recherche sans avoir besoin de compétences trop techniques. Et bien qu'un nombre croissant d'entreprises cherchent à démocratiser l'apprentissage automatique via l'autoML, cette technologie est largement réservée aux personnes ayant une expertise en IA et en science des données. C'est un outil, pas une plateforme spécifique ; et c'est un outil avec des utilisations assez étroites, selon Kjell Carlsson, responsable de la stratégie et de l'évangélisation en science des données chez Domino Data Lab.
Carlsson conseille les clients sur les moyens d'adapter leur stratégie de science des données et d'utiliser l'IA plus efficacement, et il décrit l'autoML comme une sorte de "booster" ou "d'accélérateur" pour les scientifiques des données.
"Cela peut leur permettre de découvrir plus rapidement les fonctionnalités qu'ils souhaitent utiliser. Cela peut leur permettre d'affiner plus rapidement les algorithmes qu'ils souhaitent utiliser. Et ils peuvent être utiles, dès le début, pour identifier certains problèmes avec vos données", a-t-il déclaré à Built In. "Cela peut être très utile pour la phase de preuve de concept - pour comprendre, 'Est-ce faisable?'"
Obtenez l'opinion d'un initié Rage contre l'apprentissage automatique : ma guerre contre les moteurs de recommandation
L'apprentissage automatique automatisé, a déclaré Carlsson, concerne "principalement" l'apprentissage automatique supervisé, ce qui signifie qu'il donne aux utilisateurs des informations sur le résultat qu'ils essaient de prédire en créant un modèle qui identifie les modèles dans les données étiquetées.
Il existe de nombreux types d'apprentissage automatique, mais avec l'apprentissage supervisé, les données d'entrée et de sortie étiquetées sont constamment introduites dans des systèmes formés par l'homme, offrant des prédictions avec une précision croissante après que chaque nouvel ensemble de données est introduit dans le système.
Par exemple, si une entreprise veut pouvoir prédire si quelqu'un va acheter ou non son produit, elle doit d'abord disposer d'un ensemble de données d'anciens clients, organisé par qui a acheté et n'a pas acheté. Ensuite, il doit être en mesure d'utiliser cet ensemble de données pour prédire ce qu'un tout nouvel ensemble de clients décidera de faire. Ou, si vous voulez qu'un ordinateur puisse identifier un chat dans une vidéo, vous devez d'abord l'entraîner en lui montrant d'autres vidéos avec des chats afin qu'il puisse en identifier un avec précision dans une vidéo qu'il n'a jamais vue auparavant.
L'apprentissage automatique automatisé automatise la sélection de différentes variables dans un ensemble de données donné qui doivent être utilisées dans un modèle, ainsi que les algorithmes nécessaires pour créer ce modèle.
Dans le cas de la prédiction si une personne achètera ou non, autoML serait utilisé pour analyser les milliers de points de données que l'entreprise possède sur cette personne et décider quelles informations devraient être utilisées pour faire une prédiction précise. Il automatise également la sélection elle-même et décide quel modèle a le plus de sens. Il peut s'agir d'un modèle de régression logistique, d'un modèle de forêt aléatoire, d'une sorte de modèle d'ensemble, etc., tout ce qui s'applique le plus au cas d'utilisation commerciale.
Étant donné que les algorithmes autoML fonctionnent à un niveau d'abstraction supérieur aux modèles d'apprentissage automatique sous-jacents, en s'appuyant uniquement sur les sorties de ces modèles comme guides, ils peuvent également être appliqués à des modèles pré-formés pour obtenir de nouvelles informations sans avoir à répéter les recherches existantes ou à gaspiller de la puissance de calcul.
La durée exacte d'autoML dépend entièrement de la quantité de données introduites dans le modèle, ainsi que du nombre de types de modèles différents appliqués. Pour les ensembles de données standard et structurés (comme les données client dans un CRM, par exemple), Carlsson a déclaré qu'il peut être "super rapide" d'exécuter un modèle autoML - aussi peu que quelques secondes. Dans les ensembles de données plus volumineux, où l'utilisateur souhaite essayer de nombreuses permutations de modèles différentes de différents algorithmes à utiliser, cela peut prendre des jours, voire des semaines.
En savoir plus sur l'apprentissage automatique avec l'apprentissage automatique intégré sur Built In Learning Lab
Alors, quels outils autoML sont disponibles ? Ce ne sont là que quelques-uns des choix populaires utilisés par les professionnels pour automatiser les processus d'apprentissage automatique.
La suite de solutions d'IA d'Aible permet d'automatiser les tâches de science des données et d'ingénierie des données dans plusieurs secteurs. Ses produits peuvent détecter les relations de données clés, évaluer la préparation des données pour l'entrée du modèle et augmenter l'analyse des données et les recommandations. Aible se connecte directement au cloud pour la sécurité des données et peut être intégré à d'autres outils tels que Salesforce et Tableau.
AutoKeras est une bibliothèque open source et un outil autoML basé sur Keras, une API d'apprentissage automatique Python. L'outil peut automatiser les tâches de classification et de régression dans les modèles d'apprentissage en profondeur pour les images, le texte et les données structurées. AutoKeras applique largement la recherche d'architecture neuronale pour optimiser l'écriture de code, la sélection d'algorithmes d'apprentissage automatique et la conception de pipelines.
Auto-PyTorch, basé sur la bibliothèque d'apprentissage automatique PyTorch en Python, permet des tâches d'apprentissage en profondeur entièrement automatisées (autoDL). Il automatise la sélection d'algorithmes et le réglage des hyperparamètres pour les architectures de réseaux de neurones profonds, et peut prendre en charge des ensembles de données tabulaires et chronologiques. Auto-PyTorch applique l'optimisation bayésienne, le méta-apprentissage et la construction d'ensembles pour l'automatisation.
Auto-Sklearn est un outil autoML open source basé sur la bibliothèque d'apprentissage automatique scikit-learn en Python. L'outil automatise la création supervisée d'un pipeline d'apprentissage automatique et peut être utilisé en remplacement des classificateurs scikit-learn en Python. Comme Auto-PyTorch, Auto-Sklearn utilise le méta-apprentissage, l'apprentissage d'ensemble et l'optimisation bayésienne pour rechercher automatiquement des algorithmes d'apprentissage lorsqu'un nouvel ensemble de données est fourni.
Google Cloud AutoML est une suite d'outils d'autoML développés par Google qui peuvent être utilisés pour créer des modèles d'apprentissage automatique personnalisés. À la tête de la suite se trouve Vertex AI, une plate-forme où des modèles peuvent être créés pour des objectifs tels que la classification, la régression et la prévision dans les images, les vidéos, le texte et les données tabulaires. Vertex AI propose des API pré-formées et prend en charge tous les frameworks d'apprentissage automatique open source, y compris PyTorch, TensorFlow et scikit-learn.
AutoML peut être utilisé sur des applications d'intelligence artificielle avancées ou sur des problèmes simples souvent rencontrés dans les entreprises conventionnelles qui n'ont tout simplement pas les humains pour tout faire.
Salesforce a des milliers de clients qui cherchent à prédire une variété de choses, de l'attrition des clients aux clics de marketing par e-mail en passant par les pannes d'équipement. Et tout cela nécessite de nombreuses données riches propres à leur activité spécifique, qui peuvent être utilisées pour créer des modèles d'apprentissage automatique personnalisés. Salesforce s'attache à rendre la création de ces modèles facile et accessible à tous grâce au machine learning automatisé.
"Afin d'exploiter ces données", a expliqué Aerni, "[Salesforce n'est] pas en mesure de les examiner. Nous devons donc utiliser des approches d'apprentissage automatique automatisées pour nous entraîner sur l'ensemble de données de ce client, afin de transformer ces données." Cela s'étend aux différentes étapes du processus d'apprentissage automatique, de la préparation des données à la formation et à la sélection des modèles et algorithmes les plus appropriés, le tout de manière entièrement automatisée.
Arijit Sengupta, le fondateur de BeyondCore, devenu Einstein de Salesforce après son acquisition, a créé une société appelée Aible, dans le but d'aider quiconque à construire un modèle d'IA qui crée de la valeur. Son objectif : "Comment donner à chacun la possibilité d'extraire de la valeur de ses données à l'aide de l'IA ?"
Aible le fait en proposant une suite de logiciels. Un outil se concentre sur l'ingénierie des données augmentées, un autre est l'analyse augmentée, fournissant aux entreprises des informations clés sur leurs données dans un langage qu'elles peuvent comprendre. Et une troisième offre est la science des données augmentée et l'apprentissage automatique, où elle gère la construction de modèles prédictifs tout en tenant compte de tous les avantages des prédictions correctes et du coût des prédictions incorrectes.
Par exemple, "Quel est l'avantage de vous dire correctement que quelqu'un achètera ? Quel est le coût de vous dire à tort que quelqu'un achètera alors qu'il ne le ferait pas ? Et quelle capacité avez-vous pour poursuivre ces prospects ?" il expliqua. "Et puis notre système génère automatiquement une IA ou un ensemble d'IA qui créerait la valeur la plus économique, compte tenu de votre activité unique."
Sangupta a déclaré qu'il souhaitait éloigner l'entreprise de ce qui est traditionnellement considéré comme l'apprentissage automatique automatisé, principalement parce qu'il considère que l'autoML traditionnel est "complètement inutile".
"Le problème avec l'autoML traditionnel est qu'il ne part pas de la réalité commerciale", a déclaré Sangupta. "Il essaie simplement divers paramètres et un tas de modèles, et revient et vous dit" Voici le meilleur modèle ". Et c'est vraiment complètement inutile."
Voici un exemple : imaginez que le bénéfice d'une vente dans votre entreprise est de 100 $ et que le coût de la poursuite d'un prospect est de 1 $. Vous pourriez être d'accord pour vous fier à un modèle d'apprentissage automatique qui vous donne 99 prédictions erronées pour chaque personne qui achète pour 100 $ de produit. Mais, disons que votre capacité de vente ne permet que 20 appels. Cela crée un tout nouvel ensemble de restrictions.
"Le problème avec autoML est qu'il est si puissant que si vous ne réfléchissez pas à ce que vous essayez de faire, et si vous ne pouvez pas expliquer l'impact de ce modèle sur l'entreprise que vous essayez de comprendre dans un langage que les utilisateurs professionnels peuvent comprendre", a déclaré Sangupta, "vous pouvez vraiment vous blesser".
C'est peut-être la plus grande lacune de l'apprentissage automatique : son manque d'intuition commerciale. AutoML produira certainement un modèle prêt pour la production plus rapidement, mais il n'indiquera pas nécessairement à un utilisateur pourquoi il devrait utiliser un modèle particulier ou quelle est la justification commerciale - et encore moins offrir un problème justifiable à résoudre au milieu d'un ensemble massif de données.
"Cela a été une solution à la recherche d'un problème pendant assez longtemps", a déclaré Carlsson de Domino Data Lab.
Un autre problème qui se pose est qu'il n'y a pas de norme établie pour ce à quoi ressemble un "bon" modèle d'IA. Est-ce uniquement basé sur la précision ? La vitesse contribue-t-elle ? Ou sa capacité à apprendre ? Quoi qu'il en soit, Carlsson a déclaré que ces mesures correspondent très rarement au problème réel de l'entreprise.
"La plaisanterie est que nous pouvons tous créer un modèle qui prédira l'activité terroriste avec une précision de 99,99 % - nous prédisons simplement qu'il n'y aura jamais de terrorisme", a-t-il déclaré. "Le terrorisme se produit si rarement que si je prédis juste que le terrorisme ne se produit jamais, j'ai ce modèle super précis. Mais c'est un modèle inutile." Pendant ce temps, si vous créiez un modèle qui prédisait si un joueur devait ou non prendre une autre carte dans un jeu de blackjack avec une précision de 50,1 %, « cela me rendrait incroyablement riche », a-t-il ajouté.
En bref : tout est relatif, et les modèles autoML ne peuvent pas dire si leurs propres prédictions sont inutiles ou non. Et quelle que soit la complexité de l'apprentissage automatique automatisé, il n'offre pas le "pourquoi" de son processus de prise de décision, ce que la plupart d'entre nous recherchent en matière de confiance.
Mais Kotthoff de l'Université du Wyoming a déclaré qu'il était "assez difficile" d'y parvenir, en particulier dans le cas d'autoML, "en raison de la complexité de toute cette machinerie et des nombreuses décisions qui sont prises automatiquement sous le capot".
AutoML n'automatise pas non plus l'éthique. Il n'y a pas de conception intrinsèque de l'équité. Vous pouvez imposer différentes contraintes dans un effort pour être juste - comme un taux de rejet égal, un taux d'acceptation égal, une probabilité égale de succès - et ensuite vous assurer que l'IA sert cette définition de l'équité, mais Sangupta dit que cela sort du cadre de ce que l'autoML est capable de faire parce que les humains doivent définir ces contraintes.
"C'est le danger avec autoML, c'est que vous finissez par faire de mauvaises choses commerciales et que vous faites de mauvaises choses éthiques, car la seule chose que le système autoML comprend, ce sont les données", a-t-il déclaré.
En savoir plus sur l'éthique de l'IA Éthique de l'IA : un guide pour une IA éthique
Cela étant dit, certains problèmes sont vraiment bien adaptés à l'apprentissage automatique. Ce sont les problèmes qui nécessitent la création de centaines de milliers de modèles, puis la mise à jour régulière de ces centaines de milliers de modèles.
Le plus souvent, ces modèles mentionnés sont classés comme modèles de prévision, a déclaré Carlsson. Par exemple, si un fournisseur de soins de santé souhaitait prédire la demande pour différentes unités dans son réseau d'hôpitaux, il devrait non seulement créer des modèles différents pour chaque hôpital, mais également les différentes unités au sein de ces hôpitaux, ainsi que des délais différents (une semaine, trois mois, etc.). Au final, vous vous retrouvez avec des milliers de modèles, dont la création et le recyclage nécessitent une immense quantité de travail pour un data scientist humain.
"Les modèles AutoML fonctionnent vraiment très bien dans ce genre d'instances", a déclaré Carlsson.
Et autoML n'est généralement pas sujet au même type d'oubli ou de myopie que nous, les humains, en particulier lorsqu'ils sont confrontés à des problèmes importants et complexes.
"L'utilisation de ces approches automatisées a tendance à obtenir de meilleurs résultats que ceux que les humains peuvent obtenir, simplement parce que la machine ne fait pas d'erreurs. Elle prend toutes ces informations que j'ai recueillies de manière fondée sur des principes, puis prend les décisions en fonction de cela, là où les humains sont enclins à oublier des choses", a déclaré Kotthoff.
Mais, bien sûr, le plus grand avantage de l'apprentissage automatique automatisé est que les scientifiques des données n'ont plus à faire le travail dur et monotone de la construction manuelle de modèles ML, a-t-il ajouté. "C'est vraiment quelque chose qui, en fin de compte, permettra aux humains de mieux travailler et de faire plus de travail en peu de temps car ils n'ont pas à faire les parties fastidieuses."
Comme tous les aspects de l'automatisation, l'autoML n'est pas à l'abri de la spéculation continue selon laquelle il remplacerait les employés humains, en particulier ceux qui travaillent en tant que data scientists. En effet, la "démocratisation de la science des données" était la phrase à la mode lorsque DataRobot a porté cette technologie pour la première fois à l'attention du public, et elle a été réitérée par tout le monde, de Salesforce à Google. Mais l'idée qu'une entreprise puisse utiliser cette technologie sans aucune aide de scientifiques de données n'a pas tout à fait abouti, selon Carlsson.
"Parce que les gens ne savent pas ce que font les scientifiques des données, il y a cette vision de 'Eh bien, si nous avons les bons outils, tout le monde pourra le faire et nous n'aurons plus besoin des scientifiques des données.' Je n'ai vraiment jamais vu cela être vrai", a-t-il déclaré, ajoutant qu'il avait plutôt vu des gens se déplacer dans la direction opposée. Les entreprises embauchent de plus en plus de data scientists. Et former davantage d'analystes de données afin qu'ils puissent devenir des data scientists.
En fait, selon Carlsson, non seulement autoML ne remplacera pas les scientifiques des données, mais les scientifiques des données sont vraiment les seules personnes qui bénéficient de cette technologie. Et même dans ce cas, ce n'est que "progressivement bénéfique" pour eux, principalement parce qu'ils ont besoin de beaucoup de conseils supplémentaires.
"L'utilisation de ces approches automatisées tend à obtenir de meilleurs résultats que ceux que les humains peuvent obtenir, simplement parce que la machine ne fait pas d'erreurs."
"Lorsque vous travaillez dans le monde des scientifiques des données, la création réelle du modèle n'est qu'une petite partie de cela", a déclaré Carlsson. Les équipes de données peuvent utiliser autoML un peu au début pour effectuer des analyses exploratoires, mais lorsqu'il s'agit de créer le "véritable modèle", a-t-il ajouté, elles vont le créer elles-mêmes à partir de zéro. "Il s'avère que vous avez en fait besoin de personnes qui comprennent les données, savent comment regarder et analyser la distribution de ces données, et savent comment analyser les résultats de ces données - la validation des données - pour que vous puissiez créer un modèle qui a vraiment du sens."
Et le fondateur d'Aible, Sangupta, dit que les gens qui s'inquiètent du fait que l'autoML remplace carrément les scientifiques des données passent complètement à côté de l'essentiel. Il ne pense pas que donner à chacun la possibilité de construire un modèle d'IA qui crée de la valeur signifie que nous devons nous débarrasser du tout des data scientists. Au lieu de cela, il compare ce que fait Aible à ce que le navigateur Netscape a fait pour l'adoption généralisée d'Internet dans les années 1990 - il a rendu ce nouveau monde étranger et incroyablement complexe plus accessible aux gens ordinaires.
"Chaque technologie passe par cette phase où, au départ, vous avez ces experts et seuls les experts peuvent le faire. Mais le véritable potentiel vient lorsque tout le monde est habilité à en tirer parti. C'est ce qui va se passer avec l'IA. Cela doit arriver", a déclaré Sangupta. Sinon, l'écart de pouvoir entre les "détenteurs de l'IA et les démunis" continuera de croître.
En effet, ce dont l'intelligence artificielle est capable aujourd'hui est très différent de ce qu'elle était il y a quelques années à peine, et cela a eu d'énormes implications sur la façon dont les entreprises sont gérées. Les chatbots ordinaires passent le test de Turing, l'IA suit le rythme d'une cybercriminalité de plus en plus sophistiquée et les équipes de vente travaillent avec plus de précision et d'informations que jamais.
"Notre monde change si vite que, sans IA, vous ne pouvez pas rivaliser", a déclaré Sangupta. "Lorsque la révolution Internet a éclaté, de nombreuses entreprises qui n'étaient pas montées à bord se sont éteintes. Je pense en fait que la révolution de l'IA va être beaucoup plus perturbatrice que la révolution Internet ne l'a jamais été."
Agit comme une solution à la recherche d'un problème