Ce que tout PDG devrait savoir sur l'IA générative
Au milieu de l'excitation autour de l'IA générative depuis la sortie de ChatGPT, Bard, Claude, Midjourney et d'autres outils de création de contenu, les PDG se demandent à juste titre : est-ce un battage technologique ou une opportunité qui change la donne ? Et si c'est ce dernier, quelle est la valeur pour mon entreprise ?
Cet article est un effort de collaboration de Michael Chui, Roger Roberts, Tanya Rodchenko, Alex Singla, Alex Sukharevsky, Lareina Yee et Delphine Zurkiya, représentant les points de vue du McKinsey Technology Council et de QuantumBlack, AI by McKinsey, qui font tous deux partie de McKinsey Digital.
La version publique de ChatGPT a atteint 100 millions d'utilisateurs en seulement deux mois. Il a démocratisé l'IA d'une manière jamais vue auparavant tout en devenant de loin l'application à la croissance la plus rapide de tous les temps. Son accessibilité prête à l'emploi rend l'IA générative différente de toutes les IA qui l'ont précédée. Les utilisateurs n'ont pas besoin d'un diplôme en apprentissage automatique pour interagir avec ou en tirer de la valeur ; presque tous ceux qui peuvent poser des questions peuvent l'utiliser. Et, comme pour d'autres technologies révolutionnaires telles que l'ordinateur personnel ou l'iPhone, une plate-forme d'IA générative peut donner lieu à de nombreuses applications pour des publics de tout âge ou niveau d'éducation et dans n'importe quel endroit avec accès à Internet.
Tout cela est possible car les chatbots d'IA générative sont alimentés par des modèles de base, qui sont de vastes réseaux de neurones formés sur de grandes quantités de données non structurées et non étiquetées dans une variété de formats, tels que le texte et l'audio. Les modèles de fondation peuvent être utilisés pour un large éventail de tâches. En revanche, les générations précédentes de modèles d'IA étaient souvent "étroites", ce qui signifie qu'elles ne pouvaient effectuer qu'une seule tâche, comme prédire l'attrition des clients. Un modèle de base, par exemple, peut créer un résumé pour un rapport technique de 20 000 mots sur l'informatique quantique, rédiger une stratégie de mise sur le marché pour une entreprise d'élagage d'arbres et fournir cinq recettes différentes pour les dix ingrédients du réfrigérateur de quelqu'un. L'inconvénient d'une telle polyvalence est que, pour l'instant, l'IA générative peut parfois fournir des résultats moins précis, ce qui place une attention renouvelée sur la gestion des risques liés à l'IA.
Avec des garde-corps appropriés en place, l'IA générative peut non seulement débloquer de nouveaux cas d'utilisation pour les entreprises, mais également accélérer, faire évoluer ou améliorer les cas existants. Imaginez un appel de vente à un client, par exemple. Un modèle d'IA spécialement formé pouvait suggérer des opportunités de vente incitative à un vendeur, mais jusqu'à présent, celles-ci étaient généralement basées uniquement sur des données client statiques obtenues avant le début de l'appel, telles que les données démographiques et les habitudes d'achat. Un outil d'IA générative peut suggérer des opportunités de vente incitative au vendeur en temps réel en fonction du contenu réel de la conversation, en s'appuyant sur les données internes des clients, les tendances externes du marché et les données des influenceurs des médias sociaux. En parallèle, l'IA générative pourrait proposer une première ébauche d'argumentaire de vente à adapter et personnaliser par le vendeur.
L'exemple précédent montre les implications de la technologie sur un poste. Mais presque tous les travailleurs du savoir peuvent probablement bénéficier d'une collaboration avec l'IA générative. En fait, bien que l'IA générative puisse éventuellement être utilisée pour automatiser certaines tâches, une grande partie de sa valeur pourrait provenir de la manière dont les éditeurs de logiciels intègrent la technologie dans les outils quotidiens (par exemple, les logiciels de messagerie ou de traitement de texte) utilisés par les travailleurs du savoir. De tels outils améliorés pourraient augmenter considérablement la productivité.
Les PDG veulent savoir s'ils doivent agir maintenant et, si oui, par où commencer. Certains peuvent voir une opportunité de dépasser la concurrence en réimaginant la façon dont les humains travaillent avec des applications d'IA génératives à leurs côtés. D'autres voudront peut-être faire preuve de prudence, expérimenter quelques cas d'utilisation et en apprendre davantage avant de faire des investissements importants. Les entreprises devront également évaluer si elles disposent de l'expertise technique, de l'architecture technologique et des données, du modèle d'exploitation et des processus de gestion des risques nécessaires que certaines des implémentations les plus transformatrices de l'IA générative nécessiteront.
L'objectif de cet article est d'aider les PDG et leurs équipes à réfléchir sur le cas de création de valeur pour l'IA générative et sur la façon de commencer leur voyage. Tout d'abord, nous proposons une introduction à l'IA générative pour aider les cadres à mieux comprendre l'évolution rapide de l'IA et les options techniques disponibles. La section suivante examine comment les entreprises peuvent participer à l'IA générative à travers quatre exemples de cas ciblés sur l'amélioration de l'efficacité organisationnelle. Ces cas reflètent ce que nous constatons parmi les premiers utilisateurs et mettent en lumière l'éventail d'options en matière de technologie, de coût et d'exigences de modèle d'exploitation. Enfin, nous abordons le rôle vital du PDG dans le positionnement d'une organisation pour réussir avec l'IA générative.
L'excitation autour de l'IA générative est palpable, et les dirigeants de la suite C veulent à juste titre aller de l'avant avec une rapidité réfléchie et intentionnelle. Nous espérons que cet article offre aux chefs d'entreprise une introduction équilibrée dans le monde prometteur de l'IA générative.
La technologie de l'IA générative progresse rapidement (Figure 1). Le cycle de publication, le nombre de démarrages et l'intégration rapide dans les applications logicielles existantes sont remarquables. Dans cette section, nous discuterons de l'étendue des applications d'IA générative et fournirons une brève explication de la technologie, y compris en quoi elle diffère de l'IA traditionnelle.
L'IA générative peut être utilisée pour automatiser, augmenter et accélérer le travail. Pour les besoins de cet article, nous nous concentrons sur les façons dont l'IA générative peut améliorer le travail plutôt que sur la façon dont elle peut remplacer le rôle des humains.
Alors que les chatbots générateurs de texte tels que ChatGPT ont reçu une attention démesurée, l'IA générative peut activer des fonctionnalités sur un large éventail de contenus, y compris les images, la vidéo, l'audio et le code informatique. Et il peut remplir plusieurs fonctions dans les organisations, notamment classer, éditer, résumer, répondre aux questions et rédiger de nouveaux contenus. Chacune de ces actions a le potentiel de créer de la valeur en modifiant la façon dont le travail est effectué au niveau de l'activité dans les fonctions et les flux de travail de l'entreprise. Voici quelques exemples.
Au fur et à mesure que la technologie évolue et mûrit, ces types d'IA générative peuvent être de plus en plus intégrés dans les workflows d'entreprise pour automatiser les tâches et effectuer directement des actions spécifiques (par exemple, l'envoi automatique de notes de synthèse à la fin des réunions). On voit déjà émerger des outils dans ce domaine.
Interface de programmation d'applications (API)est un moyen d'accéder par programme à des modèles (généralement externes), à des ensembles de données ou à d'autres logiciels.
Intelligence artificielle (IA)est la capacité d'un logiciel à effectuer des tâches qui nécessitent traditionnellement l'intelligence humaine.
L'apprentissage en profondeur est un sous-ensemble de l'apprentissage automatique qui utilise des réseaux de neurones profonds, qui sont des couches de "neurones" connectés dont les connexions ont des paramètres ou des poids qui peuvent être entraînés. Il est particulièrement efficace pour apprendre à partir de données non structurées telles que des images, du texte et de l'audio.
Réglage fin est le processus d'adaptation d'un modèle de base pré-entraîné pour mieux performer dans une tâche spécifique. Cela implique une période de formation relativement courte sur un ensemble de données étiqueté, qui est beaucoup plus petit que l'ensemble de données sur lequel le modèle a été initialement formé. Cette formation supplémentaire permet au modèle d'apprendre et de s'adapter aux nuances, à la terminologie et aux modèles spécifiques trouvés dans l'ensemble de données plus petit.
Modèles de fondation (FM) sont des modèles d'apprentissage en profondeur entraînés sur de grandes quantités de données non structurées et non étiquetées qui peuvent être utilisées pour un large éventail de tâches prêtes à l'emploi ou adaptées à des tâches spécifiques grâce à un réglage fin. Des exemples de ces modèles sont GPT-4, PaLM, DALL·E 2 et Stable Diffusion.
IA générative est une IA qui est généralement construite à l'aide de modèles de base et qui possède des capacités que l'IA antérieure n'avait pas, telles que la capacité de générer du contenu. Les modèles de base peuvent également être utilisés à des fins non génératives (par exemple, classer le sentiment de l'utilisateur comme négatif ou positif sur la base des transcriptions d'appels) tout en offrant une amélioration significative par rapport aux modèles précédents. Pour plus de simplicité, lorsque nous faisons référence à l'IA générative dans cet article, nous incluons tous les cas d'utilisation du modèle de base.
Unités de traitement graphique (GPU) sont des puces informatiques qui ont été développées à l'origine pour produire des graphiques informatiques (comme pour les jeux vidéo) et sont également utiles pour les applications d'apprentissage en profondeur. En revanche, l'apprentissage automatique traditionnel et d'autres analyses s'exécutent généralement surunités centrales de traitement (CPU), normalement appelé "processeur" d'un ordinateur.
Grands modèles de langage (LLM) constituent une classe de modèles de base capables de traiter d'énormes quantités de texte non structuré et d'apprendre les relations entre des mots ou des portions de mots, appelées jetons. Cela permet aux LLM de générer du texte en langage naturel, en effectuant des tâches telles que le résumé ou l'extraction de connaissances. GPT-4 (qui sous-tend ChatGPT) et LaMDA (le modèle derrière Bard) sont des exemples de LLM.
Apprentissage automatique (ML) est un sous-ensemble d'IA dans lequel un modèle acquiert des capacités après avoir été entraîné ou affiché sur de nombreux exemples de points de données. Les algorithmes d'apprentissage automatique détectent des modèles et apprennent à faire des prédictions et des recommandations en traitant des données et des expériences, plutôt qu'en recevant des instructions de programmation explicites. Les algorithmes s'adaptent également et peuvent devenir plus efficaces en réponse à de nouvelles données et expériences.
MLOps fait référence aux modèles et pratiques d'ingénierie pour faire évoluer et maintenir l'IA et le ML. Il englobe un ensemble de pratiques qui couvrent le cycle de vie complet du ML (gestion des données, développement, déploiement et opérations en direct). Bon nombre de ces pratiques sont désormais activées ou optimisées par des logiciels de support (outils qui aident à normaliser, rationaliser ou automatiser les tâches).
Ingénierie rapidefait référence au processus de conception, d'affinement et d'optimisation des invites d'entrée pour guider un modèle d'IA génératif vers la production des sorties souhaitées (c'est-à-dire précises).
Données structuréessont des données tabulaires (par exemple, organisées dans des tables, des bases de données ou des feuilles de calcul) qui peuvent être utilisées pour former efficacement certains modèles d'apprentissage automatique.
Données non structuréesmanquent d'un format ou d'une structure cohérents (par exemple, du texte, des images et des fichiers audio) et nécessitent généralement des techniques plus avancées pour extraire des informations.
Comme son nom l'indique, la principale différence entre l'IA générative et les formes précédentes d'IA ou d'analyse est qu'elle peut générer de nouveaux contenus, souvent sous des formes « non structurées » (par exemple, du texte écrit ou des images) qui ne sont pas naturellement représentés dans des tableaux avec des lignes et des colonnes (voir l'encadré « Glossaire » pour une liste des termes associés à l'IA générative).
La technologie sous-jacente qui permet à l'IA générative de fonctionner est une classe de réseaux de neurones artificiels appelés modèles de base. Les réseaux de neurones artificiels s'inspirent des milliards de neurones connectés dans le cerveau humain. Ils sont formés à l'aide de l'apprentissage en profondeur, un terme qui fait allusion aux nombreuses couches (profondes) des réseaux de neurones. L'apprentissage en profondeur a alimenté de nombreuses avancées récentes de l'IA.
Cependant, certaines caractéristiques distinguent les modèles de base des générations précédentes de modèles d'apprentissage en profondeur. Pour commencer, ils peuvent être entraînés sur des ensembles extrêmement vastes et variés de données non structurées. Par exemple, un type de modèle de base appelé grand modèle de langage peut être formé sur de grandes quantités de texte accessibles au public sur Internet et couvrant de nombreux sujets différents. Alors que d'autres modèles d'apprentissage en profondeur peuvent fonctionner sur des quantités importantes de données non structurées, ils sont généralement formés sur un ensemble de données plus spécifique. Par exemple, un modèle peut être entraîné sur un ensemble spécifique d'images pour lui permettre de reconnaître certains objets sur des photographies.
En fait, d'autres modèles d'apprentissage en profondeur ne peuvent souvent effectuer qu'une seule de ces tâches. Ils peuvent, par exemple, soit classer des objets sur une photo, soit remplir une autre fonction comme faire une prédiction. En revanche, un modèle de base peut remplir ces deux fonctions et générer également du contenu. Les modèles de base accumulent ces capacités en apprenant des modèles et des relations à partir des données de formation générales qu'ils ingèrent, ce qui, par exemple, leur permet de prédire le mot suivant dans une phrase. C'est ainsi que ChatGPT peut répondre à des questions sur des sujets variés et comment DALL·E 2 et Stable Diffusion peuvent produire des images basées sur une description.
Compte tenu de la polyvalence d'un modèle de base, les entreprises peuvent utiliser le même pour mettre en œuvre plusieurs cas d'utilisation métier, ce qui est rarement réalisé avec les modèles d'apprentissage en profondeur antérieurs. Un modèle de base qui a incorporé des informations sur les produits d'une entreprise pourrait potentiellement être utilisé à la fois pour répondre aux questions des clients et pour aider les ingénieurs à développer des versions mises à jour des produits. En conséquence, les entreprises peuvent mettre en place des applications et réaliser leurs avantages beaucoup plus rapidement.
Cependant, en raison du fonctionnement des modèles de fondation actuels, ils ne sont pas naturellement adaptés à toutes les applications. Par exemple, les grands modèles de langage peuvent être sujets aux "hallucinations" ou répondre à des questions avec des affirmations plausibles mais fausses (voir l'encadré "Utiliser l'IA générative de manière responsable"). De plus, le raisonnement sous-jacent ou les sources d'une réponse ne sont pas toujours fournis. Cela signifie que les entreprises doivent veiller à intégrer l'IA générative sans surveillance humaine dans les applications où les erreurs peuvent causer des dommages ou où l'explicabilité est nécessaire. L'IA générative est également actuellement inadaptée à l'analyse directe de grandes quantités de données tabulaires ou à la résolution de problèmes avancés d'optimisation numérique. Les chercheurs travaillent dur pour surmonter ces limites.
L'IA générative présente une variété de risques. Les PDG voudront concevoir leurs équipes et leurs processus pour atténuer ces risques dès le départ, non seulement pour répondre aux exigences réglementaires en évolution rapide, mais aussi pour protéger leur entreprise et gagner la confiance numérique des consommateurs (nous proposons des recommandations sur la manière de le faire plus loin dans cet article).
Justice:Les modèles peuvent générer un biais algorithmique en raison de données de formation imparfaites ou de décisions prises par les ingénieurs développant les modèles.
Propriété intellectuelle (PI) :Les données de formation et les résultats des modèles peuvent générer des risques importants en matière de propriété intellectuelle, notamment portant atteinte à du matériel protégé par le droit d'auteur, une marque de commerce, un brevet ou autrement protégé par la loi. Même lorsqu'elles utilisent l'outil d'IA générative d'un fournisseur, les organisations devront comprendre quelles données ont été utilisées pour la formation et comment elles sont utilisées dans les résultats de l'outil.
Confidentialité: Des problèmes de confidentialité pourraient survenir si les utilisateurs saisissent des informations qui se retrouvent plus tard dans les sorties du modèle sous une forme qui rend les individus identifiables. L'IA générative pourrait également être utilisée pour créer et diffuser des contenus malveillants tels que la désinformation, les deepfakes et les discours de haine.
Sécurité: L'IA générative peut être utilisée par des acteurs malveillants pour accélérer la sophistication et la rapidité des cyberattaques. Il peut également être manipulé pour fournir des sorties malveillantes. Par exemple, grâce à une technique appelée injection rapide, un tiers donne à un modèle de nouvelles instructions qui incitent le modèle à fournir une sortie non souhaitée par le producteur du modèle et l'utilisateur final.
Explicabilité :L'IA générative s'appuie sur des réseaux de neurones avec des milliards de paramètres, ce qui met à l'épreuve notre capacité à expliquer comment une réponse donnée est produite.
Fiabilité:Les modèles peuvent produire des réponses différentes aux mêmes invites, ce qui entrave la capacité de l'utilisateur à évaluer l'exactitude et la fiabilité des sorties.
Impact organisationnel :L'IA générative peut affecter de manière significative la main-d'œuvre, et l'impact sur des groupes spécifiques et des communautés locales pourrait être disproportionnellement négatif.
Impact social et environnemental :Le développement et la formation de modèles de base peuvent avoir des conséquences sociales et environnementales néfastes, notamment une augmentation des émissions de carbone (par exemple, la formation d'un grand modèle de langage peut émettre environ 315 tonnes de dioxyde de carbone).
Alors que les modèles de base servent de « cerveau » à l'IA générative, une chaîne de valeur entière émerge pour soutenir la formation et l'utilisation de cette technologie (Figure 2).1 Les plates-formes cloud offrent la possibilité d'exploiter ce matériel. Les MLOps et les fournisseurs de hubs de modèles offrent les outils, les technologies et les pratiques dont une organisation a besoin pour adapter un modèle de base et le déployer dans ses applications d'utilisateur final. De nombreuses entreprises entrent sur le marché pour proposer des applications construites sur des modèles de base qui leur permettent d'effectuer une tâche spécifique, comme aider les clients d'une entreprise avec des problèmes de service.
Les premiers modèles de base nécessitaient des niveaux d'investissement élevés pour se développer, compte tenu des ressources informatiques substantielles nécessaires pour les former et de l'effort humain requis pour les affiner. En conséquence, ils ont été développés principalement par quelques géants de la technologie, des start-up soutenues par des investissements importants et certains collectifs de recherche open source (par exemple, BigScience). Cependant, des travaux sont en cours sur des modèles plus petits qui peuvent fournir des résultats efficaces pour certaines tâches et sur une formation plus efficace. Cela pourrait éventuellement ouvrir le marché à davantage d'entrants. Certaines start-ups ont déjà réussi à développer leurs propres modèles. Par exemple, Cohere, Anthropic et AI21 Labs construisent et entraînent leurs propres grands modèles de langage.
Les PDG devraient considérer l'exploration de l'IA générative comme un must, pas un peut-être. L'IA générative peut créer de la valeur dans un large éventail de cas d'utilisation. Les exigences économiques et techniques pour démarrer ne sont pas prohibitives, tandis que l'inconvénient de l'inaction pourrait être de prendre rapidement du retard sur les concurrents. Chaque PDG doit travailler avec l'équipe de direction pour réfléchir où et comment jouer. Certains PDG peuvent décider que l'IA générative présente une opportunité de transformation pour leurs entreprises, offrant une chance de tout réinventer, de la recherche et du développement au marketing et des ventes aux opérations client. D'autres peuvent choisir de commencer petit et d'évoluer plus tard. Une fois la décision prise, il existe des voies techniques que les experts en IA peuvent suivre pour exécuter la stratégie, en fonction du cas d'utilisation.
Une grande partie de l'utilisation (mais pas nécessairement de la totalité de la valeur) de l'IA générative dans une organisation proviendra des employés utilisant des fonctionnalités intégrées dans le logiciel qu'ils possèdent déjà. Les systèmes de messagerie fourniront une option pour écrire les premiers brouillons des messages. Les applications de productivité créeront le premier brouillon d'une présentation basée sur une description. Un logiciel financier générera une description en prose des caractéristiques notables d'un rapport financier. Les systèmes de gestion de la relation client suggéreront des moyens d'interagir avec les clients. Ces fonctionnalités pourraient accélérer la productivité de chaque travailleur du savoir.
Mais l'IA générative peut aussi être plus transformatrice dans certains cas d'utilisation. Ensuite, nous examinons quatre exemples de la manière dont des entreprises de différents secteurs utilisent aujourd'hui l'IA générative pour remodeler la façon dont le travail est effectué au sein de leur organisation.2 Ces exemples sont des amalgames de cas extraits de notre travail avec des clients et d'exemples publics plutôt que de refléter des événements exacts dans une entreprise en particulier. Les exemples vont de ceux nécessitant des ressources minimales à des entreprises à forte intensité de ressources. (Pour une comparaison rapide de ces exemples et plus de détails techniques, voir l'Annexe 3.)
Le premier exemple est un cas relativement peu complexe avec des avantages de productivité immédiats, car il utilise une solution d'IA générative prête à l'emploi et ne nécessite pas de personnalisation en interne.
La plus grande partie du travail d'un ingénieur logiciel consiste à écrire du code. C'est un processus à forte intensité de main-d'œuvre qui nécessite de nombreux essais et erreurs et des recherches dans la documentation privée et publique. Dans cette entreprise, une pénurie d'ingénieurs logiciels qualifiés a entraîné un important arriéré de demandes de fonctionnalités et de corrections de bogues.
Pour améliorer la productivité des ingénieurs, l'entreprise met en œuvre un produit de complétion de code basé sur l'IA qui s'intègre au logiciel que les ingénieurs utilisent pour coder. Cela permet aux ingénieurs d'écrire des descriptions de code en langage naturel, tandis que l'IA propose plusieurs variantes de blocs de code qui satisferont la description. Les ingénieurs peuvent sélectionner l'une des propositions de l'IA, apporter les améliorations nécessaires et cliquer dessus pour insérer le code.
Nos recherches ont montré que de tels outils peuvent accélérer la génération de code d'un développeur jusqu'à 50 %. Cela peut également aider au débogage, ce qui peut améliorer la qualité du produit développé. Mais aujourd'hui, l'IA générative ne peut pas remplacer les ingénieurs logiciels qualifiés. En fait, les ingénieurs plus expérimentés semblent tirer les plus grands avantages de la productivité des outils, les développeurs inexpérimentés obtenant des résultats moins impressionnants, et parfois négatifs. Un risque connu est que le code généré par l'IA peut contenir des vulnérabilités ou d'autres bogues, de sorte que les ingénieurs logiciels doivent être impliqués pour assurer la qualité et la sécurité du code (voir la dernière section de cet article pour les moyens d'atténuer les risques).
Le coût de cet outil de codage d'IA génératif prêt à l'emploi est relativement faible et le délai de mise sur le marché est court car le produit est disponible et ne nécessite pas de développement interne important. Le coût varie selon le fournisseur de logiciels, mais les abonnements à frais fixes varient de 10 $ à 30 $ par utilisateur et par mois. Lors du choix d'un outil, il est important de discuter des problèmes de licence et de propriété intellectuelle avec le fournisseur pour s'assurer que le code généré n'entraîne pas de violations.
Le soutien du nouvel outil est assuré par une petite équipe interfonctionnelle chargée de sélectionner le fournisseur de logiciels et de surveiller les performances, ce qui devrait inclure la vérification des problèmes de propriété intellectuelle et de sécurité. La mise en œuvre ne nécessite que des changements de flux de travail et de politique. Étant donné que l'outil est purement un logiciel en tant que service (SaaS) prêt à l'emploi, les coûts de calcul et de stockage supplémentaires sont minimes, voire inexistants.
Les entreprises peuvent décider de créer leurs propres applications d'IA génératives, en s'appuyant sur des modèles de base (via des API ou des modèles ouverts), au lieu d'utiliser un outil standard. Cela nécessite une augmentation de l'investissement par rapport à l'exemple précédent, mais facilite une approche plus personnalisée pour répondre au contexte et aux besoins spécifiques de l'entreprise.
Dans cet exemple, une grande banque d'entreprise souhaite utiliser l'IA générative pour améliorer la productivité des chargés de clientèle (RM). Les MR passent un temps considérable à examiner des documents volumineux, tels que des rapports annuels et des transcriptions d'appels sur les revenus, pour rester informés de la situation et des priorités d'un client. Cela permet au RM d'offrir des services adaptés aux besoins particuliers du client.
La banque a décidé de créer une solution qui accède à un modèle de base via une API. La solution numérise les documents et peut apporter rapidement des réponses synthétiques aux questions posées par les MR. Des couches supplémentaires autour du modèle de base sont créées pour rationaliser l'expérience utilisateur, intégrer l'outil aux systèmes de l'entreprise et appliquer des contrôles de risque et de conformité. En particulier, les sorties du modèle doivent être vérifiées, tout comme une organisation vérifierait les sorties d'un analyste junior, car certains grands modèles de langage sont connus pour halluciner. Les RM sont également formés pour poser des questions d'une manière qui fournira les réponses les plus précises de la solution (appelée ingénierie rapide), et des processus sont mis en place pour rationaliser la validation des sorties et des sources d'informations de l'outil.
Dans ce cas, l'IA générative peut accélérer le processus d'analyse d'un RM (de quelques jours à quelques heures), améliorer la satisfaction au travail et potentiellement capturer des informations que le RM aurait pu ignorer autrement.
Le coût de développement provient principalement de la construction de l'interface utilisateur et des intégrations, qui nécessitent du temps de la part d'un data scientist, d'un ingénieur en apprentissage automatique ou d'un ingénieur de données, d'un concepteur et d'un développeur front-end. Les dépenses courantes incluent la maintenance logicielle et le coût d'utilisation des API. Les coûts dépendent du choix du modèle et des frais des fournisseurs tiers, de la taille de l'équipe et du délai d'obtention du produit minimum viable.
Le prochain niveau de sophistication consiste à peaufiner un modèle de base. Dans cet exemple, une entreprise utilise un modèle de base optimisé pour les conversations et l'affine sur ses propres chats clients de haute qualité et ses questions et réponses spécifiques au secteur. L'entreprise opère dans un secteur avec une terminologie spécialisée (par exemple, le droit, la médecine, l'immobilier et la finance). Un service client rapide est un différenciateur concurrentiel.
Les représentants du service client de cette société traitent des centaines de demandes entrantes par jour. Les temps de réponse étaient parfois trop longs, provoquant l'insatisfaction des utilisateurs. L'entreprise a décidé d'introduire un bot de service client IA génératif pour traiter la plupart des demandes des clients. L'objectif était une réponse rapide dans un ton qui correspondait à la marque de l'entreprise et aux préférences des clients. Une partie du processus d'ajustement et de test du modèle de base consiste à s'assurer que les réponses sont alignées sur le langage spécifique au domaine, la promesse de marque et le ton défini pour l'entreprise ; une surveillance continue est nécessaire pour vérifier les performances du système à travers de multiples dimensions, y compris la satisfaction du client.
L'entreprise a créé une feuille de route du produit composée de plusieurs vagues pour minimiser les erreurs de modèle potentielles. Dans la première vague, le chatbot a été piloté en interne. Les employés ont pu donner des réponses "pouce vers le haut" ou "pouce vers le bas" aux suggestions du modèle, et le modèle a pu apprendre de ces entrées. Dans une prochaine étape, le modèle "a écouté" les conversations du support client et a proposé des suggestions. Une fois que la technologie a été suffisamment testée, la deuxième vague a commencé et le modèle a été déplacé vers des cas d'utilisation en contact avec le client avec un humain dans la boucle. Finalement, lorsque les dirigeants sont totalement confiants dans la technologie, celle-ci peut être largement automatisée.
Dans ce cas, l'IA générative a libéré les représentants de service pour qu'ils se concentrent sur les demandes client complexes et de plus grande valeur, amélioré l'efficacité et la satisfaction au travail des représentants, et renforcé les normes de service et la satisfaction client. Le bot a accès à toutes les données internes sur le client et peut "se souvenir" des conversations précédentes (y compris les appels téléphoniques), ce qui représente un changement radical par rapport aux chatbots clients actuels.
Pour tirer parti des avantages, ce cas d'utilisation a nécessité des investissements matériels dans les logiciels, l'infrastructure cloud et les talents technologiques, ainsi qu'un degré plus élevé de coordination interne des risques et des opérations. En général, la mise au point des modèles de base coûte deux à trois fois plus cher que la création d'une ou plusieurs couches logicielles au-dessus d'une API. Les coûts des talents et des tiers pour le cloud computing (en cas de réglage fin d'un modèle auto-hébergé) ou pour l'API (en cas de réglage fin via une API tierce) expliquent l'augmentation des coûts. Pour mettre en œuvre la solution, l'entreprise avait besoin de l'aide d'experts DataOps et MLOps ainsi que de la contribution d'autres fonctions telles que la gestion des produits, la conception, les spécialistes juridiques et le service client.
Les cas d'utilisation de l'IA générative les plus complexes et les plus personnalisés émergent lorsqu'aucun modèle de base approprié n'est disponible et que l'entreprise doit en créer un à partir de zéro. Cette situation peut survenir dans des secteurs spécialisés ou en travaillant avec des ensembles de données uniques qui sont significativement différents des données utilisées pour former des modèles de base existants, comme le montre cet exemple pharmaceutique. La formation d'un modèle de base à partir de zéro présente des défis techniques, d'ingénierie et de ressources considérables. Le retour sur investissement supplémentaire résultant de l'utilisation d'un modèle plus performant devrait l'emporter sur les coûts en capital financier et humain.
Dans cet exemple, des chercheurs chargés de la découverte de médicaments dans une société pharmaceutique devaient décider des expériences à exécuter ensuite, sur la base d'images de microscopie. Ils disposaient d'un ensemble de données de millions de ces images, contenant une mine d'informations visuelles sur les caractéristiques cellulaires qui sont pertinentes pour la découverte de médicaments mais difficiles à interpréter pour un humain. Les images ont été utilisées pour évaluer les candidats thérapeutiques potentiels.
La société a décidé de créer un outil qui aiderait les scientifiques à comprendre la relation entre la chimie des médicaments et les résultats de microscopie enregistrés afin d'accélérer les efforts de R&D. Comme ces modèles multimodaux n'en sont qu'à leurs balbutiements, l'entreprise a décidé de former les siens à la place. Pour construire le modèle, les membres de l'équipe ont utilisé à la fois des images du monde réel qui sont utilisées pour former des modèles fondamentaux basés sur des images et leur grand ensemble de données d'images de microscopie interne.
Le modèle formé a ajouté de la valeur en prédisant quels médicaments candidats pourraient conduire à des résultats favorables et en améliorant la capacité à identifier avec précision les caractéristiques cellulaires pertinentes pour la découverte de médicaments. Cela peut conduire à des processus de découverte de médicaments plus efficients et efficaces, non seulement en améliorant le délai de rentabilisation, mais également en réduisant le nombre d'analyses inexactes, trompeuses ou ayant échoué.
En général, la formation d'un modèle à partir de zéro coûte dix à 20 fois plus cher que la création d'un logiciel autour d'une API de modèle. Des équipes plus importantes (y compris, par exemple, des experts en apprentissage automatique de niveau doctorat) et des dépenses de calcul et de stockage plus élevées expliquent les différences de coût. Le coût prévu de la formation d'un modèle de base varie considérablement en fonction du niveau de performance du modèle souhaité et de la complexité de la modélisation. Ces facteurs influencent la taille requise de l'ensemble de données, la composition de l'équipe et les ressources de calcul. Dans ce cas d'utilisation, l'équipe d'ingénierie et les dépenses cloud en cours représentaient la majorité des coûts.
La société a constaté que des mises à jour majeures de son infrastructure et de ses processus technologiques seraient nécessaires, y compris l'accès à de nombreuses instances GPU pour former le modèle, des outils pour distribuer la formation sur de nombreux systèmes et les meilleures pratiques MLOps pour limiter les coûts et la durée du projet. De plus, un important travail de traitement des données a été nécessaire pour la collecte, l'intégration (s'assurer que les fichiers de différents ensembles de données sont dans le même format et la même résolution) et le nettoyage (filtrer les données de mauvaise qualité, supprimer les doublons et s'assurer que la distribution est conforme à l'utilisation prévue). Étant donné que le modèle de base a été formé à partir de zéro, des tests rigoureux du modèle final ont été nécessaires pour garantir que la sortie était précise et sûre à utiliser.
Les cas d'utilisation décrits ici offrent de puissants enseignements aux PDG alors qu'ils se lancent dans l'aventure de l'IA générative :
Le PDG a un rôle crucial à jouer pour catalyser la concentration d'une entreprise sur l'IA générative. Dans cette dernière section, nous discutons des stratégies que les PDG voudront garder à l'esprit au début de leur parcours. Beaucoup d'entre eux font écho aux réponses des cadres supérieurs aux précédentes vagues de nouvelles technologies. Cependant, l'IA générative présente ses propres défis, notamment la gestion d'une technologie évoluant à une vitesse jamais vue lors des transitions technologiques précédentes.
De nombreuses organisations ont commencé à explorer les possibilités de l'IA traditionnelle par le biais d'expériences cloisonnées. L'IA générative nécessite une approche plus délibérée et coordonnée compte tenu de ses considérations de risque uniques et de la capacité des modèles de base à sous-tendre plusieurs cas d'utilisation au sein d'une organisation. Par exemple, un modèle affiné à l'aide de matériel propriétaire pour refléter l'identité de marque de l'entreprise pourrait être déployé dans plusieurs cas d'utilisation (par exemple, générer des campagnes marketing personnalisées et des descriptions de produits) et fonctions commerciales, telles que le développement et le marketing de produits.
À cette fin, nous recommandons de réunir un groupe interfonctionnel de dirigeants de l'entreprise (par exemple, représentant la science des données, l'ingénierie, le juridique, la cybersécurité, le marketing, la conception et d'autres fonctions commerciales). Un tel groupe peut non seulement aider à identifier et hiérarchiser les cas d'utilisation les plus importants, mais également permettre une mise en œuvre coordonnée et sûre dans toute l'organisation.
L'IA générative est un outil puissant qui peut transformer le fonctionnement des organisations, avec un impact particulier dans certains domaines commerciaux de la chaîne de valeur (par exemple, le marketing pour un détaillant ou les opérations pour un fabricant). La facilité de déploiement de l'IA générative peut inciter les organisations à l'appliquer à des cas d'utilisation sporadiques dans l'ensemble de l'entreprise. Il est important d'avoir une perspective sur la famille de cas d'utilisation par domaine qui aura le potentiel de transformation le plus important dans toutes les fonctions de l'entreprise. Les organisations réinventent l'état cible activé par l'IA générative fonctionnant en synchronisation avec d'autres applications d'IA traditionnelles, ainsi que de nouvelles méthodes de travail qui n'étaient peut-être pas possibles auparavant.
Une pile de données et de technologie moderne est la clé de presque toute approche réussie de l'IA générative. Les PDG doivent se tourner vers leurs directeurs techniques pour déterminer si l'entreprise dispose des capacités techniques requises en termes de ressources informatiques, de systèmes de données, d'outils et d'accès aux modèles (open source via des hubs de modèles ou commerciaux via des API).
Par exemple, l'élément vital de l'IA générative est un accès fluide aux données adaptées à un contexte ou à un problème métier spécifique. Les entreprises qui n'ont pas encore trouvé de moyens d'harmoniser efficacement et de fournir un accès immédiat à leurs données ne seront pas en mesure d'affiner l'IA générative pour débloquer davantage de ses utilisations potentiellement transformatrices. Il est tout aussi important de concevoir une architecture de données évolutive qui inclut des procédures de gouvernance et de sécurité des données. Selon le cas d'utilisation, l'infrastructure informatique et d'outillage existante (qui peut provenir d'un fournisseur de cloud ou être configurée en interne) peut également nécessiter une mise à niveau. Une stratégie claire de données et d'infrastructure ancrée sur la valeur commerciale et l'avantage concurrentiel découlant de l'IA générative sera essentielle.
Les PDG voudront éviter de rester coincés dans les étapes de planification. De nouveaux modèles et applications sont développés et lancés rapidement. GPT-4, par exemple, a été publié en mars 2023, après la sortie de ChatGPT (GPT-3.5) en novembre 2022 et de GPT-3 en 2020. Dans le monde des affaires, le temps presse et la nature rapide de la technologie d'IA générative exige que les entreprises agissent rapidement pour en tirer parti. Il existe plusieurs façons pour les dirigeants de continuer à avancer à un rythme régulier.
Bien que l'IA générative en soit encore à ses balbutiements, il est important de montrer en interne comment elle peut affecter le modèle d'exploitation d'une entreprise, peut-être par le biais d'une "approche phare". Par exemple, une voie à suivre consiste à créer un « expert virtuel » qui permet aux travailleurs de première ligne d'exploiter des sources de connaissances exclusives et d'offrir le contenu le plus pertinent aux clients. Cela a le potentiel d'augmenter la productivité, de créer de l'enthousiasme et de permettre à une organisation de tester l'IA générative en interne avant de passer à des applications orientées client.
Comme pour les autres vagues d'innovation technique, il y aura une fatigue de la preuve de concept et de nombreux exemples d'entreprises bloquées dans le "purgatoire pilote". Mais encourager une preuve de concept reste le meilleur moyen de tester et d'affiner rapidement une analyse de rentabilisation avant de passer à des cas d'utilisation adjacents. En se concentrant sur les premières victoires qui produisent des résultats significatifs, les entreprises peuvent créer une dynamique, puis se développer et se développer, en tirant parti de la nature polyvalente de l'IA générative. Cette approche pourrait permettre aux entreprises de promouvoir une adoption plus large de l'IA et de créer la culture de l'innovation qui est essentielle pour conserver un avantage concurrentiel. Comme indiqué ci-dessus, l'équipe de direction interfonctionnelle voudra s'assurer que ces preuves de concept sont délibérées et coordonnées.
Comme le démontrent nos quatre cas d'utilisation détaillés, les chefs d'entreprise doivent équilibrer les opportunités de création de valeur avec les risques liés à l'IA générative. Selon notre récente enquête mondiale sur l'IA, la plupart des organisations n'atténuent pas la plupart des risques associés à l'IA traditionnelle, même si plus de la moitié des organisations ont déjà adopté la technologie3. "L'état de l'IA en 2022 - et une demi-décennie en revue", McKinsey, 6 décembre 2022. L'IA générative attire une attention renouvelée sur bon nombre de ces mêmes risques, tels que le potentiel de perpétuer des biais cachés dans les données de formation, tout en en présentant de nouveaux, comme sa propension à halluciner.
En conséquence, l'équipe de direction interfonctionnelle voudra non seulement établir des principes et des directives éthiques généraux pour l'utilisation générative de l'IA, mais également développer une compréhension approfondie des risques présentés par chaque cas d'utilisation potentiel. Il sera important de rechercher des cas d'utilisation initiaux qui s'alignent à la fois sur la tolérance globale au risque de l'organisation et qui disposent de structures en place pour atténuer les risques consécutifs. Par exemple, une organisation de vente au détail peut donner la priorité à un cas d'utilisation qui a une valeur légèrement inférieure mais également un risque moindre, comme la création d'ébauches initiales de contenu marketing et d'autres tâches qui tiennent un humain au courant. Dans le même temps, l'entreprise peut mettre de côté un cas d'utilisation à plus forte valeur ajoutée et à haut risque, tel qu'un outil qui rédige et envoie automatiquement des e-mails marketing hyperpersonnalisés. De telles pratiques de gestion des risques peuvent permettre aux organisations d'établir les contrôles nécessaires pour gérer correctement l'IA générative et maintenir la conformité.
Les PDG et leurs équipes voudront également se tenir au courant des derniers développements en matière de réglementation de l'IA générative, y compris les règles relatives à la protection des données des consommateurs et aux droits de propriété intellectuelle, afin de protéger l'entreprise des problèmes de responsabilité. Les pays peuvent adopter différentes approches de la réglementation, comme ils le font souvent déjà avec l'IA et les données. Les organisations peuvent avoir besoin d'adapter leur approche de travail pour calibrer la gestion des processus, la culture et la gestion des talents de manière à pouvoir gérer l'environnement réglementaire en évolution rapide et les risques de l'IA générative à grande échelle.
Les chefs d'entreprise doivent se concentrer sur la création et le maintien d'un ensemble équilibré d'alliances. La stratégie d'acquisitions et d'alliances d'une entreprise doit continuer à se concentrer sur la création d'un écosystème de partenaires adaptés à différents contextes et à répondre aux besoins de l'IA générative à tous les niveaux de la pile technologique, tout en veillant à éviter le blocage des fournisseurs.
Un partenariat avec les bonnes entreprises peut aider à accélérer l'exécution. Les organisations n'ont pas à créer elles-mêmes toutes les applications ou tous les modèles de base. Au lieu de cela, ils peuvent s'associer à des fournisseurs et à des experts de l'IA générative pour agir plus rapidement. Par exemple, ils peuvent s'associer à des fournisseurs de modèles pour personnaliser des modèles pour un secteur spécifique, ou s'associer à des fournisseurs d'infrastructure qui offrent des capacités de support telles que le cloud computing évolutif.
Les entreprises peuvent utiliser l'expertise des autres et agir rapidement pour tirer parti de la dernière technologie d'IA générative. Mais les modèles d'IA générative ne sont que la pointe de la lance : plusieurs éléments supplémentaires sont nécessaires à la création de valeur.
Pour appliquer efficacement l'IA générative à des fins commerciales, les entreprises doivent renforcer leurs capacités techniques et améliorer les compétences de leur main-d'œuvre actuelle. Cela nécessite un effort concerté de la direction pour identifier les capacités requises en fonction des cas d'utilisation prioritaires de l'entreprise, qui s'étendront probablement au-delà des rôles techniques pour inclure un mélange de talents dans les domaines de l'ingénierie, des données, de la conception, des risques, des produits et d'autres fonctions commerciales.
Comme le montrent les cas d'utilisation mis en évidence ci-dessus, les besoins techniques et en talents varient considérablement en fonction de la nature d'une implémentation donnée, de l'utilisation de solutions prêtes à l'emploi à la création d'un modèle de base à partir de zéro. Par exemple, pour créer un modèle génératif, une entreprise peut avoir besoin d'experts en apprentissage automatique de niveau doctorat ; d'autre part, pour développer des outils d'IA générative à l'aide de modèles existants et d'offres SaaS, un ingénieur de données et un ingénieur logiciel peuvent suffire à diriger l'effort.
En plus d'embaucher les bons talents, les entreprises voudront former et éduquer leur main-d'œuvre existante. Les interfaces utilisateur conversationnelles basées sur des invites peuvent rendre les applications d'IA génératives faciles à utiliser. Mais les utilisateurs doivent encore optimiser leurs invites, comprendre les limites de la technologie et savoir où et quand ils peuvent intégrer l'application de manière acceptable dans leurs flux de travail. La direction doit fournir des directives claires sur l'utilisation des outils d'IA générative et offrir une éducation et une formation continues pour tenir les employés informés de leurs risques. Favoriser une culture de recherche et d'expérimentation autonomes peut également encourager les employés à innover dans les processus et les produits qui intègrent efficacement ces outils.
Les entreprises poursuivent des ambitions d'IA depuis des années, et beaucoup ont réalisé de nouvelles sources de revenus, des améliorations de produits et des efficacités opérationnelles. Une grande partie des succès dans ces domaines sont dus aux technologies d'IA qui restent le meilleur outil pour un travail particulier, et les entreprises devraient continuer à intensifier ces efforts. Cependant, l'IA générative représente un autre bond en avant prometteur et un monde de nouvelles possibilités. Alors que l'échafaudage opérationnel et de risque de la technologie est encore en cours de construction, les chefs d'entreprise savent qu'ils doivent se lancer dans l'aventure de l'IA générative. Mais par où et comment commencer ? La réponse variera d'une entreprise à l'autre ainsi qu'au sein d'une organisation. Certains commenceront grand; d'autres peuvent entreprendre de plus petites expériences. La meilleure approche dépendra des aspirations et de l'appétit pour le risque de l'entreprise. Quelle que soit l'ambition, la clé est de se lancer et d'apprendre en faisant.
Michel Chuiest partenaire du McKinsey Global Institute et partenaire du bureau de McKinsey dans la région de la baie, oùRoger Robertest partenaire,Tanya Rodtchenkoest partenaire associé, etLareina Yee, président du McKinsey Technology Council, est un associé principal.Alex Singla, associé principal du bureau de Chicago, etAlex Sukharevsky, un associé principal du bureau de Londres, sont les leaders mondiaux de QuantumBlack, AI by McKinsey.Delphine Zurkiyaest un associé principal du bureau de Boston.
Crédit : vidéo créée par Chris Grava / Darby Films à l'aide d'un langage de programmation visuel basé sur des nœuds
Au milieu de l'effervescence Interface de programmation d'applications (API) Intelligence artificielle (IA) Apprentissage en profondeur Réglage fin Modèles de base (FM) IA générative Unités de traitement graphique (GPU) Unités centrales de traitement (CPU) Grands modèles de langage (LLM) Apprentissage automatique (ML) MLOps Ingénierie rapide Données structurées Données non structurées Sukharevsky Delphine Zurkiya