Apprentissage automatique dans l'enseignement supérieur
De nombreux établissements d'enseignement supérieur les institutions utilisent désormais les données et l'analyse comme partie intégrante de leurs processus. Que l'objectif soit d'identifier et de mieux soutenir les points faibles dans le parcours des étudiants, d'allouer plus efficacement les ressources ou d'améliorer l'expérience des étudiants et des professeurs, les établissements voient les avantages des solutions basées sur les données.
Cet article est un effort de collaboration de Claudio Brasca, Nikhil Kaithwal, Charag Krishnan, Monatrice Lam, Jonathan Law et Varun Marya, représentant les points de vue de la pratique du secteur public et social de McKinsey.
Ceux qui sont à l'avant-garde de cette tendance se concentrent sur l'exploitation des analyses pour accroître la personnalisation et la flexibilité des programmes, ainsi que pour améliorer la rétention en identifiant les étudiants à risque de décrocher et en les contactant de manière proactive avec des interventions sur mesure. En effet, la science des données et l'apprentissage automatique peuvent débloquer une valeur significative pour les universités en garantissant que les ressources sont ciblées sur les opportunités à plus fort impact pour améliorer l'accès d'un plus grand nombre d'étudiants, ainsi que l'engagement et la satisfaction des étudiants.
Par exemple, la Western Governors University dans l'Utah utilise la modélisation prédictive pour améliorer la rétention en identifiant les étudiants à risque et en développant des programmes d'intervention précoce. Les efforts initiaux ont augmenté le taux de diplomation du programme de premier cycle de quatre ans de l'université de cinq points de pourcentage entre 2018 et 2020.1 "Disponible à la demande : améliorer la réussite des étudiants grâce à une approche unifiée de l'analyse de données et de l'IA", Databricks, consulté en décembre 2021 ; "À propos des taux de diplomation", Western Governors University, 2 décembre 2021.
Pourtant, l'enseignement supérieur en est encore aux premiers stades du renforcement des capacités en matière de données. Les universités étant confrontées à de nombreux défis (tels que les pressions financières, la falaise démographique et une augmentation des problèmes de santé mentale des étudiants) et à une variété d'opportunités (y compris atteindre les apprenants adultes et développer l'apprentissage en ligne), l'utilisation croissante de l'analyse avancée et de l'apprentissage automatique peut s'avérer bénéfique.
Ci-dessous, nous partageons certains des cas d'utilisation les plus prometteurs pour l'analyse avancée dans l'enseignement supérieur afin de montrer comment les universités capitalisent sur ces opportunités pour surmonter les défis actuels, à la fois en permettant l'accès à beaucoup plus d'étudiants et en améliorant l'expérience étudiante.
La science des données et l'apprentissage automatique peuvent libérer une valeur significative pour les universités en garantissant que les ressources sont ciblées sur les opportunités à plus fort impact pour améliorer l'accès d'un plus grand nombre d'étudiants, ainsi que l'engagement et la satisfaction des étudiants.
Les techniques d'analyse avancée peuvent aider les établissements à obtenir des informations beaucoup plus approfondies sur leurs populations étudiantes et à identifier des risques plus nuancés qu'ils ne pourraient le faire grâce à des analyses descriptives et diagnostiques, qui s'appuient sur des approches linéaires fondées sur des règles (Figure 1).
L'analyse avancée - qui utilise la puissance d'algorithmes tels que l'amplification de gradient et la forêt aléatoire - peut également aider les établissements à corriger les biais involontaires dans leurs méthodes existantes d'identification des étudiants à risque et à concevoir de manière proactive des interventions sur mesure pour atténuer la majorité des risques identifiés.
Par exemple, les établissements qui utilisent des approches linéaires fondées sur des règles examinent des indicateurs tels que les faibles notes et la faible assiduité pour identifier les étudiants à risque de décrochage ; les établissements tendent ensuite la main à ces étudiants et lancent des initiatives pour mieux les accompagner. Bien que de telles initiatives puissent être utiles, elles sont souvent mises en œuvre trop tard et ne ciblent qu'un sous-ensemble de la population à risque. Cette approche pourrait être une bonne solution de fortune à deux problèmes auxquels sont confrontés les leaders de la réussite étudiante dans les universités. Premièrement, il y a trop de variables qui pourraient être analysées pour indiquer le risque d'attrition (telles que les facteurs académiques, financiers et de santé mentale, et le sentiment d'appartenance au campus). Deuxièmement, s'il est facile d'identifier une variance notable sur une ou deux variables, il est difficile d'identifier une variance nominale sur plusieurs variables. Les approches linéaires basées sur des règles peuvent donc ne pas identifier les étudiants qui, par exemple, peuvent avoir des notes décentes et une assiduité supérieure à la moyenne, mais qui ont du mal à remettre leurs devoirs à temps ou qui ont constamment eu des difficultés à payer leurs factures (Figure 2).
Un modèle d'apprentissage automatique pourrait relever les deux défis décrits ci-dessus. Un tel modèle examine dix années de données pour identifier les facteurs qui pourraient aider une université à déterminer rapidement le risque d'attrition d'un étudiant. Par exemple, l'étudiant a-t-il changé de mode de paiement sur le portail de l'université ? À quelle distance de la date d'échéance l'étudiant soumet-il ses devoirs ? Une fois que l'établissement a identifié les étudiants à risque, il peut déployer de manière proactive des interventions pour les retenir.
Bien que de nombreux établissements reconnaissent la promesse de l'analytique pour personnaliser les communications avec les étudiants, augmenter les taux de rétention et améliorer l'expérience et l'engagement des étudiants, les établissements pourraient utiliser ces approches pour l'éventail complet des cas d'utilisation tout au long du parcours étudiant, qu'ils soient potentiels, actuels ou anciens.
Par exemple, des analyses avancées peuvent aider les établissements à identifier les lycées, les codes postaux et les comtés sur lesquels ils doivent se concentrer pour atteindre les étudiants potentiels les plus susceptibles de convenir parfaitement à l'établissement. L'apprentissage automatique pourrait également aider à identifier les interventions et le soutien qui devraient être mis à la disposition des différents archétypes d'étudiants inscrits pour aider à mesurer et à augmenter la satisfaction des étudiants. Ces cas d'utilisation pourraient ensuite être étendus pour aider les étudiants à développer leurs compétences au-delà de l'obtention du diplôme, permettant aux établissements d'offrir des opportunités d'apprentissage continu et de mieux impliquer les anciens. Au fur et à mesure qu'un établissement étend son application et sa couverture d'outils d'analyse avancée tout au long du cycle de vie des étudiants, le modèle améliore son identification des modèles et l'établissement peut prendre des interventions et des actions de plus en plus granulaires.
Les établissements voudront probablement adopter un modèle en plusieurs étapes pour exploiter l'apprentissage automatique afin de mieux servir les étudiants. Par exemple, pour les efforts visant à améliorer les taux d'achèvement et de diplomation des étudiants, la technique en cinq étapes suivante pourrait générer une immense valeur :
Les établissements pourraient déployer ce modèle à un rythme régulier pour identifier les étudiants qui bénéficieraient le plus d'un soutien supplémentaire.
Les établissements pourraient également créer des modèles similaires pour répondre à d'autres objectifs ou défis stratégiques, notamment la génération de prospects et l'inscription. Par exemple, les établissements pourraient, dans un premier temps, analyser 100 attributs ou plus à partir d'années de données historiques pour comprendre les caractéristiques des candidats les plus susceptibles de s'inscrire.
Les établissements voudront probablement adopter un modèle en plusieurs étapes pour exploiter l'apprentissage automatique afin de mieux servir les étudiants.
Les expériences de deux établissements d'enseignement supérieur qui se sont appuyés sur des analyses avancées pour améliorer les inscriptions et la rétention révèlent l'impact que de tels efforts peuvent avoir.
Une université privée à but non lucratif avait récemment inscrit sa plus grande classe de première année de l'histoire et cherchait à augmenter à nouveau ses inscriptions. L'établissement souhaitait à la fois toucher davantage d'étudiants potentiels de première année de premier cycle qui conviendraient parfaitement à l'établissement et améliorer la conversion dans le parcours d'inscription d'une manière gérable pour l'équipe d'inscription sans augmenter considérablement les investissements et les ressources. L'université a pris trois mesures importantes:
Pour cette institution, la modélisation analytique avancée a eu des implications et un impact immédiats. L'initiative a également suggéré des opportunités futures pour l'université de servir plus d'étudiants de première année avec une plus grande efficacité marketing. Lorsqu'il a été initialement testé par rapport aux pistes pour l'automne suivant (avant la date limite de candidature), le modèle a prédit avec précision 85 % des candidats qui ont soumis une candidature, et il a prédit les 35 % des candidats à ce stade du cycle qui étaient les plus susceptibles de s'inscrire, en supposant qu'aucun changement n'a été apporté aux critères d'admission (pièce 3). L'équipe de gestion des inscriptions est désormais en mesure de mieux hiérarchiser ses ressources et son temps sur les prospects et les candidats à fort potentiel pour générer une classe importante. Ces nouvelles capacités donneront à l'institution la flexibilité de faire des choix stratégiques ; plutôt que de se concentrer principalement sur la taille de la classe entrante, il peut garantir la taille de classe souhaitée tout en donnant la priorité à d'autres objectifs, tels que la mixité des classes, l'allocation d'aides financières ou les économies budgétaires.
À l'instar de nombreux établissements d'enseignement supérieur pendant la pandémie,2« Persistance et rétention », National Student Clearinghouse Research Center, 8 juillet 2021. une université en ligne faisait face à une tendance à la baisse significative de la rétention des étudiants. L'université a exploré plusieurs options et déployé des initiatives menées par les départements académiques et administratifs, y compris des groupes de discussion et des campagnes de soutien, mais les résultats n'ont pas été à la hauteur des attentes.
L'établissement voulait mettre la barre haute pour la réussite des étudiants et obtenir des améliorations marquées et durables en matière de rétention. Elle s'est tournée vers une approche d'analyse avancée pour poursuivre ses aspirations audacieuses.
Pour construire un modèle d'apprentissage automatique qui permettrait à l'université d'identifier tôt les étudiants à risque d'attrition, elle a d'abord analysé dix ans de données historiques pour comprendre les caractéristiques clés qui différencient les étudiants les plus susceptibles de continuer - et donc d'obtenir leur diplôme - par rapport à ceux qui se sont désinscrits. Après avoir validé que le modèle initial était plusieurs fois plus efficace pour prédire la rétention que la référence, l'établissement a affiné le modèle et l'a appliqué à la population étudiante actuelle. Ce modèle d'attrition a produit cinq archétypes d'étudiants à risque, dont trois étaient contre-intuitifs à la sagesse conventionnelle sur ce à quoi ressemblent les profils typiques d'étudiants à risque (Figure 4).
Ensemble, ces trois archétypes contre-intuitifs d'étudiants à risque - qui auraient été omis en utilisant une approche d'analyse linéaire - représentent environ 70 % des étudiants les plus susceptibles d'abandonner l'inscription. Le groupe le plus important d'individus à risque (représentant environ 40 % des élèves à risque identifiés) était composé d'étudiants remarquables ayant d'excellents antécédents. Cela signifie que le modèle a identifié au moins deux fois plus d'étudiants à risque d'attrition que les modèles basés sur des règles linéaires. Les résultats du modèle ont permis à l'université d'identifier plus efficacement les étudiants à risque d'attrition et d'investir stratégiquement dans des initiatives à court et moyen terme les plus susceptibles d'améliorer la rétention.
Avec le modèle et les données sur les profils d'étudiants à risque en main, l'université en ligne a lancé un ensemble d'interventions ciblées visant à fournir un soutien personnalisé aux étudiants de chaque archétype pour augmenter la rétention. Les actions comprenaient la planification de plus de points de contact avec les conseillers académiques et professionnels, l'élargissement du mentorat du corps professoral et la création de voies alternatives pour que les étudiants comblent leurs lacunes en matière de connaissances.
L'analyse avancée est un outil puissant qui peut aider les établissements d'enseignement supérieur à surmonter les défis auxquels ils sont confrontés aujourd'hui, à stimuler la croissance et à mieux soutenir les étudiants. Cependant, l'apprentissage automatique est complexe, avec des risques associés considérables. Bien que les risques varient en fonction de l'établissement et des données incluses dans le modèle, les établissements d'enseignement supérieur peuvent souhaiter suivre les étapes suivantes lors de l'utilisation de ces outils :
Alors que de nombreux établissements d'enseignement supérieur ont commencé à exploiter les données et l'analyse, il reste encore un long chemin à parcourir pour réaliser le plein potentiel de ces capacités en termes d'expérience étudiante. L'afflux d'étudiants et d'établissements qui se sont engagés dans l'apprentissage en ligne et l'utilisation d'outils technologiques au cours des deux dernières années signifie qu'il y a beaucoup plus de données avec lesquelles travailler que jamais auparavant ; les établissements d'enseignement supérieur voudront peut-être commencer à l'utiliser pour mieux servir les étudiants dans les années à venir.
Claudio Brascaest un associé du bureau de McKinsey à San Francisco, oùVarun Maryaest un associé principal ;Nikhil Kaithwalest associé associé au bureau de Londres,Charag Krishnanest partenaire du bureau du New Jersey–Summit,Monatrice Lamest consultant au bureau de Bay Area-Silicon Valley, etJonathan Loiest un associé principal du bureau de Californie du Sud.
Les auteurs tiennent à remercier Inès Garceau-Aranda, Emily Cohen, Katie Owen, Xiaowo Sun, Xuecong Sun et Shyla Ziade pour leurs contributions à cet article.
Beaucoup d'enseignement supérieur Claudio Brasca Varun Marya Nikhil Kaithwal Charag Krishnan Monatrice Lam Jonathan Law