banner
Maison / Nouvelles / Utilisation de l'apprentissage automatique pour prédire la rétention des étudiants à partir de la situation sociale
Nouvelles

Utilisation de l'apprentissage automatique pour prédire la rétention des étudiants à partir de la situation sociale

Jan 17, 2024Jan 17, 2024

Rapports scientifiques volume 13, Numéro d'article : 5705 (2023) Citer cet article

1983 Accès

25 Altmétrique

Détails des métriques

L'attrition des étudiants pose un défi majeur aux établissements universitaires, aux organismes de financement et aux étudiants. Avec l'essor du Big Data et de l'analyse prédictive, un nombre croissant de travaux dans la recherche sur l'enseignement supérieur a démontré la faisabilité de prédire le décrochage des étudiants à partir de données facilement disponibles au niveau macro (par exemple, les données sociodémographiques ou les premières mesures de performance) et au niveau micro (par exemple, les connexions aux systèmes de gestion de l'apprentissage). Pourtant, les travaux existants ont largement négligé un élément critique de niveau méso de la réussite des étudiants connu pour stimuler la rétention : l'expérience des étudiants à l'université et leur intégration sociale au sein de leur cohorte. En partenariat avec une application mobile qui facilite la communication entre les étudiants et les universités, nous avons collecté à la fois (1) des données institutionnelles au niveau macro et (2) des données comportementales au niveau micro et méso sur l'engagement (par exemple, la quantité et la qualité des interactions avec les services et événements universitaires ainsi qu'avec d'autres étudiants) pour prédire le décrochage après le premier semestre. En analysant les dossiers de 50 095 étudiants de quatre universités et collèges communautaires américains, nous démontrons que les données combinées au niveau macro et méso peuvent prédire l'abandon avec des niveaux élevés de performance prédictive (AUC moyenne sur les modèles linéaires et non linéaires = 78 % ; AUC max = 88 %). Il a été constaté que les variables d'engagement comportemental représentant l'expérience des étudiants à l'université (par exemple, la centralité du réseau, l'engagement des applications, les évaluations des événements) ajoutaient un pouvoir prédictif supplémentaire au-delà des variables institutionnelles (par exemple, GPA ou origine ethnique). Enfin, nous soulignons la généralisabilité de nos résultats en montrant que les modèles formés sur une université peuvent prédire la rétention dans une autre université avec des niveaux raisonnablement élevés de performance prédictive.

Aux États-Unis, environ 60 % seulement des étudiants à temps plein obtiennent leur diplôme1,2, la majorité de ceux qui interrompent leurs études abandonnant au cours de leur première année3. Ces taux d'attrition élevés posent des défis majeurs aux étudiants, aux universités et aux organismes de financement4,5.

Le décrochage universitaire sans diplôme a un impact négatif sur les finances et la santé mentale des étudiants. Plus de 65 % des étudiants américains de premier cycle reçoivent des prêts étudiants pour les aider à payer leurs études universitaires, ce qui les oblige à contracter de lourdes dettes au cours de leurs études6. Selon le Département américain de l'éducation, les étudiants qui contractent un prêt mais n'obtiennent jamais leur diplôme sont trois fois plus susceptibles de ne pas rembourser leur prêt que les étudiants qui obtiennent leur diplôme7. Ce n'est guère surprenant étant donné que les étudiants qui décrochent de l'université sans diplôme gagnent 66 % de moins que les diplômés universitaires titulaires d'un baccalauréat et sont beaucoup plus susceptibles d'être au chômage2. En plus des pertes financières, le sentiment d'échec a souvent un impact négatif sur le bien-être et la santé mentale des étudiants8.

Dans le même temps, l'attrition des étudiants a un impact négatif sur les universités et les organismes de financement fédéraux. Pour les universités, l'attrition des étudiants entraîne une réduction des revenus annuels moyens d'environ 16,5 milliards de dollars par an en raison de la perte des frais de scolarité9,10. De même, l'attrition des étudiants gaspille des ressources précieuses fournies par les États et les gouvernements fédéraux. Par exemple, le système de données intégré sur l'éducation postsecondaire (IPEDS) du ministère de l'Éducation des États-Unis montre qu'entre 2003 et 2008, les gouvernements des États et fédéral ont fourni ensemble plus de 9 milliards de dollars en bourses et subventions aux étudiants qui ne sont pas retournés dans l'établissement où ils étaient inscrits pour une deuxième année11.

Compte tenu des coûts élevés de l'attrition, la capacité de prévoir les étudiants à risque – et de leur fournir un soutien supplémentaire – est essentielle12,13. Comme la plupart des décrocheurs surviennent au cours de la première année14, de telles prédictions sont plus utiles si elles peuvent identifier les élèves à risque le plus tôt possible13,15,16. Plus tôt on peut identifier les étudiants qui pourraient éprouver des difficultés, meilleures sont les chances que les interventions visant à les empêcher de prendre progressivement du retard – et éventuellement d'arrêter leurs études – soient efficaces17,18.

Des recherches antérieures ont identifié divers prédicteurs de la persévérance scolaire, notamment les résultats scolaires antérieurs, les facteurs démographiques et socio-économiques et l'intégration sociale d'un étudiant dans son établissement d'origine19,20,21,22,23.

Les résultats scolaires antérieurs (par exemple, les scores GPA, SAT et ACT au lycée ou GPA au collège) ont été identifiés comme l'un des prédicteurs les plus cohérents de la rétention des élèves : les élèves qui réussissent mieux sur le plan scolaire sont moins susceptibles d'abandonner17,21,24,25,26,27,28,29. De même, la recherche a mis en évidence le rôle des variables démographiques et socio-économiques, y compris l'âge, le sexe et l'origine ethnique12,19,25,27,30 ainsi que le statut socio-économique31 dans la prédiction de la probabilité qu'un étudiant persiste. Par exemple, les femmes sont plus susceptibles de poursuivre leurs études que les hommes12,30,32,33 tandis que les étudiants blancs et asiatiques sont plus susceptibles de persévérer que les étudiants des autres groupes ethniques19,27,30. De plus, il a été démontré que le statut socio-économique et la situation financière immédiate d'un étudiant ont un impact sur la rétention. Les étudiants sont plus susceptibles d'abandonner leurs études s'ils sont des étudiants de première génération34,35,36 ou s'ils connaissent des niveaux élevés de difficultés financières (p. En revanche, les étudiants qui reçoivent une aide financière qui n'a pas à être remboursée après l'obtention du diplôme sont plus susceptibles d'obtenir leur diplôme39,40.

Alors que la plupart des prédicteurs de la rétention des étudiants décrits sont des caractéristiques intrapersonnelles relativement stables et souvent difficiles ou coûteuses à modifier, la recherche met également en évidence un pilier plus malléable de la rétention : l'expérience des étudiants à l'université. En particulier, la mesure dans laquelle ils sont intégrés et socialisés avec succès dans l'institution16,22,41,42. Comme le note Bean (2005), "peu de gens nieraient que la vie sociale des étudiants au collège et leurs échanges avec d'autres à l'intérieur et à l'extérieur de l'établissement sont importants dans les décisions de rétention" (p. 227)41. La mesure dans laquelle un étudiant est socialement intégré et ancré dans son établissement a été étudiée de plusieurs façons, reliant la rétention au développement d'amitiés avec d'autres étudiants43, la position de l'étudiant dans les réseaux sociaux16,29, l'expérience des liens sociaux44 et un sentiment d'appartenance42,45,46. Ensemble, ces études suggèrent que les interactions avec les pairs ainsi qu'avec le corps professoral et le personnel - par exemple par la participation aux activités du campus, l'adhésion à des organisations et la poursuite d'activités parascolaires - aident les étudiants à mieux s'intégrer à la vie universitaire44,47. En revanche, un manque d'intégration sociale résultant des déplacements (c'est-à-dire ne pas vivre sur le campus avec d'autres étudiants) a un impact négatif sur les chances d'un étudiant d'obtenir son diplôme48,49,50,51. En bref, plus un étudiant est solidement ancré et se sent intégré à la communauté universitaire – en particulier au cours de sa première année – moins il est susceptible de décrocher42,52.

Une grande partie de la recherche sur l'attrition des étudiants s'est concentrée sur la compréhension et l'explication des moteurs de la persévérance scolaire. Cependant, parallèlement à l'essor des méthodes informatiques et de la modélisation prédictive dans les sciences sociales53,54,55, les chercheurs et les praticiens en éducation ont commencé à explorer la faisabilité et la valeur des approches axées sur les données pour soutenir la prise de décision institutionnelle et l'efficacité de l'éducation (pour d'excellents aperçus du domaine en pleine croissance, voir56,57). Conformément à cette tendance plus large, un nombre croissant de travaux ont montré le potentiel de prédiction du décrochage scolaire à l'aide de l'apprentissage automatique. Contrairement aux approches inférentielles traditionnelles, les approches d'apprentissage automatique s'intéressent principalement à la performance prédictive (c'est-à-dire la capacité de prévoir avec précision un comportement qui ne s'est pas encore produit)54. Dans le contexte de la persévérance scolaire, cela signifie : avec quelle précision peut-on prédire si un étudiant va terminer ou abandonner ses études (dans le futur) en analysant ses caractéristiques démographiques et socio-économiques, ses performances académiques passées et actuelles, ainsi que son intégration actuelle dans le système et la culture universitaires ?

Faisant écho à la déclaration de la National Academy of Education (2017) selon laquelle "dans le contexte éducatif, les mégadonnées prennent généralement la forme de données administratives et de données sur les processus d'apprentissage, chacune offrant sa propre promesse pour la recherche en éducation" (p.4)58, la grande majorité des études existantes se sont concentrées sur la prédiction de la rétention des étudiants à partir de caractéristiques démographiques et socio-économiques ainsi que des antécédents scolaires et des performances actuelles des étudiants13,59,60,61,62,63,64,65,66. Dans une étude récente, Aulck et ses collègues ont formé un modèle sur les données administratives de plus de 66 000 étudiants de première année inscrits dans une université publique américaine (par exemple, la race, le sexe, le GPA du lycée, les résultats des examens d'entrée et les données sur les performances/relevés de notes au début de l'université) pour prédire s'ils se réinscriraient en deuxième année et finiraient par obtenir leur diplôme59. Plus précisément, ils ont utilisé une gamme de modèles d'apprentissage automatique linéaires et non linéaires (par exemple, régression logistique régularisée, k plus proche voisin, forêt aléatoire, machine à vecteurs de support et arbres à gradient boosté) pour prédire la rétention hors échantillon à l'aide d'une procédure standard de validation croisée. Leur modèle était capable de prédire les abandons avec une précision de 88 % et l'obtention du diplôme avec une précision de 81 % (où 50 % correspond au hasard).

Bien que l'ensemble des travaux existants fournisse des preuves solides du potentiel des modèles prédictifs pour identifier les étudiants à risque, ils sont basés sur des ensembles similaires de données macro (par exemple, données institutionnelles, performances académiques) ou de données micro (par exemple, données de flux de clics). Les données sur l'expérience quotidienne des étudiants et leur engagement avec les autres étudiants et l'université elle-même (niveau méso) sont presque entièrement absentes de cette recherche. Bien qu'un petit nombre d'études aient tenté de capturer une partie de cette expérience en déduisant les réseaux sociaux des transactions par carte à puce effectuées par les étudiants au même moment et au même endroit16 ou des mesures d'engagement avec un cours en ligne ouvert67, aucun des travaux existants n'a offert une vision plus holistique et complète de l'expérience quotidienne des étudiants. Une explication potentielle de cet écart est que les informations sur les interactions sociales des étudiants avec leurs camarades de classe ou leur engagement quotidien avec les services et événements universitaires sont difficiles à suivre. Alors que les universités ont souvent accès à des variables démographiques ou socio-économiques via leurs systèmes d'information sur les étudiants (SIS) et peuvent facilement suivre leurs performances académiques, la plupart des universités n'ont pas de moyen facile de capturer l'engagement plus profond des étudiants avec le système.

Dans cette recherche, nous nous associons à une société de logiciels éducatifs - READY Education - qui propose une plate-forme d'interaction virtuelle à guichet unique sous la forme d'une application pour smartphone pour faciliter la communication entre les étudiants, les professeurs et le personnel. Les étudiants reçoivent des informations et des annonces pertinentes, peuvent gérer leurs activités universitaires et interagir avec d'autres étudiants de différentes manières. Par exemple, l'application offre une expérience de médias sociaux comme Facebook, y compris la messagerie privée, les groupes, les murs publics et les amitiés. En outre, il capture l'engagement des étudiants avec l'université en leur demandant de vérifier les événements (par exemple, l'orientation, les événements sur le campus et les services aux étudiants) en utilisant la fonctionnalité de code QR et en les invitant à évaluer leur expérience par la suite (voir Méthodes pour plus de détails sur les fonctionnalités que nous avons extraites de ces données). En conséquence, l'application READY Education nous permet d'observer un ensemble complet d'informations sur les étudiants qui incluent à la fois (i) des données institutionnelles (c'est-à-dire des caractéristiques démographiques et socio-économiques ainsi que des performances académiques) et (ii) leur expérience idiosyncratique à l'université capturée par leurs interactions quotidiennes avec d'autres étudiants et les services/événements universitaires. La combinaison des deux sources de données saisit le profil d'un étudiant de manière plus globale et permet de tenir compte des interactions potentielles entre les ensembles de variables. Par exemple, être étroitement intégré dans un réseau de soutien social composé d'amis pourrait être plus important pour la rétention des élèves de première génération qui pourraient ne pas recevoir le même niveau de soutien scolaire ou apprendre les normes et règles académiques implicites de leurs parents.

En nous appuyant sur cet ensemble de données unique, nous utilisons des modèles d'apprentissage automatique pour prédire la rétention des étudiants (c'est-à-dire l'abandon) à partir de données d'engagement institutionnelles et comportementales. Étant donné le désir d'identifier les étudiants à risque le plus tôt possible, nous n'utilisons que les informations recueillies au cours du premier semestre des étudiants pour prédire si l'étudiant a abandonné à un moment quelconque de son programme. Pour valider et examiner minutieusement notre approche analytique, générer des informations pour des interventions potentielles et sonder la généralisabilité de nos modèles prédictifs dans différentes universités, nous étudions les trois questions de recherche suivantes :

Avec quelle précision pouvons-nous prédire la probabilité qu'un étudiant abandonne ses études en utilisant les informations du premier trimestre de ses études (c'est-à-dire les données institutionnelles, les données d'engagement comportemental et une combinaison des deux) ?

Quelles caractéristiques sont les plus prédictives de la persévérance scolaire ?

Dans quelle mesure les modèles prédictifs se généralisent-ils à travers les universités (c'est-à-dire, dans quelle mesure pouvons-nous prédire la rétention des étudiants d'une université si nous utilisons le modèle formé sur les données d'une autre université et vice versa) ?

Nous analysons les données anonymisées de quatre établissements avec un total de 50 095 étudiants (min = 476, max = 45 062). Tous les étudiants ont donné leur consentement éclairé à l'utilisation des données anonymisées par READY Education et ses partenaires de recherche. Tous les protocoles expérimentaux ont été approuvés par le comité d'éthique de l'Université de Columbia, et toutes les méthodes mises en œuvre étaient conformes aux directives et règlements du comité. Les données proviennent de deux sources : (a) les données institutionnelles et (b) les données d'engagement comportemental. Les données institutionnelles recueillies par les universités contiennent des données sociodémographiques (par exemple, le sexe, l'origine ethnique), des informations générales sur les études (par exemple, la durée d'admission, le programme d'études), des informations financières (par exemple, l'éligibilité au pell), les résultats scolaires des étudiants (par exemple, GPA, ACT) ainsi que le statut de rétention. Ce dernier indique si les étudiants ont poursuivi ou abandonné leurs études et sert de variable de résultat. Étant donné que différentes universités recueillent des informations différentes sur leurs étudiants, la portée des données institutionnelles variait d'une université à l'autre. Le tableau 1 présente un aperçu descriptif des caractéristiques sociodémographiques les plus importantes pour chacune des quatre universités. En outre, il fournit un aperçu descriptif de l'utilisation de l'application, y compris le nombre moyen de journaux par étudiant, le nombre total de sessions et de journaux, ainsi que le pourcentage d'étudiants d'une cohorte utilisant l'application (c'est-à-dire la couverture). La large couverture des étudiants utilisant l'application, comprise entre 70 et 98 %, se traduit par un échantillon largement représentatif des populations étudiantes dans les universités respectives.

Notamment, les universités 1 à 3 sont des campus universitaires traditionnels, tandis que l'université 4 est une combinaison de 16 collèges communautaires différents. Étant donné qu'il existe une hétérogénéité considérable entre les campus, les précisions prédictives pour l'Université 4 devraient a priori être inférieures à celles observées pour les universités 1 à 3 (et témoignent déjà en partie de la généralisabilité des résultats). La décision d'inclure l'Université 4 en tant qu'entité unique était basée sur le fait que la séparation des 16 collèges aurait entraîné une surreprésentation des collèges communautaires qui partagent tous des caractéristiques similaires, gonflant ainsi artificiellement les précisions interuniversitaires observées. Compte tenu de ces limites (et du fait que l'Université elle-même a effondré les campus universitaires pour bon nombre de leurs rapports internes), nous avons décidé de l'analyser comme une seule unité, reconnaissant que cette approche comporte ses propres limites.

Les données d'engagement comportemental ont été générées via l'application (voir le tableau 1 pour les fenêtres de collecte de données spécifiques à chaque université). Les données d'engagement comportemental étaient disponibles sous la forme de journaux d'événements horodatés (c'est-à-dire que chaque ligne des données brutes représentait un événement enregistré tel qu'un onglet cliqué, un commentaire publié, un message envoyé). Chaque journal pourrait être attribué à un étudiant particulier via un identifiant unique et anonymisé. Dans les quatre universités, les données d'engagement contenaient 7 477 630 sessions (moyenne = 1 869 408, écart-type = 3 329 852) et 17 032 633 journaux (moyenne = 4 258 158, écart-type = 6 963 613) dans toutes les universités. Pour un aperçu complet de toutes les mesures d'engagement comportemental, y compris une description, voir le tableau S1 dans les documents supplémentaires.

Dans un premier temps, nous avons nettoyé à la fois les données institutionnelles et celles des applications. Pour les données institutionnelles, nous avons exclu les étudiants qui n'ont pas utilisé l'application et qui n'ont donc pas pu se voir attribuer un identifiant unique. De plus, nous avons exclu les étudiants sans terme d'admission pour garantir que nous n'observons que le premier semestre des étudiants. Enfin, nous avons supprimé les entrées en double résultant d'une double inscription dans différents programmes. Pour les données d'utilisation de l'application, nous avons inspecté visuellement les variables de notre ensemble de données à la recherche de valeurs aberrantes pouvant provenir de problèmes techniques. Nous avons prétraité les données qui reflétaient les clics sur l'application, nommées "clicked_[…]" et "viewed_[…]" (voir le tableau S1 dans les documents supplémentaires). Un petit nombre d'observations ont montré un nombre irréaliste de clics sur le même onglet sur une très courte période, ce qui est probablement le reflet d'un étudiant cliquant à plusieurs reprises sur un onglet en raison d'un long temps de chargement ou d'autres problèmes techniques. Pour éviter de suréchantillonner ces comportements, nous avons supprimé tous les clics du même type effectués par la même personne à moins d'une minute d'intervalle.

Nous avons extrait jusqu'à 462 caractéristiques pour chaque université dans deux grandes catégories : (i) les caractéristiques institutionnelles et (ii) les caractéristiques d'engagement, en utilisant les preuves de recherches antérieures comme point de référence (voir le tableau S2 dans les documents supplémentaires pour un aperçu complet de toutes les caractéristiques et leur disponibilité pour chacune des universités). Les caractéristiques institutionnelles contiennent des informations démographiques, socio-économiques et académiques sur les étudiants. Les caractéristiques d'engagement représentent le comportement des étudiants au cours de leur premier trimestre d'études. Ils peuvent être divisés en engagement d'application et engagement de communauté. Les fonctionnalités d'engagement de l'application représentent le comportement des étudiants par rapport à l'utilisation de l'application, par exemple si les étudiants ont utilisé l'application avant le début du semestre, la fréquence à laquelle ils ont cliqué sur les notifications ou les onglets de la communauté, ou si leur utilisation de l'application a augmenté au cours du semestre. Les caractéristiques d'implication communautaire reflètent le comportement social et l'interaction avec les autres, par exemple, le nombre de messages envoyés, de publications et de commentaires, d'événements visités ou la position d'un étudiant dans le réseau telle qu'elle est déduite des amitiés et des messages directs. Il est important de noter que de nombreuses caractéristiques de notre ensemble de données seront intercorrélées. Par exemple, vivre dans un logement universitaire pourrait signaler des niveaux de statut socio-économique plus élevés, mais aussi rendre plus probable que les étudiants assistent à des événements sur le campus et se connectent avec d'autres étudiants vivant sur le campus. Bien que les intercorrélations entre les prédicteurs constituent un défi avec les techniques statistiques inférentielles standard telles que les analyses de régression, les méthodes que nous appliquons dans cet article peuvent tenir compte d'un grand nombre de prédicteurs corrélés.

Les caractéristiques institutionnelles ont été directement dérivées des données enregistrées par les institutions. Comme indiqué ci-dessus, toutes les fonctionnalités n'étaient pas disponibles pour toutes les universités, ce qui a entraîné des ensembles de fonctionnalités légèrement différents d'une université à l'autre. Les fonctionnalités d'engagement ont été extraites des données d'utilisation de l'application. Comme nous nous sommes concentrés sur une prédiction précoce du décrochage, nous avons limité les données aux journaux d'événements qui ont été enregistrés au cours du premier trimestre des étudiants respectifs. Notamment, les données capturent l'engagement des étudiants sous la forme d'une série d'événements horodatés, offrant un aperçu précis de leur expérience quotidienne. Pour des raisons de simplicité et d'interprétabilité (voir la question de recherche 2), nous avons regroupé les données en une seule entrée pour chaque élève. Plus précisément, nous décrivons l'expérience globale d'un étudiant au cours du premier semestre, en calculant des mesures de distribution pour chaque étudiant telles que la moyenne arithmétique, l'écart type, l'aplatissement, l'asymétrie et les valeurs de somme. Par exemple, nous calculons le nombre de messages quotidiens qu'un étudiant en particulier a envoyés ou reçus au cours de son premier semestre, ou le nombre total d'événements sur le campus auxquels il a participé. Cependant, nous tenons également compte des changements dans le comportement d'un élève au fil du temps en calculant des caractéristiques plus complexes telles que l'entropie (par exemple, la mesure dans laquelle une personne a des contacts fréquents avec peu de personnes ou le même degré de contact avec de nombreuses personnes) et le développement de comportements spécifiques au fil du temps mesuré par la pente des analyses de régression, ainsi que des caractéristiques représentant la régularité du comportement (par exemple, l'écart de temps entre l'envoi de messages). Dans l'ensemble, l'ensemble de fonctionnalités visait à décrire l'engagement global d'un étudiant avec les ressources du campus et les autres étudiants au cours du premier semestre, ainsi que l'évolution de l'engagement au fil du temps. Enfin, nous avons extrait certaines des caractéristiques séparément pour les jours de semaine et les week-ends afin de tenir compte des différences et des similitudes dans les activités des étudiants pendant la semaine et le week-end. Par exemple, peu d'interaction sociale en semaine pourrait prédire la rétention différemment que peu d'interaction sociale le week-end.

Nous avons ensuite nettoyé les données en supprimant les participants pour lesquels le statut de rétention était manquant et ceux pour lesquels 95 % ou plus des valeurs étaient nulles ou manquantes. De plus, les caractéristiques ont été supprimées si elles montraient peu ou pas de variance entre les participants, ce qui les rend essentiellement dénuées de sens dans une tâche de prédiction. Plus précisément, nous avons exclu les caractéristiques numériques qui montraient les mêmes valeurs pour plus de 90 % des observations et les caractéristiques catégorielles qui montraient la même valeur pour toutes les observations.

En plus de ces procédures générales de prétraitement, nous avons intégré des étapes de prétraitement supplémentaires dans le rééchantillonnage avant de former les modèles pour éviter une surestimation des performances du modèle68. Pour éviter les problèmes liés aux caractéristiques catégorielles qui se produisent lorsqu'il y a moins de niveaux dans le test que dans les données d'apprentissage, nous avons d'abord supprimé les catégories qui n'apparaissaient pas dans les données d'apprentissage. Deuxièmement, nous avons supprimé les caractéristiques catégorielles constantes contenant une seule valeur (et donc aucune variation). Troisièmement, nous avons imputé les valeurs manquantes en utilisant les procédures suivantes : Les caractéristiques catégorielles ont été imputées avec le mode. Suivant les approches couramment utilisées pour traiter les données manquantes, l'imputation des caractéristiques numériques variait d'un apprenant à l'autre. Pour le filet élastique, nous avons imputé ces caractéristiques avec la médiane. Pour la forêt aléatoire, nous avons utilisé deux fois le maximum pour donner aux valeurs manquantes une signification distincte qui permettrait au modèle de tirer parti de ces informations. Enfin, nous avons utilisé la "Synthetic Minority Oversampling Technique" (SMOTE) pour créer des exemples artificiels pour la classe minoritaire dans les données d'apprentissage69. La seule exception était l'Université 4 qui a suivi une procédure différente en raison de la grande taille de l'échantillon et de la puissance de calcul estimée pour la mise en œuvre de SMOTE. Au lieu de suréchantillonner les cas minoritaires, nous avons sous-échantillonné les cas majoritaires de sorte que les classes positives et négatives soient équilibrées. Cela a été fait pour remédier au déséquilibre de classe causé par le fait que la plupart des étudiants poursuivent leurs études plutôt que d'abandonner12.

Nous avons prédit le statut de rétention (1 = abandonné, 0 = continué) dans une tâche de prédiction binaire, avec trois ensembles de caractéristiques : (1) caractéristiques institutionnelles (2) caractéristiques d'engagement et (3) un ensemble combiné de toutes les caractéristiques. Pour garantir la robustesse de nos prédictions et identifier le modèle le mieux adapté au contexte de prédiction actuel54, nous avons comparé un classifieur linéaire (filet élastique ; implémenté dans glmnet 4.1–4)70,71 et un classifieur non linéaire (forêt aléatoire ; implémenté dans randomForest 4.7–1)72,73. Les deux modèles sont particulièrement bien adaptés à notre contexte de prédiction et sont des choix courants en sciences sociales computationnelles. Autrement dit, les modèles de régression linéaire ou logistique simples ne conviennent pas pour travailler avec des ensembles de données qui ont de nombreux prédicteurs intercorrélés (dans notre cas, un total de 462 prédicteurs dont beaucoup sont fortement corrélés) en raison d'un risque élevé de surajustement. Le filet élastique et l'algorithme de forêt aléatoire peuvent utiliser efficacement de grands ensembles de fonctionnalités tout en réduisant le risque de surajustement. Nous évaluons les performances de nos six modèles pour chaque école (2 algorithmes et 3 ensembles de fonctionnalités), en utilisant des expériences de référence hors échantillon qui estiment les performances prédictives et les comparent à un modèle de référence commun non informatif. La ligne de base représente un modèle nul qui n'inclut aucune caractéristique, mais prédit toujours la classe majoritaire, ce qui dans nos échantillons signifie « continu ».74 Ci-dessous, nous fournissons plus de détails sur les algorithmes spécifiques (c'est-à-dire, filet élastique et forêt aléatoire), la procédure de validation croisée et les mesures de performance que nous avons utilisées pour l'évaluation du modèle.

Le filet élastique est une approche de régression régularisée qui combine les avantages de la régression de crête75 avec ceux du LASSO76 et est motivée par la nécessité de gérer de grands ensembles de fonctionnalités. Le filet élastique réduit les coefficients bêta des caractéristiques qui ajoutent peu de valeur prédictive (par exemple, intercorrélées, peu de variance). De plus, le filet élastique peut supprimer efficacement des variables du modèle en réduisant les coefficients bêta respectifs à zéro70. Contrairement aux modèles de régression classiques, le filet élastique ne vise pas à optimiser la somme des moindres carrés, mais comprend deux termes de pénalité (L1, L2) qui incitent le modèle à réduire la valeur bêta estimée des caractéristiques qui n'ajoutent pas d'informations au modèle. En combinant les pénalités L1 (la somme des valeurs absolues des coefficients) et L2 (la somme des valeurs au carré des coefficients), le filet élastique résout les limites des modèles linéaires alternatifs tels que la régression LASSO (incapable de gérer la multi-colinéarité) et la régression Ridge (peut ne pas produire des solutions suffisamment clairsemées)70.

Formellement, suivant Hastie & Qian (2016), l'équation modèle du filet élastique pour les problèmes de classification binaire peut être écrite comme suit77. Supposons que la variable de réponse prend des valeurs dans G = {0,1}, yi noté I(gi = 1), la formule du modèle s'écrit

Après avoir appliqué la transformation log-odds, la formule modèle peut être écrite comme

La fonction objectif de la régression logistique est la log-vraisemblance binomiale négative pénalisée

où λ est le paramètre de régularisation qui contrôle la force globale de la régularisation, α est le paramètre de mélange qui contrôle l'équilibre entre la régularisation L1 et L2 avec des valeurs α plus proches de zéro pour aboutir à des modèles plus clairsemés (régression lasso α = 1, régression ridge α = 0). β représente les coefficients du modèle de régression, ||β||1 est la norme L1 des coefficients (la somme des valeurs absolues des coefficients), ||β||2 est la norme L2 des coefficients (la somme des valeurs au carré des coefficients).

L'approche de régression régularisée est particulièrement pertinente pour notre modèle car de nombreuses fonctionnalités d'engagement basées sur l'application sont fortement corrélées (par exemple, le nombre de clics est lié au nombre d'activités enregistrées dans l'application). De plus, nous avons préféré l'algorithme net élastique aux alternatives plus complexes, car les coefficients bêta régularisés peuvent être interprétés comme l'importance des caractéristiques, ce qui permet de mieux comprendre quels prédicteurs sont les plus informatifs sur le décrochage universitaire78,79.

Les modèles de forêts aléatoires sont une méthode d'apprentissage d'ensemble largement utilisée qui développe de nombreux arbres de décision ensachés et décorrélés pour arriver à une prédiction "collective" du résultat (c'est-à-dire le résultat qui est choisi par la plupart des arbres dans un problème de classification)72. Les arbres de décision individuels divisent récursivement l'espace des caractéristiques (règles pour distinguer les classes) dans le but de séparer les différentes classes du critère (abandonner vs rester dans notre cas). Pour une description détaillée de la façon dont les arbres de décision individuels fonctionnent et se traduisent en une forêt aléatoire, voir Pargent, Schoedel & Stachl80.

Contrairement au filet élastique, les modèles de forêts aléatoires peuvent tenir compte des associations non linéaires entre les caractéristiques et les critères et inclure automatiquement les interactions multidimensionnelles entre les caractéristiques. Chaque arbre de décision dans une forêt aléatoire prend en compte un sous-ensemble aléatoire de cas et de caractéristiques bootstrap, augmentant ainsi la variance des prédictions entre les arbres et la robustesse de la prédiction globale. Pour le découpage en chaque nœud de chaque arbre, un sous-ensemble aléatoire de caractéristiques (hyperparamètre mtry que nous optimisons dans nos modèles) est utilisé en tirant au hasard dans l'ensemble total. Pour chaque répartition, toutes les combinaisons de variables de répartition et de points de répartition sont comparées, le modèle choisissant les répartitions qui optimisent la séparation entre les classes72.

L'algorithme de forêt aléatoire peut être formellement décrit comme suit (texte tiré de Hastie et al., 2016, p. 588) :

Pour b = 1 à B :

Dessinez un échantillon bootstrap de taille N à partir des données d'apprentissage.

Développez un arbre de décision sur les données amorcées, en répétant de manière récursive les étapes suivantes pour chaque nœud terminal de l'arbre, jusqu'à ce que la taille de nœud minimale soit atteinte.

Sélectionnez m variables au hasard parmi les p variables.

Choisissez la meilleure variable/split-point parmi les m en fonction de la fonction de perte (dans notre cas, la diminution de Gini-impureté)

Divisez le nœud en deux nœuds filles.

Sortie de l'ensemble des arbres

De nouvelles prédictions peuvent ensuite être faites en générant une prédiction pour chaque arbre et en agrégeant les résultats à l'aide d'un vote majoritaire.

L'agrégation des prédictions à travers les arbres dans les forêts aléatoires améliore les performances de prédiction par rapport aux arbres de décision individuels, car elle peut bénéficier de la variance des arbres et la réduire considérablement pour arriver à une seule prédiction72,81.

Nous évaluons les performances de nos modèles prédictifs en utilisant une approche de validation hors échantillon. L'idée derrière la validation hors échantillon est d'augmenter la probabilité qu'un modèle prédise avec précision le décrochage des étudiants sur de nouvelles données (par exemple, les nouveaux étudiants) en utilisant différents ensembles de données lors de la formation et de l'évaluation du modèle. Une technique efficace et couramment utilisée pour la validation hors échantillon consiste à ajuster (cf. formation) et à évaluer (cf. tester) à plusieurs reprises des modèles sur des parties non chevauchantes des mêmes ensembles de données et à combiner les estimations individuelles sur plusieurs itérations. Cette procédure - connue sous le nom de validation croisée - peut également être utilisée pour l'optimisation du modèle (par exemple, réglage d'hyperparamètres, prétraitement, sélection de variables), en évaluant à plusieurs reprises différents paramètres pour des performances prédictives optimales. Lorsque les deux approches sont combinées, les étapes d'évaluation et d'optimisation doivent être effectuées de manière imbriquée pour assurer une séparation stricte des données d'entraînement et de test pour une estimation réaliste des performances hors échantillon. L'idée générale est d'émuler toutes les étapes de modélisation dans chaque pli du rééchantillonnage comme s'il s'agissait d'un modèle unique dans l'échantillon. Ici, nous utilisons la validation croisée imbriquée pour estimer les performances prédictives de nos modèles, optimiser les hyperparamètres du modèle et prétraiter les données. Nous illustrons la procédure dans la Fig. 1.

Procédure schématique de validation croisée pour les prédictions hors échantillon. La figure montre une validation croisée décuplée dans la boucle externe qui est utilisée pour estimer la performance globale du modèle en comparant les résultats prédits pour chaque élève dans l'ensemble de tests inédits avec leurs résultats réels. Dans chacune des 10 boucles externes, une validation croisée quintuple dans la boucle interne est utilisée pour affiner les hyperparamètres du modèle en évaluant différents paramètres du modèle.

La procédure de validation croisée fonctionne comme suit : supposons que nous ayons un ensemble de données avec 1 000 étudiants. Dans un premier temps, l'ensemble de données est divisé en dix sous-échantillons différents, chacun contenant les données de 100 étudiants. Au premier tour, neuf de ces sous-échantillons sont utilisés pour la formation (c.-à-d., ajustement du modèle pour estimer les paramètres, cases vertes). Cela signifie que les données des 900 premiers étudiants seront incluses dans la formation du modèle pour relier les différentes caractéristiques au résultat de rétention. Une fois la formation terminée, les performances du modèle peuvent être évaluées sur les données des 100 étudiants restants (c.-à-d. ensemble de données de test, boîtes bleues). Pour chaque élève, le résultat réel (retenu ou abandonné, chiffres gris et noirs) est comparé au résultat prévu (retenu ou abandonné, chiffres gris et noirs). Cette comparaison permet le calcul de diverses mesures de performance (voir la section « Mesures de performance » ci-dessous pour plus de détails). Contrairement à l'application des statistiques inférentielles traditionnelles, le processus d'évaluation dans les modèles prédictifs sépare les données utilisées pour former un modèle des données utilisées pour évaluer ces associations. Par conséquent, tout surajustement qui se produit au stade de la formation (par exemple, en utilisant les degrés de liberté du chercheur ou en raison des relations d'apprentissage du modèle qui sont uniques aux données de formation), nuit à la performance prédictive au stade du test. Pour augmenter encore la robustesse des résultats et tirer parti de l'ensemble des données, ce processus est répété pour les 10 sous-échantillons, de sorte que chaque sous-échantillon est utilisé neuf fois pour la formation et une fois pour les tests. Enfin, les estimations obtenues à partir de ces dix itérations sont agrégées pour arriver à une estimation croisée des performances du modèle. Cette procédure de validation croisée en dix volets est appelée "boucle externe".

En plus de la boucle extérieure, nos modèles contiennent également une "boucle intérieure". La boucle interne consiste en une procédure de validation croisée supplémentaire qui est utilisée pour identifier les paramètres d'hyperparamètres idéaux (voir la section "Réglage des hyperparamètres" ci-dessous). Autrement dit, dans chacune des dix itérations de la boucle externe, l'échantillon d'apprentissage est ensuite divisé en un ensemble d'apprentissage et de test pour identifier les meilleures constellations de paramètres avant l'évaluation du modèle dans la boucle externe. Nous avons utilisé une validation croisée quintuple dans la boucle interne. Tous les scripts d'analyses pour les étapes de pré-traitement et de modélisation sont disponibles sur OSF (https://osf.io/bhaqp/?view_only=629696d6b2854aa9834d5745425cdbbc).

Nous évaluons les performances du modèle sur la base de quatre métriques différentes. Notre principale mesure de performance du modèle est l'AUC (aire sous la courbe des caractéristiques de fonctionnement reçues). L'ASC est couramment utilisée pour évaluer les performances d'un modèle sur une ligne de base de 50 % de chance et peut varier entre 0 et 1. La métrique AUC capture l'aire sous la courbe des caractéristiques de fonctionnement du récepteur (ROC), qui trace le taux de vrais positifs (TPR ou rappel ; c'est-à-dire le pourcentage d'abandons correctement classés parmi tous les étudiants qui ont effectivement abandonné) par rapport au taux de faux positifs (FPR ; c'est-à-dire le pourcentage d'étudiants classés par erreur comme décrocheurs parmi tous les étudiants qui ont effectivement continué). Lorsque l'AUC est de 0,5, la performance prédictive du modèle est égale au hasard ou à un pile ou face. Plus la valeur est proche de 1, plus la performance prédictive du modèle est élevée pour distinguer les étudiants qui ont continué de ceux qui ont abandonné.

De plus, nous rapportons le score F1, qui varie entre 0 et 182. Le score F1 est basé sur la valeur prédictive positive du modèle (ou précision, c'est-à-dire le pourcentage de décrocheurs correctement classés parmi tous les élèves prédits comme ayant décroché) ainsi que sur le TPR du modèle. Un score F1 élevé indique donc qu'il y a à la fois peu de faux positifs et peu de faux négatifs.

Compte tenu du contexte spécifique, nous rapportons également le TPR et les taux de vrais négatifs (TNR, c'est-à-dire le pourcentage d'étudiants prévus pour continuer parmi tous les étudiants qui ont effectivement continué). En fonction de leur objectif, les universités pourraient mettre davantage l'accent sur l'optimisation du TPR pour s'assurer qu'aucun étudiant risquant de décrocher ne soit oublié ou sur l'optimisation du TNR pour économiser les ressources et s'assurer que les étudiants ne soient pas trop surchargés. Notamment, dans la plupart des cas, les universités sont susceptibles de rechercher un équilibre entre les deux, ce qui se reflète dans notre principale mesure de l'AUC. Toutes les mesures de performance rapportées représentent la performance prédictive moyenne sur les 10 plis de validation croisée de la boucle externe54.

Nous avons utilisé une recherche aléatoire avec 50 itérations et une validation croisée quintuple pour le réglage des hyperparamètres dans la boucle interne de notre validation croisée. L'algorithme de recherche aléatoire adapte des modèles avec des configurations d'hyperparamètres sélectionnées au hasard dans un espace d'hyperparamètres préalablement défini, puis sélectionne le modèle qui affiche la meilleure performance généralisée moyenne sur les cinq plis de validation croisée. La meilleure configuration d'hyperparamètres est utilisée pour la formation dans la boucle de rééchantillonnage externe afin d'évaluer les performances du modèle.

Pour le classificateur net élastique, nous avons réglé le paramètre de régularisation lambda, la règle de décision utilisée pour choisir lambda et le paramètre L1-ratio. L'espace de recherche pour lambda englobait les 100 valeurs par défaut de glmnet71. L'espace des règles de décision pour lambda comprenait lambda.min qui choisit la valeur de lambda qui entraîne l'erreur de validation croisée moyenne minimale, et lambda.1se qui choisit la valeur de lambda qui entraîne le modèle le plus régularisé de sorte que l'erreur de validation croisée reste à moins d'une erreur standard du minimum. L'espace de recherche pour le paramètre L1-ratio comprenait la plage de valeurs comprises entre 0 (crête) et 1 (lasso). Pour le classificateur de forêt aléatoire, nous avons réglé le nombre de caractéristiques sélectionnées pour chaque division dans un arbre de décision (mtry) et la taille minimale des nœuds (c'est-à-dire le nombre de cas devant rester dans les nœuds finaux résultants de l'arbre). L'espace de recherche pour le nombre de caractéristiques d'entrée par arbre de décision a été défini sur une plage de 1 à p, où p représente la dimensionnalité de l'espace des caractéristiques. L'espace de recherche pour la taille minimale des nœuds a été défini sur une plage de 1 à 5. De plus, pour les deux modèles, nous avons réglé le taux de suréchantillonnage et le nombre de voisins utilisés pour générer de nouveaux échantillons utilisés par l'algorithme SMOTE. Le taux de suréchantillonnage a été défini sur une plage de 2 à 15 et le nombre de voisins les plus proches a été défini sur une plage de 1 à 10.

La figure 2 affiche les scores AUC (axe Y) dans les différentes universités (lignes), séparés par les différents ensembles de fonctionnalités (couleurs) et algorithmes prédictifs (étiquettes de l'axe X). La figure affiche la distribution des précisions AUC sur les 10 plis de validation croisée, ainsi que leur moyenne et leur écart type. Des tests t indépendants utilisant des corrections de Holm pour des comparaisons multiples indiquent des différences statistiques dans la performance prédictive entre les différents modèles et ensembles de fonctionnalités au sein de chaque université. Le tableau 2 fournit les performances prédictives pour les quatre métriques.

Performances de l'AUC dans les quatre universités pour différents ensembles de fonctionnalités et modèles.

Dans l'ensemble, nos modèles ont montré des niveaux élevés de précision prédictive dans les universités, les modèles, les ensembles de fonctionnalités et les mesures de performance, dépassant de manière significative la référence dans tous les cas. La principale mesure de performance AUC a atteint une moyenne de 73 % (où 50 % est une chance), avec un maximum de 88 % pour le modèle de forêt aléatoire et l'ensemble complet de fonctionnalités de l'Université 1. Les caractéristiques institutionnelles et les caractéristiques d'engagement ont contribué de manière significative à la performance prédictive, soulignant le fait que la probabilité d'abandon d'un étudiant est à la fois fonction de ses caractéristiques sociodémographiques plus stables ainsi que de son expérience de la vie sur le campus. Dans la plupart des cas, le modèle conjoint (c'est-à-dire la combinaison des caractéristiques institutionnelles et d'engagement) a donné de meilleurs résultats que chacun des modèles individuels pris isolément. Enfin, les modèles de forêt aléatoire ont produit des niveaux de performance prédictive plus élevés que le filet élastique dans la plupart des cas (réseau élastique AUC moyen = 70 %, forêt aléatoire AUC = 75 %), ce qui suggère que les caractéristiques sont susceptibles d'interagir les unes avec les autres pour prédire la rétention des étudiants et pourraient ne pas toujours être linéairement liées au résultat.

Pour donner un aperçu des relations sous-jacentes entre la persévérance scolaire et les caractéristiques sociodémographiques et comportementales, nous avons examiné deux indicateurs d'importance des caractéristiques qui offrent tous deux des informations uniques. Premièrement, nous avons calculé les corrélations d'ordre zéro entre les caractéristiques et les résultats pour chacune des quatre universités. Nous avons choisi des corrélations d'ordre zéro plutôt que des coefficients nets élastiques car ils représentent les relations non modifiées par la procédure de régularisation du modèle (c'est-à-dire que la relation entre une caractéristique et le résultat est indiquée indépendamment de l'importance des autres caractéristiques dans le modèle). Pour améliorer la robustesse de nos résultats, nous n'avons inclus que les variables qui dépassaient le seuil d'inclusion des données dans nos modèles et dont moins de 50 % des données étaient imputées. Le tiers supérieur du tableau 3 affiche les 10 caractéristiques les plus importantes (c'est-à-dire la corrélation absolue la plus élevée avec la rétention). Le signe entre parenthèses indique la direction des effets avec ( +) indiquant un facteur de protection et (−) indiquant un facteur de risque. Les fonctionnalités figurant dans le top 10 pour plus d'une université sont mises en évidence en gras.

Deuxièmement, nous avons calculé les scores d'importance des variables de permutation pour les modèles de filet élastique et de forêt aléatoire. Pour le modèle de réseau élastique, l'importance des caractéristiques est indiquée comme le coefficient du modèle après réduction des coefficients en fonction de leur pouvoir prédictif incrémentiel. Par rapport à la corrélation d'ordre zéro, les coefficients nets élastiques identifient donc les caractéristiques qui ont la variance unique la plus forte. Pour les modèles de forêts aléatoires, l'importance des caractéristiques est signalée comme une métrique indépendante du modèle qui estime l'importance d'une caractéristique en observant la baisse des performances prédictives du modèle lorsque l'association réelle entre la caractéristique et le résultat est rompue par des observations aléatoires72,83. Une caractéristique est considérée comme importante si le brassage de ses valeurs augmente l'erreur du modèle (et donc diminue les performances prédictives du modèle). Contrairement aux coefficients du modèle de réseau élastique, les scores d'importance des caractéristiques de permutation ne sont pas orientés et ne fournissent pas d'informations sur la nature spécifique de la relation entre la caractéristique et le résultat. Cependant, ils tiennent compte du fait que certaines fonctionnalités peuvent ne pas être prédictives elles-mêmes, mais peuvent néanmoins s'avérer utiles dans les performances globales du modèle, car elles modèrent l'impact d'autres fonctionnalités. Par exemple, les étudiants issus de minorités ou de première génération pourraient bénéficier davantage d'être intégrés dans un réseau social solide que les étudiants de la majorité qui ne sont pas confrontés aux mêmes obstacles et sont susceptibles d'avoir un réseau de soutien externe plus solide. Le bas du tableau 3 affiche les 10 caractéristiques les plus importantes dans les modèles de filet élastique et de forêt aléatoire (c'est-à-dire l'importance de la variable de permutation la plus élevée).

À l'appui des résultats rapportés dans QR1, les corrélations d'ordre zéro confirment que les caractéristiques d'engagement institutionnel et comportemental jouent un rôle important dans la prédiction de la persévérance scolaire. Conformément aux travaux antérieurs, les performances des étudiants (mesurées par GPA ou ACT) sont apparues à plusieurs reprises comme l'un des prédicteurs les plus importants dans les universités et les modèles. De plus, bon nombre des caractéristiques d'engagement (p. ex., services fréquentés, centralité du réseau de messages de clavardage) sont liées aux activités sociales ou aux caractéristiques du réseau, soutenant l'idée que les liens sociaux et le soutien d'un étudiant jouent un rôle essentiel dans la persévérance scolaire. De plus, la mesure dans laquelle les étudiants s'engagent positivement avec leurs établissements (par exemple, en assistant à des événements et en les évaluant très bien) semble jouer un rôle essentiel dans la prévention du décrochage.

Pour tester la généralisabilité de nos modèles à travers les universités, nous avons utilisé le modèle prédictif formé sur une université (par exemple, l'Université 1) pour prédire la rétention des trois universités restantes (par exemple, les universités 2 à 4). Les figures 3A,B affichent les AUC sur toutes les paires possibles, indiquant quelle université a été utilisée pour la formation (axe X) et laquelle a été utilisée pour les tests (axe Y, voir la figure S1 dans le SI pour les graphiques illustrant les résultats pour F1, TNR et TPR).

Performance (AUC moyenne) des prédictions interuniversitaires.

Dans l'ensemble, nous avons observé des niveaux raisonnablement élevés de performances prédictives lors de l'application d'un modèle formé sur une université aux données d'une autre. L'ASC moyenne observée était de 63 % (pour le filet élastique et la forêt aléatoire), la performance prédictive la plus élevée atteignant 74 % (formé sur l'Université 1, prédisant l'Université 2), à seulement 1 % de moins que la performance prédictive observée pour la prédiction du modèle propre à l'université (formé sur l'Université 2, prédisant l'Université 2). Contrairement aux résultats de QR1, les modèles de forêt aléatoire n'ont pas obtenu de meilleurs résultats que le filet élastique lors de la réalisation de prédictions pour d'autres universités. Cela suggère que les avantages offerts par les modèles de forêt aléatoire capturent des modèles d'interaction complexes qui sont quelque peu uniques à chaque université, mais qui pourraient ne pas bien se généraliser à de nouveaux contextes. La principale valeur aberrante en matière de généralisabilité était l'Université 4, où aucun des autres modèles n'a atteint des précisions bien meilleures que le hasard, et dont le modèle a produit des niveaux de précision relativement faibles lors de la prédiction de la rétention des étudiants dans les universités 1 à 2. Cela est probablement dû au fait que l'Université 4 était qualitativement différente des autres universités à plusieurs égards, notamment le fait que l'Université 4 était un collège communautaire et se composait de 16 campus différents qui ont été fusionnés aux fins de cette analyse (voir Méthodes pour plus de détails).

Nous montrons que la rétention des étudiants peut être prédite à partir des données institutionnelles, des données d'engagement comportemental et de leur combinaison. En utilisant les données de plus de 50 000 étudiants de quatre universités, nos modèles prédictifs atteignent des précisions hors échantillon allant jusqu'à 88 % (où 50 % est une chance). Notamment, alors que les données institutionnelles et les données d'engagement comportemental prédisent de manière significative la rétention, la combinaison des deux donne les meilleurs résultats dans la plupart des cas. Cette constatation est en outre étayée par nos analyses de l'importance des caractéristiques qui suggèrent que les caractéristiques d'engagement institutionnel et comportemental sont parmi les prédicteurs les plus importants de la persévérance scolaire. Plus précisément, il a été démontré que les performances académiques mesurées par GPA et les mesures comportementales associées à l'engagement sur le campus (par exemple, la fréquentation d'événements ou les notes) ou la position d'un étudiant dans le réseau (par exemple, la proximité ou la centralité) agissent comme des facteurs de protection. Enfin, nous soulignons la généralisabilité de nos modèles à travers les universités. Les modèles formés dans une université ont pu prédire la rétention des étudiants dans une autre avec des niveaux raisonnablement élevés de performance prédictive. Comme on pouvait s'y attendre, la généralisabilité entre les universités dépend fortement de la mesure dans laquelle les universités sont similaires sur des dimensions structurelles importantes, la précision des prédictions chutant radicalement dans les cas où la similitude est faible (voir faible généralisation croisée pour l'Université 4).

Nos résultats contribuent à la littérature existante de plusieurs façons. Premièrement, ils répondent aux appels récents pour plus de recherche prédictive en psychologie54,55 ainsi qu'à l'utilisation de l'analyse des mégadonnées dans la recherche en éducation56,57. Non seulement nos modèles tiennent compte des caractéristiques sociodémographiques recueillies par les universités, mais ils capturent également l'expérience quotidienne des étudiants et l'engagement universitaire en suivant les comportements via l'application READY Education. Nos résultats suggèrent que ces prédicteurs plus psychologiques de la persévérance scolaire peuvent améliorer les performances des modèles prédictifs au-delà des variables sociodémographiques. Ceci est cohérent avec les résultats précédents suggérant que l'inclusion de mesures d'engagement améliore les performances des modèles prédictifs16,84,85. Dans l'ensemble, nos modèles ont montré des précisions supérieures aux modèles d'études antérieures qui ont été formés uniquement sur les données démographiques et les relevés de notes15,25 ou des caractéristiques comportementales moins complètes16 et ont fourni des résultats comparables à ceux rapportés dans les études qui comprenaient en outre un large éventail de variables socio-économiques12. Étant donné que l'application READY Education ne capture qu'une fraction de l'expérience réelle des étudiants, les précisions prédictives élevées plaident encore plus en faveur de l'importance de l'engagement des étudiants dans la persévérance scolaire.

Deuxièmement, nos résultats donnent un aperçu des caractéristiques les plus importantes pour prédire si un élève va décrocher ou non. Ce faisant, ils complètent notre approche prédictive avec des couches de compréhension qui permettent non seulement de valider nos modèles, mais également de générer des informations sur les facteurs de protection et de risque potentiels. Plus important encore, nos résultats mettent en évidence la pertinence des mesures d'engagement comportemental pour prédire la rétention des étudiants. La plupart des fonctionnalités identifiées comme étant importantes dans la prédiction étaient liées à l'application et à l'engagement de la communauté. Conformément aux recherches antérieures, les caractéristiques indiquant une intégration sociale précoce et profonde, telles que les interactions avec les pairs et les professeurs ou le développement d'amitiés et de réseaux sociaux, se sont avérées hautement prédictives16,41. Par exemple, il est raisonnable de supposer qu'un court laps de temps entre l'inscription à l'application et la première visite à un événement sur le campus (l'une des caractéristiques identifiées comme importantes) a un impact positif sur la rétention, car les événements sur le campus offrent aux étudiants des occasions idéales de socialiser86. La participation précoce à un événement sur le campus implique une intégration précoce et un réseautage avec les autres, protégeant les étudiants du stress perçu87 et offrant un meilleur soutien social et émotionnel88. En revanche, un étudiant qui n'assiste jamais à un événement ou qui le fait très tard dans le semestre peut être moins connecté à la vie du campus et à la communauté étudiante, ce qui augmente la probabilité de décrocher. Cette interprétation est renforcée par le fait qu'une proportion élevée d'évaluations positives d'événements a été identifiée comme un prédicteur important de la poursuite des études par un étudiant. Les étudiants qui apprécient un événement sont susceptibles de se sentir plus à l'aise, de s'intégrer à la vie universitaire, d'établir plus de liens et de nouer des liens plus solides. Cela pourrait entraîner un cercle vertueux dans lequel les étudiants continuent d'assister à des événements et, au fil du temps, créent un lien social fort avec leurs pairs. Comme dans la plupart des travaux antérieurs, un score GPA élevé était systématiquement lié à une probabilité plus élevée de poursuivre ses études21,24. Bien que leur importance variait d'une université à l'autre, l'ethnicité jouait également un rôle majeur dans la rétention, avec des inégalités constantes se reproduisant dans nos modèles prédictifs12,19,47. Par exemple, les étudiants noirs étaient en moyenne plus susceptibles de décrocher, ce qui suggère que les universités devraient consacrer des ressources supplémentaires pour protéger ce groupe. Il est important de noter que toutes les interprétations qualitatives sont post-hoc. Bien que bon nombre des résultats soient intuitifs et conformes aux recherches antérieures sur le sujet, les études futures devraient valider nos résultats et étudier la causalité sous-jacente aux effets dans les conceptions intra-individuelles expérimentales ou longitudinales54,78.

Enfin, nos résultats sont les premiers à explorer la mesure dans laquelle les relations entre certaines caractéristiques sociodémographiques et comportementales pourraient être idiosyncratiques et uniques à une université spécifique. En étant en mesure de comparer les modèles de quatre universités différentes, nous avons pu montrer que bon nombre des connaissances acquises dans une université peuvent être exploitées pour prédire la rétention des étudiants dans une autre. Cependant, nos résultats indiquent également des conditions limites importantes : plus les universités sont dissemblables dans leurs structures organisationnelles et l'expérience des étudiants, plus les modèles entre certaines caractéristiques sociodémographiques et comportementales avec la rétention des étudiants seront idiosyncratiques et plus il est difficile de simplement traduire les idées générales sur le campus universitaire spécifique.

Nos résultats ont également des implications pratiques importantes. Aux États-Unis, l'attrition des étudiants entraîne une perte de revenus annuelle moyenne d'environ 16,5 milliards de dollars par an9,10 et plus de 9 milliards de dollars gaspillés en subventions et subventions fédérales et étatiques accordées aux étudiants qui ne terminent pas leur diplôme11. Par conséquent, il est essentiel de prévoir les abandons potentiels le plus tôt et le plus précisément possible pour pouvoir offrir un soutien dédié et allouer les ressources là où elles sont le plus nécessaires. Nos modèles reposent exclusivement sur des données recueillies au cours du premier semestre à l'université et constituent donc un système d'"alerte précoce" idéal pour les universités qui souhaitent prédire si leurs étudiants poursuivront probablement leurs études ou abandonneront à un moment donné. Selon les ressources et les objectifs de l'université, les modèles prédictifs peuvent être optimisés pour différentes mesures de performance. En effet, une université pourrait décider de se concentrer sur le taux de vrais positifs pour capter le plus de décrocheurs possible. Bien que cela reviendrait à classer à tort les étudiants « en bonne santé » comme des décrocheurs potentiels, les universités pourraient décider que le fardeau de fournir un soutien « inutile » à ces étudiants en bonne santé vaut le risque réduit de rater un décrocheur. Il est important de noter que nos modèles vont au-delà des simples variables sociodémographiques et permettent un modèle personnel plus nuancé qui considère non seulement "qui est quelqu'un", mais aussi à quoi ressemble son expérience sur le campus. Ainsi, nos modèles permettent de reconnaître l'individualité plutôt que d'utiliser des évaluations trop généralisées de segments sociodémographiques entiers.

Mais surtout, il est essentiel de soumettre ces modèles à une assurance qualité continue. Alors que les modèles prédictifs pourraient permettre aux universités de signaler tôt les étudiants à risque, ils pourraient également perpétuer des biais qui se calcifient dans les modèles prédictifs eux-mêmes. Par exemple, les étudiants qui sont traditionnellement moins susceptibles d'abandonner leurs études pourraient devoir passer un niveau beaucoup plus élevé de comportement d'engagement dysfonctionnel avant que leur dossier ne soit signalé comme « à risque ». De même, une personne appartenant à un groupe traditionnellement sous-représenté peut recevoir un volume inutilement élevé de vérifications supplémentaires, même si elle s'épanouit généralement dans son expérience quotidienne. Étant donné que le fait d'être étiqueté comme "à risque" peut être associé à une stigmatisation qui pourrait renforcer la stigmatisation autour des groupes historiquement marginalisés, il sera essentiel de surveiller à la fois la performance du modèle au fil du temps ainsi que la perception de son utilité parmi les administrateurs, les professeurs et les étudiants.

Notre étude présente plusieurs limites et met en évidence des pistes de recherche futures. Premièrement, notre échantillon se composait de quatre universités américaines. Ainsi, nos résultats ne sont pas nécessairement généralisables aux pays ayant des cultures plus collectivistes et à d'autres systèmes éducatifs tels que l'Asie, où les raisons de l'abandon peuvent être différentes89,90, ou l'Europe où la plupart des étudiants travaillent à temps partiel et vivent hors campus. Les recherches futures devraient étudier dans quelle mesure nos modèles peuvent être généralisés à d'autres contextes culturels et identifier les caractéristiques de la persévérance scolaire qui sont universellement valables dans tous les contextes.

Deuxièmement, nos modèles prédictifs s'appuyaient sur les données d'utilisation des applications. Par conséquent, notre approche prédictive n'a pu être appliquée qu'aux étudiants qui ont décidé d'utiliser l'application. Cette sélection, en soi, est susceptible d'introduire un biais d'échantillonnage, car les étudiants qui décident d'utiliser l'application pourraient être plus susceptibles de retenir en premier lieu, limitant la variance des observations et excluant les étudiants pour lesquels les données d'utilisation de l'application n'étaient pas disponibles. Cependant, comme le suggèrent nos résultats, les données institutionnelles fournissent à elles seules des performances prédictives indépendantes des fonctionnalités de l'application, ce qui en fait une alternative viable pour les étudiants qui n'utilisent pas l'application.

Troisièmement, nos modèles prédictifs reposent sur des prédictions transversales. Autrement dit, nous observons le comportement d'un étudiant au cours d'un semestre entier et, sur la base des tendances observées chez d'autres étudiants, nous prédisons si cet étudiant est susceptible d'abandonner ou non. Des recherches futures pourraient tenter d'améliorer à la fois les performances prédictives du modèle et son utilité pour des contextes appliqués en modélisant dynamiquement les tendances intra-individuelles. Avec suffisamment de données, le modèle pourrait observer le comportement de base d'une personne et identifier les changements par rapport à cette ligne de base comme potentiellement problématiques. En fait, plus de contacts sociaux avec d'autres étudiants pourraient être considérés comme un facteur de protection dans notre modèle transversal. Cependant, il existe des différences individuelles substantielles dans la quantité de contacts sociaux que les individus recherchent et apprécient91. Par conséquent, envoyer 10 messages de chat par semaine peut être considéré comme beaucoup pour une personne, mais très peu pour une autre. Les recherches futures devraient donc déterminer si les caractéristiques d'engagement comportemental permettent un modèle intra-personnel plus dynamique qui permet de prendre en compte les taux de base et de fournir une évaluation dynamique et momentanée de la probabilité qu'un élève décroche.

Quatrièmement, bien que les données sur l'engagement aient été saisies sous la forme d'une série chronologique longitudinale avec des événements horodatés, nous avons regroupé les données en un seul ensemble de caractéristiques transversales pour chaque élève. Bien que certaines de ces caractéristiques capturent la variation des comportements au fil du temps (par exemple, l'entropie et les tendances linéaires), les recherches futures devraient essayer de mettre en œuvre des modèles d'apprentissage automatique plus avancés pour tenir compte directement de ces données de séries chronologiques. Par exemple, les modèles de mémoire longue à court terme (LSTM)92 – un type de réseau neuronal récurrent – ​​sont capables d'apprendre des modèles dans des données séquentielles longitudinales comme les nôtres.

Cinquièmement, même si la recherche actuelle fournit un premier aperçu du fonctionnement des modèles en soulignant l'importance de certaines caractéristiques, les conclusions qui peuvent être tirées de ces analyses sont limitées car les mesures d'importance sont calculées pour l'ensemble de la population. Les recherches futures pourraient viser à calculer l'importance de certaines caractéristiques au niveau individuel pour tester si leur importance varie selon certaines caractéristiques sociodémographiques. Estimer l'importance de la position d'une personne dans le réseau social au niveau individuel, par exemple, permettrait de voir si cette importance est corrélée à des données institutionnelles telles que le statut minoritaire ou de première génération.

Enfin, nos résultats jettent les bases du développement d'interventions qui favorisent la rétention en façonnant l'expérience des étudiants à l'université93. Les interventions dont il a été démontré qu'elles ont un effet positif sur la rétention comprennent les programmes d'orientation et le conseil académique94, les services de soutien aux étudiants comme le mentorat et le coaching ainsi que les bourses en fonction des besoins95. Cependant, à ce jour, les programmes d'expérience de première année destinés à renforcer l'intégration sociale des étudiants de première année ne semblent pas avoir donné de résultats positifs96,97. Nos résultats pourraient soutenir le développement d'interventions visant à améliorer et à maintenir l'intégration des étudiants sur le campus. À un niveau élevé, les aperçus des caractéristiques les plus importantes fournissent une voie empirique pour développer des interventions pertinentes qui ciblent les leviers les plus importants de la persévérance scolaire. Par exemple, le fait que le temps entre l'inscription et la première participation à un événement ait un impact aussi important sur la rétention des étudiants signifie que les universités devraient faire tout leur possible pour que les étudiants assistent aux événements le plus tôt possible. De même, ils pourraient développer des interventions qui conduisent à des réseaux plus cohérents entre les cohortes et s'assurer que tous les étudiants se connectent à leur communauté. À un niveau plus profond et plus sophistiqué, de nouvelles approches de l'explicabilité des modèles pourraient permettre aux universités d'adapter leur intervention à chaque étudiant98,99. Par exemple, l'IA explicable permet de dériver des règles de décision pour chaque élève, indiquant quelles caractéristiques étaient essentielles pour prédire le résultat des élèves. Alors que l'on peut prédire que l'élève A abandonnera parce qu'il est déconnecté du réseau, on peut prédire que l'élève B abandonnera parce qu'il n'accède pas aux bonnes informations sur l'application. Compte tenu de ces informations, les universités seraient en mesure de personnaliser leurs offres en fonction des besoins spécifiques de l'étudiant. Alors que l'étudiant A peut être encouragé à passer plus de temps à socialiser avec d'autres étudiants, l'étudiant B peut être invité à consulter des informations importantes sur le cours. Par conséquent, les modèles prédictifs pourraient non seulement être utilisés pour identifier les étudiants à risque, mais également fournir un chemin automatisé pour offrir des conseils et un soutien personnalisés.

Pour chaque étude interrompue, un rêve éducatif se brise. Et chaque rêve brisé a un impact négatif à long terme à la fois sur l'étudiant et sur l'université qu'il a fréquentée. Dans cette étude, nous introduisons une approche pour prédire avec précision la persévérance scolaire après le premier trimestre. Nos résultats montrent que la rétention des étudiants peut être prédite avec des niveaux relativement élevés de performance prédictive lorsque l'on considère les données institutionnelles, les données d'engagement comportemental ou une combinaison des deux. En combinant des caractéristiques sociodémographiques avec des traces comportementales observées passivement reflétant les activités quotidiennes d'un étudiant, nos modèles offrent une image holistique des expériences universitaires des étudiants et de sa relation avec la rétention. Dans l'ensemble, ces modèles prédictifs ont un grand potentiel à la fois pour l'identification précoce des élèves à risque et pour permettre des interventions opportunes et fondées sur des preuves.

Les données brutes ne sont pas accessibles au public en raison de leur nature exclusive et des risques associés à la désanonymisation, mais elles sont disponibles auprès de l'auteur correspondant sur demande raisonnable. Les données prétraitées et tous les codes d'analyses sont disponibles sur OSF (https://osf.io/bhaqp/?view_only=629696d6b2854aa9834d5745425cdbbc) pour faciliter la reproductibilité de notre travail. Les données ont été analysées à l'aide de R, version 4.0.0 (R Core Team, 2020 ; voir les sous-sections pour les packages et versions spécifiques utilisés). La conception de l'étude repose sur des données secondaires et les analyses n'ont pas été préenregistrées.

Ginder, SA, Kelly-Reid, JE & Mann, FB Taux de diplomation pour les cohortes sélectionnées, 2009–14 ; Mesures des résultats pour l'année de cohorte 2009-2010 ; Aide financière aux étudiants, année universitaire 2016-2017 ; et Admissions dans les établissements postsecondaires, automne 2017. Premier coup d'œil (données provisoires). NCES 2018–151. Centre national des statistiques de l'éducation (2018).

Snyder, TD, de Brey, C. & Dillow, SA Digest of Education Statistics 2017 NCES 2018-070. Natl. Cent. Éduc. Statistique (2019).

Centre de recherche du NSC. Persistance et rétention - 2019. Centre de recherche NSC https://nscresearchcenter.org/snapshotreport35-first-year-persistence-and-retention/ (2019).

Bound, J., Lovenheim, MF et Turner, S. Pourquoi les taux d'achèvement des études supérieures ont-ils diminué ? Une analyse de l'évolution de la préparation des étudiants et des ressources collégiales. Suis. Écon. J. Appl. Écon. 2, 129-157 (2010).

Article PubMed PubMed Central Google Scholar

Bowen, WG, Chingos, MM & McPherson, MS Traverser la ligne d'arrivée. dans Franchir la ligne d'arrivée (Princeton University Press, 2009).

McFarland, J. et al. La condition de l'éducation 2019. NCES 2019-144. Natl. Cent. Éduc. Statistique (2019).

Éducation, USD de. Fiche d'information : Axer l'enseignement supérieur sur la réussite des étudiants. [Fiche d'information] (2015).

Freudenberg, N. & Ruglis, J. Examen par les pairs : Recadrer le décrochage scolaire en tant que problème de santé publique. Préc. Dis chronique. 4, 4 (2007).

Google Scholar

Raisman, N. Le coût de l'attrition des collèges dans les collèges et universités de quatre ans - une analyse de 1669 établissements américains. Perspective politique. (2013).

Wellman, J., Johnson, N. et Steele, P. Mesurer (et gérer) les coûts invisibles de l'attrition postsecondaire. Note politique. Projection des coûts delta Suis. Instit. Rés. (2012).

Schneider, M. Finir le premier tour : Le coût de l'attrition des étudiants de première année dans les collèges et universités américains de quatre ans (American Institutes for Research, 2010).

Google Scholar

Delen, D. Une analyse comparative des techniques d'apprentissage automatique pour la gestion de la rétention des étudiants. Décis. Système de soutien. 49, 498-506 (2010).

Article Google Scholar

Yu, R., Lee, H. & Kizilcec, RF Les modèles de prédiction du décrochage universitaire devraient-ils inclure des attributs protégés ? dans Actes de la huitième conférence ACM sur l'apprentissage @ Scale 91–100 (2021).

Tinto, V. Reconstitution de la première année de collège. Plan. Haut. Éduc. 25, 1–6 (1996).

Google Scholar

Ortiz-Lozano, JM, Rua-Vieites, A., Bilbao-Calabuig, P. & Casadesús-Fa, M. Rétention des étudiants universitaires : meilleur moment et données pour identifier les étudiants de premier cycle à risque de décrochage. Innov. Éduc. Enseigner. Int. 57, 74-85 (2020).

Google Scholar

Ram, S., Wang, Y., Currim, F. et Currim, S. Utilisation de mégadonnées pour prédire la rétention des étudiants de première année. en 2015 conférence internationale sur les systèmes d'information : Exploring the information frontier, ICIS 2015 (Association for Information Systems, 2015).

Levitz, RS, Noel, L. & Richter, BJ Mouvements stratégiques pour le succès de la rétention. N. Dir. Haut. Éduc. 1999, 31–49 (1999).

Article Google Scholar

Veenstra, CP Une stratégie pour améliorer la rétention des étudiants de première année à l'université. J.Qual. Particip. 31, 19-23 (2009).

Google Scholar

Astin, AW Comment, « bon » est le taux de rétention de votre établissement ?. Rés. Haut. Éduc. 38, 647–658 (1997).

Article Google Scholar

Coleman, JS Le capital social dans la création du capital humain. Suis. J. Social. 94, S95–S120 (1988).

Article Google Scholar

Reason, RD Variables de l'étudiant qui prédisent la rétention : Recherches récentes et nouveaux développements. J. Goujon. Aff. Rés. Pratique. 40, 704–723 (2003).

Google Scholar

Tinto, V. Abandon de l'enseignement supérieur : Une synthèse théorique des recherches récentes. Rev Educ Res 45, 89–125 (1975).

Article Google Scholar

Tinto, V. Compléter l'université : Repenser l'action institutionnelle (University of Chicago Press, 2012).

Réserver Google Scholar

Astin, A. Retenir et satisfaire les étudiants. Éduc. Rec. 68, 36-42 (1987).

Google Scholar

Aulck, L., Velagapudi, N., Blumenstock, J. & West, J. Prédire le décrochage des étudiants dans l'enseignement supérieur. prétirage arXiv arXiv:1606.06364 (2016).

Bogard, M., Helbig, T., Huff, G. et James, C. Une comparaison de modèles empiriques pour prédire la rétention des étudiants (Western Kentucky University, 2011).

Google Scholar

Murtaugh, PA, Burns, LD et Schuster, J. Prédire la rétention des étudiants universitaires. Rés. Haut. Éduc. 40, 355–371 (1999).

Article Google Scholar

Porter, KB Tendances actuelles en matière de persévérance scolaire : une revue de la littérature. Enseigner. Apprendre. Infirmières. 3, 3–5 (2008).

Article Google Scholar

Thomas, SL Des liens qui unissent : Une approche de réseau social pour comprendre l'intégration et la persévérance des étudiants. J. Haut. Éduc. 71, 591–615 (2000).

Google Scholar

Peltier, GL, Laden, R. & Matranga, M. Persévérance des étudiants à l'université : Un examen de la recherche. J. Coll. Étalon. Ret. 1, 357–375 (2000).

Article Google Scholar

Nandeshwar, A., Menzies, T. & Nelson, A. Modèles d'apprentissage de la rétention des étudiants universitaires. Système expert. Appl. 38, 14984–14996 (2011).

Article Google Scholar

Boero, G., Laureti, T. & Naylor, R. Une analyse économétrique du retrait et de la progression des étudiants dans les universités italiennes post-réforme. (2005).

Tinto, V. Quitter l'université : repenser les causes et les remèdes à l'attrition des étudiants (ERIC, 1987).

Google Scholar

Choy, S. Élèves dont les parents ne sont pas allés au collège : accès, persévérance et réussite aux études postsecondaires. Résultats de l'état de l'éducation, 2001. (2001).

Ishitani, TT Étudier le comportement d'attrition et d'obtention de diplômes chez les étudiants de première génération aux États-Unis. J. Haut. Éduc. 77, 861–885 (2006).

Article Google Scholar

Thayer, PB Rétention des étudiants de la première génération et des milieux à faible revenu. (2000).

Britt, SL, Ammerman, DA, Barrett, SF & Jones, S. Prêts étudiants, stress financier et rétention des étudiants. J. Goujon. Financ. Aide 47, 3 (2017).

Google Scholar

McKinney, L. & Burridge, AB Aide ou gêne ? Les effets des prêts sur la persévérance des étudiants des collèges communautaires. Rés. Haute Educ. 56, 299–324 (2015).

Article Google Scholar

Hochstein, SK & Butler, RR Les effets de la composition d'un ensemble d'aides financières sur la persévérance scolaire. J. Goujon. Financ. Aide 13, 21-26 (1983).

Google Scholar

Singell, LD Jr. Venez et restez un moment : L'aide financière affecte-t-elle la rétention conditionnée à l'inscription dans une grande université publique ?. Écon. Éduc. Rév. 23, 459–471 (2004).

Article Google Scholar

Bean, JP Neuf thèmes d'étudiant. Coll. Étalon. Rétention. Formule Goujon. Succès 215, 243 (2005).

Google Scholar

Tinto, V. À travers les yeux des étudiants. J. Coll. Étalon. Ret. 19, 254–269 (2017).

Article Google Scholar

Cabrera, AF, Nora, A. & Castaneda, MB Persévérance collégiale : test de modélisation par équations structurelles d'un modèle intégré de persévérance scolaire. J. Haut. Éduc. 64, 123-139 (1993).

Google Scholar

Roberts, J. & Styron, R. Satisfaction et persévérance des étudiants : Facteurs essentiels à la persévérance scolaire. Rés. Haut. Éduc. J. 6, 1 (2010).

Google Scholar

Gopalan, M. & Brady, ST Sentiment d'appartenance des étudiants du Collège : Une perspective nationale. Éduc. Rés. 49, 134-137 (2020).

Article Google Scholar

Hoffman, M., Richmond, J., Morrow, J. & Salomone, K. Enquête sur le "sentiment d'appartenance" chez les étudiants de première année. J. Coll. Étalon. Ret. 4, 227–256 (2002).

Article Google Scholar

Terenzini, PT & Pascarella, ET Vers la validation du modèle de Tinto sur l'attrition des étudiants universitaires : un examen des études récentes. Rés. Haute Educ. 12, 271-282 (1980).

Article Google Scholar

Astin, AW L'impact de la vie en dortoir sur les étudiants. Dossier scolaire (1973).

Astin, AW Implication des étudiants : une théorie du développement pour l'enseignement supérieur. J. Coll. Étalon. Pers. 25, 297-308 (1984).

Google Scholar

Terenzini, PT & Pascarella, ET Étudier les étudiants au 21e siècle : relever de nouveaux défis. Rév. High Ed. 21, 151-165 (1998).

Google Scholar

Thompson, J., Samiratedu, V. & Rafter, J. Les effets de la résidence sur le campus sur les nouveaux étudiants. NASPA J. 31, 41–47 (1993).

Article Google Scholar

Tinto, V. Recherche et pratique de la persévérance scolaire : et ensuite ?. J. Coll. Étalon. Ret. 8, 1–19 (2006).

Article Google Scholar

Lazer, D. et al. Sciences sociales computationnelles. Sciences 1979(323), 721–723 (2009).

Article Google Scholar

Yarkoni, T. & Westfall, J. Choisir la prédiction plutôt que l'explication en psychologie : leçons de l'apprentissage automatique. Perspective. Psychol. Sci. 12, 1100-1122 (2017).

Article PubMed PubMed Central Google Scholar

Peters, H., Marrero, Z. & Gosling, SD La boîte à outils Big Data pour les psychologues : sources de données et méthodologies. dans La psychologie de la technologie : la recherche en sciences sociales à l'ère du Big Data. 87-124 (Association américaine de psychologie, 2022). doi : https://doi.org/10.1037/0000290-004.

Fischer, C. et al. Mining big data dans l'éducation : Affordances et défis. Rév. Rés. Éduc. 44, 130-160 (2020).

Article Google Scholar

Hilbert, S. et al. Apprentissage automatique pour les sciences de l'éducation. Rév. Éduc. 9, e3310 (2021).

Article Google Scholar

Académie nationale de l'éducation. Big data dans l'éducation : Équilibrer les avantages de la recherche en éducation et la vie privée des étudiants. (2017).

Aulck, L., Nambi, D., Velagapudi, N., Blumenstock, J. & West, J. Mining registres universitaires pour prédire l'attrition en première année de premier cycle. Int. Éduc. Données min. Soc. (2019).

Beaulac, C. & Rosenthal, JS Prédire la réussite scolaire et la majeure des étudiants universitaires à l'aide de forêts aléatoires. Rés. Haute Educ. 60, 1048-1064 (2019).

Article Google Scholar

Berens, J., Schneider, K., Görtz, S., Oster, S. et Burghoff, J. Détection précoce des étudiants à risque - prédiction des abandons d'étudiants à l'aide de données administratives sur les étudiants et de méthodes d'apprentissage automatique. Disponible au SSRN 3275433 (2018).

Dawson, S., Jovanovic, J., Gašević, D. & Pardo, A. De la prédiction à l'impact : Évaluation d'un programme de rétention analytique de l'apprentissage. dans Actes de la septième conférence internationale sur l'analyse et la connaissance de l'apprentissage 474–478 (2017).

Dekker, GW, Pechenizkiy, M. & Vleeshouwers, JM Prédire le décrochage scolaire : une étude de cas. Int. Travail. Groupe Éduc. Données min. (2009).

del Bonifro, F., Gabbrielli, M., Lisanti, G. & Zingaro, SP Prévision du décrochage scolaire. dans Conférence internationale sur l'intelligence artificielle dans l'éducation 129-140 (Springer, 2020).

Hutt, S., Gardner, M., Duckworth, AL & D'Mello, SK Évaluation de l'équité et de la généralisabilité dans les modèles prédisant l'obtention du diplôme à temps à partir des candidatures collégiales. Int. Éduc. Données min. Soc. (2019).

Jayaprakash, SM, Moody, EW, Lauría, EJM, Regan, JR & Baron, JD Alerte précoce des étudiants à risque sur le plan académique : une initiative d'analyse open source. J. Apprendre. Anal. 1, 6–47 (2014).

Article Google Scholar

Balakrishnan, G. & Coetzee, D. Prédire la rétention des étudiants dans des cours en ligne ouverts massifs à l'aide de modèles de Markov cachés. Élire. Ing. Calcul. Sci. Univ. Californie Berkeley 53, 57–58 (2013).

Google Scholar

Hastie, T., Tibshirani, R. & Friedman, J. Les éléments de l'apprentissage statistique (Springer Series in Statistics, New York, NY, USA, 2001).

Livre MATH Google Scholar

Chawla , NV , Bowyer , KW , Hall , LO & Kegelmeyer , WP SMOTE : Une technique de suréchantillonnage minoritaire synthétique. J.Artif. Renseignement. Rés. 16, 321–357 (2002).

Article MATH Google Scholar

Zou, H. & Hastie, T. Régularisation et sélection de variables via le filet élastique. Statistique JR. Soc. Seri. Statistique B. Méthodologie. 67, 301–320 (2005).

Article MathSciNet MATH Google Scholar

Friedman, J., Hastie, T. & Tibshirani, R. Chemins de régularisation pour les modèles linéaires généralisés via la descente de coordonnées. J. Stat. Logiciel 33, 1 (2010).

Article PubMed PubMed Central Google Scholar

Breiman, L. Forêts aléatoires. Mach. Apprendre. 45, 5–32 (2001).

Article MATH Google Scholar

Liaw, A. & Wiener, M. Classification et régression par randomForest. R News 2, 18–22 (2002).

Google Scholar

Pargent, F., Schoedel, R. & Stachl, C. Une introduction à l'apprentissage automatique pour les psychologues dans R. Psyarxiv (2022).

Hoerl, AE & Kennard, RW Ridge Regression. dans l'Encyclopédie des sciences statistiques vol. 8 129–136 (John Wiley & Sons, Inc., 2004).

Tibshirani, R. Retrait de régression et sélection via le Lasso. Statistique JR. Soc. Ser. B (Methodol.) 58, 267–288 (1996).

MathSciNet MATHGoogle Scholar

Hastie, T. & Qian, vignette J. Glmnet. vol. 9 1–42 https://hastie.su.domains/Papers/Glmnet_Vignette.pdf (2016).

Orrù, G., Monaro, M., Conversano, C., Gemignani, A. & Sartori, G. Apprentissage automatique en psychométrie et recherche psychologique. Devant. Psychol. 10, 2970 (2020).

Article PubMed PubMed Central Google Scholar

Pargent, F. & Albert-von der Gönna, J. Modélisation prédictive avec données de panel psychologiques. Z Psychol (2019).

Pargent, F., Schoedel, R. & Stachl, C. Meilleures pratiques en apprentissage automatique supervisé : un tutoriel pour les psychologues. Doi : https://doi.org/10.31234/osf.io/89snd (2023).

Friedman, J., Hastie, T. & Tibshirani, R. Les éléments de l'apprentissage statistique Vol. 1 (Springer Series in Statistics, 2001).

MATH Google Scholar

Rijsbergen, V. & Joost, CK Information Retrieval Butterworths Londres. Google Scholar Bibliothèque numérique Google Scholar Bibliothèque numérique (1979).

Molnar, C. Apprentissage automatique interprétable. (Lulu.com, 2020).

Aguiar, E., Ambrose, GA, Chawla, N. v, Goodrich, V. & Brockman, J. Engagement vs Performance : Utilisation de portfolios électroniques pour prédire la persévérance des étudiants en génie au premier semestre. Journal of Learning Analytics vol. 1 (2014).

Chai, KEK & Gibson, D. Prédire le risque d'attrition pour les étudiants de premier cycle avec une modélisation basée sur le temps. Int. Assoc. Dév. Inf. Soc. (2015).

Saenz, T., Marcoulides, GA, Junn, E. & Young, R. La relation entre l'expérience collégiale et la performance scolaire chez les étudiants issus de minorités. Int. J. Educ. Gérer (1999).

Pidgeon, AM, Coast, G., Coast, G. & Coast, G. Modérateurs psychosociaux du stress, de l'anxiété et de la dépression perçus chez les étudiants universitaires : une étude internationale. Open J. Soc. Sci. 2, 23 (2014).

Google Scholar

Wilcox, P., Winn, S. & Fyvie-Gauld, M. « Cela n'avait rien à voir avec l'université, c'était juste les gens » : le rôle du soutien social dans l'expérience de première année de l'enseignement supérieur. Étalon. Haut. Éduc. 30, 707–722 (2005).

Article Google Scholar

Guiffrida, DA Vers un avancement culturel de la théorie de Tinto. Rév. High Ed. 29, 451–472 (2006).

Article Google Scholar

Triandis, HC, McCusker, C. & Hui, CH Sondages multiméthodes de l'individualisme et du collectivisme. J. Pers. Soc. Psychol. 59, 1006 (1990).

Article Google Scholar

Watson, D. & Clark, LA Extraversion et son noyau émotionnel positif. dans Manuel de psychologie de la personnalité 767–793 (Elsevier, 1997).

Greff, K., Srivastava, RK, Koutník, J., Steunebrink, BR & Schmidhuber, J. LSTM : Une odyssée de l'espace de recherche. IEEE Trans. Réseau neuronal. Apprendre. Syst. 28, 2222-2232 (2017).

Article MathSciNet PubMed Google Scholar

Arnold, KE & Pistilli, MD Signaux de cours à Purdue : Utilisation de l'analyse de l'apprentissage pour accroître la réussite des élèves. dans Actes de la 2e conférence internationale sur l'analyse et la connaissance de l'apprentissage 267-270 (2012).

Braxton, JM & McClendon, SA La promotion de l'intégration sociale et de la rétention par la pratique institutionnelle. J. Coll. Étalon. Ret. 3, 57–71 (2001).

Article Google Scholar

Sneyers, E. & de Witte, K. Les interventions dans l'enseignement supérieur et leur effet sur la réussite des étudiants : une méta-analyse. Éduc. Rev. (Birm) 70, 208–228 (2018).

Article Google Scholar

Jamelske, E. Mesure de l'impact d'un programme d'expérience universitaire de première année sur la moyenne et la rétention des étudiants. Haute Educ. (Dordr) 57, 373–391 (2009).

Article Google Scholar

Purdie, JR & Rosser, VJ Examiner le rendement scolaire et la rétention des étudiants de première année dans les communautés d'apprentissage vivant et les cours d'expérience de première année. Coll. Étalon. Aff. J. 29, 95 (2011).

Google Scholar

Lundberg, SM et al. Des explications locales à la compréhension globale avec une IA explicable pour les arbres. Nat. Mach. Renseignement. 2, 56–67 (2020).

Article PubMed PubMed Central Google Scholar

Ramon, Y., Farrokhnia, RA, Matz, SC et Martens, D. IA explicable pour le profilage psychologique à partir de données comportementales : une application aux cinq grandes prédictions de personnalité à partir des enregistrements de transactions financières. Informations 12, 518 (2021).

Article Google Scholar

Télécharger les références

Université Columbia, New York, États-Unis

Sandra C. Matz et Heinrich Peters

Université Ludwig Maximilian de Munich, Munich, Allemagne

Christina S. Bukow

Ready Education, Montréal, Canada

Christine Diacres

Université de Saint-Gall, Saint-Gall, Suisse

Clemens Stahl

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

SCM, CB et CS ont conçu la recherche. CD a fourni les données. SCM, CB et HP ont analysé les données. SCM et CB ont rédigé le manuscrit. Tous les auteurs ont examiné le manuscrit. Les versions antérieures de cette recherche faisaient partie de la thèse de maîtrise du CB qui a été supervisée par SCM et CS

Correspondance avec Sandra C. Matz.

CD est un ancien employé de Ready Education. Aucun des autres auteurs n'a de conflit d'intérêts lié à cette soumission.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Matz, SC, Bukow, CS, Peters, H. et al. Utilisation de l'apprentissage automatique pour prédire la rétention des étudiants à partir de caractéristiques sociodémographiques et de mesures d'engagement basées sur des applications. Sci Rep 13, 5705 (2023). https://doi.org/10.1038/s41598-023-32484-w

Télécharger la citation

Reçu : 09 août 2022

Accepté : 28 mars 2023

Publié: 07 avril 2023

DOI : https://doi.org/10.1038/s41598-023-32484-w

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.