Éducation

Mariage pour tous – à propos de l’algorithme de Parcoursup

Statisticien

Comment faire pour que se correspondent les préférences des étudiants et les préférences des universités ? APB s’appuyait sur le modèle du « mariage collectif » des mathématiciens Gale et Shapley (qui marier avec qui ? peut-on rester non marié ?), dans lequel les femmes (les étudiants) proposent et les hommes (les facs) disposent. Est-ce la même chose avec Parcoursup ? Alors que les premières réponses parviennent ce 22 mai aux candidats qui y ont inscrit leurs vœux, revenons sur le problème du choix algorithmique et de ce qu’il implique.

Publicité

À l’heure où nous écrivons, un peu plus de 800 000 inscrits postulent à l’une des 13 000 formations proposés par le portail Parcoursup. Avec quel modèle algorithmique construit-on un outil de ce type ? Et pour quels objectifs d’affectation ?

En septembre 2017, la CNIL avait réagi au système APB et mis en demeure le ministère de l’Enseignement supérieur de « cesser de prendre des décisions sur des personnes sur le seul fondement d’un algorithme », en vertu de l’article 10 de la loi « Informatique et Libertés » (aucune « décision produisant des effets juridiques à l’égard d’une personne ne peut être prise sur le seul fondement d’un traitement automatisé de données »). À l’heure où la transparence des algorithmes est réclamée par la société civile, il est utile de revenir sur les règles qui président à leur conception et sur leurs implications.

Commençons par signaler que les capacités d’accueil des universités sont définies au niveau du rectorat (de même que les quotas de boursiers ou de bacheliers technologiques). Il en résulte qu’une solution simple pour éviter des problèmes d’affectation consiste à définir les capacités d’accueil à partir des souhaits des étudiants. Ceci va évidemment générer des problèmes de locaux, de taux d’encadrement des étudiants ou de débouchés mais guère plus que lorsqu’on décide qu’il y aura des cours de remise à niveau (le fameux « oui, si » de Parcoursup).

Dans les temps anciens, les étudiants venaient s’inscrire à l’université et les premiers arrivés étaient les premiers servis. Le premier achat du néo-bachelier était donc un sac de couchage pour passer la nuit à espérer une place.

Cependant, sur les 800 000 inscrits, il n’y aura « que » 640 000 nouveaux bacheliers [1] en se référant aux chiffres réels 2017, ce qui ferait environ 160 000 candidats en reconversion, alors que les effectifs totaux en première année à la rentrée 2017 (université + IUT + BTS + classes préparatoires aux grandes écoles) étaient d’environ 500 000 [2]. Définir les capacités d’accueil en fonction des demandes reviendrait donc à ne pas tenir compte d’une déperdition importante.

Et revenons rapidement sur l’histoire de l’accueil des étudiants dans les études supérieures. Dans les temps anciens, les étudiants venaient s’inscrire à l’université et les premiers arrivés étaient les premiers servis. Le premier achat du néo-bachelier était donc un sac de couchage pour passer la nuit à espérer une place. Devant l’augmentation des effectifs étudiants dans les années 1980, le système RAVEL (Recensement automatisé des vœux des élèves) est mis en place en 1987 afin de prévoir les flux d’étudiants vers les universités (principalement franciliennes).

Il est difficile de savoir si l’initiative de RAVEL revient aux recteurs ou aux présidents d’universités, mais ce système de pré-inscription à l’université par académie résout efficacement la question des files d’attente aux inscriptions. En 2008, il laissera la place à une procédure nationale appelée Admission post-bac (APB). RAVEL reposait sur une logique géographique et avec APB la notion d’ordre des choix prend le pas sur la sectorisation.

Découper le territoire est une question assez simple mais affecter des choix à des préférences est nettement plus compliqué. Il est souvent impossible de satisfaire les élèves en leur affectant leur formation préférée, et simultanément les formations en leur affectant les élèves qu’elles ont retenus en premier. Il faut donc trouver une méthode pour décider de l’affectation des étudiants dans les différentes filières en prenant en compte à la fois les classements des étudiants aux différentes formations et leurs préférences entre les différentes formations.

Si le classement était unique pour toutes les filières, la question serait simple : l’étudiant le mieux classé choisit la formation de son choix et les suivants choisissent, dans l’ordre de leur rang de classement, une formation parmi les places restantes. C’est le principe des « amphi de garnison » dans les concours de médecine. On peut cependant concevoir que des qualités différentes soient demandées selon les filières : on aura alors des rangs de classement différents selon les formations et la question se complexifie si l’on veut que correspondent entre elles les demandes, les préférences et les affectations.

Gale et Shapley traitent le problème d’affectation comme un problème de « mariage collectif ». Le principe adopté est que les hommes proposent et que les femmes disposent.

Dans les années 1960, David Gale et Llyod Shapley « sont les premiers à considérer mathématiquement le problème de l’affectation dans le cadre de la théorie des jeux alors encore récente [3] ». Leurs travaux (et les extensions d’Alvin Roth) sont à la base de la construction d’APB. Le prix « Alfred Nobel » d’économie récompense en 2012 Llyod Shapley et Alvin Roth pour leurs réponses tant mathématiques que pratiques à ce type de problèmes. (Gale n’était pas éligible au prix car il est décédé en 2008.)

Gale et Shapley traitent le problème d’affectation comme un problème de « mariage collectif » (à l’image de La Nuit des temps où René Barjavel imagine une société dont les mariages sont décidés de façon centralisée). Le principe adopté est que les hommes proposent et que les femmes disposent ; dans notre cas : les étudiants proposent et les filières disposent.

Un problème de mariage collectif est considéré comme stable s’il n’y a pas deux personnes (un couple extra-conjugal) qui préféreraient être mariées ensemble plutôt que de rester avec leur conjoint respectif. On a pu lire de-ci de-là que cet algorithme était optimal mais il est un peu rapide de résumer l’optimalité d’un couple à sa stabilité.

Nous renvoyons le lecteur intéressé par les détails des travaux de Gale et Shapley vers les excellents articles d’Images des maths, d’Interstices ou de Wikipedia.

On peut retenir ceci de leurs travaux : tout problème de mariage collectif admet au moins une solution stable. Parmi les solutions stables, il en existe une qui est optimale du point de vue des femmes, c’est-à-dire qu’aucune femme ne puisse obtenir un meilleur mariage dans une autre solution stable (dans notre cas : deux étudiants n’ont pas envie de permuter). De façon symétrique, il existe aussi une solution optimale pour les hommes, mais ce n’est en général pas la même que pour les femmes.

On voit à ce moment-là que la meilleure solution pour les établissements n’est pas la meilleure solution pour les étudiants (et réciproquement). Il est donc important de savoir qui est privilégié dans l’algorithme, car on peut penser que les étudiants ayant obtenu une place dans la formation souhaitée seront plus motivés et auront ainsi plus de chances de réussir leurs études.

Parcoursup a été pensé pour éviter, du moins théoriquement, les tirages au sort pratiqués au temps d’APB.

On n’a toutefois pas fait le tour de la question en rappelant le modèle Gale-Shapley, et le diable se cache, comme toujours, dans les détails.

Tout d’abord, comme il est bien évidemment impossible de classer tous les candidats dans toutes les formations, APB limitait la liste à 24 choix. Or, si aucun des vœux n’est exaucé (et c’était possible avec APB, comme on le sait), un étudiant se retrouve sans aucune affectation. On en conclut logiquement que, dans Parcoursup, la limitation à 10 choix (et 10 sous-choix pour certaines filières) augmente sensiblement les risques de se retrouver sans rien. De façon symétrique, il y a un risque qu’une formation ne soit pas remplie (si les étudiants lui préfèrent d’autres filières).

Par ailleurs, avec APB la question des ex-aequo dans les classements a été à l’origine des tirages au sort qui ont défrayé la chronique. Cette question complique en effet fortement le processus d’affectation. Le tirage au sort a concerné en 2017 une centaine de formations, et donc une très faible proportion d’étudiants. C’est assez comparable aux années précédentes mais l’impact émotionnel a été fort et constitue la base des critiques faites à APB. Les considérations autour de ces critiques sortent du cadre de cet article mais il est clair que ce dispositif a fortement brouillé la logique méritocratique d’APB. Il aurait probablement été plus clair de proposer des critères additionnels pour départager les ex-aequo (des critères de genre ou de motivation par exemple).

Parcoursup a été pensé pour éviter, du moins théoriquement, ces tirages au sort. Cependant, on peut dire que Parcoursup obéit aussi au modèle des « mariages » même si les vœux exprimés par les étudiants n’y sont pas classés. Dans un premier temps, les formations classent les demandes des étudiants. Si une formation a moins de demandes que de places, elle doit accepter toutes les candidatures.

À partir du 22 mai, les futurs bacheliers reçoivent, au fil de l’eau, des réponses à leurs vœux. S’ils reçoivent au moins deux réponses positives, ils doivent n’en retenir qu’une seule dans le délai imparti. Toutefois, si le lycéen le souhaite, les vœux en attente continuent à être pris en compte. Ainsi, au fur et à mesure de la procédure, les propositions qui intéressent le moins l’étudiant sont éliminées pour lui permettre de ne conserver que la proposition préférée. Tel est le schéma connu à ce jour.

Avec APB, toutes les affectations arrivaient en même temps. Avec Parcoursup, l’affectation n’est plus automatique puisque les vœux n’ont pas été classés. Les lycéens pourront avoir le sentiment d’affiner leurs préférences au fil des semaines en acceptant ou en refusant une proposition si une autre leur convient mieux. Les propositions rejetées vont repartir dans le lot commun et les allers-retours entre lycéens et universités risquent d’être nombreux.

Notons que les étudiants peuvent choisir leur affectation sur Parcoursup en attendant les résultats de leurs candidatures à des formations qui ne sont pas sur Parcoursup (comme par exemple les formations privées). Ces phénomènes existaient déjà avec APB mais les délais de réponse risquent de les amplifier. Espérons donc que Parcoursup ne deviennent pas le plan B (public) pour les étudiants postulant à des formations privées.

Et permettons-nous une deuxième digression ici : avec Parcoursup, aucune formation ne peut accéder aux préférences des lycéens. La confidentialité est certes mieux respectée qu’avec APB, mais le classement va devoir être fait par les lycéens dans des délais très courts. On peut ainsi regretter l’absence d’accompagnement à cette étape cruciale, ainsi que l’absence de réflexion sur la réforme du service public d’orientation.

Ce que l’on nomme algorithme dans APB ou Parcoursup correspond au codage informatique d’une règle ministérielle. Il est important que la discussion autour de la transparence des algorithmes ne cache pas la discussion politique.

Revenons à l’algorithme : nous l’avons dit plus haut, il y a eu beaucoup de discussion sur l’accès au code d’APB et en particulier pour savoir si l’algorithme choisi était favorable aux établissements ou bien aux étudiants. Avec Parcoursup, il faut plutôt parler de système interactif. En pratique, Parcoursup a exactement la même interface qu’APB et la seule réelle évolution est la disparition de l’algorithme d’affectation. Cependant, les formations ayant à gérer des masses de candidatures devront probablement faire appel à des traitements automatisés. On est droit de demander à chacune des formations leur algorithme de classement ; il reste que la comparaison entre les algorithmes sera compliquée.

Enfin, le bouche à oreille est actuellement le seul moyen pour un lycéen d’évaluer ses chances dans telle ou telle filière. On pourrait alors souhaiter le processus inverse et, comme le propose aussi l’article d’Interstices cité plus haut, demander à chaque formation de rendre publiques des statistiques anonymisées relatives aux élèves admis les années précédentes (typiquement, des ordres de notes par matières). La transparence des critères de choix est une condition nécessaire du débat démocratique et un fondement de l’État de droit.

La liste des critères à prendre en compte pourrait aussi contenir des items imposés. À titre d’exemple : le handicap n’est pas mentionné de manière officielle dans le dossier Parcoursup, pourquoi ne pas l’intégrer ? faut-il favoriser les candidatures des femmes dans les formations scientifiques ? ou tous autres critères servant à lutter contre des inégalités scolaires et sociales.

Au final, on peut remarquer que le travail fait par le ministère du temps d’APB est aujourd’hui fait par les universités avec Parcoursup. N’est-ce pas là le but de l’autonomie des établissements l’enseignement supérieur ? Mais demeurent des questions en suspens. Si la sélection (ou la priorisation) reste un mot tabou, ne faut-il pas commencer à se demander ce que deviennent les non-sélectionnés ? De même, à un moment où la formation tout au long de la vie est très en vogue, que va-t-il se passer pour ceux qui arrêteront leurs études et voudront les reprendre plus tard ? Ce que l’on nomme algorithme dans APB ou Parcoursup correspond au codage informatique d’une règle ministérielle. Il est important que la discussion autour de la transparence des algorithmes ne cache pas la discussion politique.

Avner Bar-Hen

Statisticien, Professeur au CNAM et titulaire de la chaire Statistique et données massives