Accéder au contenu principal

Utiliser ChatGPT, est-ce tricher ? Réflexions sur la fraude étudiante à l’ère des IA génératives

  Par  Jean-François Cerisier , Université de Poitiers L’usage de l’intelligence artificielle générative est désormais massif dans les nouvelles générations étudiantes, bousculant les codes et les enjeux de l’évaluation des connaissances. Voilà qui pose un certain nombre de dilemmes aux universités. Comment peuvent-elles repenser leurs examens pour maintenir la crédibilité des diplômes ? S’il existe vraiment des innovations de rupture dans l’éducation, les usages des intelligences artificielles génératives pourraient être de celles-là. Ce n’est rien moins qu’un nouveau rapport au savoir qui s’instaure sous nos yeux. À l’université, c’est probablement l’évaluation des apprentissages et le risque de triche qui soulèvent le plus de questions. Les fraudes sont difficiles à observer. Par définition la triche est cachée et il est difficile de la différencier des utilisations légitimes des intelligences artificielles génératives. De plus, il n’existe pas à ce jo...

Utiliser ChatGPT, est-ce tricher ? Réflexions sur la fraude étudiante à l’ère des IA génératives

 

chatgpt

Par Jean-François Cerisier, Université de Poitiers

L’usage de l’intelligence artificielle générative est désormais massif dans les nouvelles générations étudiantes, bousculant les codes et les enjeux de l’évaluation des connaissances. Voilà qui pose un certain nombre de dilemmes aux universités. Comment peuvent-elles repenser leurs examens pour maintenir la crédibilité des diplômes ?


S’il existe vraiment des innovations de rupture dans l’éducation, les usages des intelligences artificielles génératives pourraient être de celles-là. Ce n’est rien moins qu’un nouveau rapport au savoir qui s’instaure sous nos yeux. À l’université, c’est probablement l’évaluation des apprentissages et le risque de triche qui soulèvent le plus de questions.

Les fraudes sont difficiles à observer. Par définition la triche est cachée et il est difficile de la différencier des utilisations légitimes des intelligences artificielles génératives. De plus, il n’existe pas à ce jour en France d’étude robuste qui permettrait de la qualifier et de la quantifier, d’autant que les plateformes de détection de plagiat s’avèrent inopérantes. Peu fiables, celles-ci produisent à la fois des faux positifs et des faux négatifs, comme le montrent l’étude de William H. Walters et celle de Philippe Dessus et Daniel Seyve.

On sait en revanche que les étudiants utilisent massivement les intelligences artificielles génératives. Une enquête du Digital Education Council, publiée en août 2024 montre que 86 % d’entre eux, dans un panel de 16 pays incluant la France, les utilisent, alors qu’une étude, plus récente, du Higher Education Policy Institute, réalisée en février 2025, estime que 92 % des étudiants britanniques y recourent dont 88 % pour des activités donnant lieu à une évaluation.

Face à ce double constat, les universités semblent assez démunies. L’effondrement de leur capacité à maintenir les formats classiques d’évaluation appelle à en repenser radicalement les finalités et les modalités afin de maintenir l’efficacité des formations et la crédibilité des diplômes.

À quoi les évaluations servent-elles ?

Dans l’éducation comme ailleurs, on définit usuellement l’évaluation comme un jugement de valeur porté sur une mesure et destiné à une prise de décision. À l’université, il s’agit donc de proposer aux étudiants des activités, spécifiques ou non, qui permettront de mesurer leurs connaissances et/ou leurs compétences. Celles-ci peuvent prendre différentes formes, dont l’épreuve écrite sur table, l’exposé oral, le mémoire de recherche ou le rapport de stage.

L’évaluation est un processus au service de deux finalités très différentes, potentiellement complémentaires mais le plus souvent confondues.

La première vise à accompagner les étudiants en leur fournissant des informations qualitatives (analyse des progrès et des difficultés, conseils pour y remédier…) et/ou quantitatives (notes) sur leurs apprentissages. Ces éléments leur permettent d’orienter et d’ajuster leurs efforts, alors qu’ils invitent le corps professoral à adapter les leurs aux besoins des étudiants. Pour ces raisons, cette forme d’évaluation est dite « formative » et joue un rôle essentiel dans la réussite des étudiantes et des étudiants.

L’autre finalité, qualifiée le plus souvent de « sommative », vise à rendre compte des connaissances et/ou compétences des étudiants, à une étape donnée d’une formation, souvent à la fin, afin d’autoriser une poursuite d’études, de délivrer un certificat ou un diplôme. Les résultats d’une évaluation sommative sont le plus souvent communiqués selon des modalités quantitatives (notes).

Quelle que soit la finalité d’une évaluation, sa qualité repose d’abord sur son alignement avec les objectifs d’apprentissage visés. Elle doit rendre compte de ce qui est attendu en termes de connaissances et/ou de compétences. Elle doit par ailleurs être fiable, c’est-à-dire mesurer ce qu’elle est censée mesurer et le faire de façon suffisamment fine. Enfin, elle doit procéder de manière équitable, en tenant compte de difficultés rencontrées par les étudiants susceptibles de masquer leurs apprentissages, comme la prise en compte de handicaps invisibles, tels que la dyslexie par exemple.

Qu’est-ce que tricher avec une intelligence artificielle générative ?

Il convient de distinguer nettement la fraude de toutes les autres situations dans lesquelles les étudiants délèguent aux intelligences artificielles génératives tout ou partie des tâches qui leur sont prescrites. Hors évaluation, l’aide attendue des intelligences artificielles génératives constitue également une problématique pédagogique d’une très grande importance mais elle n’entame pas l’intégrité du rapport aux règles universitaires.

La triche est avérée si la production de l’étudiante ou de l’étudiant s’inscrit dans une démarche d’évaluation alors que l’utilisation d’intelligences artificielles génératives a été interdite. Ainsi, la résolution d’un problème de statistique dans le cadre d’un examen de fin de semestre, en recourant de manière dissimulée à ces outils, alors que leur utilisation a été interdite par le corps professoral, relève de la triche. Recourir à la même intelligence artificielle générative comme aide à la réalisation du même problème avec l’accord et l’encadrement de l’enseignant n’en relève pas.

De fait, la triche à l’intelligence artificielle générative ruine la qualité de l’évaluation, en particulier sa fiabilité, puisque l’évaluation ne mesure plus ce qu’elle est censée mesurer. De même, cette fraude entraîne une rupture d’égalité face à l’évaluation. De façon générique, la fraude académique désigne les pratiques estudiantines interdites et/ou trompeuses destinées à obtenir un avantage en termes d’évaluation de leurs performances.

Pourquoi les étudiants fraudent-ils ?

La triche doit être rapportée à ce que représente l’évaluation pour les étudiants. Une publication scientifique récente souligne l’importance que les étudiants accordent à l’évaluation de leurs apprentissages mais aussi les critiques qu’ils formulent à l’égard d’évaluations dont ils estiment que les formes actuelles les rendent stressantes, injustes, opaques, et qu’elles manquent de rétroactions.

Cette pression évaluative s’exerce dans un contexte social et universitaire où l’individualisme, la compétition et le court-termisme sont tels qu’il ne faut pas s’étonner de la montée d’une vision utilitariste des études universitaires et donc de l’affaiblissement de l’exigence morale. Le modèle du « diamant de la fraude » (Wolfe et Hermanson, 2004) identifie les quatre facteurs principaux qui peuvent expliquer (et prédire) toute triche ; rationalisation de l’activité, opportunité de tricher, motivation et capacité perçue.

La confrontation de ce modèle à la problématique de la fraude académique est éclairante. Les quatre facteurs ont du sens dans le contexte universitaire :

  • La triche permet une forme de forte rationalisation de l’activité avec une maximisation des résultats et une minimisation de l’effort.

  • L’opportunité de tricher est importante puisque les performances des intelligences artificielles génératives permettent de répondre assez efficacement à la plupart des formats d’évaluation (répondre à des questions de cours, analyser un texte, traiter des données, coder…).

  • Très forte, la motivation de la triche est liée à la valeur utilitaire attribuée aux études et conduit à privilégier l’obtention d’un diplôme à l’intérêt intrinsèque des apprentissages. Elle répond aussi, de façon étonnante, à une démarche de rééquilibrage des étudiants qui estiment que, s’ils n’utilisent pas les intelligences artificielles génératives, ils sont défavorisés par rapport à ceux qui l’utilisent.

  • La capacité perçue, enfin, est forte, puisque les intelligences artificielles génératives sont simples à prendre en main, et que même les usages novices les plus maladroits produisent des résultats intéressants.

Que peuvent faire les universités ?

Maintenir les modalités actuelles d’évaluation n’étant pas une option, interdire efficacement l’utilisation des intelligences artificielles génératives et détecter leur utilisation a posteriori n’étant pas possible, les universités vont devoir repenser leur doctrine de l’évaluation.

Recourir plus fréquemment à l’évaluation orale, densifier la surveillance des examens, réviser les chartes des examens, sanctionner davantage les fraudes, élaborer et diffuser des chartes d’usages, concevoir des épreuves qui résistent mieux aux intelligences artificielles génératives sont des pistes importantes qu’il convient de suivre.

Elles ne sauraient pourtant régler le problème, d’autant plus qu’elles sont très coûteuses en temps, denrée rare et chère dans les universités. Une autre voie possible est que les étudiants puissent donner un sens aux évaluations qui les invitent à ne pas tricher.

Pour ce faire, l’une des pistes consiste à séparer strictement les évaluations destinées à accompagner les étudiants dans leurs parcours d’apprentissage, avec l’analyse de leurs difficultés et des pistes pour les aider à les surmonter (évaluations formatives), de celles destinées à valider formellement les étapes de leur formation, avec des notes ou des validations de compétences (les évaluations sommatives).

S’agissant des évaluations sommatives, cela permettrait de les sanctuariser pour en conserver la fiabilité. Sans exclure tout risque de triche, une diminution drastique de leur nombre permettrait d’y concentrer plus de moyens pour limiter les risques de triche.

Ainsi dégagées de leur valeur sommative, toutes les autres évaluations pourraient être conçues autour de leur finalité formative et inciter les étudiants à une sincérité de leur travail pour un meilleur accompagnement.

Il est vrai que cette organisation contrevient à la logique d’évaluation sommative continue qui s’est mise en place ces dernières années. Pas de solution miracle donc, mais un chantier important à ouvrir en n’oubliant pas d’y inclure le corps professoral et les étudiants qui sont, non seulement les premiers concernés, mais aussi les seuls à disposer d’une connaissance intime de la situation.The Conversation

Jean-François Cerisier, Professeur de sciences de l'information et de la communication, Université de Poitiers

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Posts les plus consultés de ce blog

Le bipeur des années 80 plus efficace que le smartphone ?

Par André Spicer, professeur en comportement organisationnel à la Cass Business School (City University of London) : Vous vous souvenez des bipeurs ? Ces appareils étaient utilisés largement avant l'arrivée massive des téléphones portables et des SMS. Si vous aviez un bipeur, vous pouviez recevoir des messages simples, mais vous ne pouviez pas répondre. Un des rares endroits où on peut encore en trouver aujourd’hui sont les hôpitaux. Le Service National de Santé au Royaume-Uni (National Health Service) en utilise plus de 130 000. Cela représente environ 10 % du nombre total de bipeurs présents dans le monde. Une récente enquête menée au sein des hôpitaux américains a révélé que malgré la disponibilité de nombreuses solutions de rechange, les bipeurs demeurent le moyen de communication le plus couramment utilisée par les médecins américains. La fin du bipeur dans les hôpitaux britanniques ? Néanmoins, les jours du bipeur dans les hôpitaux britanniques pourraient être compté...

Quelle technologie choisir pour connecter les objets ?

Par Frédéric Salles, Président et co-fondateur de Matooma   En 2021, le nombre total d'objets connectés utilisés atteindra les 25 milliards selon Gartner. Il est ainsi légitime de se demander quelles sont les technologies principales permettant de connecter les objets, et quelle pourrait être celle la plus adaptée pour sa solution. Un projet de vidéosurveillance par exemple n'aura absolument pas les mêmes besoins qu'un projet basé sur le relevé de température au milieu du désert. Ainsi pour trouver la meilleure connectivité pour son objet, de nombreuses questions peuvent se poser : mon objet fonctionne-t-il sur batterie ou est-il alimenté ? Mon objet restera-t-il statique ou sera-t-il mobile ?  Mon objet est-il susceptible d'être dans un endroit difficile d'accès ou enterré ? A quelle fréquence mes données doivent-elles remonter ? Etc. Voici les différentes solutions actuellement disponibles sur le marché. Courte distance : RFID/Bluetooth/WiFi La RFID (Ra...

La fin du VHS

La bonne vieille cassette VHS vient de fêter ses 30 ans le mois dernier. Certes, il y avait bien eu des enregistreurs audiovisuels avant septembre 1976, mais c’est en lançant le massif HR-3300 que JVC remporta la bataille des formats face au Betamax de Sony, pourtant de meilleure qualité. Ironie du sort, les deux géants de l’électronique se retrouvent encore aujourd’hui face à face pour déterminer le format qui doit succéder au DVD (lire encadré). Chassée par les DVD ou cantonnée au mieux à une petite étagère dans les vidéoclubs depuis déjà quatre ans, la cassette a vu sa mort programmée par les studios hollywoodiens qui ont décidé d’arrêter de commercialiser leurs films sur ce support fin 2006. Restait un atout à la cassette VHS: l’enregistrement des programmes télé chez soi. Las, l’apparition des lecteurs-enregistreurs de DVD et, surtout, ceux dotés d’un disque dur, ont sonné le glas de la cassette VHS, encombrante et offrant une piètre qualité à l’heure de la TNT et des écrans pl...

Comment savoir si je suis touché par un logiciel espion ?

Par Allan Camps, Senior Enterprise Account Executive chez Keeper Security Les logiciels espions sont des logiciels malveillants qui, installés à votre insu sur votre appareil, permettent aux cybercriminels de vous espionner et de voler vos informations privées. Ces informations peuvent ensuite être utilisées par des cybercriminels ou vendues sur le dark web pour commettre des fraudes ou des usurpations d'identité. Il est possible de repérer ces logiciels malveillants sur votre appareil en observant des signes particuliers tels que l'épuisement rapide de la batterie, la surchauffe, l'augmentation du nombre de fenêtres pop-up ou de l'utilisation des données, et la présence d'applications inconnues. Comment détecter un logiciel espion sur votre smartphone Android ou votre iPhone ? Recherchez les applications que vous n'avez pas téléchargées. Les applications que vous n'avez pas téléchargées peuvent se cacher dans votre bibliothèque et contenir des logiciels ...

6 questions sur Zone-telechargement

Quel était ce site ? Zone-telechargement.com était jusqu'à lundi soir l'un des plus gros sites web français proposant de télécharger des contenus numériques illégaux. En grande majorité des films parfois très récents ; des séries télé notamment américaines qui n'étaient pas diffusées en France ; de la musique ; des logiciels et des jeux vidéo. Les séries et les films étaient disponibles en différentes qualités et ceux en langue anglaise étaient sous-titrés grâce à des communautés d'utilisateurs capables de sous-titrer des épisodes de série 24 heures après leur diffusion aux États-Unis. Le site comptabilisait, selon la gendarmerie, en moyenne 140 millions de pages vues par mois et 11 000 téléchargements par jour. La société Alexa affichait Zone-Telechargement à la 11e place des sites les plus visités de France… devant Twitter ! Zone-Telechargement proposait 18 000 films, 2 500 séries télé ; 11 000 documentaires ; 20 943 émissions télé ; plus de 150 000 MP3 mais aus...

Le retour de la pellicule argentique : Kodak investit pour l'avenir

La photographie argentique, longtemps considérée comme une relique du passé, connaît un regain d'intérêt spectaculaire en 2024. Kodak, l'emblématique entreprise américaine, a récemment annoncé des investissements significatifs pour moderniser ses infrastructures et augmenter sa production de pellicules. Cette décision intervient alors que la demande pour les films argentiques explose, portée par une nouvelle génération de passionnés et de créateurs en quête d'authenticité. L'engouement pour l'argentique n'est pas un simple effet de mode. Il s'agit d'un véritable retour aux sources, où la qualité des couleurs, les textures uniques et le processus créatif de la photographie analogique séduisent autant les amateurs que les professionnels. Kodak, conscient de cet engouement, s'engage à produire des films aussi longtemps que la demande existera. Cette modernisation de l'usine de Rochester, où sont fabriqués les films emblématiques de Kodak, représente...