Accéder au contenu principal

L’IA menace-t-elle l’apprentissage des langues ?

Les téléphones permettent de communiquer avec des personnes qui ne parlent pas notre langue et dont nous ne parlons pas la langue. Maxx-Studio / Shutterstock Par  Pascual Pérez-Paredes , Universidad de Murcia Est-il encore utile d’apprendre des langues étrangères quand on dispose de smartphones équipés de traducteurs automatiques ? Si cette hypothèse inquiète, il semblerait que l’intelligence artificielle ouvre aussi de nouvelles pistes pour s’initier à différentes langues. En 2024, la société Open AI , spécialisée dans l’intelligence artificielle, a présenté GPT4-o, un nouveau grand modèle de langage capable de « raisonner » et d’interagir avec du texte, des images et des sons. Dans l’une des vidéos diffusées après ce lancement, on voit deux personnes sur leur téléphone portable qui demandent à GPT4-o de les écouter et de traduire leurs échanges de l’anglais à l’espagnol ou de l’espagnol à l’anglais, de sorte que

L’intelligence artificielle peut-elle créer une poésie d’un genre nouveau ?

La boîte à poésie. RAFFARD ROUSSEL

Par Thierry Poibeau, École normale supérieure (ENS) – PSL

Il existe des centaines de programmes de génération de poésie sur Internet – c’est-à-dire des systèmes capables de produire de la poésie automatiquement –, mais à quoi peuvent-ils servir ? Ces programmes ont-ils un intérêt, au-delà de celui de satisfaire leur concepteur ?

On a beaucoup entendu parler de GPT2 ou GPT3, ces énormes programmes informatiques capables de produire des textes très réalistes, et même de la poésie. GPT2 et GPT3 sont en fait des « modèles », des espèces de bases de connaissances, alimentés par des milliards de phrases et de textes glanés sur Internet, et « digérés » afin de pouvoir produire des textes nouveaux, inspirés des textes anciens, mais en même temps très différents.

Ajouter des contraintes

Pour produire de la poésie, il « suffit » d’y ajouter des contraintes : surveiller les rimes et la longueur des vers, respecter la structure globale, l’absence de répétition en position rimée, etc. Les systèmes de génération automatique connaissent un certain succès (on en trouve un nombre phénoménal sur Internet) car la tâche est amusante, ludique, mais aussi complexe si on veut produire des textes avec du sens (et encore plus si on veut contrôler ce qui est dit).

On a donc ici un cadre idéal pour expérimenter (souvent hors contrainte de financement) : la génération de poésie est souvent un loisir et un passe-temps, chez le chercheur comme chez l’amateur éclairé.

Une question se pose toutefois. Ces systèmes sont-ils dignes d'attention ?

Sur le plan littéraire, la plupart des systèmes sont encore, il faut bien l’avouer, assez rudimentaires et ont du mal à rivaliser avec du Baudelaire ou du Rimbaud. Les plus avancés sont toutefois bluffants, et c’est avant tout la base d’entraînement qui joue un rôle crucial (c’est-à-dire l’ensemble des textes qui ont permis au système d’apprendre. On peut en effet fournir à un système un jeu de données réduit, mais spécialisé (des œuvres de poètes du XIXe siècle par exemple) pour « spécialiser » un système, l’adapter à moindre coût. On peut alors obtenir des systèmes qui rédigent des paragraphes à la manière de Balzac, ou de la poésie à la manière de Baudelaire.

Il faut toutefois noter que les résultats apparaissant dans la presse (qu’il s’agisse de génération de prose ou de poésie) sont souvent le fruit de multiples essais, voire le fruit d’un travail de postédition de la part du journaliste.

Le projet Oupoco

Le projet Oupoco (Ouvroir de poésie combinatoire) que nous avons développé avec une équipe du laboratoire LATTICE, avait un but plus modeste. À l’image de l’expérience de Queneau dans Cent mille milliards de poèmes, notre ambition première était de produire des milliards de poèmes simplement en recombinant des vers issus d’un corpus poétique français représentatif.

Cent mille milliards de poèmes, Raymond Queneau, 1961. Musée Médard

À cette fin, nous avons assemblé une base de plus de 4000 sonnets d’auteurs allant du début du 19e jusqu’au début du XXe siècle. Alors que tous les vers de Queneau riment ensemble, il nous a fallu déterminer automatiquement la rime de chaque vers afin de pouvoir produire de la poésie avec rimes. Le projet était donc dès l’origine davantage un projet d’analyse qu’un projet de génération (comme en témoigne cette vidéo.

Ce projet peut paraître dommageable, en ce qu’il ferait passer la poésie pour du « n’importe quoi ». Mais le but est évidemment bien différent. Des expériences concrètes et la rencontre avec le public nous ont montré que cette crainte est en grande partie injustifiée. Le public (jeunes et vieux, femmes et hommes) est amusé, intrigué, veut en savoir plus. Un public d’ordinaire peu attiré par la poésie s’intéresse à ce qui est produit. Le public n’est pas naïf, même quand il s’agit d’enfants : il voit bien le caractère fabriqué, étrange et ludique de l’affaire. Il sait que derrière ce qui est produit se cachent d’autres textes et l’incongruité d’un vers hors norme pousse souvent à aller voir le contexte original, c’est-à-dire le poème d’origine.

Un exemple de poésie (Oupoco) – en rouge, les passages présentant un problème de cohérence. OupocoFourni par l'auteur

Le générateur de poésie, avec les dispositifs de diffusion qui vont avec (comme la Boîte à poésie, une œuvre d’art conçue par l’Atelier Raffard-Roussel et permettant d’obtenir un objet portatif intégrant le générateur de poésie d’Oupoco), permettent à un public large de renouer avec la poésie, alors que c’est une forme souvent délaissée même par les lecteurs régulier.

Quant aux expériences en génération pure (où la poésie produite n’est pas composée à partir de vers préexistants, mais est réellement conçue par ordinateur), elles amènent à réfléchir à d’autres aspects. Sur le texte lui-même : quelle est la richesse du texte produit ? Qu’est-ce qui fait la valeur d’un texte poétique ? Si on est dans le cadre d’une génération « à la manière de » (de façon similaire à la production de musique « à la manière de »), on peut s’interroger sur la valeur du résultat, sur les caractéristiques d’un auteur, sur ce qui fait le style d’un auteur, finalement.

Différents niveaux de créativité

Ces questions amènent enfin à s’interroger sur la notion de créativité elle-même. Margaret Boden, une informaticienne anglaise ayant développé une théorie sur la question, distingue trois niveaux de créativité, chez les humains comme chez les ordinateurs : la « créativité exploratrice », qui consiste juste à étendre un peu ce qui existe déjà (écrire un poème à la façon de Hugo) ; la « créativité combinatoire », qui consiste à combiner de façon originale des éléments existants autour de nous, mais de nature éloignée (les travaux de l’Oulipo, mêlant littérature et contraintes mathématiques sont probablement de cet ordre). La troisième forme de créativité, qualifiée de « transformationnelle », est d’une autre nature, elle change radicalement la façon de voir la réalité et produit généralement toute une nouvelle lignée d’œuvres. Margaret Boden parle de l’invention du cubisme par Picasso ; on peut penser à l’abandon des codes du roman dans les années 1950, autour du nouveau roman, mais la notion de rupture en littérature serait un concept à discuter en lui-même.

Le système Oupoco, recombinant juste des vers existants, est indéniablement de nature exploratrice, même si cette exploration est fondée sur la combinatoire. Le Graal de la créativité par ordinateur serait d’atteindre la créativité transformationnelle, au sens que Boden accorde à ce mot. Un ordinateur serait-il capable d’atteindre ce niveau ? On peut en douter, car ce niveau implique une certaine conscience de soi, une prise de recul par rapport au réel, pour imaginer des mécanismes complètement nouveaux. L’apprentissage artificiel, à la source de la plupart des développements récents et médiatiques en matière d’IA (intelligence artificielle), est très bon pour généraliser et recombiner les milliards de données reçues en entrée, mais est incapable de « faire un pas de côté », pour réellement transformer le réel.

Notons enfin que les humains apprennent aussi à partir de stimulis et par imitation. La nature et la réalité de la créativité transformationnelle n’est pas complètement prouvée. Peut-être qu’à partir des milliards de perceptions reçues au cours de sa vie l’homme est capable de recombiner de manière suffisamment libre pour donner l’impression d’une créativité transformationnelle. On est alors au cœur de la cognition !


Ont participé à Oupoco les personnes suivantes : Claude Grunspan, Mylène Maignant, Clément Plancq, Frédérique Mélanie Becquet, Marco Naguib, Yann Raphalen, Mathilde Saurat, ainsi que l’Atelier Raffard-Roussel.The Conversation

Thierry Poibeau, DR CNRS, École normale supérieure (ENS) – PSL

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Posts les plus consultés de ce blog

Le bipeur des années 80 plus efficace que le smartphone ?

Par André Spicer, professeur en comportement organisationnel à la Cass Business School (City University of London) : Vous vous souvenez des bipeurs ? Ces appareils étaient utilisés largement avant l'arrivée massive des téléphones portables et des SMS. Si vous aviez un bipeur, vous pouviez recevoir des messages simples, mais vous ne pouviez pas répondre. Un des rares endroits où on peut encore en trouver aujourd’hui sont les hôpitaux. Le Service National de Santé au Royaume-Uni (National Health Service) en utilise plus de 130 000. Cela représente environ 10 % du nombre total de bipeurs présents dans le monde. Une récente enquête menée au sein des hôpitaux américains a révélé que malgré la disponibilité de nombreuses solutions de rechange, les bipeurs demeurent le moyen de communication le plus couramment utilisée par les médecins américains. La fin du bipeur dans les hôpitaux britanniques ? Néanmoins, les jours du bipeur dans les hôpitaux britanniques pourraient être compté

Quelle technologie choisir pour connecter les objets ?

Par Frédéric Salles, Président et co-fondateur de Matooma   En 2021, le nombre total d'objets connectés utilisés atteindra les 25 milliards selon Gartner. Il est ainsi légitime de se demander quelles sont les technologies principales permettant de connecter les objets, et quelle pourrait être celle la plus adaptée pour sa solution. Un projet de vidéosurveillance par exemple n'aura absolument pas les mêmes besoins qu'un projet basé sur le relevé de température au milieu du désert. Ainsi pour trouver la meilleure connectivité pour son objet, de nombreuses questions peuvent se poser : mon objet fonctionne-t-il sur batterie ou est-il alimenté ? Mon objet restera-t-il statique ou sera-t-il mobile ?  Mon objet est-il susceptible d'être dans un endroit difficile d'accès ou enterré ? A quelle fréquence mes données doivent-elles remonter ? Etc. Voici les différentes solutions actuellement disponibles sur le marché. Courte distance : RFID/Bluetooth/WiFi La RFID (Ra

Comment les machines succombent à la chaleur, des voitures aux ordinateurs

  La chaleur extrême peut affecter le fonctionnement des machines, et le fait que de nombreuses machines dégagent de la chaleur n’arrange pas les choses. Afif Ramdhasuma/Unsplash , CC BY-SA Par  Srinivas Garimella , Georgia Institute of Technology et Matthew T. Hughes , Massachusetts Institute of Technology (MIT) Les humains ne sont pas les seuls à devoir rester au frais, en cette fin d’été marquée par les records de chaleur . De nombreuses machines, allant des téléphones portables aux voitures et avions, en passant par les serveurs et ordinateurs des data center , perdent ainsi en efficacité et se dégradent plus rapidement en cas de chaleur extrême . Les machines génèrent de plus leur propre chaleur, ce qui augmente encore la température ambiante autour d’elles. Nous sommes chercheurs en ingénierie et nous étudions comment les dispositifs mécaniques, électriques et électroniques sont affectés par la chaleur, et s’il est possible de r

De quoi l’inclusion numérique est-elle le nom ?

Les professionnels de l'inclusion numérique ont pour leitmotiv la transmission de savoirs, de savoir-faire et de compétences en lien avec la culture numérique. Pexels , CC BY-NC Par  Matthieu Demory , Aix-Marseille Université (AMU) Dans le cadre du Conseil National de la Refondation , le gouvernement français a proposé au printemps 2023 une feuille de route pour l’inclusion numérique intitulée « France Numérique Ensemble » . Ce programme, structuré autour de 15 engagements se veut opérationnel jusqu’en 2027. Il conduit les acteurs de terrain de l’inclusion numérique, notamment les Hubs territoriaux pour un numérique inclusif (les structures intermédiaires ayant pour objectif la mise en relation de l’État avec les structures locales), à se rapprocher des préfectures, des conseils départementaux et régionaux, afin de mettre en place des feuilles de route territoriales. Ces documents permettront d’organiser une gouvernance locale et dé

La fin du VHS

La bonne vieille cassette VHS vient de fêter ses 30 ans le mois dernier. Certes, il y avait bien eu des enregistreurs audiovisuels avant septembre 1976, mais c’est en lançant le massif HR-3300 que JVC remporta la bataille des formats face au Betamax de Sony, pourtant de meilleure qualité. Ironie du sort, les deux géants de l’électronique se retrouvent encore aujourd’hui face à face pour déterminer le format qui doit succéder au DVD (lire encadré). Chassée par les DVD ou cantonnée au mieux à une petite étagère dans les vidéoclubs depuis déjà quatre ans, la cassette a vu sa mort programmée par les studios hollywoodiens qui ont décidé d’arrêter de commercialiser leurs films sur ce support fin 2006. Restait un atout à la cassette VHS: l’enregistrement des programmes télé chez soi. Las, l’apparition des lecteurs-enregistreurs de DVD et, surtout, ceux dotés d’un disque dur, ont sonné le glas de la cassette VHS, encombrante et offrant une piètre qualité à l’heure de la TNT et des écrans pl

L’Europe veut s’armer contre la cybercriminalité avec le Cyber Resilience Act

  Par  Patricia Mouy , Commissariat à l’énergie atomique et aux énergies alternatives (CEA) et Sébastien Bardin , Commissariat à l’énergie atomique et aux énergies alternatives (CEA) Assez des cyberattaques  ? La loi sur la cyberrésilience, ou Cyber Resilience Act a été adoptée par les députés européens le 12 mars dernier et arrive en application dans les mois à venir, avec l’ambition de changer la donne en termes de sécurité des systèmes numériques en Europe. Alors que les systèmes numériques sont littéralement au cœur des sociétés modernes, leurs potentielles faiblesses face aux attaques informatiques deviennent des sources de risques majeurs – vol de données privées, espionnage entre états ou encore guerre économique. Citons par exemple le cas de Mirai , attaque à grande échelle en 2016, utilisant le détournement de dispositifs grand public comme des caméras connectées pour surcharger des domaines Internet d’entreprise, attaque de type DDoS (déni de service distribué)