Accéder au contenu principal

Face aux fake news, les techniques de veille peuvent vous aider

Avis d'expert d'Arnaud Marquant, directeur des opérations chez KB Crawl SAS Les fake news n’ont de cesse de se développer : selon un récent sondage, 2/3 des Français y seraient sensibles. Face à ce phénomène, les techniques propres à la veille stratégique peuvent servir de grille d’analyse. Il y a quatre ans, l’immersion de la pandémie de Covid-19 s’est caractérisée par un vaste mouvement de désinformation sur les réseaux sociaux. Loin d’avoir disparu, celui-ci perdure en 2024, comme l’indique notamment l’étude récemment réalisée par Ipsos sur la désinformation qui touche actuellement la campagne électorale européenne. Selon cette dernière, 74 % des personnes interrogées estiment être capables de réaliser un tri entre vraies et fausses informations. Dans le même temps, 2/3 des personnes interrogées (66%) adhèrent à au moins l’une des fake news qui leur ont été présentées… Comment les Françaises et les Français peuvent-ils s’armer face aux phénomènes de désinformation qui frapp

Une intelligence artificielle pour mieux analyser les appels au SAMU

samu


Par Emmanuel Lagarde, Université de Bordeaux

Chaque jour, les SAMU de France reçoivent environ 85 000 appels. Ce chiffre a presque doublé aux pires moments de la crise de la Covid-19. Le contenu de chaque appel fait l’objet d’un compte rendu informatisé au fur et à mesure des informations collectées par les différents intervenants : l’assistant de régulation médical lors de la prise d’appel, le médecin régulateur et l’assistant de régulation médical dédié à l’envoi des moyens et au suivi des bilans.

Se donner les moyens de suivre les évolutions des motifs de tous ces appels, c’est se doter d’un outil puissant et réactif d’observation de la santé de la population.

Mais en pratique, nous disposons de centaines de milliers de comptes rendus qui ressemblent par exemple à ça :

Deux comptes rendus réels d’appels au SAMU – le cas lié à la Covid-19 est évident. Mais comment prendre le temps de lire et classer 85 000 appels par jour ? Emmanuel Lagarde, Author provided

Pour savoir si l’appel correspondant à ce compte rendu est à classer plutôt dans la catégorie « suspicion de Covid-19 » ou « accident domestique », il suffit de le lire.

Mais lorsqu’il s’agit de classer les 85 000 appels du jour, la relecture est impossible. On pourrait bien sûr demander aux répondants de classer eux-mêmes ces appels, mais cela pose deux problèmes : d’abord, ils ont autre chose à faire, occupés qu’ils sont à prodiguer leurs conseils aux appelants ou à envoyer les secours les plus appropriés. L’autre raison est que, dans le feu de l’action, ils ne disposent pas toujours du recul suffisant pour faire cette classification sans être influencés par divers facteurs : pression de l’urgence, situation épidémique, priorité donnée à d’autres dossiers, sensibilité individuelle à tel ou tel dossier par exemple. C’est pour ces raisons que les tentatives faites jusque-là ont échoué à mettre en place un système de codage satisfaisant.

Un outil récent de l’intelligence artificielle à la rescousse

Nous développons une solution utilisant l’intelligence artificielle pour effectuer ce travail de classification, car elle possède deux qualités bien utiles : elle opère quasi instantanément et de manière totalement indépendante du contexte.

Pour construire un outil permettant de réaliser cette tâche, nous avons fait appel à une technologie issue d’une avancée très récente dans le domaine de l’intelligence artificielle qui porte un nom de blockbuster : le « Transformer ». Cette technologie est construite en deux phases : la première consiste à montrer au Transformer un nombre aussi grand que possible d’exemples de comptes rendus pour lui apprendre à écrire « à la manière » de ces comptes rendus. La deuxième étape consiste à entraîner le Transformer à réaliser la tâche de classification en lui « montrant » des exemples de comptes rendus avec la bonne classification, réalisée pour cette phase d’apprentissage par un humain. Plus on lui montre d’exemples, meilleur sera le Transformer lorsqu’il aura à faire la classification lui-même.

Nous avons appliqué notre Transformer aux données issues du centre 15 du SAMU de la Gironde, avant, pendant et après la période de confinement pour observer les tendances dans le motif des appels.

Admissions aux urgences en Gironde et les appels au SAMU 33 correspondant à des symptômes grippaux, extrait par le Transformer de l’ensemble des appels. Emmanuel Lagarde, Author provided

Ceci nous a appris que le nombre d’appels pour symptômes grippaux a connu un pic très important trois jours avant le début du confinement, deux semaines avant l’arrivée de patients présentant des symptômes évocateurs de Covid-19 aux urgences. On constate aussi des pics d’appels, plus tardifs, pour douleur thoracique et stress et anxiété (non représentés sur la figure), contemporains des admissions aux urgences. Les appels pour douleur thoracique correspondent en fait à des patients qui présentent des difficultés ou des détresses respiratoires, signant pour ceux atteints de la Covid-19 un stade plus grave de la maladie. Le pic des appels pour stress et anxiété témoigne pour sa part de l’inquiétude que génère ce début d’épidémie.

Il ne s’agit là que de résultats préliminaires. Nous travaillons par exemple aujourd’hui à construire des indicateurs qui permettraient de mieux distinguer les signes d’épidémie, de façon par exemple à différencier le plus tôt possible une poussée de Covid-19 de celle de la grippe saisonnière.

Comment les « Transformers » ont révolutionné les outils de lecture de texte automatiques

Le Transformer est le dernier rejeton des techniques d’analyse du langage, qui évoluent très vite.

Les applications les plus connues sont sans doute les outils de traduction automatique, par exemple l’impressionnant DeepL, mais ces techniques sont aussi mises en œuvre pour « comprendre » les textes. C’est ce qui est utilisé par exemple lorsque vous faites une recherche en langage naturel sur un moteur de recherche.

Elles peuvent aussi être utilisées pour des tâches de classification. À partir d’un texte, on peut par exemple demander à la machine de produire un résumé ou de répondre à des questions le concernant.

Pourtant, à la fin des années 80, ça semblait mal parti pour la communauté scientifique de l’apprentissage automatique : les ordinateurs d’alors, dotés des algorithmes d’alors, ne réussissaient pas à assimiler la grammaire et la structure sémantique du langage humain.

Plusieurs stratégies apparaissent dans les années suivantes. Elles sont basées sur des modèles statistiques dont les paramètres s’affinent au fur et à mesure de l’apprentissage et elles ne fournissent pas des résultats, mais seulement des probabilités de résultats : dans notre exemple, le Transformer ne dirait pas qu’un compte rendu doit être classé comme un syndrome grippal. Il dira que la probabilité que ce soit le cas est de 90 %.

Dans les années 2010, l’utilisation d’algorithmes informatiques qui singent de manière grossière le fonctionnement des réseaux de neurones renouvelle le domaine, en permettant enfin de réaliser des « apprentissages profonds », avec de nouvelles performances.

Parmi ces réseaux de neurones dits « artificiels », la famille dont fait partie le Transformer se caractérise par des modèles qui permettent de traiter les données dites « séquentielles », comme les données météo ou les suites de mots qui forment des phrases. Le Transformer apparaît en 2018, et ses performances étonnantes révolutionnent aujourd’hui la discipline.

Pourquoi Transformer est-il aussi puissant ?

Pour faire court, le Transformer est construit pour tirer des leçons des interrelations entre les différents morceaux d’une phrase (par exemple des mots ou des morceaux de mots) à partir de la lecture d’une grande quantité de textes.

Dans une première phase, dite d’« apprentissage non supervisé », le Transformer est rendu capable de produire des textes artificiels indistinguables de textes produits par des humains. On lui montre pour cela le plus grand nombre de textes possible – dans notre cas, environ 300 000 comptes rendus. À la fin de cette phase, le modèle est capable de prédire le mot qui suit une série de mots donnés. Par exemple, si on entre la phase « le petit chat s’approche du chien avec », le système proposera comme mot suivant « précaution », ou encore le mot « son ». On peut ainsi construire de manière itérative un texte artificiel en répétant le processus avec comme nouvelle phrase d’amorce « le petit chat s’approche du chien avec son ».

Le Transformer devient ainsi une machine à produire du texte synthétique. Si le résultat peut être tour à tour surprenant, abscons, amusant ou pertinent, produire du texte artificiel n’a pas beaucoup d’utilité en soi. Mais il permet, et c’est là toute sa puissance, de construire un système dédié à une tâche à moindre effort. Pour nous, il permet de classer ces comptes rendus grâce à la deuxième phase d’apprentissage, dite supervisée.

Voici deux exemples de comptes rendus artificiels produits par notre Transformer après avoir lu 300 000 comptes rendus d’appels au SAMU. Emmanuel Lagarde, Author provided

Cette deuxième phase d’apprentissage change de nature : on montre cette fois au modèle des couples formés du texte à classer et de la bonne classe, déterminée par un codeur humain. Grâce à la première phase d’apprentissage au cours de laquelle le modèle a appris à construire des phrases intelligibles, dans laquelle des notions sémantiques ont été intégrées, les exemples nécessaires pour apprendre une tâche utile deviennent très peu nombreux. Un peu comme un enfant à qui il n’est pas utile de montrer 10 000 fois comment fonctionne un biberon, un jouet ou un téléphone pour qu’il en maîtrise l’usage.

C’est ce Transformer, entraîné cette fois-ci de manière « supervisée » – c’est-à-dire avec des exemples de résultats attendus, qui nous permet pour chaque appel de déterminer automatiquement quels sont les symptômes évoqués, ou quel est la nature de l’événement concerné, un accident de la route, une chute, une toux inquiétante ou un malaise.


 Emmanuel Lagarde, Directeur de recherche INSERM, Université de Bordeaux Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.Cet article a été co-écrit par la Dr Catherine Pradeau du service SAMU-SMUR et par le Dr Cédric Gil-Jardine du service des Urgences du Centre Hospitalier Universitaire de Bordeaux.The Conversation

Posts les plus consultés de ce blog

Le bipeur des années 80 plus efficace que le smartphone ?

Par André Spicer, professeur en comportement organisationnel à la Cass Business School (City University of London) : Vous vous souvenez des bipeurs ? Ces appareils étaient utilisés largement avant l'arrivée massive des téléphones portables et des SMS. Si vous aviez un bipeur, vous pouviez recevoir des messages simples, mais vous ne pouviez pas répondre. Un des rares endroits où on peut encore en trouver aujourd’hui sont les hôpitaux. Le Service National de Santé au Royaume-Uni (National Health Service) en utilise plus de 130 000. Cela représente environ 10 % du nombre total de bipeurs présents dans le monde. Une récente enquête menée au sein des hôpitaux américains a révélé que malgré la disponibilité de nombreuses solutions de rechange, les bipeurs demeurent le moyen de communication le plus couramment utilisée par les médecins américains. La fin du bipeur dans les hôpitaux britanniques ? Néanmoins, les jours du bipeur dans les hôpitaux britanniques pourraient être compté

Comment les machines succombent à la chaleur, des voitures aux ordinateurs

  La chaleur extrême peut affecter le fonctionnement des machines, et le fait que de nombreuses machines dégagent de la chaleur n’arrange pas les choses. Afif Ramdhasuma/Unsplash , CC BY-SA Par  Srinivas Garimella , Georgia Institute of Technology et Matthew T. Hughes , Massachusetts Institute of Technology (MIT) Les humains ne sont pas les seuls à devoir rester au frais, en cette fin d’été marquée par les records de chaleur . De nombreuses machines, allant des téléphones portables aux voitures et avions, en passant par les serveurs et ordinateurs des data center , perdent ainsi en efficacité et se dégradent plus rapidement en cas de chaleur extrême . Les machines génèrent de plus leur propre chaleur, ce qui augmente encore la température ambiante autour d’elles. Nous sommes chercheurs en ingénierie et nous étudions comment les dispositifs mécaniques, électriques et électroniques sont affectés par la chaleur, et s’il est possible de r

Ce que les enfants comprennent du monde numérique

  Par  Cédric Fluckiger , Université de Lille et Isabelle Vandevelde , Université de Lille Depuis la rentrée 2016 , il est prévu que l’école primaire et le collège assurent un enseignement de l’informatique. Cela peut sembler paradoxal : tous les enfants ne sont-ils pas déjà confrontés à des outils numériques, dans leurs loisirs, des jeux vidéos aux tablettes, et, dans une moindre mesure, dans leur vie d’élève, depuis le développement des tableaux numériques interactifs et espaces numériques de travail ? Le paradoxe n’est en réalité qu’apparent. Si perdure l’image de « natifs numériques », nés dans un monde connecté et donc particulièrement à l’aise avec ces technologies, les chercheurs ont montré depuis longtemps que le simple usage d’outils informatisés n’entraîne pas nécessairement une compréhension de ce qui se passe derrière l’écran. Cela est d’autant plus vrai que l’évolution des outils numériques, rendant leur utilisation intuitive, a conduit à masquer les processus in

De quoi l’inclusion numérique est-elle le nom ?

Les professionnels de l'inclusion numérique ont pour leitmotiv la transmission de savoirs, de savoir-faire et de compétences en lien avec la culture numérique. Pexels , CC BY-NC Par  Matthieu Demory , Aix-Marseille Université (AMU) Dans le cadre du Conseil National de la Refondation , le gouvernement français a proposé au printemps 2023 une feuille de route pour l’inclusion numérique intitulée « France Numérique Ensemble » . Ce programme, structuré autour de 15 engagements se veut opérationnel jusqu’en 2027. Il conduit les acteurs de terrain de l’inclusion numérique, notamment les Hubs territoriaux pour un numérique inclusif (les structures intermédiaires ayant pour objectif la mise en relation de l’État avec les structures locales), à se rapprocher des préfectures, des conseils départementaux et régionaux, afin de mettre en place des feuilles de route territoriales. Ces documents permettront d’organiser une gouvernance locale et dé

Midi-Pyrénées l’eldorado des start-up

Le mouvement était diffus, parfois désorganisé, en tout cas en ordre dispersé et avec une visibilité et une lisibilité insuffisantes. Nombreux sont ceux pourtant qui, depuis plusieurs années maintenant, ont pressenti le développement d’une économie numérique innovante et ambitieuse dans la région. Mais cette année 2014 pourrait bien être la bonne et consacrer Toulouse et sa région comme un eldorado pour les start-up. S’il fallait une preuve de ce décollage, deux actualités récentes viennent de l’apporter. La première est l’arrivée à la tête du conseil de surveillance de la start-up toulousaine Sigfox , spécialisée dans le secteur en plein boom de l’internet des objets, d’Anne Lauvergeon, l’ancien sherpa du Président Mitterrand. Que l’ex-patronne du géant Areva qui aurait pu prétendre à la direction de grandes entreprises bien installées, choisisse de soutenir l’entreprise prometteuse de Ludovic Le Moan , en dit long sur le changement d’état d’esprit des élites économiques du pay

La fin du VHS

La bonne vieille cassette VHS vient de fêter ses 30 ans le mois dernier. Certes, il y avait bien eu des enregistreurs audiovisuels avant septembre 1976, mais c’est en lançant le massif HR-3300 que JVC remporta la bataille des formats face au Betamax de Sony, pourtant de meilleure qualité. Ironie du sort, les deux géants de l’électronique se retrouvent encore aujourd’hui face à face pour déterminer le format qui doit succéder au DVD (lire encadré). Chassée par les DVD ou cantonnée au mieux à une petite étagère dans les vidéoclubs depuis déjà quatre ans, la cassette a vu sa mort programmée par les studios hollywoodiens qui ont décidé d’arrêter de commercialiser leurs films sur ce support fin 2006. Restait un atout à la cassette VHS: l’enregistrement des programmes télé chez soi. Las, l’apparition des lecteurs-enregistreurs de DVD et, surtout, ceux dotés d’un disque dur, ont sonné le glas de la cassette VHS, encombrante et offrant une piètre qualité à l’heure de la TNT et des écrans pl