Accéder au contenu principal

Comment fonctionne ChatGPT ? Décrypter son nom pour comprendre les modèles de langage

Par  Frédéric Alexandre , Inria On voit passer beaucoup d’avis sur ChatGPT, mais finalement, qu’en sait-on ? Juste que c’est un réseau de neurones artificiels avec des milliards de paramètres, capable de tenir une discussion de haut niveau, mais aussi de tomber dans des pièges grossiers tendus par des internautes facétieux. On nous parle beaucoup de lui mais on en sait finalement très peu sur son fonctionnement. Je vous propose donc de présenter les mécanismes principaux sur lesquels ChatGPT repose et de montrer ainsi que, si le résultat est parfois impressionnant, ses mécanismes élémentaires sont astucieux mais pas vraiment nouveaux. Pour ce faire, passons en revue les différents termes du sigle « ChatGPT ». T comme transformer Un « transformer » est un réseau de neurones qui bénéficie du même algorithme d’apprentissage que les réseaux profonds ( deep networks ), qui a déjà fait ses preuves pour l’entraînement de grosses architectures. Il bénéficie également de deux caractéristi

Twitter, Facebook et Google dans le viseur de l'UFC


Vous êtes-vous déjà intéressé aux conditions générales d’utilisation des réseaux sociaux tels que Facebook, Twitter, Google plus ou d’autres ? Certainement pas et ceux d’entre nous qui l’ont fait se sont perdus dans les méandres de pages interminables, parfois en anglais, au langage technique ou aux formulations absconses. Et pourtant, ces textes encadrent l’utilisation que font les géants d’internet des données collectées auprès de leurs utilisateurs. Une utilisation peut-être conforme au droit américain mais certainement pas à la vision que s’en font les Européens.

L’UFC dénonce des centaines de clauses abusives ou illicites

En juin dernier, l’association de défense des consommateurs UFC-Que Choisir avait alors mis en demeure les trois principaux réseaux sociaux de modifier leurs conditions générales. En vain. Hier l’association est passée à l’étape supérieure en les assignant devant le tribunal de grande instance de Paris, pointant des clauses jugées « abusives ou illicites » et très nombreuses (180 pour l’un des réseaux). « Les conditions sont toujours aussi inaccessibles, illisibles, remplies de liens hypertextes. Pire, les réseaux persistent à s’autoriser très largement la collecte, la modification, la conservation et l’exploitation des données des utilisateurs et même de leur entourage. Ils s’octroient toujours, sans l’accord particulier des utilisateurs, une licence mondiale, illimitée et sans rémunération, d’exploitation et de communication des données à des partenaires économiques. Bref, non seulement vous êtes l’objet de publicité ciblée mais en outre vos données peuvent faire l’objet d’une exploitation commerciale (publicité, ouvrages, etc.) sans votre accord exprès et sans le moindre centime », dénonce l’association.
Saluant le travail du Parlement européen qui vient d’adopter un règlement et une directive, l’UFC demande à l’Union et aux États membres de mettre en œuvre rapidement ces nouveaux textes. Ce qu’ils ne feraient pas assez vite, déplore l’association. Car le débat pose aussi la question de trouver un subtil et difficile équilibre entre, d’un côté, la légitime protection des données personnelles et, de l’autre, la libre circulation des informations en tant que moteur commercial.

Des milliards de dollars en jeu

Les enjeux, il est vrai, sont colossaux. « La valeur des données personnelles est évaluée à 300 milliards de dollars aujourd’hui, 1 000 en 2020 », rappelait l’eurodéputée Françoise Castex lors d’un débat sur la protection des données organisé récemment à l’université Toulouse I-Capitole. Les intérêts économiques se heurtent aussi à la différence d’approche de part et d’autre de l’Atlantique. « En dehors des données sensibles, l’utilisation des données aux USA fait partie de la liberté du commerce » confirme Me Winston Maxwell, avocat chez Hogan Lovells, qui se veut toutefois optimiste.
En effet, les choses pourraient évoluer. Les affaires des écoutes de la NSA interrogent outre-Atlantique jusqu’à la Maison Blanche, où Barack Obama est conscient de la nécessité de faire des gestes envers ses alliés européens. « Aujourd’hui, beaucoup d’Américains veulent se rapprocher des positions européennes », assure Me Maxwell.

« Je garde la main sur mes données » 

85 % des Français sont préoccupés par la protection de leurs données personnelles, mais restent impuissants à les contrôler : seuls 24 % disent être parvenus totalement à les effacer. Forte de ce constat, l’UFC a lancé une campagne de sensibilisation doublée par une pétition « Je garde la main sur mes données » pour exiger des pouvoirs publics « une réelle protection de la vie privée et la non-utilisation de nos données à notre insu. » L’association a mis en ligne sur son site quechoisir.org des didacticiels pour sécuriser un profil, activer les options antitraçage de l’ordinateur ou encore effacer des données à distance sur les terminaux mobiles. 

Posts les plus consultés de ce blog

Le bipeur des années 80 plus efficace que le smartphone ?

Par André Spicer, professeur en comportement organisationnel à la Cass Business School (City University of London) : Vous vous souvenez des bipeurs ? Ces appareils étaient utilisés largement avant l'arrivée massive des téléphones portables et des SMS. Si vous aviez un bipeur, vous pouviez recevoir des messages simples, mais vous ne pouviez pas répondre. Un des rares endroits où on peut encore en trouver aujourd’hui sont les hôpitaux. Le Service National de Santé au Royaume-Uni (National Health Service) en utilise plus de 130 000. Cela représente environ 10 % du nombre total de bipeurs présents dans le monde. Une récente enquête menée au sein des hôpitaux américains a révélé que malgré la disponibilité de nombreuses solutions de rechange, les bipeurs demeurent le moyen de communication le plus couramment utilisée par les médecins américains. La fin du bipeur dans les hôpitaux britanniques ? Néanmoins, les jours du bipeur dans les hôpitaux britanniques pourraient être compté

Univers parallèles et mondes virtuels : la guerre des métavers est commencée

  Une partie de poker dans le métavers (capture d'écran de la vidéo “Le métavers et comment nous allons le construire ensemble” sur YouTube) Par  Oihab Allal-Chérif , Neoma Business School Le 17 octobre 2021, Mark Zuckerberg a lancé les hostilités de manière assez théâtrale, comme s’il défiait ses concurrents d’en faire autant. Afin de concrétiser son rêve d’enfant, le métavers, il a décidé de mettre en œuvre des moyens colossaux : 10 000 ingénieurs hautement qualifiés seront recrutés en Europe dans les 5 prochaines années. Cette annonce a été faite quelques jours avant celle du changement de nom du groupe Facebook en Meta , le 28 octobre, démontrant ainsi l’engagement total du fournisseur de réseaux sociaux dans la transition vers le métavers. Le 22 juillet 2021, dans une interview à The Verge , le créateur de Facebook racontait : « Je pense à certains de ces trucs depuis le collège quand je commençais tout juste à coder. […] J’écrivais du code

La fin des cookies tiers ne répond pas au besoin de contrôle des internautes sur leurs données

Pour le moment, la plupart des solutions alternatives aux cookies privilégient l’objectif commercial aux dépens des attentes des internautes. Piqsels , CC BY-SA Par  Carlos Raúl Sánchez Sánchez , Montpellier Business School – UGEI ; Audrey Portes , Montpellier Business School – UGEI et Steffie Gallin , Montpellier Business School – UGEI Les révélations du Wall Street Journal contenues dans les « Facebook Files » , publiés en septembre dernier, ont une nouvelle fois montré que les utilisateurs s’exposaient à des risques liés à la divulgation des informations personnelles. Les réseaux sociaux ne sont pas les seuls en cause : les nombreux data breach (incidents de sécurité en termes de données confidentielles) rendus publics, illustrent régulièrement la vulnérabilité des individus face à une navigation quotidienne sur les moteurs de recherche, sites de e-commerce et autres ayant recours à des « cookies tiers » , ces fichiers de données envoyés par

Midi-Pyrénées l’eldorado des start-up

Le mouvement était diffus, parfois désorganisé, en tout cas en ordre dispersé et avec une visibilité et une lisibilité insuffisantes. Nombreux sont ceux pourtant qui, depuis plusieurs années maintenant, ont pressenti le développement d’une économie numérique innovante et ambitieuse dans la région. Mais cette année 2014 pourrait bien être la bonne et consacrer Toulouse et sa région comme un eldorado pour les start-up. S’il fallait une preuve de ce décollage, deux actualités récentes viennent de l’apporter. La première est l’arrivée à la tête du conseil de surveillance de la start-up toulousaine Sigfox , spécialisée dans le secteur en plein boom de l’internet des objets, d’Anne Lauvergeon, l’ancien sherpa du Président Mitterrand. Que l’ex-patronne du géant Areva qui aurait pu prétendre à la direction de grandes entreprises bien installées, choisisse de soutenir l’entreprise prometteuse de Ludovic Le Moan , en dit long sur le changement d’état d’esprit des élites économiques du pay

ChatGPT et cybersécurité : quels risques pour les entreprises ?

Analyse de Proofpoint Les plateformes de génération de texte tel que ChatGPT permettent de créer du contenu de qualité, instantanément, gratuitement, et sur n’importe quel sujet. Comme le confirme le lancement de Bard par Google, nous sommes désormais entrés dans une course à l’IA, ou chaque géant du web cherche à posséder la meilleure solution possible. Si l’avancée technologique est majeure, le risque notamment pour la cybersécurité des entreprises est indéniable. Comment lutter contre des campagnes de phishing de plus en plus ciblées et sophistiquées, maintenant alimentées par des technologies capables de parfaire encore plus la forme et la teneur d’un email malveillant ? En quelques mots, ChatGPT offre une ingénierie sociale très performante, mais une automatisation encore limitée. Concernant la détection de la menace par rançongiciels, comme l’explique Loïc Guézo, Directeur de la stratégie Cybersécurité chez Proofpoint, « Bien que les chatbots puissent générer du texte pour le cor

Décryptage de l'attaque par ransomware du Centre Hospitalier de Versailles

  Par Cassie Leroux, Directrice Produit chez Mailinblack Après l’hôpital de Corbeilles Essonnes, c’est au tour de l'établissement hospitalier de Versailles, situé au Chesnay-Rocquencourt (Yvelines), d’être visé depuis samedi soir par une cyberattaque. Comment s’est-elle déroulée, quelles conséquences pour ses patients, et aurait-elle pû être évitée ? Décryptage de Cassie Leroux, Directrice Produit chez Mailinblack. Que savons-nous de cette attaque ? Cette cyberattaque vise l’ensemble de l'établissement, dont l'hôpital André-Mignot, la maison de retraite Despagne et l'hôpital Richaud à Versailles. L’hôpital continue de fonctionner, mais au ralenti ce lundi, ce qui perturbe sérieusement son activité. Le parquet de Paris a ouvert une enquête préliminaire pour tentative d'extorsion.  Cette cyberattaque est de type Ransomware, un logiciel malveillant qui bloque l’accès à aux outils informatiques et aux données en les chiffrant. Dans ce type d’attaque, le hacker demande g