Accéder au contenu principal

Deepfake, décryptage d’une arnaque

Par Thomas Mannierre, Directeur EMEA Sud de BeyondTrust L’IA a fait entrer les braquages dans une nouvelle dimension. Plus besoin d’une cagoule noire désormais. En améliorant les attaques d'ingénierie sociale modernes, l’IA a donné naissance à un autre type de menaces : les deepfakes. Bienvenue dans ce qui pourrait être un épisode de Black Mirror ! Le faux CFO de Hong Kong En début d’année, une entreprise à Hong Kong s’est vue escroquée de 25,6 millions de dollars par un hacker utilisant l’IA et la technologie deepfake pour usurper l’identité d’un directeur financier. Si l'on en croit les rapports d’enquête, l'attaque a simulé un environnement de vidéoconférence complet et utilisé une fausse identité d'un important directeur financier de Hong Kong et d'autres participants à la réunion. La victime ciblée du département financier s'est d'abord méfiée d'un e-mail de phishing prétendant provenir du directeur financier. Cependant, la victime a rejoint une con

Décrypter notre génome grâce à l’intelligence artificielle

L'œuvre “Miraikan” au National Museum of Emerging Science and Innovation. MIKI Yoshihito / FlickrCC BY-SA


Par Julien Mozziconacci, Muséum national d’histoire naturelle (MNHN) et Etienne Routhier, Sorbonne Université

Toutes les cellules de notre corps contiennent la même séquence d’ADN, le même génome. Et pourtant il existe une grande variété de types cellulaires, par exemple les fibres musculaires, les cellules de la peau, du sang ou encore les neurones.

Dans chacun de ces types cellulaires, certains gènes sont exprimés, c’est-à-dire que la séquence d’ADN correspondante est transformée en ARN puis en protéines, alors que d’autres sont éteints. Les instructions qui garantissent une expression coordonnée de ces gènes au cours du développement, puis dans chaque tissu de chaque organe, sont elles-mêmes inscrites dans le génome.

Seuls 2 % de notre séquence d’ADN code pour des protéines et c’est dans les 98 % restant du génome que l’on cherche actuellement à comprendre le programme de coordination de l’expression des gènes.

C’est donc dans un livre de 3 milliards de lettres (imaginez un roman d’un million de pages !) qu’il faut décrypter les règles de ce programme.

C’est là que l’intelligence artificielle va jouer un rôle important. Mais avant de comprendre comment, il nous faut résumer ce que nous savons sur la façon dont est mis en œuvre ce programme.

Des coffres verrouillés

Les premières réponses obtenues montrent que c’est la manière dont se replie la molécule d’ADN au sein des chromosomes qui définit le programme de régulation des gènes. Une image simplifiée de ce repliement serait celle d’une chambre forte dans une banque.

Chaque coffre contient un gène, et la séquence de ce gène est utilisée pour fabriquer une protéine seulement si ce coffre est ouvert. Chaque coffre est verrouillé par une serrure à combinaison et seules quelques combinaisons sont capables de l’ouvrir.

Dans cette image, chaque cellule est une réplique de la chambre forte, une combinaison est un ensemble de facteurs de transcription, et pour chaque gène – chaque coffre – existe une combinaison unique, spécifique à la cellule. Cette combinaison correspond à l’ensemble des facteurs de transcription présents dans la cellule. Ces facteurs de transcription activent ou inhibent les gènes en se liant sur la molécule d’ADN à des endroits précis.

Ainsi, à une combinaison de facteurs de transcription donnée correspond un ensemble de coffres déverrouillés et un ensemble de gènes exprimés. Dans les différentes régions d’un embryon en train de se développer, ces facteurs peuvent être présents ou absents, et la réaction de notre génome à leur présence ou à leur absence permet l’apparition de tissus spécialisés aux endroits voulus.

À gauche, un domaine génique contenant un gène, trois amplificateurs et flanqué de deux isolants. Trois facteurs de transcription, représentés par une carrée, un rond, et un triangle, vont, lorsqu’ils sont présents dans la cellule en nombre suffisant, se lier à un amplificateur du gène pour permettre son expression. À droite, chaque domaine génique peut être comparé a un coffre-fort. Dans cette image, les isolants correspondent aux parois du coffre, les amplificateurs aux mécanismes de serrure. Le coffre s’ouvre si et seulement si les bons facteurs de transcription sont présents dans les proportions requises. Jean-François Dejouannet - MNHN / UMS 2AD / AISAuthor provided

La séquence de notre génome contient ainsi le plan qui permet de construire non seulement l’ensemble des coffres, mais aussi l’ensemble des systèmes de verrouillage de ces coffres. Ce plan fait intervenir deux types d’éléments, qui correspondent chacun à de petites séquences de quelques dizaines de lettres (A, C, T ou G). Tout d’abord les « isolants » permettent partitionner le génome, c’est-à-dire de définir là où commence et où finit chaque coffre. Ensuite les « amplificateurs » permettent de fabriquer le système de verrouillage qui valide ou invalide l’ouverture de chaque coffre. Pour avoir une idée de la taille et de la complexité de ce système, il faut imaginer que notre génome contient environ 30 000 gènes, un nombre similaire d’isolants, et des dizaines voire des centaines d’amplificateurs pour chaque gène.

Des expériences pour mieux comprendre

Pour mieux comprendre l’activité de tous ces composants au cours du développement, des expériences de grande ampleur sont réalisées aujourd’hui. Ces expériences reposent sur notre capacité à lire, ou séquencer, la succession des lettres du génome.

Les techniques de séquençage, qui était au paravent seulement utilisable sur des ensembles de millions de cellules, peuvent maintenant être appliquées aux cellules uniques.

Ces développements font entrevoir pour la première fois la possibilité de révéler simultanément l’ensemble des éléments régulateurs (isolants et amplificateurs) ainsi que leur activité dans les différentes cellules au cours du temps.

Bien que les recherches dans ce domaine avancent à grands pas grâce aux nouvelles technologies, une question reste en suspens : comment déterminer l’effet d’une variation du génome sur le processus de régulation des gènes ?

Cette question est d’une importance cruciale pour comprendre pourquoi certaines maladies ont une prédisposition génétique et ainsi comment mieux soigner un individu lorsque l’on connaît son patrimoine génétique.

On observe en effet couramment que certaines variations récurrentes du génome peuvent avoir un rôle dans l’apparition ou l’aggravation de maladies. La grande majorité de ces variations apparaît dans des régions du génome qui ne sont pas des gènes, mais des régions isolantes ou amplificatrices.

Un algorithme pour analyser les séquences d’ADN

Pour comprendre l’effet de ces variations du génome, il est maintenant possible de recourir à l’intelligence artificielle. L’idée est simple : utiliser toutes les données expérimentales obtenues jusqu’ici pour entraîner un algorithme à prédire l’activité des régions isolantes et amplificatrices en fonction de leur séquence génomique.

Pour cela, il faut tout d’abord convertir les quatre lettres A, C, T et G en langage binaire de 0 et de 1. Puis on entraîne des réseaux de neurones similaires à ceux qu’utilisent les algorithmes de reconnaissance d’images, utilisés par exemple pour numériser des documents manuscrits ou pour analyser les images des caméras embarquées de véhicules autonomes.

Toutes ces applications sont basées sur le même principe : convertir un ensemble de chiffres, appelé entrée, en un autre ensemble de chiffres, appelé sortie. Cette conversion s’obtient en plusieurs étapes. Un ensemble de pré-sorties sont calculées par la multiplication de chaque chiffre de l’entrée par un coefficient puis par l’addition des résultats obtenus. Ce processus est répété en changeant les coefficients pour générer des centaines ou des milliers de pré-sorties qui vont constituer une couche du réseau. L’ensemble des pré-sorties de cette première couche sert d’entrée à une deuxième couche. Plusieurs couches sont ainsi empilées jusqu’à la dernière, qui donne la sortie du réseau. Le processus d’entraînement consiste à fixer les valeurs des coefficients qui font correspondre chacune des entrées à la sortie correspondante. Pour tester ces valeurs et les optimiser, il faut ainsi faire des milliards d’opérations, toutes très simples. Cela est aujourd’hui possible grâce aux performances des cartes graphiques modernes développées initialement pour les jeux vidéo.

Un réseau de neurones est entraîné pour associer à une séquence d’ADN sa fonction d’isolant ou d’amplificateur, ainsi que la combinaison correspondant à son activation s’il s’agit d’un amplificateur. Le réseau peut ensuite être utilisé pour scanner le génome en entier et prédire les règles de régulation des gènes d’un individu. Jean-François Dejouannet - MNHN / UMS 2AD / AIS, Author provided

Dans notre cas, l’entrée va être une suite de 0 et de 1 qui correspond à une séquence d’ADN binarisée. La sortie va correspondre à une autre suite de 0 et de 1 qui va représenter une annotation fonctionnelle (par exemple 10 ou 01 pour « amplificateur » ou « isolant » et 00001000 ou 01000000 vont correspondre à différentes combinaisons de facteurs de transcription). Une fois l’algorithme entraîné, il devient alors possible de l’utiliser pour prédire l’annotation fonctionnelle d’une séquence dont on aurait changé une ou plusieurs lettres : les fameuses variations. Une équipe de chercheurs de l’Université de Princeton a ainsi testé les variations du génome connues pour être fréquentes chez les personnes autistes et a pu identifier comment elles modifiaient la combinaison de gènes exprimés dans les cellules du cerveau.

La même méthodologie a été appliquée à d’autres maladies parmi lesquelles la maladie de Crohn ou l’infection chronique à l’hépatite B. Dans les prochaines années, la médecine personnalisée devrait pouvoir utiliser cette méthodologie pour adapter un traitement en fonction de données génomiques recueillies pour chaque individu.The Conversation

Julien Mozziconacci, Professeur en biologie computationelle, Muséum national d’histoire naturelle (MNHN) et Etienne Routhier, Doctorant en data science, Sorbonne Université Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Posts les plus consultés de ce blog

Le bipeur des années 80 plus efficace que le smartphone ?

Par André Spicer, professeur en comportement organisationnel à la Cass Business School (City University of London) : Vous vous souvenez des bipeurs ? Ces appareils étaient utilisés largement avant l'arrivée massive des téléphones portables et des SMS. Si vous aviez un bipeur, vous pouviez recevoir des messages simples, mais vous ne pouviez pas répondre. Un des rares endroits où on peut encore en trouver aujourd’hui sont les hôpitaux. Le Service National de Santé au Royaume-Uni (National Health Service) en utilise plus de 130 000. Cela représente environ 10 % du nombre total de bipeurs présents dans le monde. Une récente enquête menée au sein des hôpitaux américains a révélé que malgré la disponibilité de nombreuses solutions de rechange, les bipeurs demeurent le moyen de communication le plus couramment utilisée par les médecins américains. La fin du bipeur dans les hôpitaux britanniques ? Néanmoins, les jours du bipeur dans les hôpitaux britanniques pourraient être compté

Comment les machines succombent à la chaleur, des voitures aux ordinateurs

  La chaleur extrême peut affecter le fonctionnement des machines, et le fait que de nombreuses machines dégagent de la chaleur n’arrange pas les choses. Afif Ramdhasuma/Unsplash , CC BY-SA Par  Srinivas Garimella , Georgia Institute of Technology et Matthew T. Hughes , Massachusetts Institute of Technology (MIT) Les humains ne sont pas les seuls à devoir rester au frais, en cette fin d’été marquée par les records de chaleur . De nombreuses machines, allant des téléphones portables aux voitures et avions, en passant par les serveurs et ordinateurs des data center , perdent ainsi en efficacité et se dégradent plus rapidement en cas de chaleur extrême . Les machines génèrent de plus leur propre chaleur, ce qui augmente encore la température ambiante autour d’elles. Nous sommes chercheurs en ingénierie et nous étudions comment les dispositifs mécaniques, électriques et électroniques sont affectés par la chaleur, et s’il est possible de r

De quoi l’inclusion numérique est-elle le nom ?

Les professionnels de l'inclusion numérique ont pour leitmotiv la transmission de savoirs, de savoir-faire et de compétences en lien avec la culture numérique. Pexels , CC BY-NC Par  Matthieu Demory , Aix-Marseille Université (AMU) Dans le cadre du Conseil National de la Refondation , le gouvernement français a proposé au printemps 2023 une feuille de route pour l’inclusion numérique intitulée « France Numérique Ensemble » . Ce programme, structuré autour de 15 engagements se veut opérationnel jusqu’en 2027. Il conduit les acteurs de terrain de l’inclusion numérique, notamment les Hubs territoriaux pour un numérique inclusif (les structures intermédiaires ayant pour objectif la mise en relation de l’État avec les structures locales), à se rapprocher des préfectures, des conseils départementaux et régionaux, afin de mettre en place des feuilles de route territoriales. Ces documents permettront d’organiser une gouvernance locale et dé

La fin du VHS

La bonne vieille cassette VHS vient de fêter ses 30 ans le mois dernier. Certes, il y avait bien eu des enregistreurs audiovisuels avant septembre 1976, mais c’est en lançant le massif HR-3300 que JVC remporta la bataille des formats face au Betamax de Sony, pourtant de meilleure qualité. Ironie du sort, les deux géants de l’électronique se retrouvent encore aujourd’hui face à face pour déterminer le format qui doit succéder au DVD (lire encadré). Chassée par les DVD ou cantonnée au mieux à une petite étagère dans les vidéoclubs depuis déjà quatre ans, la cassette a vu sa mort programmée par les studios hollywoodiens qui ont décidé d’arrêter de commercialiser leurs films sur ce support fin 2006. Restait un atout à la cassette VHS: l’enregistrement des programmes télé chez soi. Las, l’apparition des lecteurs-enregistreurs de DVD et, surtout, ceux dotés d’un disque dur, ont sonné le glas de la cassette VHS, encombrante et offrant une piètre qualité à l’heure de la TNT et des écrans pl

Des conseils d'administration inquiets et mal préparés face à la menace cyber

Alors que les Assises de la Sécurité ouvrent leurs portes ce mercredi 11 octobre, pour trois jours de réflexion sur l’état de la cybersécurité en France, la société de cybersécurité Proofpoint f ait le point sur le niveau de préparation des organisations face à l’avancée de la menace.  Cette année encore, les résultats montrent que la menace cyber reste omniprésente en France et de plus en plus sophistiquée. Si les organisations en ont bien conscience,  augmentant leur budget et leurs compétences en interne pour y faire face, la grande majorité d’entre elles ne se sont pour autant, pas suffisamment préparées pour l’affronter réellement, estime Proofpoint. En France, 80 % des membres de conseils d’administration interrogés estiment que leur organisation court un risque de cyberattaque d’envergure, contre 78 % en 2022 – 36 % d’entre eux jugent même ce risque très probable. Et si 92 % d’entre eux pensent que leur budget lié à la cybersécurité augmentera au cours des 12 prochains mois, ces

L’Europe veut s’armer contre la cybercriminalité avec le Cyber Resilience Act

  Par  Patricia Mouy , Commissariat à l’énergie atomique et aux énergies alternatives (CEA) et Sébastien Bardin , Commissariat à l’énergie atomique et aux énergies alternatives (CEA) Assez des cyberattaques  ? La loi sur la cyberrésilience, ou Cyber Resilience Act a été adoptée par les députés européens le 12 mars dernier et arrive en application dans les mois à venir, avec l’ambition de changer la donne en termes de sécurité des systèmes numériques en Europe. Alors que les systèmes numériques sont littéralement au cœur des sociétés modernes, leurs potentielles faiblesses face aux attaques informatiques deviennent des sources de risques majeurs – vol de données privées, espionnage entre états ou encore guerre économique. Citons par exemple le cas de Mirai , attaque à grande échelle en 2016, utilisant le détournement de dispositifs grand public comme des caméras connectées pour surcharger des domaines Internet d’entreprise, attaque de type DDoS (déni de service distribué)