Grand débat : la démocratie à l'épreuve de l'intelligence artificielle

ia


Le Grand débat national voulu par Emmanuel Macron et censé répondre à la crise des Gilets jaunes se poursuit jusqu'au 15 mars, mais déjà l'heure de l'analyse des contributions a sonné. C'est que, pour l'exécutif, il est capital d'obtenir le plus rapidement possible la synthèse de ces milliers de contributions déposées sur le site internet, envoyées par courrier, émises lors des réunions locales ou encore écrites sur les cahiers citoyens mis à disposition par les maires. Objectif pour Emmanuel Macron qui a promis des «décisions fortes» : disposer dès la clôture du débat d'éléments pour prendre rapidement des décisions politiques et leurs modalités (référendum, Grenelle social, etc.).

Depuis mercredi dernier, les maires rendent aux préfets «les cahiers de doléances» ou les formulaires d'expression citoyenne, ouverts depuis le 16 janvier dans quelque 10 000 communes. Ils seront transmis à la Bibliothèque nationale de France (BNF) d'ici demain lundi.

«La BNF se chargera de référencer, d'indexer et de numériser leurs contenus. Ces données seront transmises pour analyse au consortium piloté par Roland Berger, associé à Cognito et BlueNove, prestataires de la Mission du grand débat national spécialisés dans la civic tech, l'intelligence collective et le traitement de données de masse», a précisé le gouvernement.


Une première en France

Car face au nombre colossal de données à traiter – la plateforme a franchi le cap du million de contributions – le gouvernement va se faire aider par l'intelligence artificielle. Une première en France dans un cadre aussi vaste.

L'institut de sondage OpinionWay a été chargé d'analyser les résultats de la consultation en ligne. Les contributions au Grand débat seront closes le 18 mars ; leur restitution publique est calée pour fin mars. Un délai très court.

Opinion Way, qui a remporté un marché public attribué dès 2015 pour une mission d'«analyse de données issues de consultations en ligne» a déjà traité les résultats d'une dizaine de consultations organisées par plusieurs ministères. Concrètement, OpinionWay va récupérer deux types de données : le résultat des questionnaires en ligne sur le site et les propositions libres des internautes. Dans le premier cas, les choses sont simples : en fonction des réponses cochées dans les formulaires, OpinionWay calculera des pourcentages (ni pondérés ni redressés, contrairement aux sondages).

Algorithmes et deep learning
Dans le second cas en revanche, il faut trier des verbatims. Pour ce faire, OpinionWay s'est associée à la société française Qwam Content, spécialisée dans la veille sur le web et l'analyse sémantique. Qwam est capable de traiter des volumes massifs de texte en s'appuyant sur des algorithmes et de l'intelligence artificielle. La machine lit chacun des verbatims et les compare à un dictionnaire de notions : mots, groupes de mots, idées, etc. Avec cette technologie de l'apprentissage profond (deep learning), «le système reconnaît les contextes et peut deviner le sens d'un mot à 99 %», assure le directeur général de Qwam, Christian Langevin.

Dans le cas où les verbatims ne seraient pas compris par la machine, ils seront repris manuellement par une équipe d'une vingtaine d'analystes qui les lui «apprendra».

Attention aux biais

Reste que cette méthode de traitement des contributions du grand débat soulève des questions, car il existe certains biais.

Le premier est que les contributeurs du site granddebat.fr créent un compte qui ne leur demande qu'une adresse e-mail et un code postal. La plateforme ne connaît ainsi ni leur lieu de résidence, ni s'il s'agit d'un homme ou d'une femme, ni la catégorie sociale à laquelle ils appartiennent ou même leur profession. «Ne pas disposer des variables telles que l'âge ou la profession, c'est s'exposer à toutes sortes de biais sachant que les groupes sociaux ne vont pas se mobiliser de façon uniforme», expliquait dans Le Monde Sébastien Delarre, sociologue de l'université Lille-I. Dès lors, la plateforme s'expose à des opérations de lobbying orchestrées par des groupes très organisés qui vont poster les mêmes propositions pour pousser leurs idées. On a vu un tel phénomène sur la consultation en ligne lancée par le Conseil économique, social et environnemental (Cese), achevée le 4 janvier, qui avait fait émerger comme idée l'abrogation de la loi sur le mariage pour tous… après une forte mobilisation de la Manif pour tous.

Le second biais concerne le dictionnaire de notions que vont utiliser OpinionWay et ses partenaires. Les algorithmes ne sont pas neutres : le dictionnaire utilisé a préalablement été alimenté par certains termes. «L'algorithme répond toujours à une finalité, cette finalité est déterminée par l'Homme», rappelait David Forst, docteur en théorie politique à l'université Paris I, lors d'un colloque organisé par le ministère de la Justice en juin dernier.

Le gouvernement est conscient de ces problématiques et a mis en accès libre (open data) toutes les données de la plateforme. «On ne va rien cacher. Tout sera accessible», indiquait à La Dépêche la semaine dernière le ministre des Collectivités territoriales Sébastien Lecornu.

Des analyses alternatives

De fait, les contributions seront analysées par le gouvernement, mais aussi par d'autres, chercheurs ou associations. Ainsi la plate-forme grandeannotation.fr propose à tous ceux qui le souhaitent de catégoriser des contributions. «Lisons et catégorisons les textes écrits dans le cadre du grand débat pour faire émerger les idées les plus répandues et regrouper les réponses similaires», explique le projet soutenu par le collectif Code for France. 300 personnes ont ainsi annoté plus de 210 000 contributions.

Autre initiative, celle de chercheurs qui ont lancé l'Observatoire des débats, copiloté par l'Institut de la concertation et de la participation citoyenne (ICPC) et le GIS Démocratie et Participation. «Un protocole d'observation a été élaboré sous la direction de Martial Foucault, directeur du Cevipof (CNRS-Sciences Po), qui prévoit le suivi d'environ 60 débats par semaine, sélectionnés par tirage au sort afin de représenter au mieux l'ensemble du territoire français», explique le projet, qui fournira une évaluation indépendante en avril.

Ces initiatives sont dès lors autant de garde-fous qui permettront d'avoir au final une analyse très fine de ce qui s'est vraiment dit au cours du Grand débat.

0 commentaires: