Par Maximiliano Marzetti , IÉSEG School of Management Aux États-Unis, un premier jugement autorise l’usage d’œuvres légalement acquises pour l’apprentissage des modèles d’intelligence artificielle, mais le recours à des contenus piratés est, lui, explicitement condamné. Un coup d’arrêt pour les auteurs, et un bouleversement juridique aux enjeux internationaux ? En 2024, les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson ont porté plainte contre Anthropic, l’un des géants de l’intelligence artificielle (IA), l’accusant d’avoir utilisé leurs ouvrages pour entraîner son modèle de langage Claude . Cette affaire s’inscrit dans une série de litiges similaires : au moins 47 procès ont déjà été engagés aux États-Unis, visant différentes entreprises consacrées à l’IA. La question principale ? Les modèles d’IA auraient été entraînés à partir d’œuvres protégées par le droit d’auteur, sans autorisation préalable des auteurs,...

En avril 2005, 23 bibliothèques demandent alors à l’Union européenne de réfléchir à la création d’une « bibliothèque numérique européenne. »
En mars 2006, après un appel à idées, la Commission européenne lance enfin cette bibliothèque numérique. Au cœur de celle-ci se trouveront des livres, des revues et des journaux. Pour ces derniers, la bibliothèque nationale de France (BNF) dispose d’un plan de numérisation de la presse ambitieux dont le financement de 3,5 m€ permettra le traitement de 2,1 millions de pages. Et parmi ces pages se trouveront celles de « La Dépêche du Midi. »
2,5 millions de pages
Le PDG du groupe Dépêche, Jean-Michel Baylet, et le président de la BNF, Jean-Noël Jeanneney, ont signé mercredi 17 janvier une convention de partenariat au terme de laquelle plus de 800000 pages de « La Dépêche » issues de l’édition toulousaine entre 1870 et 2003 seront hébergées et conservées en haute définition pour une consultation sur les sites internet de la BNF (Gallica) et de notre journal.
« La Dépêche » assure de son côté, à partir de son centre de documentation, de recherche éditoriale et d’édition (Cedre) la numérisation en mode texte et image de ses pages générales et de ses éditions locales éditées depuis 1870 soit… 2,5 millions de pages !
La coopération entre la BNF et « La Dépêche du Midi » s’accompagnera d’une réflexion commune sur l’expérimentation du dépôt légal de notre journal sous forme numérique.
Philippe Rioux
En mars 2006, après un appel à idées, la Commission européenne lance enfin cette bibliothèque numérique. Au cœur de celle-ci se trouveront des livres, des revues et des journaux. Pour ces derniers, la bibliothèque nationale de France (BNF) dispose d’un plan de numérisation de la presse ambitieux dont le financement de 3,5 m€ permettra le traitement de 2,1 millions de pages. Et parmi ces pages se trouveront celles de « La Dépêche du Midi. »
2,5 millions de pages
Le PDG du groupe Dépêche, Jean-Michel Baylet, et le président de la BNF, Jean-Noël Jeanneney, ont signé mercredi 17 janvier une convention de partenariat au terme de laquelle plus de 800000 pages de « La Dépêche » issues de l’édition toulousaine entre 1870 et 2003 seront hébergées et conservées en haute définition pour une consultation sur les sites internet de la BNF (Gallica) et de notre journal.
« La Dépêche » assure de son côté, à partir de son centre de documentation, de recherche éditoriale et d’édition (Cedre) la numérisation en mode texte et image de ses pages générales et de ses éditions locales éditées depuis 1870 soit… 2,5 millions de pages !
La coopération entre la BNF et « La Dépêche du Midi » s’accompagnera d’une réflexion commune sur l’expérimentation du dépôt légal de notre journal sous forme numérique.
Philippe Rioux
Les étapes de la numérisation
Après une préparation du document (débrochage, décollement, dépoussiérage), il est numérisé en niveau de gris au format Tiff. Ces fichiers numériques très lourds (15 à 40 Mo) sont ensuite compressés au format Jpeg (0,7 Mo). L’image est recadrée selon des normes strictes et des données sont intégrées au fichier. Quand le document est validé, il peut être mis en consultation sur Gallica. Là où cela devient plus intéressant, c’est que les images numérisées peuvent être analysées par un logiciel de reconnaissance optique de caractères (OCR) qui fournira du texte brut. Sur ce texte, mis en ligne sur internet, l’on pourra effectuer des recherches par titre, date, ou un simple mot-clé. Bref, toute La Dépêche au bout de votre souris d’ici 2010.