Actualité

Numérisation des bibliothèques - L'accord Google-BnF

Une coopération historique

En entamant un rapprochement sans précédent et très médiatisé avec le moteur de recherche Google, la Bibliothèque nationale de France (BnF) vient de décider de se tourner résolument vers une culture de performance et de résultat.
Les grands Gagnants ? Les lecteurs bien sûr, car avec une politique de numérisation ambitieuse, il s'agira de pouvoir donner accès au plus grand nombre à des ouvrages autrefois confinés au rez-de-jardin de l'établissement, stockés dans les archives et réservés de facto aux chercheurs et autres spécialistes.

Nous avions eu l'occasion dans un précédent article, de dénoncer la logique contre-productive qui tendait à faire s'opposer les projets de bibliothèque numérique soutenus par Google d'une part et Europeana son concurrent européen d'autre part.
Nous avons ainsi montré que la bataille de la numérisation partait d'amblée avec une longueur de retard sur le sol de la « vieille Europe ». Aujourd'hui, c'est bien le coût désormais insupportable des numérisations projetées qui devait rapprocher la BnF de son concurrent américain.

En effet, l'établissement public avec sa base Gallica, voyait son entreprise de numérisation financée à hauteur de 5 millions d'€/an, pour un coût de numérisation moyen de 43,7 € par ouvrage avec une très forte amplitude en fonction des ouvrages (de 0,12 € la page pour les documents les plus simples à près de 0,74 € pour les plus difficiles).
Résultat, une numérisation avançant à pas comptés : si le tournant de la numérisation par la BnF a permis de passer résolument d'une numérisation annuelle de 6 000 ouvrages à 100 000 ouvrages à partir de 2007, cet objectif [1] est toujours trop modeste par rapport à son concurrent américain mais aussi au regard du volume des collections.

Par exemple très peu de fonds sont actuellement dédiés par la BnF à la numérisation des périodiques, soit 2% des collections de Presse en sept ans d'ici 2012 !

Ainsi que le relève avec pertinence un rapport de l'Inspection générale des Finances, très en faveur d'un rapprochement avec l'opérateur américain : « La BnF ne pourra pas concurrencer Google par le nombre, puisque sa bibliothèque numérique atteindra au mieux la taille du seul fonds ancien de la bibliothèque nationale de Lyon que Google s'est engagé à numériser dans les années à venir, ce qui représente 5% du nombre d'ouvrages disponibles sur « Google Book Search » (le moteur de recherche de livres numérisés interfacé à la bibliothèque numérique de l'opérateur, le Google Library Project). [2] » Il faut dire que l'effectif actuellement affecté à la numérisation des collections de la BnF, est important (60 ETPT) mais doit passer de l'artisanat à la phase industrielle.
En ce sens l'inspection relève « que (l'établissement) ne parvient pas à tenir le rythme prévu, alors même qu'un nombre important d'agents est mobilisé à cet effet ».

Ces résultats ne sont pas comparables à ceux enregistrés par Google. L'opérateur américain a atteint en 2009 la numérisation de son 10 millionième ouvrage, pour un objectif total provisoire de 15 millions (quand en 2008, l'opérateur n'en était qu'à 7 millions). Il faut dire que son réseau est très structuré : 29 bibliothèques partenaires de niveau mondial dont la bibliothèque municipale de Lyon pour des fonds libres de droits numérisés représentant 8,5 millions d'ouvrages, ainsi que les fonds sous droit de 25 000 éditeurs représentant 1,5 million de références.
Bruno Racine a donc su saisir la balle au bond, d'autant que les pouvoirs publics voient d'un bon œil une synergie public-privé permettant de développer à moindre coût le processus de numérisation. Nathalie Kosciusko-Morizet secrétaire d'Etat à l'économie numérique soutient la stratégie adoptée : « La France dispose d'un fonds patrimonial formidable et il est normal qu'un acteur tel que la BnF discute avec Google pour le valoriser. Le vrai risque serait que les acteurs français soient exclus de ces discussions alors que le numérique restructure toute cette industrie ».

Google face à la justice américaine

Pour que l'opération envisagée en France soit pleinement couronnée de succès, il reste à lever l'hypothèque d'un procès déclenché avec le concours du Département de la justice américain (DoJ) contre l'accord passé entre Google et les éditeurs et auteurs américains. Il ne faudrait pas cependant se méprendre sur la portée de la décision qui sera rendue par le tribunal de New York le 7 octobre prochain. La question qui est posée est celle de savoir si les dispositions de l'accord signé n'enfreignent pas le droit de la concurrence (risque d'abus de position dominante), le droit d'auteur (concernant les publications des auteurs et éditeurs étrangers) et le droit des poursuites en nom collectif (théoriquement refusé par l'accord aux intéressés qui n'étaient pas partie à la procédure initiale). Mais quelles que soient les conclusions du tribunal, la position du Département de la Justice reste équilibrée : « Tel qu'il est rédigé actuellement, l'accord ne remplit pas les normes juridiques que cette cour doit appliquer (…) L'intérêt public serait mieux servi si la cour encourageait la poursuite de ces discussions ». En coulisse, il s'agira de transiger afin de respecter les droits des éditeurs et des auteurs européens non parties à l'accord, et de définir le mode futur de leurs rémunérations. Quant au milieu du livre américain (Association of American Publishers et Authors Guild), les propositions offertes sont généreuses : reversement de 63% des bénéfices réalisés par la vente de contenu payant en ligne, ainsi qu'une enveloppe de 125 millions de $ soit 2,7 fois plus que proposé initialement pour les ouvrages sous droits déjà numérisés. Un accord qui devrait à terme bousculer la position hégémonique d'Amazon sur la vente de livres en ligne et faire baisser les prix.

Pourtant, dès l'annonce des premières négociations avec l'opérateur américain le 18 août 2009, un aréopage hétéroclite s'est élevé une nouvelle fois sur le thème rebattu de la « marchandisation » de la culture. En fer de lance, l'acharné défenseur de l'exception française, Jean-Noël Jeanneney, l'ancien président de la BnF qui, dans les colonnes du Monde, dénonçait par avance la stratégie de l'entreprise de numérisation envisagée et son caractère systématique : « Mais qui parle d'une telle exhaustivité ?Elle est contraire au principe même de l'effort, qui consiste précisément à choisir parmi l'immensité des parutions afin d'offrir aux citoyens, aux journalistes, aux enseignant, un fil d'Ariane dans l'exploration de notre héritage culturel, contre cet ennemi essentiel : le vrac. »
En clair, l'offre culturelle « massifiée » manquerait de cohérence car elle ne serait pas réinterprétée par l'Université et nos plus brillants chercheurs.
Cette remarque a de quoi faire sourire : la liberté individuelle de chercher en suivant son propre fil de lecture est un élément clé de l'organisation numérique virtuelle. Elle néglige l'évolution des algorithmes des moteurs de recherche de Google. Elle permet à tout un chacun d'avoir un accès sans intermédiaire à la connaissance, donc sans filtre préétabli [3]. La numérisation et internet ont en outre un autre mérite qui va de pair avec la gratuité : celle de pouvoir vérifier les emprunts entre les auteurs et de combattre un fléau de la recherche scientifique : le plagia. Un élément dont pourra juger à loisir l'universalité des lecteurs.

Le futur accord arbitré en définitive par le ministre de la Culture Frédéric Mitterrand prendra nécessairement appui sur la décision du tribunal de New York (voir encadré) afin de sécuriser le processus de numérisation de la BNF. Dès à présent l'IGF propose des pistes de négociations envisagées sur la base du donnant/donnant, en attendant de pouvoir offrir aux auteurs et éditeurs français les mêmes droits que leurs homologues américains sur le sol français :

- Se concentrer sur les œuvres tombées dans le domaine public
- Venir en complément avec les programmes de numérisation du Centre national du Livre
- Procéder à un échange des bases numériques : l'opérateur américain se voyant attribuer la numérisation des collections des doubles contre le transfert à la BnF des fonds déjà numérisés à la Bibliothèque municipale de Lyon.

Le rapprochement Google-BnF est un premier pas que l'iFRAP appelait de ses vœux depuis plusieurs mois. Souhaitons qu'il permette de déboucher sur des accords plus larges permettant d'entrer dans une politique de numérisation massive conjuguant les points forts des différentes institutions en présence et de développer l'interopérabilité : une organisation des connaissances à la fois quantitative et qualitative avec à la clé une ergonomie renforcée et des économies substantielles pour les finances publiques.

Numérisation : de vastes champs d'évolution en perspective

Devant le défit posé par l'entreprise, de nombreux chantiers vont devoir être engagés. Comme le révèle une source interne, actuellement Google ne cherche pas de nouveaux partenaires en France pour le moment et Gallica ne peut pas accueillir de documents numérisés en dehors de la Bibliothèque Nationale à cause d'un « workflow » trop rigide. En clair, les fonctionnalités du logiciel de la BnF en terme de flux d'information ne permettent pas de centraliser l'ensemble des fonds numérisés au sein des autres bibliothèques française. Une particularité qui devra être réglée rapidement afin d'éviter les entreprises de numérisation en doublon.

Par ailleurs, il existe beaucoup de bibliothèques en dehors de la BnF qui conservent de nombreux documents libres de droits qui ne se trouvent pas dans les fonds de la Bibliothèque Nationale. Ce patrimoine mérite d'être numérisé. Malheureusement, pour le moment, chaque bibliothèque est contrainte de développer sa propre petite plate-forme de diffusion à sa manière et pour un prix oscillant entre 100 000 et 200 000 €. Au cours du débat public BnF/Google, cette question de la diffusion des documents numérisés n'a encore jamais été abordée.

Une mutualisation serait pourtant vraiment nécessaire. Actuellement un appel d'offres est à l'étude avec possibilité de vente de fac-similés à la demande (selon un modèle proche de celui de EOD (comme le fait actuellement l'ANRT (l'Atelier national de reproduction des thèses)) ainsi que le financement de la numérisation de documents particuliers par voie de mécénat. La Sorbonne, la Bibliothèque Sainte-Geneviève, la Bibliothèque Mazarine et l'Université de Paris VIII s'intéressent de près au sujet. Assez curieusement, le ministère de l'Enseignement Supérieur, intéressé, n'a pas accordé pour le moment les rallonges budgétaires nécessaires…

[1] Soit 300 000 volume en 3 ans à compter de 2007, soit 300 000 volumes disponibles à partir de 2010, auxquels il faut rajouter les fonds déjà numérisés jusqu'en 2007 soit 95 000 documents dont 70 000 ouvrages en mode image.

[2] Rapport sur « la bibliothèque nationale de France », Janvier 2009, p.13. N° 2008-M-065-02.

[3] Et avec l'utilisation d'algorithmes autrement plus performants que ceux qui auraient été employés en cas de systèmes autonomes et dispersés.