4. La mutualisation des contenus collaboratifs au service de la médiation en bibliothèque publique : le projet babelthèque

Soumis par cvigneault le mer 04/01/2017 - 16:46

 

 

Avec l'émergence des outils de sociabilisation et de contribution sur Internet, le rôle du lecteur dans la découverte de livres a connu une importance renouvelée. Les types de contenus exploitables au sein des catalogues de bibliothèques sont hétérogènes : des bases de critiques ou avis, aux métadonnées de classification en passant par les systèmes de recommandation fondés sur des données de lecteurs. Au-delà de leur valeur ajoutée pour favoriser la prescription de livres au sein des bibliothèques, la constitution de ces bases de contenus nécessite une importante mutualisation des plates-formes de partage* et d'expression. En effet, la mise en commun des ressources se justifie par des contraintes technologiques, avec la possibilité de bénéficier collectivement de développements techniques complexes, et par des enjeux sociaux, avec le besoin de créer un espace de partage entre lecteurs élargi au-delà des communautés locales des bibliothèques.

 

Babelio : quand les internautes mettent en commun leurs lectures


Du catalogage communautaire au réseau social de lecteurs

Notre expérience naît à la fin de l’année 2006, alors qu’émerge une tendance qu’on désigne à l’époque par le terme, devenu désuet, de Web 2.0. Internet se transforme et, d’une plate-forme de diffusion d’information accessible à une minorité, devient un espace auquel chacun peut apporter sa contribution, le Time consacrant l’internaute “you” comme personnalité de l’année. Dans ce contexte, il apparaît qu’un espace ouvert et collaboratif doit permettre de faciliter l’échange et la découverte de livres. C’est ainsi qu’est lancé le projet d’un réseau social de lecteurs francophones : Babelio. À sa naissance en 2007, le service permet aux internautes de créer leur bibliothèque virtuelle : d’enregistrer les livres qu’ils ont lus ou souhaiteraient lire, d’ajouter des mots-clés d’indexation de leurs lectures ou encore de publier des critiques ou des extraits de leurs livres. Les contributions des internautes sont ainsi agrégées et accessibles sur une page dédiée à chaque titre. Il apparaît évident dès l’origine du service que sa force résidera dans la mutualisation des apports de nombreux lecteurs. Alors que plus de 60 000 livres sont publiés en France chaque année, proposer une information de qualité sur l’ensemble de la production éditoriale ne peut émerger que d’une collaboration entre de nombreux lecteurs.

L’interface du site s’est raffinée progressivement au cours des neuf dernières années, permettant des enrichissements variés. Nous essaierons dans un premier temps de dresser une typologie des contenus bibliographiques qui sont mutualisés sur notre plate-forme, avant de présenter comment les bibliothèques se sont approprié cet outil collaboratif, pour diffuser leurs contributions ou enrichir leurs catalogues.

Le cœur originel du service est de permettre aux internautes de créer le catalogue personnel de leurs lectures passées, actuelles ou futures et de les qualifier en donnant une note sur chaque livre. En 2016, environ 300 000 livres sont ajoutés par l’ensemble des membres de la communauté chaque mois, pour un total de 12 millions depuis la création du site, dont 5 millions ont été notés. Nous reviendrons plus en détail sur les usages indirects qui peuvent être faits de ces informations, mais notons d’emblée que c’est bien la mise en commun des données sur les goûts de lecture des internautes qui permet de donner l’information la plus précise possible sur le catalogue de titres le plus étendu ; la gageure du service réside dans ce besoin d’exhaustivité.

La démocratisation de la critique littéraire

Chaque jour, 800 nouvelles critiques sont publiées sur Babelio, pour un total de plus d’un million depuis la création du site. La qualité de ces contributions peut difficilement être évaluée de manière objective, mais la nature même du cœur de la communauté (passionnés de lecture, professeurs, documentalistes, bibliothécaires ou libraires) a rapidement imposé un standard assez exigeant en comparaison de sites marchands ou d’autres espaces de contribution sur Internet. En moyenne, une critique sur Babelio est de 1 100 caractères ; même si elles revendiquent une forte subjectivité, sans exigence de professionnalisme on est donc loin du simple avis de consommateur. Notons par ailleurs que si le cœur originel de la communauté est fait de lecteurs de littérature générale, celui-ci s’est étendu à des genres variés.

Tableau. Volume de critiques par catégorie éditoriale
Catégorie éditoriale Volume de critiques
Romans policiers 209 618
Littérature jeunesse 205 061
Science-fiction 102 313
Bande dessinée 102 067
Sciences humaines 80 899
Fantasy 78 345

La modération est un enjeu important, en apparence, de ces pratiques de critiques mutualisées sur Internet. L’absence de barrières étant une condition sine qua non à la contribution, il est impossible de contrôler ex ante la qualité des critiques. Néanmoins, les contributions se font sous le régime, non pas de l’anonymat, mais du « pseudonymat ». Ainsi, si les internautes contribuent avec des identités fictives, ils recréent également un écosystème de réputation et de confiance qu’ils cherchent à maintenir dans la durée, à la fois en soignant leurs propres contributions et en relevant d’éventuels abus, construisant ainsi un système d’autogestion efficace. En outre, la nature même d’une communauté littéraire est moins sujette aux excès que l’on pourrait retrouver ailleurs sur Internet. Enfin il est assez aisé de dégager des constances dans les usages anormaux, et de construire des algorithmes pour les détecter. De facto, les très rares cas de modération concernent surtout des critiques artificiellement positives, rapidement identifiées par des comportements types : publication d’une unique critique très positive sur un titre, afflux de critiques sur une courte période, lexique ou sémantique spécifique, pour n’en citer que quelques-uns.

De la mise en commun des contributions aux nouvelles formes de recommandation

Si la mutualisation des critiques permet un changement de degré avec un important volume de contributions, elle offre également pour d’autres types de contenus un véritable changement de nature. Les membres de Babelio sont par exemple invités à ranger leurs livres dans des étagères virtuelles en les indexant avec des « étiquettes » de classement, en toute liberté. Le lecteur peut ainsi classer un livre avec des mots-clés aussi divers que « space opera », « littérature argentine » ou « roman graphique ». Chaque contribution, prise isolément, est d’une valeur documentaire limitée car elle n’est pas soumise à des règles de classification ordonnées et structurées. Tel lecteur utilisera le terme « seconde guerre mondiale » là où un autre parlera de « guerre 39-45 », tel autre utilisera des mots-clés subjectifs comme « émouvant » ou personnels comme « emprunté ». Mais la mutualisation d’un grand volume de mots-clés permet de faire émerger une vraie valeur documentaire de classification.

nuage

Nuage de mots-clés sur la bande dessinée Ici, de Richard Mc Guire Ici

En effet, si ce qu’on appelle aussi folksonomie n’a pas la rigueur des taxinomies professionnelles, elle n’en a pas non plus la rigidité. Ainsi, les internautes utilisent un langage plus évolutif et dynamique, dans le vocabulaire propre aux lecteurs et contemporain de leurs usages. Ces données agrégées permettent finalement de dresser une très bonne carte d’identité du livre et partant, de répondre à des requêtes précises, par exemple pour un lecteur cherchant un « roman graphique » sur « le temps qui passe ».

Par ailleurs, ces métadonnées sont essentielles à la construction des moteurs de recommandation de lectures automatisés du type « Si vous avez aimé ce livre, nous vous suggérons également… ». Ces outils algorithmiques sont un champ de la recherche très dynamique, mais la vraie révolution de la discipline vient de l’accès à des volumes importants de métadonnées, notamment par la mutualisation des données des lecteurs. Dans le cas de Babelio, nous utilisons essentiellement deux logiques complémentaires : tout d’abord le filtrage dit collaboratif, qui tente de prédire les goûts de lecteurs en fonction des goûts de lecteurs similaires. Ensuite, le filtrage dit "sur le contenu", qui rapproche des livres à partir des informations descriptives. Par exemple, sur un titre comme Le journal d’Anne Frank, on recommandera des livres à la fois lus par la même typologie de lecteurs, et traitant de la déportation, sous la forme du témoignage. Ces outils offrent essentiellement l’avantage de permettre une suggestion instantanée de découverte, sur un très grand volume de titres.

Enfin, précisons qu’afin d’offrir l’information la plus complète possible sur chaque titre, Babelio réalise un travail d’agrégation de contenus professionnels. On retrouve notamment 50 000 chroniques de la presse générale et spécialisée issues d’une revue quotidienne de 45 sources. Mais également, une base de contenus multimédias : interviews d’auteurs, archives de l’Institut national de l’audiovisuel (INA) ou podcasts de France Culture, soit 60 000 enrichissements audios ou vidéos.

 

Babelthèque : l’information mutualisée au service des bibliothèques publiques


Un besoin d’enrichissement et de médiation numérique

Les mutations techniques et d’usage apportées par le Web collaboratif ont naturellement attiré l’attention d’acteurs qui y voyaient parfois une menace pour leur cœur de métier historique, parfois une opportunité de renouvellement. Les oppositions apparentes et très médiatisées sont légion, entre blogueurs et journalistes, encyclopédistes professionnels et contributeurs de Wikipedia, critiques professionnels et amateurs. Les bibliothèques publiques ont de leur côté accueilli avec une certaine bienveillance cette mise en commun de l’information, mais ont parfois aussi témoigné d’expectatives en décalage avec les possibilités de ces nouveaux outils.

C’est à l’initiative de la médiathèque publique José Cabanis de Toulouse qu’a été créé en 2009 Babelthèque, un service qui permet d’enrichir les notices bibliographiques d’un catalogue, avec les contenus mutualisés par Babelio. Ce service est actuellement accessible dans une soixantaine de bibliothèques de lecture publique. La bibliothèque publique externalise la collecte et le traitement d’informations communautaires à Babelio, et bénéficie des données bibliographiques permettant de faciliter la découverte et la recommandation de livres parmi son propre fonds. Nous avions réalisé en 2015 une enquête auprès de 450 grands lecteurs portant sur leurs attentes relatives à la médiation numérique. Parmi les enseignements de cette étude, nous avions pu identifier le type d’informations attendues en priorité par les lecteurs lors de la consultation des catalogues de bibliothèques. Si la disponibilité du livre est l’information clé, des enrichissements facilitant la découverte sont réclamés, avec, parmi ceux proposés par Babelio : des mots-clés thématiques de recherche (demandés par 86 % des lecteurs), les dernières parutions (79 %), des critiques de lecteurs (78 %), des suggestions de lecture (76 %) ou encore des critiques de professionnels (65 %). Seule une initiative mutualisée permet de répondre à cette exigence élevée d’information exhaustive dans des catalogues de bibliothèques comptant plusieurs dizaines ou centaines de milliers de références.

Vers la mise en valeur des fonds bibliographiques accessibles en ligne

Le fonctionnement technique de Babelthèque est simple : un Webservice permet d’afficher dynamiquement sur la notice du livre dans un catalogue, tous les contenus pertinents de Babelio (critiques, extraits, notes, recommandations, multimédia, prix littéraires, etc.). L’intégration technique a été validée sur la quasi-totalité des fournisseurs (Orphée, Archimed, AFI, Bibliomondo, etc.), mais surtout, le développement technique du module pour Koha est une initiative commune de la Médiathèque intercommunale Istres Ouest Provence et du réseau des bibliothèques de Nîmes, mutualisant ainsi le coût informatique d’installation du service. Les contenus sont, le cas échéant, adaptés au fonds bibliographique de la bibliothèque concernée. Par exemple, les suggestions automatisées de lecture sont filtrées pour ne proposer que des titres présents dans le catalogue de la bibliothèque. Deux outils de mesure permettent de vérifier l’usage de ces enrichissements : le taux de recouvrement brut, qui mesure la proportion de notices du catalogue11.pour lesquelles le fournisseur dispose de contenus enrichis (nombre d’ISBN enrichis/nombre d’ISBN au catalogue) : celui-ci s’établit par exemple à 58 % à la bibliothèque de Toulouse pour un fonds de plus de 200 000 références. Mais, fait intéressant, il n’était que de 15 % au lancement de Babelthèque en 2009. De facto, 4 fois plus de notices sont donc désormais enrichies, du fait de la croissance importante de l’activité de la communauté de lecteurs sur Babelio. En second lieu, le taux de recouvrement effectif rend compte de la proportion de notices consultées pour lesquelles nous disposons de contenus enrichis. On atteint alors un taux de 78 % pour la bibliothèque concernée : en effet les notices les plus consultées sont également celles avec le plus de contenus, il est donc normal que ce chiffre soit plus élevé que le taux brut.

Fausses pistes et malentendus : une définition par la négative

Il nous semble enfin important de déconstruire certains mythes qui sont parfois associés à ces services. Tout d’abord, Babelthèque n’est pas un outil de captation des contributions professionnelles. Si les contenus de professionnels sont labellisés et identifiés en tant que tels via la plate-forme, l’outil n’a pas pour vocation à fédérer des avis de bibliothécaires ou à devenir un réservoir de données, mais bien de diffuser ce qui a déjà été mutualisé, hiérarchisé et traité au sein de Babelio.

Ensuite, Babelthèque n’est pas un outil d’animation des communautés locales de lecteurs au sein des bibliothèques. Derrière le mot d’ordre légitime qui réclamait la contribution des amateurs dans la prescription, on a souvent cru qu’il suffisait de donner la parole aux internautes pour qu’ils la prennent. Et qu’il suffisait de mettre en place des outils technologiques de contribution pour que l’usage suive. Dans les faits, si nous proposons au sein de notre outil, des modules permettant l’ajout de critiques ou d’extraits de livres directement dans l’OPAC, ce dernier n’est pas un contexte naturel d’expression des usagers. Deux chiffres permettent d’illustrer ce diagnostic : près de 1 000 critiques ont été publiées par des usagers sur le catalogue de Toulouse en 6 ans. Cela représente un peu plus de 3 critiques par semaine. En comparaison, 5 970 critiques ont été publiées sur Babelio la semaine où cet article a été écrit, soit près de 2 000 fois plus ! Par ailleurs, sans pouvoir donner une évaluation de qualité objective, relevons simplement qu’en moyenne une critique ajoutée dans le catalogue fait 220 caractères, à comparer avec les 1 200 caractères moyens d’une critique sur Babelio. De facto, la mutualisation par les usagers ne peut se faire que dans des contextes d’usage spécifiques. Les usagers diffusent ici peu leurs contributions car la fonction principale d’un site web de bibliothèque est de proposer des informations préalables à l’emprunt car il n’existe pas de contexte social de gratification : les usagers n’ont pas de réputation à maintenir, pas de retours d’autres lecteurs sur leurs contributions, ni d’espace personnel d’expression.

Enfin, il nous semble que la mutualisation des contenus ne remet pas en cause le cœur de métier du bibliothécaire, mais qu’au contraire il l’élargit. Alors que le catalogage peut être externalisé via des initiatives collectives, rendant caduque la description de documents, répétée à l’identique dans de multiples établissements, alors que sont accessibles des bases de critiques et de contenus favorisant la recommandation et la découverte bibliographiques, il est important de redéfinir le métier de médiateur du livre. Une évolution certaine est que les bibliothécaires peuvent recréer des formes de médiation singulières, personnalisées et éditorialisées qui s’établissent en creux des services existants.

 

Perspectives de la mutualisation des contenus communautaires


La mise en commun sur Internet des données bibliographiques par les lecteurs n’est, en premier ressort, qu’une manière de rendre visible et de sauvegarder un mode de prescription traditionnel pour le livre : le bouche-à-oreille. Ce faisant, en se digitalisant, cette forme de médiation change à la fois d’échelle ‒ avec des volumes très élevés de contenus disponibles ‒ et de nature ‒ avec la possibilité de construire de nouveaux outils de recommandation. La possibilité de rassembler les lecteurs autour d’un projet commun ne dépend néanmoins pas tant de la mise à disposition d’un outil technologique, que de la construction d’un contexte social spécifique où les intérêts personnels se rejoignent. Ce savoir collectif répond avant tout à une demande d’information sur des volumes de titres si importants qu’ils ne pourraient être traités par des moyens traditionnels. L’avenir de ce service s’inscrit dès lors dans une double tendance. La première, qui voit dans la mutualisation des établissements en réseaux une opportunité pour la mutualisation des contenus. L’accès aux enrichissements est en effet conditionné à des ressources dont ne disposent pas les établissements de petite taille, et la pertinence de ces fonctionnalités de découverte s’avère d’autant plus élevée que les catalogues sont profonds. La deuxième tendance tient à ce que la nature des contenus et des services de Babelthèque épouse les évolutions potentielles du réseau Babelio. On peut identifier trois types de développements prospectifs : de nouveaux services communautaires et de nouveaux supports (créations de communautés thématiques, outils d’interrogation d’experts par domaine, applications mobiles dédiées, etc.), davantage de données bibliographiques ou une meilleure structuration de celles-ci (classement en ontologies, analyse du corps du texte, base de données de lieux, personnages, styles littéraires, etc.) et enfin le progrès des technologies d’intelligence artificielle, qui permet d’imaginer la création à moyen terme d’agents virtuels ou de requêtes en langage naturel pour découvrir la richesse des fonds bibliographiques.

 

 
1.

Voir sur le site < www.babeltheque.com >, rubrique Présentation détaillée du service, la diapositive n°3 dans la présentation slideshare.