mardi 30 décembre 2014

Là-bas... Les merveilleux nuages

La richesse des informations de toutes sortes disponibles sur Internet s’accroît tous les jours, au point que les problèmes de logistique (maîtriser les masses de données de manière à pouvoir les utiliser judicieusement) deviennent réellement stratégiques. L’économie d’un blog comme celui-ci est originale, puisqu’il s’agit de publier soit des billets d’information (annonçant une nouvelle publication, un séminaire, un colloque, etc.), soit des billets plus généraux, traitant, dans un format réduit (en général moins de 5000 signes) mais souvent avec une ou plusieurs illustrations, de tel ou tel sujet au choix. Il y a, dans cette économie de l’écriture, quelque chose qui fait penser à la tactique de la cavalerie légère: on se porte rapidement sur un point, avant de se replier et de se porter sur un autre. Liberté et rapidité en sont les deux caractéristiques principales.
L’inconvénient est connu: il n’y a pas de suivi dans les thématiques de publication, de sorte que le lecteur ne peut pas savoir si tel ou tel sujet susceptible de l’intéresser a été ou non abordé par le blog. Les anciens «libellés» que nous utilisions étaient trop généraux pour servir pratiquement à quelque chose, tandis que la fonction «Recherche» (disponible dans la colonne de droite) ne répond pas pleinement à cette problématique. C'est pourquoi nous avons entrepris de mettre en place un nouvel outil, sous la forme d’un «nuage de tags».
Puisque les nuages et autres cloud sont à la mode... quelques nuages estivaux dans la campagne de Touraine
Le vocabulaire des informaticiens est relativement imprécis: dans la pratique, le tag (qui désigne en principe un graffiti servant de signature) correspond ici à une étiquette, ou mieux, à ce que nous appellerions un «mot matières». Il s’agira donc pour nous d’affecter au contenu de chaque billet un ou plusieurs descriptifs (désignés comme des «libellés» dans le logiciel utilisé) susceptibles de le décrire. Le classement des tags par ordre alphabétique (en réalité, plus ou moins alphabétique) aboutit à fournir une sorte d'index des matières, dans lequel le module de chaque terme augmente en fonction de sa fréquence de citation. En définitive, une procédure très efficace, mais qui nécessite bien évidemment de balayer l’ensemble des billets pour affecter à chacun les tags correspondants, et qui suppose, pour l’administrateur du blog, de prendre un certain nombre de précautions.
La question, classique en bibliothéconomie, est celle du thesaurus: comment choisir les descriptifs de la manière la plus cohérente et la plus efficace? Certaines remarques sont de bon sens: il est inutile que les descriptifs soient trop nombreux, de manière à ce que le nuage reste d’utilisation assez facile; inversement, il ne faut pas se limiter à un nombre trop réduit, sauf à ne rien décrire qui soit pratiquement utilisable. L'intérêt du procédé est de ne pas se limiter au lexique utilisé dans les textes du blog: on peut notamment inclure certains intitulés généraux, qui permettent, peut-être, de regrouper plusieurs textes disjoints mais abordant des problématiques ou des sujets analogues (par ex. «Anthropologie»).
Nous revendiquons la subjectivité de nos choix, qui correspond à une forme de liberté, mais qui ne va pas sans inconvénients: tel descriptif pourrait s’appliquer aussi à un texte auquel il n’est pas attribué, etc. (les choses peuvent se corriger selon qu’on les repère). C’est par souci de la cohérence que nous avons fait entrer dans le thesaurus (alias le nuage) des descriptifs que l’on trouverait aussi bien par la fonction «Recherche» (par ex.: «Strasbourg»): le «nuage» ne renvoie pas à toutes les occurrences du mot «Strasbourg» dans tous les textes, mais seulement aux textes dans lesquels «Strasbourg» apparaît comme le ou l’un des sujets principaux.
Le procédé lui-même pourrait être amélioré: par ex., il est apparemment impossible de poser des questions associant plusieurs tags, comme «bibliothèque» et «XVIIIe siècle»;  de même, on ne peut pas insérer de renvois d’une vedette à l’autre (par ex. de «Renaissance» à «XVe siècle»); ou encore : les lettres accentués (éditeurs) sont rejetées par le classement alphabétique. Pourtant, tel qu’il est aujourd’hui disponible, le nuage constitue à nos yeux un précieux outil permettant de mieux maîtriser une information par nature très dispersée (rien n’empêche d’ailleurs de l’utiliser parallèlement à la fonction classique «Rechercher dans ce blog»).

NB- Nous procédons par rétroconversion (selon la bonne pratique bibliothéconomique!). À ce jour (12 janv. 2015), le nuage concerne les billets publiés depuis le 1er janvier 2011.

Aucun commentaire:

Publier un commentaire