Des livres à la carte

Le blog aeiou s’est fait l’écho du nouveau service initié par Google qui relie automatiquement à une carte Google Maps les lieux cités par un livre répertorié dans Google Books . Quand le nombre de toponymes cités dans un livre est « suffisamment important » (Inside Google Book Search dixit), la page « About this book » est agrémentée d’une carte présentant les lieux du livre. Chaque pointeur de Google Maps affiche l’extrait du livre mentionnant le lieu et le numéro de page. Un clic envoie au contenu de la page si celle-ci est disponible en ligne. Le premier livre traité est bien entendu l’emblématique Tour du monde en quatre-vingt jours de Jules Vernes.

googlemapsbooks2.jpg

Le principe ne s’applique pas seulement à la fiction, mais aux enquêtes, aux guides touristiques ou à n’importe quel contenu livresque. On trouve pêle-mêle sur la page du site les cartes d’un guide de New-York datant de 1888, celles du rapport de la commission d’enquête sur le 11 septembre, celle de Guerre et Paix et d’une biographie de Bach… L’usage est donc varié. On peut aller à la découverte d’un lieu à partir d’un guide, se livrer à une analyse scientifique de la fréquence des toponymes dans un texte historique ou visualiser les pérégrinations d’un personnage de fiction.

La technologie utilisée par Google est-elle celle de Metacarta, société pionnière dans l’extraction dans des textes de l’information liée à des lieux et la présentation des résultats sur une carte ? Certains le pensent en se référant à la démonstration de Metacarta à la Conférence Where 2.0 de 2006, qui a tant impressionné Francis Pisani. L’examen du site de Matacarta montre en tout cas que les deux sociétés ont de multiples accords de coopération. Dans le projet Gutenkarte Metacarta utilise sa technologie pour géolocaliser les textes du projet Gutemberg (fourniture de lives électroniques libres de droits). Vous pouvez expérimenter facilement cette technologie sur la page Web de votre choix grâce à ce petit outil de Metacarta.

Pour l’instant les livres analysés dans Google Books restent en nombre limité et comme certains commentateurs l’ont remarqué, les toponymes analysés par les robots correspondent essentiellement aux grandes villes. Par ailleurs, les programmes ont des difficultés à distinguer les toponymes d’autres noms propres et à les placer correctement. Sur le blog de Platial Tracy Rollin note ainsi que toutes les citations de Orlando, personnage de Comme il vous plaira de Shakespeare, se trouvent invariablement localisées en Floride et que Syracuse renvoie systématiquement à l’Etat de New-York plutôt qu’à la Sicile. Dans le projet Gutenkarte, on constate rapidement que le logiciel prend systématiquement les noms de personnes pour des noms de lieux. La géographie du Comte de Monte-Christo en est ainsi sévérement bousculée. Spada, entre Verdun et Toul, devient un lieu d’action du roman à cause du personnage du Cardinal Spada. Il faut noter que Metacarta évalue le degré de confiance de sa localisation (61 % quand même pour Spada). Il reste donc de nombreuses difficultés à lever en ce domaine pour obtenir un outil automatique fiable : topo-homonymies, noms propres, localisation dérivée, changement de noms de lieux au cours du temps, localisation multi-échelle… Comme il est écrit ici, l’interprétation des résultats par un opérateur humain va rester longtemps indispensable.

On remarquera aussi que la navigation n’est pas complète: sur la page du livre à laquelle renvoie le pointeur de Google Maps, les toponymes concernés sont bien surlignés en jaune mais ne sont pas cliquables, alors que l’on s’attendrait à ce qu’ils nous ramènent à la carte. C’est en revanche le cas dans Gutenkarte : l’écran visualise simultanément la page du livre à gauche et la carte à droite. Les liens entre les toponymes du livre et de la carte sont actifs dans un sens comme dans l’autre. Metacarta propose même un accès direct à la définition Wikipedia du toponyme, avec cependant tous les aléas liés à ce type de lien. Pour Spada, Wikipefia nous redirige vers spatha, glaive romain, ce qui ne nous rapproche guère de la Meuse et encore moins du Cardinal.

Par ailleurs, la sémiologie googlienne très sommaire limite la lisibilité des résultats obtenus. On obtient toujours une pelote d’épingles plus ou moins serrée selon le niveau de zoom. On peut préférer le rendu de Gutenkarte par affichage direct des toponymes, avec une taille de police proportionnelle au nombre de citations comme dans un nuage de tags. On aimerait surtout des visualisations plus évoluées : par exemple afficher chronologiquement l’itinéraire d’un roman à travers le numéro de la page où il apparaît. L’essai de cartographie synthétique de tous les lieux cités dans les livres indexés par Google Books que propose Matthew Gray est prometteur, même si la sémiologie de sa carte est discutable.

On est encore loin d’approcher automatiquement avec ces outils la subtilité toponymique du Proust de la Recherche (parcourir à ce propos sur Wikisource le chapitre de Du côté de chez Swann intitulé justement Noms de pays : le nom). Une navigation fluide entre les livres et les cartes demandera un travail important de description hiérarchique des toponymes. Elle nécessitera aussi le développement de fonctions d’analyse lexicale et syntaxique beaucoup plus puissantes que celles apparemment mobilisées dans les outils actuels de Google ou Metacarta. Pour avoir une idée de la manière dont les scientifiques abordent ces questions, on peut consulter les travaux de Julien Lesbegueries et Pierre Loustau sur l’extraction automatisée d’itinéraires à partir de journaux de voyage.

Si ce type d’outil doit pour l’heure être réservé à des usages simples, et les résultats filtrés par l’utilisateur, leur principe n’en ouvre pas moins des perspectives fascinantes dans la mise en correspondance des textes et des lieux.

2 réflexions sur “Des livres à la carte

  1. Belle analyse de cette formidable idée de rapprocher la littérature de sa dimension spatiale.
    Je partage complètement votre analyse, j’ai moi-même créé une carte à partir d’un roman historique. Le travail a été fastidieux mais je ne suis pas mécontent du résultat, d’autant que l’action du roman se déroule au XIIIè siècle, que certains lieux ont été détruits, ont disparu, ont changé de nom plusieurs fois : alémanique, français, alsacien, allemand… dimension spatiale mais aussi temporelle quasi indissociable.
    Bref, je vais prendre le temps de regarder les sources citées dans votre article en prévision de mon prochain travail cartographique (même si cela a été fastidieux par moment, j’ai pris beaucoup de plaisir à repérer les lieux et à les matérialiser sur une carte).

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s