Ballard et Blaine

User search-limiting behavior in online catalogs: Comparing classic catalog use to search behavior in next-generation catalogs

de Terry Ballard et Anna Blaine

Résumé par Simon Côté-Lapointe

Référence : Ballard, Terry, et Anna Blaine, (2011), User search-limiting behavior in online catalogs: Comparing classic catalog use to search behavior in next-generation catalogs, New Library World, Vol. 112 Iss: 5 pp. 261 – 273.

Cliquez ici pour accéder à l’article original.

Résumé

[Traduction du résumé de l’article]

Objectif

Montrer comment l’ajout de fonctions de nouvelle génération au catalogue en ligne actuel peu mener à des recherches plus raffinées pour les utilisateurs. Les utilisateurs de catalogues en ligne classiques ont toujours eu la possibilité de raffiner leur recherche et de mieux définir le type de matériel voulu. Cependant, des recherches réalisées depuis les deux dernières décennies ont démontrées que peu d’utilisateurs tirent profit de ces options supplémentaires. Avec l’avènement récent de plateformes de découverte comme Encore et Aquabrowser, les options limitatives de recherche sont automatiquement affichées à la vue de l’utilisateur et cette étude cherche à démontrer que ceci crée un changement significatif dans les comportements de recherche [« search behaviors »].

Design / méthodologie / approche

Comparaison de données de recherche/requêtes [« search logs »] issues d’un catalogue de bibliothèque classique et d’un catalogue en ligne sur plusieurs mois. Des données similaires ont été obtenues d’autres bibliothèques pour confirmer la tendance.

Résultats

L’étude montre que les utilisateurs sont amenés à raffiner leur recherches de 15 à 20 fois plus s’ils utilisent une plateforme de découverte.

Originalité / valeur

Les bibliothécaires peuvent ajuster leurs instructions de sessions bibliographiques à partir d’une meilleure compréhension des comportements de recherche sur les deux types de catalogues.

Plan du texte

Introduction

History
Issues with classic catalogs
Next-generation products currently available

Implementing a next-generation catalog

Planning and process
Challenges

Features common to next-generation catalogs

Enriched content
Faceted navigation
Keyword searching
Relevancy ranking
Did you mean…?
Recommendations
Web 2.0 or social network features
Federated searching

A new service

New York Law School

Data from other institutions
Conclusion

Références sélectionnées

Introduction

Les catalogues en ligne classiques sont en déclin.

  • Plus d’alternatives dynamiques, changement rapide de la technologie de l’information et augmentation de l’information numérique ont changé les attentes des utilisateurs, mais les catalogues n’ont pas suivi le courant.
  • Plusieurs utilisateurs utilisent d’autres outils de découverte plutôt que les OPAC [Online public access catalogs] classiques.
  • Processus et structures ne sont plus maintenables.

Nouvelle génération d’OPAC :

  • Objectif : Pas seulement des inventaires d’items, mais une aide réelle à la recherche;
  • Plusieurs approches pour les concevoir;
  • Éléments clés :
    • un seul point d’accès pour toutes les ressources,
    • élargir le champ de la recherche,
    • interfaces à jour;
    • améliorer l’étendue de la recherche.
    • Diffèrent des OPAC traditionnels en terme d’intégration du contenu, d’options sociales [« social features »] et visualisation des données.
    • But : Attirer plus d’utilisateurs en créant un catalogue similaire à des sites populaires comme Google ou Amazon.

Retour au plan de l’article

History

Histoire

Cycles de vie des catalogues en ligne de bibliothèque :

  • Rares en 1970 : catalogues classiques fournissaient les même points d’accès que le catalogue à cartes traditionnel.
  • Ont pris leur essor à la fin des années 1980, mais seulement disponibles à la bibliothèque même.
  • Seconde génération de catalogues étaient accessibles sur le Web, plus largement accessibles et présentaient des moteurs de recherche par mots-clés, de recherche post-coordonnée ou booléen.
    • Les systèmes booléens étaient simples et économiques à installer, mais demandaient de l’expérience de la part des utilisateurs pour être utilisés correctement.
    • À partir du milieu des années 1990, un nouveau cycle de changement commence.

Retour au plan de l’article

Issues with classic catalogs

Problèmes avec les catalogues classiques

Raisons pour lesquelles les catalogues classiques sont supplantés par les outils de découverte de ressources :

  • Interfaces de recherche complexes, non intuitives et incompatibles avec les conventions bien établies des interfaces utilisateurs.
  • Portée limitée et incapables d’inclure du contenu numérique, encore moins de le livrer. Si les bibliothèques dépensent des sommes importantes pour le contenu numérique, il doit être accessible.
  • Ne classent pas les résultats par pertinence et ne fournissent aucune des caractéristiques des réseaux sociaux que les utilisateurs s’attendent à avoir.
  • Ils ne peuvent recherche facilement ou efficacement par sujets.
  • Cependant, leur grande force réside dans leur fonctionnalité sophistiquée en ce qui a trait à la collection physique de la bibliothèque.

Retour au plan de l’article

Next-generation products currently available

Produits de prochaine génération présentement disponibles

La plupart des vendeurs de systèmes intégrés de bibliothèques [Integrated library system (ILS)] font toujours la promotion des catalogues avec fonctionnalités classiques.

Plusieurs compagnies ont cependant développé des applications de prochaine génération.

Exemples :

  • Primo (de Ex Libris), pour les bibliothèques académiques et de recherche;
  • WorldCatLocal, conçu pour remplacer le catalogue en ligne en l’intégrant comme part entière dans le ILS;
  • AquaBrowser (de Serials Solutions), populaire dans les bibliothèques publiques;
  • WebVoyage, Polaris, Encore;
  • Applications à code source libre : Koha, Evergreen, eXtensible, VuFind, LibraryFind, Scriblio et Blacklight;

Les OPAC à codes sources libres sont plus innovants que les commerciales : plus de personnalisation du design et de l’interface.

Avertissement : dû à l’évolution rapide, les auteurs peuvent présenter des informations désuètes.

Retour au plan de l’article

Implementing a next-generation catalog

Implantation d’un catalogue de prochaine génération

Planning and process

Planification et processus

Planification en 10 étapes de la Library of Congress :

  1. Définir la communauté à être desservie.
  2. Choisir une option stratégique.
  3. Préparer les liens entre le catalogue et le ILS.
  4. Innover et réduire les coûts.
  5. Améliorer l’expérience utilisateur.
  6. Prendre des bonnes décisions.
  7. Promouvoir la bibliothèque.
  8. Gérer le changement.
  9. Développer, former et recruter.
  10. Trouver du financement et des partenaires.

 

Morgan (2007) propose une implantation en 7 étapes :

  1. Allouer des ressources.
  2. Répondre aux questions concernant l’architecture de l’information.
  3. Mener des sondages, des groupes de discussion et des études d’utilisabilité.
  4. Créer et maintenir le catalogue de nouvelle génération.
  5. Répéter l’étape 4 sur une base quotidienne.
  6. Répéter l’étape 3 sur une base trimestrielle.
  7. Répéter l’étape 1 sur une base annuelle.

Challenges

Défis

Embûches possibles pour les catalogues de prochaine génération :

  • Difficulté d’atteindre l’interopérabilité du système;
  • Réticence à dispenser des opérations de catalogage hautement personnalisées;
  • Lent développement dû au manque de données pour appuyer la prise de décision;
  • Résistance possible des administrateurs;
  • Coûts : projet hors de prix pour certaines bibliothèques.

Retour au plan de l’article

Features common to next-generation catalogs

Options courantes pour les catalogues de prochaine génération

Projet Solr (d’Apache Foundation) :

  • Un moteur d’indexation textuel qui produit des résultats de recherche « à la Google » et de simples facettes pour préciser les résultats.
  • Application à code source libre : est un choix populaire avec les créateurs de catalogues de prochaine génération.

Plusieurs fonctionnalités des catalogues de prochaine génération sont conçues pour améliorer l’utilisabilité, cependant les données additionnelles fournies dans la fiche (image de couverture, icônes et graphiques, table des matières, liens, etc.) augmentent le temps que prend l’information pour se rendre à l’utilisateur.

La valeur ajoutée par le contenu n’est donc pas nécessairement utile si l’utilisateur passe à autre chose avant la fin de la recherche.

Enriched content

Contenu enrichi

Applications de prochaine génération enrichissent souvent l’information bibliographique avec du contenu tel que des images de couverture, des tables de matières, des sommaires et des critiques.

Fonctionnalités des catalogues :

  • Primo :  ajoute aux fiches des critiques, sommaires ou données provenant de notices d’autorités pour aider à la recherche.
  • Encore : affiche aussi des critiques et de sommaires.
  • Encore, Koha, Evergreen, WebVoyage, AquaBrowswer, Primo, Endeca : incorporent des contenus graphiques comme les couvertures de livres.
  • Bibliocommons : offre un « cover flow[1] » de couvertures de livres récemment critiqués.
  • WebVoyage : renvoie à Google Books pour le sommaire du contenu et les critiques.
  • AquaBrowser et Encore : présentent des nuages de mots pour assister les utilisateurs dans leur recherche. Le nuage de mots d’Encore est une liste d’étiquettes [« tags »] issues de résultats et dont la taille des caractères indique le niveau de popularité ou importance.
  • Quelques applications permettent aux utilisateurs de créer des étiquettes. Des études montrent que leur utilisation augmente les succès de recherche.

Faceted navigation

Navigation à facettes

Utilisation de facettes pour préciser les recherches.

Avantages :

  • Navigation à facettes réduit la surcharge d’information causée par le retour d’un trop grand nombre de résultats.
  • Présentation de sous-catégories pertinentes (auteur, contenu, format, langue, séries, corporation, collection, sujet, genre, emplacement dans la bibliothèque, régions géographiques et disponibilité) : les utilisateurs peuvent survoler les résultats, puis réduire la liste.
  • Études ont montré que la navigation à facettes facilite une extraction efficace, augmente la vitesse dans la découverte de ressources, plus de succès dans la découverte de ressources et augmente la satisfaction de l’usager.

À l’exception de Evergreen et WebVoyage, chacune des applications précédemment nommées offre la navigation à facettes. De plus, WorldCat Local offre le fil d’Ariane [« breadcrumbs »] lorsque les facettes sont sélectionnées.

Retour au plan de l’article

Keyword searching

Recherche par mots-clés

Technique dominante pour trouver de l’information sur Internet, à l’opposé des vocabulaires contrôlés ou boîtes de recherche par champs spécifiques.

Cette recherche avec une seule boîte « à la Google » n’est peut-être pas suffisant pour plusieurs bibliothèques : un lien vers une page de recherche avancée devrait être incluse dans le catalogue de nouvelle génération (AquaBrowser, Koha, Evergreen, et WebVoyage ont cette option).

  • Primo offre quelques options en plus de la boîte de recherche unique sous forme de menu déroulant pour sélectionner le type de matériel voulu.
  • Endeca : la recherche par autorité (auteur, titre, sujet, etc.) peut être préservée dans l’interface. Aussi, l’onglet de navigation permet la recherche avec la Classification LC et la recherche par les facettes du catalogue.

Relevancy ranking

Classement par ordre de pertinence

Basé sur la fréquence et la position des termes dans les registres bibliographiques.

Difficile d’implanter un système qui le fait bien, peu de catalogues ont réussi à incorporer les statistiques de circulation dans l’ordre de pertinence.

  • Encore utilise la technologie d’Innovative Interfaces appelée RightResult.
  • Endeca inclut une série d’options de classement par ordre qui sont combinées selon les spécification de la bibliothèque pour former un algorithme d’« ordre par pertinence » [« relevancy-ranking algorithm »].

Retour au plan de l’article

Did you mean…?

Vouliez-vous dire…

Fonction qui détecte les erreurs de frappe et offre des corrections / suggestions.

  • Encore : lorsqu’il y a faute ou pas de résultats trouvés.
  • Evergreen : lorsqu’il n’y a pas de résultats dans une recherche, le catalogue propose un orthographe alternatif.
  • Kaho : offre un vérificateur d’orthographe.

Recommendations

Recommandations

Plusieurs moteurs de recherche en ligne, en particulier ceux dédié à la vente, fournissent de l’information de manière proactive sur leurs items.

Le défi d’adapter cela aux catalogues de bibliothèque implique de trouver des données sur le comportement des utilisateurs sur lesquelles baser ces recommandations.

  • Endeca : outils « plus de titres comme cela » [« “more titles like this” tool »] est utilisé fréquemment.

Retour au plan de l’article

Web 2.0 or social network features

Web 2.0 ou fonctions de réseau social

Inviter les usagers à participer et à s’impliquer.

  • Primo, Koha et WorldCat Local : Noter les items et écrire des critiques.
  • Primo, Encore et Koha : Participer à l’étiquetage.

Federated searching

Recherche fédérée

Depuis deux décennies, les bibliothèques ont inclus dans leurs collections du contenu électronique, mais intégrer ces ressources dans le catalogue est un défi.

Plusieurs fournissent un environnement de recherche séparer pour les collections numériques.

Beaucoup d’espoir avait été placé dans la recherche fédérée pour élargir la couverture de l’information, mais les attentes n’ont pas été atteintes.

Les outils de recherche fédérée  permettent de rechercher dans plusieurs ressources informationnelles simultanément, mais ces outils étaient mal équipés pour évaluer l’ordre de pertinence et étaient séparés du catalogue de bibliothèque.

Les catalogues de nouvelle génération ont souvent la possibilité d’incorporer des contenus d’articles, mais partiellement seulement.

  • Primo : configuration possible via MetaLib.
  • ExLibris : recherche fédérée fournit du contenu électronique.
  • AquaBrowser : affiche des résultats de ressources externes en lien avec la requête de l’utilisateur, mais pas au même niveau que le catalogue local.
  • Koha : fait des liens entre les titres des journaux du catalogue et les bases de données électroniques via Serials Solutions.

Retour au plan de l’article

A new service

Un nouveau service

New York Law School

École de droit de New York

Construction en 2009 d’un nouveau building avec des salles de classe électroniques et une nouvelle bibliothèque.

Achat de Encore (de Innovative Interfaces Incorporated), plateforme de découverte de nouvelle génération.

Ceci impliquait d’ajouter un deuxième serveur à l’OPAC existante, agissant comme un outils supplémentaire pour les usagers désirant une recherche plus intuitive à travers la collection.

Peu de temps après, Encore était implanté à la New York Public Library, intégrant pour la première fois les catalogues de toutes les bibliothèques de la NYPL. Voir Figure1 pour un exemple de l’interface.

Ballard 1

Figure 1 – Encore : NYPL

Encore inclut des fonctions telles que les nuages de mots et les facettes — liens du côté gauche de l’interface qui encouragent l’utilisateur de fouiller à partir d’un simple mot-clé.

Encore est un des nombreux produits, comme entre autres Aquabrowser et Summon, connus comme les « plateformes de découverte » qui présente cette forme de recherche améliorée. (Aquabrowser est le plus acheté, installé notamment à l’Université Harvard pour leur catalogue HOLLIS.)

Encore a été présenté comme un ajout important pour faciliter les recherches légales.

L’interface est compatible avec Google analytics, ce qui permet d’avoir des statistiques sur l’utilisation et de comparer la nouvelle plateforme avec l’ancienne (voir Figure 2).

Ballard 2

Figure 2 – Comparaison, dans Google analytics, entre la plateforme Encore et la plateforme classique.

 Retour au plan de l’article

Statistiques :

  • En examinant les données de l’année passée, il apert que les utilisateurs d’Encore ont passé environ 4 minutes sur le système, en comparaison de 90 secondes sur l’ancien catalogue.
  • Le nombre d’usagers qui ont quitté une session sans chercher était de 33% pour Encore et de 84% pour le catalogue classique.
  • Utilisateurs d’Encore ont visionné en moyenne plus de 4 pages par session comparé à 1,3 pour le classique.
  • Le nombre de pages vues est égal, même si trois fois plus de personnes commençaient leur recherche avec le catalogue classique. Explication pour cela : lien vers Encore est présenté en haut du catalogue classique (voir Figure 3).
Ballard 3

Figure 3 – Page principale du catalogue du NYLS

Aspect important de l’usage : Données sur le fait de limiter la recherche.

  • Les bibliothécaires ont appris que si l’utilisateur prend le temps de limiter et de raffiner sa recherche, il va avoir plus de résultats satisfaisants.
  • Dans l’interface classique : Il apert que malgré le haut taux de réussite élevé des recherches, le bouton pour limiter les recherches a été peu utilisé. Sur plus de 70 000 recherches produites en un an (incluant les recherches effectuées par les employés), moins de 500 étaient limitées (moins de 1%).
  • Dans l’interface Encore : Analyse des recherches qui utilisent les nuages de mots et les facettes. 8,47% des recherches réalisées cette même année employaient les facettes pour raffiner leur résultats. En d’autres mots, un utilisateur avait 15 fois plus de chances de raffiner sa recherche avec Encore qu’avec le catalogue classique.

Retour au plan de l’article

Data from other institutions

Données provenant d’autres institutions

Au sujet de l’utilisation des limites dans les catalogues en ligne, les résultats sont semblables à la Quinnipiac University School of Law : sur une période de 10 jours, plus de 2000 recherches ont été effectuées, mais seulement 9 ont été limitées.

À la Wellcome Library : sur 210 000 recherches, seulement 600 étaient limitées. Moins de 10% des résultats de recherche sont filtrées avec les facettes ce qui corrobore les résultats.

Autre bibliothèque : Oklahoma State University (Aquabrowser) : 22% des recherches comprennent l’utilisation de facettes.

Retour au plan de l’article

Conclusion

Les catalogues de prochaine génération ont été développés en réaction à l’idée que les catalogues en ligne n’étaient pas assez faciles d’utilisation pour être efficaces à l’« Ère de Google ».

Leur conception reflète la théorie que les utilisateurs vont prendre avantage de la limitation de recherche si les options sont présentés directement devant eux plutôt que dans une page subséquente.

Les données expriment que les nouveaux catalogues remplissent bien leur mission.

La différence assez marquée entre les comportements de recherche devrait être nuancée par le fait que les usagers des catalogues classiques utilisent des limitations similaires à des facettes à travers leurs modes de recherche.

Alors que les pages de recherche par découverte ne fonctionnent qu’avec des mots-clés, les utilisateurs qui cherchent par mode sujet ou auteur choisissent de concentrer leur résultats de recherche.

Les auteurs espèrent que des vérifications futures de ces résultats vont être réalisées.

Retour au plan de l’article

Références sélectionnées

Antelman, K. (2006), “Toward a 21st century library catalog”, Information Technology and Libraries, Vol. 25 No. 3.

Breeding, M. (2007), “Next-generation library catalogs”, Library Technology Reports, Vol. 43 No. 4, pp. 1-41.

Brown-Sica, M., Beall, J. and McHale, N. (2010), “Next-generation library catalogs and the problem of slow response time”, Information Technology and Libraries, Vol. 29 No. 4, pp. 214-23.

Fagan, J.C. (2010), “Usability studies of faceted browsing: a literature review”, Information Technology and Libraries, Vol. 29 No. 2, pp. 58-66.

Library of Congress (2006), The Changing Nature of the Catalog and its Integration with Other Discovery Tools, report prepared by Karen Calhoun, Cornell University Library, Ithaca, NY.

Morgan, E. (2007), A “Next Generation” Library Catalog, Hesburgh Libraries, University of Notre Dame, available at:  www.library.ned.edu/daiad/morgan/musings/ngc (accessed 28 August 2010).

Sadler, E. (2009), “Project Blacklight: a next generation library catalog at a first generation university”, Library Hi Tech, Vol. 27 No. 1, pp. 57-67.

Singer, R. (2008), “In search of a really next generation catalog”, Journal of Electronic Resources Librarianship, Vol. 20, pp. 139-42.

Vaughan, J. (2011), “Web scale discovery: what and why?”, Library Technology Reports, Vol. 47 No. 4, pp. 5-11,  http://alatechsource.metapress.com/content/p2148444086n7r7t/?p¼a91ac1aec1e84fef8959133919cbbf85&pi¼0

Wisniewski, J. (2009), “Next-gen OPACs: no time like the present”, Online, October, pp. 54-7.

Yang, S. (2010), “The next generation library catalog: a comparative study of the OPACs of Koha, Evergreen and Voyager”, Information Technology and Libraries, Vol. 29 No. 3.

[1] « Cover Flow est une interface utilisateur tridimensionnelle servant à naviguer dans une bibliothèque (de musique, d’image, …) via des représentations graphiques signifiantes (pochettes d’albums, image réduite,…). » Wikipédia, http://fr.wikipedia.org/wiki/Cover_Flow

 

Retour au plan de l’article