Conradi

to_be_classified: A Facet Analysis of a Folksonomy

d’Elise Conradi

Résumé par Simon Côté-Lapointe

Référence : Conradi, Elise (2011). to_be_classified. Journal of Information Architecture. Vol. 2, No. 2.

Cliquez ici pour accéder à l’article original

Résumé

[Traduction du résumé de l’article]

Cet article examine l’utilisation de l’approche par postulats dans l’analyse des facettes pour induire manuellement une classification ontologique à facettes [« faceted classification ontology »] d’après une folksonomie (ou indexation collaborative). Une étude approfondie de la théorie de la classification à facettes est utilisée pour créer une méthodologie basée sur l’approche par postulats, qui sera ensuite appliquée pour l’analyse par facettes d’une base de données composée de plus de 107 000 cas de 1275 étiquettes [« tags »] uniques représentant 76 livres d’Histoire collectées de la folksonomie de LibraryThing. Les résultats préliminaires concernent l’induction[1] manuelle [« manual inducement »] de deux classifications ontologiques à facettes : une ontologie complète représentant le domaine des livres et une ontologie incomplète représentant le domaine des sujets contenus dans le domaine des livres. Le regroupement des étiquettes dans des facettes créées à partir de la théorie [« theoretically based facets »] et dans des catégories conceptuelles conduit à une nouvelle compréhension de la description par les usagers des ressources informationnelles. Par ailleurs, les relations discernées dans les ontologies sont des relations générées par les utilisateurs à partir des relations entre l’information étiquetée [« tagged information items »], représentant une nouvelle forme de connaissance. Les implications pratiques des résultats sont discutées : une spécialité potentielle dans laquelle les métadonnées générées par l’utilisateur pourraient améliorer les structures des facettes dans l’architecture de l’information.

[1] « En mathématiques, en logique et en informatique, l’induction complète, aujourd’hui très souvent abrégée en induction, est une autre façon de désigner la récurrence : aussi bien le raisonnement par récurrence que les définitions par récurrence. Le terme est souvent employé pour les généralisations de la récurrence aux bons ordres et relations bien fondées. Le terme d’Ensemble inductif est également employé en liaison avec le lemme de Zorn. » Tiré de Wikipédia, <http://fr.wikipedia.org/wiki/Induction> (consultée le 12 septembre 2013)

Plan du texte

Folksonomies : unstructured « wisdom of the crowd »
Related work
The faceted classification ontology
The postulational approach to facet analysis

The Postulate of Fundamental Categories
The Postulate of Basic Facet
The Postulate of Isolate Facet

Dataset and methodology

Tags from LibraryThing
The Facet Analysis

Results
The universe of books
The universe of subjects
The induced faceted classification ontology
Discussion and suggestions for further research
Références sélectionnées

Folksonomies : unstructured « wisdom of the crowd »

Folksonomie : « sagesse du peuple » non structurée.

̶ Lancement de la folksonomie sur le web en 2003 avec Del.icio.us (https://delicious.com/).

̶ Devenue depuis un moyen populaire de catégoriser un nombre important de ressources informationnelles.

̶ Folksonomie est un agrégation d’étiquettes apposées dans des sites à des objets numériques de formats variés par le créateur ou l’utilisateur de l’objet.

̶ Folksonomie large : plusieurs personnes étiquettent le même objet.

̶ Folksonomie restreinte : objet étiqueté par une ou quelques personnes.

̶ Loi de distribution de la puissance [« Power Law distribution »] des folksonomies larges :

Un grand nombre de personnes s’entendent pour utiliser un nombre restreint d’étiquettes;
Parallèlement, un plus petit groupe préfère des termes moins connus pour décrire leurs items.
La courte tête de la longue traîne représente un consensus de ce que les usagers trouvent le plus important pour chaque ressource informationnelle : la « sagesse du peuple ».

̶ Critiques de ceux qui prônent une approche de haut en bas [« top down »] pour l’organisation de l’information :

Vocabulaire non contrôlé des étiquettes cause trop de problèmes de taux de rappel et de précision (dus à l’ambiguité, la polysémie et la synonymie) pour être utiles comme outils de recherche;
Structure à plat des folksonomies empêche l’utilisateur de voir les relations entre les informations.

En réponse à ces critiques, cet article illustre comment une analyse par facettes basée sur l’approche par postulats peut révéler des catégories conceptuelles et de facettes auxquelles font partie les étiquettes agrégées de la folksonomie. Ainsi, les techniques d’analyse par facettes sont utilisées pour révéler manuellement une classification ontologique à facettes, mettant en relief les relations entre les élément d’information générées par les utilisateurs.

Retour au plan de l’article

Related work

Travaux connexes

̶ Études et projets traitant de l’utilisation de techniques de classification à facettes pour l’organisation de folksonomies :

En bibliothèque : habitudes d’étiquetage et facettes pour aider à la recherche d’information.
Facetag : système d’étiquetage.
Prototype de classification sociale pour les services du Département de la défense.
Fec.etio.us : étiquettes automatiquement regroupées dans des facettes prédéfinies.
Entreprises utilisant les facettes :
- Buzzillions <http://www.buzzillions.com/>
- MeFeedia < http://www.mefeedia.com/>

̶ Aucune étude n’explique clairement le cadre théorique ou les méthodologies utilisés pour créer les facettes, pas plus que les stratégies qui permettent à l’utilisateur d’évaluer l’utilisabilité et l’applicabilité de ces facettes.

̶ La plupart des études mettent l’accent sur l’amélioration de la navigation à facettes et de la recherche avec l’usage des étiquettes dans des facettes prédéfinies.

̶ Cette recherche a une approche différente :

Pas de facettes prédéfinies.
L’accent est mis sur la découverte des types de facettes.
Catégories conceptuelles et relations ontologiques vont émerger dans une taxonomie donnée après être soumis à une analyse par facettes basée sur l’approche par postulats.

Retour au plan de l’article

The faceted classification ontology

La classification ontologique à facettes

̶ Présentation de la classification à facettes :

Changement de paradigme dans l’organisation du savoir
Classification dans les bibliothèques avant : vision ontologique que le savoir pouvait être divisé en catégories hiérarchiques (structure en arbre de haut en bas).
Nouvelle perspective ontologique dans laquelle les ressources informationnelles peuvent être représentées simultanément sous plusieurs angles.
Structure ontologique facilement adaptable et fortement souhaitable pour l’environnement numérique.
Utilisation des facettes pour organiser est devenue commune sur le web.

̶ Modèle ontologique sous-jacent au système de classification à facettes : basé sur deux concepts distincts :

Facettes : définies comme le total des sous-classes (dans une classe) résultant de l’application d’un seul principe de division.
Catégories conceptuelles : représente, en contrepartie, des caractéristiques plus larges qui peuvent être appliquées à toutes les classes dans un univers donné.

̶ Concepts de facettes et de catégories conceptuelles sont parfois mélangés (exemple donné dans l’article).

̶ Importance de bien distinguer les deux termes :

Facettes servent à différentier entre eux les aspects de chaque classe individuelle dans un univers, alors que les catégories différentient de manière égale les aspects de toutes les classes dans un univers.
Si les facettes sont considérées équivalentes aux catégories, nous perdons la distinction entre le niveau « univers » et le niveau « classes de l’univers ».

̶ La Figure 1 illustre les relations qui constituent une classification ontologique à facettes.

Figure 1 – Relations ontologiques entre focus, facettes, catégories conceptuelles, univers et classes

̶ Plusieurs opinions en rapport à ce qu’on peut ou on ne peut décrire avec les facettes :

Vision puriste : facettes devraient être des facettes de sujets. Selon ce point de vue, les facettes du web n’en sont pas, car ils décrivent des objets.
Cœur du problème : le terme facette est utilisés différemment en architecture de l’information, où « sujet » est une facette parmi tant d’autres, et en bibliothéconomie ou « sujet » est l’objet premier de l’analyse par facettes.

̶ Le point de vue adopté dans cette recherche : le concept de facette peut être appliqué à m’importe quel aspect d’un univers, peu importe qu’il soit basé sur des sujets ou basé sur des objets [« subject-based or object-based »].

Retour au plan de l’article

The postulational approach to facet analysis

L’approche par postulats pour l’analyse des facettes

̶ Approche introduite par Ranganathan et développée par le Classification Research Group (CRG).

̶ Basée sur une série de règles normatives du Prolegomena[1] de Ranganathan :

43 Canons de Classification, 12 Postulats et 22 Principes.
De ces règles, 7 Canons et 3 Postulats concernent le choix des facettes.

̶ Dans cette approche, le « classificateur » [« classificationist »] analyse d’abord par facettes l’univers selon les Canons, puis propose aux « classeurs » [« classifiers »] (ceux qui vont utiliser la structure classificatoire pour classer d’autres éléments) des postulats qui vont guider l’identification de facettes correspondantes aux objets à être classifiés selon le schéma.

̶ Dans la présente recherche le classificateur est absent :

̶ L’analyse des facettes est faite directement selon la description des objets fournie par l’utilisateur.

̶ Les facettes trouvées dans la folksonomie sont donc inductives, représentant un agrégat de la perspective de l’utilisateur sur l’univers.

Les trois postulats de Ranganathan pour guider le choix et l’identification des facettes :

Retour au plan de l’article

1. The Postulate of Fundamental Categories

Le postulat des catégories fondamentales

̶ Ranganathan : Cinq catégories conceptuelles existent dans chaque univers : Personnalité, Matière, Énergie, Espace et Temps.

̶ CRG : prônent une utilisation plus flexible; le nombre de catégories peut varier d’un univers à l’autre.

2. The Postulate of Basic Facet

Le postulat de la facette de base

̶ Chaque propose que chaque sujet complexe [« compound subject »] a une facette de base.

̶ Pour l’identifier, une connaissance générale des listes [« schedules »] de sujets de base est nécessaire.

̶ Essentiellement, ce postulat lie les facettes des objets à être classifies avec le schéma de classification; chaque facette est donc vraiment une facette d’une classe dans la liste.

̶ Appliqué à des objets : chaque objet a une facette de base qui représente une classe dans un schéma classificatoire d’objets.

̶ Dans le cas de cette recherche, l’absence de schéma implique de discerner les facettes de bases représentant les classes.

3. The Postulate of Isolate Facet

Le postulat de la facette isolée

̶ Chaque facette isolée d’un sujet complexe peut être considérée comme une manifestation d’une, et seulement une, des cinq catégories fondamentales.

̶ Concerne la relation entre les facettes et les catégories conceptuelles.

̶ Alors qu’une catégorie peut être représentée par plusieurs facettes différentes dans un objet, chaque facette représente une, et une seule, catégorie.

Retour au plan de l’article

Dataset and methodology

Base de données et méthodologie

Tags from LibraryThing

Étiquettes de LibraryThing

̶ LibraryThing < http://www.librarything.com/> : site web de réseautage social où les utilisateurs peuvent cataloguer, étiqueter et partager leur collection de livres, tout en permettant d’établir des connexions avec des personnes ayant de goûts similaires.

̶ 940,000 membres, 45 millions de livres catalogués, 58 millions d’étiquettes apposées.

̶ Base de données utilisée dans la recherche :

Restreinte aux livres d’Histoire [« nonfiction books about history »] construite à partir de TagMash[2] avec les étiquettes « history » et « nonfiction »;
Résultat : 45 étiquettes les plus populaires et 250 livres les plus populaires étiquetés avec les deux termes;
Restreinte de nouveau pour inclure uniquement les étiquettes représentant les livres qui ont été aussi indexés dans la vedette-matière « history » de la Library of Congress.
Résultat final : 107 375 instances de 1 288 étiquettes uniques décrivant 76 livres d’Histoire.

Retour au plan de l’article

The Facet Analysis

L’analyse des facettes

̶ Méthode non-linéaire et processus itératif visant à placer chaque étiquette dans une facette mutuellement exclusive.

̶ Les postulats suivants sont proposés pour servir de guide à travers le processus de l’analyse des facettes :

Identifier les catégories conceptuelles pour lesquelles toutes les facettes dans l’univers à classifier appartiennent.
Identifier les facettes de base implicites et explicites. Elles représentent des classes dans l’univers à être classifié.
Toutes les facettes implicites ou explicites trouvées correspondent à une, et seulement une, catégorie conceptuelle trouvée. Par extension, chaque étiquette de la base de données générée par les utilisateurs correspond à une, et seulement une, facette.

̶ Un algorithme a été développé pour l’analyse initiale de chaque étiquette :

Pour plus facilement gérer la base de données en regroupant les étiquettes en groupes plus petits;
Algorithme applique la Méthode des Résidus de Ranganathan : technique conçue pour aider le « classeur » à considérer la catégorie conceptuelle à laquelle la facette identifiée correspond.
Méthodes des Résidus, fonctionnement : Si une certaine manifestation ne faisant pas partie des catégories Matière, Énergie, Espace et Temps, elle est considérée comme une manifestation de la catégorie fondamentale de Personnalité.

̶ Résultat de l’analyse initiale : division de la base de données en huit grandes catégories :

Temps, Espace, Énergie et Autre dans l’univers des livres;
Temps, Espace, Énergie et Autre dans l’univers des sujets.

̶ Les facettes et facettes de base étaient ensuite examinées pour chaque catégorie.

̶ Puis, trouver plus de catégories conceptuelles à partir des deux catégories Autre.

̶ Les étiquettes étaient groupées ensemble d’après des similarités linguistiques ou opérationnelles puis testées à partir des critères suivants :

Pour s’assurer que le groupement représente une facette, les critère suivants sont utilisés :
- Facettes sont le résultat d’un seul principe de division;
- Une facette est la facette d’une classe, qui est représentée par une facette de base;
- Chaque facette appartient à une catégorie conceptuelle.
- Pour s’assurer que le groupement représente un facette de base, les critères suivants sont utilisés :
  - Les facettes de base représentent des classes dans l’univers;
  - Les classes sont différentiés par des facettes.
  - Pour s’assurer que le groupement représente une catégorie conceptuelle, il doit différentier l’univers entier et contenir au moins une facette.

̶ La vérification de l’identification des facettes mène le plus souvent à l’identification de facettes (implicites ou explicites) de base.

̶ L’identification des catégories conceptuelles de base mène le plus souvent à l’identification des facettes déjà présentes [« therein »].

̶ Problème de l’étiquette composée :

D’après la règle basée sur le postulat de la facette isolée, chaque étiquette était placée dans une, et une seule, facette, et chaque facette était placée dans une, et une seule, catégorie.
Ceci soulève la question suivante : Dans quelle facette placer l’étiquette composée de plusieurs termes ?
Solution : étiquettes composées d’abord mises de côté puis, après l’analyse des facettes, les étiquettes ont été classées dans les facettes jugées les moins détaillées (les plus globales).
Par exemple : Europe médiévale est une étiquette composée de Moyen-Âge, qui représente la facette « par Temps », et d’Europe, qui représente la facette « par Place ». Après s’être assuré que les deux facettes étaient déjà identifiées dans la base de données, l’étiquette a été placée dans la facette « par Temps ».
Si une facette d’une étiquette composée n’est pas déjà identifiée, l’étiquette est classée dans la nouvelle facette.

Retour au plan de l’article

Results

̶ Récapitulation :

Plus de 107 000 instances de 1 275 étiquettes représentant 76 livres d’histoire constituent la folksonomie analyse dans cette recherché.

̶ Résultat de la phase de l’analyse des facettes :

Deux univers implicites distincts : l’univers des livres et l’univers des sujets contenus dans l’univers des livres.
Facettes de base, catégories conceptuelles et facettes identifiées dans les étiquettes représentant chacun des univers (voir Figure 2 et 3).

Figure 2 – Présentation des résultats de l’analyse des facettes de l’Univers des livres au niveau universel

Figure 3 – Présentation des résultats de l’analyse des facettes de l’Univers des sujets

Facettes de base identifiées implicitement dans l’Univers des livres et explicitement dans l’Univers des sujets, représentant les classes de haut niveau dans chacun des univers.

Catégories conceptuelles basées sur Ranganathan; deux catégories additionnelles ont été ajoutées à l’Univers des livres : « Agent » et « External reception ».

Retour au plan de l’article

The universe of books

L’Univers des livres (voir Figure 1)

̶ Étiquettes décrivant l’Univers des livres compte pour 29,46% de la base de données. De ce nombre, 27,93% décrivent des livres en tant qu’œuvres, le 1,53% restant les décrivant comme des objets physiques.

̶ Nombre d’étiquettes identifiées comme « orientées tâche » [« task-oriented »] et appartenant à la catégorie conceptuelle de l’Énergie :

Facette by activity de livres en tant qu’oeuvres : read et tbr (signifiant To Be Read ou To Be Released);
Facette by activity de livres en tant qu’objets physiques : borrowed et wishlist.

̶ Ces étiquettes « orientées tâche » suggèrent la présence d’une dimension supplémentaire dans la classification et l’organisation.

̶ La classification par facettes, à la différence de la classification conventionnelle à deux dimensions, inclut sans problème ces étiquettes, car permet des représentations multidimensionnelles.

̶ De plus, l’utilisateur est lui-même représenté dans la classification ontologique :

Implicitement d’abord, comme l’agent des étiquettes « orientées tâche »;
Explicitement ensuite, comme dans l’étiquette Club de lecture [« Book club »].

̶ Ainsi, l’inclusion de l’utilisateur permet de personnaliser d’une nouvelle manière la navigation à facettes.

Retour au plan de l’article

The universe of subjects

L’Univers des sujets

̶ Facette « par Sujet » dans l’Univers des livres compte pour 70,54 % de la base de données.

̶ Cette facette représente l’Univers des sujets (voir Figure 3).

̶ Les résultats de l’analyse des facettes de l’Univers des sujets est non concluant.

̶ Pourcentages donnés pour les catégories conceptuelles seulement.

̶ L’Univers des sujets est représentatif de la méthode de classification à facettes universelle utilisée par les bibliothèques.

̶ Deux manières de modéliser une classification à facettes universelle :

Diviser l’Univers des sujets en plus petites unités de connaissance (division traditionnelle par discipline, par exemple);
Diviser par les concepts trouvés dans l’univers (tentatives : CRG et Integrative Levels Classification).

Beaucoup d’étiquettes indiquant la discipline font penser qu’il s’agit d’une division naturelle initiale de la part des usagers.

Cependant, les relations entre les facettes ne sont pas tenues en compte lors de l’analyse.

Retour au plan de l’article

The induced faceted classification ontology

̶ Figure 4 et 5 : Illustrent des relations ontologiques identifiées dans la folksonomie.

Figure 4 – Univers des livres et des sujets : Modèle ontologique de l’analyse des facettes

Figure 5 – Relations ontologiques entre focus, facette, catégorie, univers et classe (haut) et exemple issu de la folksonomie illustrant l’étiquette « fiction » (bas).

̶ Chaque facette évoque une relation spécifique de « différentiation par » de l’objet.

̶ Par exemple :

Relation de « différentiation par auteur » entre le livre (en tant qu’œuvre) A History of Reading et l’étiquette Albert Manguel.
Relation de « différentiation par format » entre le livre (en tant qu’objet physique) 1776 et l’étiquette hardcover.

̶ L’identification des facettes dans un espace est signifiant, car représente une nouvelle méthode pour grouper les étiquettes.

Méthode la plus commune de groupement : le nuage de mots [« tag cloud »], basé sur la fréquence d’occurrence.
Ici, différemment, le groupement est basé sur les caractéristiques communes qui distinguent les étiquettes des autres d’après la relation des aspects de l’objet qu’elles représentent.

̶ Cependant, les relations entre facettes [« intra-facet relationships »] ne sont pas explicites : elles sont sémantiques (comme des relations de synonymie ou de hiérarchie).

̶ Désavantage majeur de classifications à facettes : absence de relations explicites entre les facettes.

̶ Par exemple : pas de relations explicites entre les facettes de base représentant les classes dans l’Univers des sujets. Étant donné que le cadre des étiquettes [« tag space »] n’était pas structuré avant l’analyse, cela résulte à l’incapacité de déterminer comment chaque discipline est reliée à l’autre et quelles facettes appartenait à quelle discipline.

̶ En contrepartie, les relations entre facettes sont explicites dans le modèle; elles sont syntaxiques.

̶ Étant donné que toutes les étiquettes sont liée à des facettes, elles héritent tant des relations « entre facettes » que des relations « entre catégories ».

̶ Exemples de relations « entre facettes » dans la base de données :

Relation « auteur-activité-sujet » : « orwell-writes about (implicit)-history ».
Relation« utilisateur-activité-place » : « book clubborrowed-library ».

̶ De plus, étant donné que toutes les facettes appartiennent à des catégories, elles héritent de relations « entre catégories »; permettant la proposition des règles générales en ce qui concerne les relations dans le domaine (en opposition aux relations entre des paires particulières de concepts).

̶ Plus l’univers est petit, plus les relations peuvent être spécifiques et définies.

Retour au plan de l’article

Discussion and suggestions for further research

Avenues futures de recherche : Discussion et suggestions

Applications pratiques de la recherche :

̶ Technique de l’analyse par facettes peut être utilisée pour l’identification et la caractérisation de facettes et de catégories conceptuelles d’étiquettes représentant des livres.

De ce point de vue, la « sagesse du peuple » peut être évoquée pour améliorer la sélection des facettes.
En effet, la première étape dans l’analyse des facettes est de définir le domaine et les intérêts des participants au domaine.
De plus, la difficulté de choisir les bonnes facettes est un des problèmes premiers dans la création des classifications à facettes, particulièrement lors de la construction d’une classification à facettes pour un site web.
Déterminer quelles facettes sont les plus utilisées pour décrire un domaine donné peut fournir des indices importants en ce qui concerne le placement visuel des facettes dans l’interface utilisateur :
Voici les facettes et catégories le plus utilisées dans cette recherche :
- par Discipline (facette de base de sujets) (37%)
- par Genre (facette de livres en tant qu’œuvre) (22%)
- par facettes dans la catégorie Personnalité (catégorie ou sujets) (16%)
- par Place (facettes de sujets) (15%)
- par facettes dans la catégorie Énergie (catégorie de sujets) (13%)
- par Activité (facette de livres en tant qu’œuvre) (4%)
- par Temps (facette de sujets) (3%)
- par Activité (facette de livres en tant qu’objet physique) (1%)
- Facettes par sujets sont les plus populaires.
- Parmi les trois facettes ci-haut décrivant l’Univers des livres, le Genre est clairement le plus populaire, suivi par deux facettes « orientées tâche ».
- Ceci implique que les facettes pourraient être triées d’après les métadonnées générées par les utilisateurs.

̶ 2) Possibilité d’inclure une dimension « utilisateur » dans une classification à facettes.

Présente plusieurs possibilités pour les designers de structures à facettes de sites web pour permettre à l’utilisateur d’interagir sans déranger la structure de base du système de classification.
Cela implique de prendre en compte de l’objectif général de la classification pour préserver la pertinence pour tous les usagers.
Présenter aux utilisateurs des facettes « orientées tâche » qui sont personnalisées en fonction de ses besoins.
Par exemple, un OPAC ou utilisateur pourrait se connecter et marquer les objets dans le catalogue selon ses critères spécifiques. Une facette pourrait s’ajouter aux autres sur la page de recherche pour présenter les étiquettes « orientées tâche » sélectionnées précédemment par l’utilisateur.

̶ Dans la présentation des résultats de l’analyse par facettes des étiquettes représentant l’Univers des sujets, des difficultés ont été rencontrées en ce qui a trait à l’identification de la nature des facettes.

̶ Ceci implique la nécessité d’une division initiale de l’Univers des sujets;

̶ Moyen pour le faire :

Un système d’étiquetage qui requiert des utilisateurs de choisir une catégorie de base dans laquelle placer chaque ressource avant de l’étiqueter.
Critiques :
- Va à l’encontre de la liberté et la facilité de l’étiquetage;
- Ne tient pas compte du fait que les distinctions entre les disciplines sont de moins en moins rigides.

̶ Plus de recherche est nécessaire pour examiner les différentes méthodes de division initiale de l’Univers des sujets pour faciliter l’analyse par facettes des étiquettes :

Open Shelves Classification (OSC) de LibraryThing : vise à créer des classes de haut niveau, dans l’Univers des sujets, testées statistiquement à travers une collaboration des utilisateurs (du bas vers le haut). Une comparaison de l’utilisation des disciplines dans les étiquettes avec les classes de haut niveau est ensuite effectuée.
Par ailleurs: Modèle existant pour la prédiction de choix d’étiquettes basé d’après une étude cognitive sur l’effet d’imitation sur l’étiquetage.

̶ La méthodologie appliquée manuellement à la base de données de cette recherche a été une entreprise longue et laborieuse :

̶ Alors que l’analyse des facettes de l’Univers des sujets est restée incomplète, l’analyse de l’Univers des livres a été réussie.

̶ Des algorithmes pourraient être développés (basés sur la Méthode des Résidus, par exemple) pour automatiser partiellement l’analyse des facettes appliquée à des domaines plus restreints.

̶ Des recherches futures en ce sens sont recommandées.

Retour au plan de l’article

Références sélectionnées

Abrera, J. (1974). Traditional Classification: Characteristics, Uses and Problems. Drexel Library Quarterly, 10 (4), 21-36.

Broughton, V. (2006). The need for a faceted classification as the basis of all methods of 92 information retrieval. Aslib Proceedings: New Information Perspectives, 58 (1/2), 49-72.

Broughton, V. (2009). Facet analysis as the theoretical basis of vocabulary tool construction: Fundamental Purposes in Knowledge Organization. PowerPoint Lecture presented at the ISCO UK Conference, 2009. Retrieved November 22, 2009, from <http://www.iskouk.org/conf2009/presentations/broughton_ISKOUK2009_presen tation.pdf>

Dahlberg, I. (1992). Cognitive Paradigms in Knowledge Organization. International Classification, 19(3), 125 and 145.

Ellis, D. & Vasconcelos, A. (1999). Ranganathan and the net: Using facet analysis to search and organize the World Wide Web. Aslib Proceedings, 51 (1), 3-10.

Fu, W-T., Kannampallil, T. & Kang, R. (2009). A Semantic Imitation Model of Social Tag Choices. Proceedings of the 2009 International Conference on Computational Science and Engineering, 4, 66-73.

Gnoli, C. & Szostak, R. (2007). The León manifesto. Retrieved March 13, 2009, from <http://www.iskoi.org/ilc/leon.php>

Gnoli, C. (2008). Categories and Facets in Integrative Levels. Axiomathes: an international journal in ontology and cognitive systems, 18 (2), 177-192.

Ingwersen, P. & Wormell, I. (1992). Ranganathan in the perspective on advanced information retrieval. Libri: international library review, 42 (3), 184-201.

Lichtblau, D., Trice, A., & Wartik, S. (2006). Taxonomic and Faceted Classification for Intelligent Tagging and Discovery in Net-Centric Command and Control. Paper presented at 2006 CCRTS, Command and Control Research and Technology Symposium, June 20–22, 2006, San Diego, California

Mills, J. (1960). A Modern Outline of Library Classification. London: Chapman & Hall.

Morville, P. & Rosenfield, L. (2007). Information Architecture for the World Wide Web (3rd ed.). California: O‘Reilly.

Petersen, E. (2006). Beneath the Metadata: Some Philosophical Problems with Folksonomies. D-Lib Magazine, 12(11). Retrieved September 3, 2009, from <http://www.dlib.org/dlib/november06/peterson/11peterson.html>

Quintarelli, E., Resmini, A. & Rosati, L. (2006). Facetag: Integrating Bottom-up and Top-down Classification in a Social Tagging System. Paper presented at the EuroIA Conference 2006, Berlin (DE).

Redmond-Neal, A. (n.d.). Facets Help Move from Search to Found (White paper). Retrieved November 27, 2009, from <http://taxodiary.com/2010/12/facets-help-move-from-search-to-found/>

Rosenfield, L. (2005). Folksonomies? How about Metadata Ecologies? Retrieved September 3, 2009, from <http://www.louisrosenfeld.com/home/bloug_archive/000330.html>

Schwartz, C. (2008). Thesauri and facets and tags, oh my! A look at three decades in subject analysis. Library Trends, 56 (4), 830-842.

Spiteri, L. (2010). Incorporating Facets into Social Tagging Applications: An Analysis of Current Trends. Cataloging & Classification Quarterly, 48(1), 94-109.

Steckel, M. (2002). Ranganathan for IAs: An Introduction to the Thought of S.R. Ranganathan for Information Architects. Retrieved September 3, 2009, from <http://boxesandarrows.com/ranganathan-for-ias/>

Stoica, E., Hearst, M. & Richardson, M. (2007). Automating Creation of Hierarchical Faceted Metadata Structures. In Proceedings of NAACL-HLT, Rochester NY, April 2007.

Uddin, M. & Janecek, P. (2007). Faceted classification in web information architecture: A framework for using semantic web tools. The Electronic Library, 25(2), 219-233.

Vickery, B.C. (1960). Faceted Classification: A guide to construction and use of special schemes. London: Aslib.

Vickery, B.C. (1966). Faceted Classification Schemes. New Brunswick, N.J.: The Graduate School of Library Services, Rutgers.

Weaver, M. (2007). Contextual metadata: Faceted schemas in virtual library communities. Library Hi Tech, 25 (4), 579-594.

Xiao, Y. (1994). Faceted Classification: A Consideration of its Features as a Paradigm of Knowledge Organization. Knowledge Organization, 21(2), 64-68.

Retour au plan de l’article

[1] Voir : Ranganathan’s Prolegomena to Library Classification. <http://www.miskatonic.org/library/prolegomena.html>

[2] Fonctionnalité du site qui permet de combiner des étiquettes. Voir : <http://www.librarything.com/blogs/librarything/2007/07/tagmash/>

INFRAN

Conradi

to_be_classified: A Facet Analysis of a Folksonomy

Résumé

Plan du texte

Folksonomies : unstructured « wisdom of the crowd »

Related work

The faceted classification ontology

The postulational approach to facet analysis

1. The Postulate of Fundamental Categories

2. The Postulate of Basic Facet

3. The Postulate of Isolate Facet

Dataset and methodology

Tags from LibraryThing

The Facet Analysis

Results

The universe of books

The universe of subjects

The induced faceted classification ontology

Discussion and suggestions for further research

Références sélectionnées

Menu

PARTAGER