Cabanac et al.

Visualisation et exploration du capital documentaire d’une organisation au travers d’une interface multifacette

de Guillaume Cabanac, Max Chevalier, Claude Chrisment et Christine Julien

Résumé par Simon Côté-Lapointe

Référence : Cabanac, G., Chevalier, M., Chrisment, C., & Julien, C. (2009). Visualisation et exploration du capital documentaire d’une organisation au travers d’une interface multifacette. Ingénierie des Systèmes d’Information, 14(2), 35-60. doi:10.3166/isi.14.2.35-60

Cliquez ici pour accéder à l’article original

Résumé

Les individus organisent les documents utiles à leurs activités dans leur espace personnel d’information (EPI). Dans le contexte d’une organisation, l’ensemble des EPI de ses membres représente un capital documentaire interne à forte valeur ajoutée. Paradoxalement, cette source d’information est peu exploitée, les individus privilégiant une source externe telle que le web, pourtant moins adaptée a priori. Afin de répondre à cette problématique, nous définissons une interface pour explorer le capital organisationnel en naviguant dans des « facettes » qui représentent les thématiques des documents et l’usage que les individus en font. Basée sur l’exploitation du SI organisationnel, cette proposition vise à mieux rentabiliser les efforts requis pour la gestion des EPI au travers d’une interface sur le principe du donnant-donnant.

Plan du texte

1. Introduction et motivations
2. Limites de l’exploitation du capital documentaire organisationnel

2.1. Arborescences de documents dans le SI : un capital à forte valeur ajoutée
2.2. Limites du partage et de la diffusion de documents organisationnels

2.2.1. Partage et diffusion manuels de documents au sein de l’organisation
2.2.2. Partage et diffusion automatiques de documents au sein de l’organisation

2.3. Limites de la visualisation des documents organisationnels

3. Interface multifacette d’accès au capital organisationnel

3.1. Aspect statique de l’interface : représentation du capital organisationnel

3.1.1. Vue 1 : représentation d’un groupe de documents
3.1.2. Vue 2 : représentation d’un seul document
3.1.3. Vue 3 : représentation d’un groupe de personnes
3.1.4. Vue 4 : représentation d’une seule personne

3.2. Aspect dynamique de l’interface : exploration du capital organisationnel
3.3. Mise en œuvre de l’interface proposée

3.3.1. Modélisation des composants du SI nécessaires à notre approche
3.3.2. Mesures de similarité sur le contenu et sur l’usage des documents

3.3.2.1. Similarité basée sur le contenu des documents indexés
3.3.2.2. Similarité basée sur l’usage des documents classés dans les EPI

3.3.3. Techniques de visualisation utilisées pour représenter documents et personnes

4. Implantation de l’interface multifacette et scénario d’utilisation
5. Discussion
6. Conclusion et perspectives
Références sélectionnées

1. Introduction et motivations

–        Importance du système d’information (SI) pour les activités des organisations : accès à l’information.

–        Espace personnel d’information (EPI) : systèmes de gestion de fichiers, favoris internet, etc. utilisés par les employés pour classer les documents.

–        Structure arborescente est une mine d’information interne sur l’activité des employés, mais souvent inutilisée : les documents organisés dans l’EPI restent confidentiels (« difficulté à accéder au capital documentaire de l’organisation » (p. 36).).

–        La capital documentaire (par exemple les documents issus de recherches web effectuées par les employés) serait utile s’il était accessible par un système de type donnant-donnant.

 

–        « [C]et article définit une interface multifacette d’accès au capital documentaire de l’organisation » pour « rendre possible la visualisation et l’exploration du capital documentaire » (p. 36).

–        Expérimentation d’un SI organisationnel non intrusif  : ne change pas la méthode de travail des employés et ne nécessite pas de modification spécifique.

–        « L’’interface proposée permet la visualisation des documents et des personnes selon deux axes :

  • Selon leur thématique (en fonction de leur contenu);
  • Selon leur usage (en fonction de leur classement dans les EPI, deux documents étant d’autant plus proches par l’usage qu’ils sont souvent rangés dans des répertoires proches au sein des EPI). » (p. 36)

–        Postulat : l’interface permet de répondre aux besoins des employés et accroît le retour sur l’investissement.

Retour au plan de l’article

2. Limites de l’exploitation du capital documentaire organisationnel

–        EPI des employés « représentent un capital à forte valeur ajoutée, bien que paradoxalement en sommeil » (p. 37).

–        Moyens pour valoriser les documents dans la littérature : diffusion (manuelle ou automatique) et techniques de visualisation.

2.1. Arborescences de documents dans le SI : un capital à forte valeur ajoutée

–        Cette section examine le rapport entre individus et les documents, en particulier les travailleurs du savoir (knowledge workers) : ingénieur, scientifique, chef de projet, etc.

–        « [L]es individus travaillent de plus en plus au contact de l’information, si bien que nous sommes tous des travailleurs du savoir » (p.37)

–        Recherche d’information :

  • 15% à 35% du temps de travail;
  • Tâche hautement cognitive :
    • formuler la requête;
    • utiliser un moteur de recherche;
    • cibler les sources pertinentes;
    • analyser les résultats;
    • identifier les documents pertinents.

–        « Lorsque l’individu estime qu’il aura à nouveau besoin d’un document, il peut le conserver en le stockant dans son EPI. » (p. 37)

–        Caractéristiques des EPI :

  • Plusieurs formes d’EPI : arborescence de fichiers, signets web (bookmarks), courriels, etc.
  • Organisés hiérarchiquement;
  • Profondeur de 1 à 3 niveaux au moins;
  • Constituent un capital documentaire pour l’organisation.

–        Problématique des EPI :

  • Accessibles que par leur propriétaire;
  • Ne profitent pas aux autres membres;
  • Documents conservés sont « l’objet d’efforts de recherche répétés, parfois en vain car une recherche sur deux échouerait » (p.38);
  • « Recréation inutile d’information : un nouveau rapport serait constitué de 90% d’informations préexistantes » (p.38);

Retour au plan de l’article

2.2. Limites du partage et de la diffusion de documents organisationnels

–        Moyens utilisés par les membres organisationnels pour partager et diffuser leurs documents.

–        Limites cognitives et motivationnelles des approches manuelles et automatiques.

2.2.1. Partage et diffusion manuels de documents au sein de l’organisation

–        Moyens pour partager manuellement :

  • Donner les droits d’accès directement sur les répertoires de l’EPI.
    • Stratégie de partage limitée, « car il faut identifier les personnes potentiellement intéressées et leur indiquer le chemin des répertoires partagés » (p. 38).
    • Créer un répertoire partagé.
      • Effort commun pour partager les documents;
      • Nécessité d’établir des règles de nommage et d’indexation;
      • Usager contraint de s’adapter, donc une surcharge cognitive.
      • Publier sur un wiki ou sur l’intranet de l’organisation avec des outils tels que MS SharePoint Services ou Lotus Notes.
        • Effort pour sélectionner les rubriques adaptées pour un document donné;
        • Difficulté liée à la taille de l’intranet (par exemple, « celui d’IBM comprendrait au moins 5,5 millions de pages » (p.38));
        • 40% des recherches sur l’intranet de grands comptes échouent;
        • Utiliser des logiciels de social boomarking (tels que Dogear ou Connotea).
          • Permet « à une personne de constituer sa collection de bookmarks et d’en partager tout ou partie » (p.39);
          • Comprend infos : URL, commentaires, tags;
          • Navigation par tags pour explorer le corpus (ambiguïté sémantique possible des tags).

–        Alternative au partage de documents : Diffusion par courriels ou listes de diffusion.

  • Démarche active et effort supplémentaire : sélectionner les documents et identifier les destinataires;
  • Surcharge possible lorsque trop d’envois;

Retour au plan de l’article

2.2.2. Partage et diffusion automatiques de documents au sein de l’organisation

–        Mise en place d’un système de filtrage qui recommande automatiquement des documents à des individus selon leur besoins.

–        Nécessite la construction de profils pour représenter les documents et les besoins des usagers.

–        Méthode de construction : Appariement par thématiques des documents et centres d’intérêt des individus.

  • Limites :
    • Difficulté à modéliser les profils et les tenir à jour;
    • Nécessité d’une masse importante d’usagers;
    • « Difficulté d’émettre des recommandations à un nouvel usager » (p. 39);
    • Problème du vocabulaire.

Retour au plan de l’article

2.3. Limites de la visualisation des documents organisationnels

–        Exemples de techniques et d’outils de visualisation applicables à l’exploration d’un capital documentaire.

–        Approche par métadonnées :

  • Exemple : visualisation Tree-map (voir Figure 1) qui représente une arborescence de fichiers en fonction de leur taille.
Cabanac 1

Figure 1 – Visualisation de la taille des fichiers d’une hiérarchie

  • Chaque rectangle représente un fichier ou un répertoire;
  • Couleur des rectangles correspond au type (extension) du fichier associé;
  • Dimension proportionnelle à la taille physique du répertoire ou fichier représenté;
  • Répertoires les plus imbriqués (niveaux hiérarchiques dans l’arborescence) sont présentés de manière plus sombre.

 Retour au plan de l’article

–        Approche par contenu basée sur l’exploitation du texte des documents :

  • Exemple : Cartes auto-organisatrices (voir Figure 2) qui représentent les thématiques des documents.
Cabanac 2

Figure 2 – Carte auto-organisatrice générée par WEBSOM

  • Carte divisée en zones qui symbolisent des thématiques;
  • Dégradé représente le nombre de documents;
  • Usager peut consulter les détails d’une zone en la consultant;
  • Dans une organisation, offre une vision globale des thématiques collectives

–        Variantes :

  • Extension pour identifier les propriétaires des documents sélectionnés et accéder à leurs documents.
  • Certaines cartes (ex :  DocCube, Tétralogie) « permettent l’analyse du corpus documentaire selon différents axes d’analyses pouvant être spécifiés à partir de leurs métadonnées (taille, date de création, auteurs) ou de leur contenu (thématiques) » (p.41)
  • Représentation  des résultats de recherche dans un cône 3D de façon à identifier leur affinité avec les mots-clés composant la requête (ISIDOR).

 

–        Caractéristiques :

  • Vue globale des documents de l’organisation;
  • Accès à tous les documents traitant d’une thématique donnée;

–        Problème :

  • l’usager ne peut « identifier les documents fréquemment utilisés avec un document donné, afin de répondre aux besoins de l’organisation. »

–        Solution proposée :

  • interface multifacette qui combine les thématiques et la fréquence d’utilisation des documents.

–        Originalité de l’approche proposée :

  • « vise à rentabiliser le SI organisationnel sur le principe du donnant-donnant » (p.41);
  • interface « destinée aux membres ainsi qu’au pilotage de l’organisation » (p.41);
  • identification et exploitation des relations d’usage qui lient les documents employés et les individus.

Retour au plan de l’article

3. Interface multifacette d’accès au capital organisationnel

–        L’interface proposée vise à répondre aussi bien à des besoins opérationnels que stratégiques.

–        Besoins opérationnels (réalisation de tâches) :

  • Vue globale des documents de l’organisation et en  permet l’exploration, par thématique ou par usage (voir Figures 3 et 4).
Cabanac 3

Figure 3 – Exemple d’un multi-arbre construit à partir de deux EPI

Cabanac 4

Figure 4 – Comparaison de la similarité des documents sur l’usage (a) par rapport à leur similarité sur le contenu (b). La longueur des arcs est inversement proportionnelle à la similarité entre les nœuds associés qui représentent les documents d1 à d12

–        Besoins stratégiques : « concerne les activités propres au pilotage de l’organisation, notamment au service des ressources humaines » (p. 42)

  • Permet de visualiser les activités documentaires de tout ou une partie des employés.
  • « Une application directe consiste à identifier les documents utilisés pour réaliser les activités associées à un poste donné. » (p.43)
  • Aide à :
    • trouver des personnes-ressources;
    • composer une groupe de travail;
    • identifier les centres d’intérêt émergeants,
    • lutter contre la rotation de l’emploi (turnover).
    • Cartographie « en fonction du contenu des documents et des relations établies entre les différents acteurs ». (p.43)
    • Approche proposée : prendre en compte la notion d’usage pour identifier les liens  « complémentaires entre les documents selon leur organisation dans les EPI ».

Retour au plan de l’article

3.1. Aspect statique de l’interface : représentation du capital organisationnel

–        Interface : visualisation de deux dimensions : documents et personnes.

–        Pour chaque dimension, possibilité d’explorer « un ensemble d’éléments (un groupe de documents ou de personnes) ou un seul élément (un document ou une personne) » (p. 43)

–        Matérialisés par quatre « vues » (ou fenêtres dans l’interface graphique) (voir Figure 5)

–        « De plus, chaque vue comprend quatre « facettes » où figurent des informations relatives à la vue choisie. » (p. 43)

Cabanac 5

Figure 5 – Architecture générale de l’interface comprenant des vues et des facettes

–        Trois types de facettes pour représenter les informations : visualisation, liste et fiche (voir Figure 6).

–        Ainsi, chaque nom de facette est préfixé par l’initiale de son type (v, l ou f).

Cabanac 6

Figure 6 – Description des facettes associées aux quatre vues composant l’interface

Retour au plan de l’article

3.1.1. Vue 1 : représentation d’un groupe de documents

–        Visualiser les documents de l’organisation regroupés par thématique (vDocsThé) et par usage (vDocsU).

–        Basé sur le contenu des documents (nombre de termes communs) et sur leur organisation au sein des EPI (ensemble dans le même dossier).

–        Facette lPers : liste des propriétaires des documents sélectionnés.

–        Facette lThé : liste les thématiques concernant les documents sélectionnés.

3.1.2. Vue 2 : représentation d’un seul document

–        Vue présente la fiche d’un document (fDoc) qui donne accès à son titre, à son contenu et aux chemins absolus des EPI.

–        Facette lThé : thématiques listées des documents.

–        Facette lPers : individus possesseurs.

–        Facette lDocsReliés : documents connexes ordonnés par similarité d’usage.

–        « L’usager identifie les personnes intéressées par le document, il peut par la suite explorer leurs EPI pour trouver d’autres documents intéressants et éventuellement prendre contact avec eux. » (p.45)

3.1.3. Vue 3 : représentation d’un groupe de personnes

–        « Cette vue permet à un usager d’identifier les intérêts thématiques caractérisant tout groupe de personnes, qu’il soit explicite (une équipe mentionnée dans l’organigramme) ou tacite (des personnes qui ont des affinités, qui déjeunent ensemble, etc.). » (p.45)

–        Facette vPers : un ensemble de personnes et visualisation des liens qui les unissent.

–        Facette lPers : liste les personnes visualisées.

–        Facette lGroupes : « noms et le nombre de représentants des groupes distincts correspondant aux personnes visualisées dans vPers » (p.45) : équipes, groupes de travail, commissions, etc.

–        Facette iThé : les thématiques associées aux EPI des personnes visualisées.

3.1.4. Vue 4 : représentation d’une seule personne

–        fPers : fiche représentant l’identité (nom, prénom) et les groupes d’appartenance d’une personne.

–        Facette vHié : représentation hiérarchique des documents de l’EPI.

–        Facette lThé : liste des thématiques relatives à l’EPI.

–        Facette lPers : personnes qui partagent les mêmes thématiques.

–        « Un scénario concret d’utilisation consiste, pour un usager donné, à visualiser sa propre fiche pour identifier les personnes proches de lui (par thématique ou par usage). Par la suite, la visualisation de leur fiche lui permet de connaître les thématiques qui les caractérisent. Il peut alors explorer le contenu de leurs EPI en fonction des thématiques qui l’intéressent et de leur structure. » (p.46)

Retour au plan de l’article

3.2. Aspect dynamique de l’interface : exploration du capital organisationnel

–        Deux types d’interactions entre l’usager et l’interface : « intra-vue » et « inter-vues ».

–        Interaction intra-vue :

  • Répercute « automatiquement la sélection d’un ou de plusieurs éléments d’une facette sur les trois autres facettes de la vue » (p.46) Tout le contenu s’adapte selon les choix de facettes.
  • Plus : Possibilité de formuler des requête avec mots-clés et opérateurs booléens pour sélectionner les éléments.
  • Permet de localiser un même élément dans toutes les facettes qui constituent une vue, ces facettes
  • proposant des représentations complémentaires de l’information extraite des EPI.

–        Interaction inter-vues :

  • Permet la navigation d’une vue à l’autre.
  • « En fonction d’une action réalisée sur une facette, l’interface remplace la vue actuelle par une autre vue répondant plus précisément au besoin exprimé. [Par exemple], la sélection d’une personne au sein de la facette vPers (vue 3) permet par exemple de basculer sur la vue 4, car elle apporte davantage d’informations sur cette personne. » (p. 46)
  • Modèle de la dynamique de l’interface (Figure 7) :
Cabanac 7

Figure 7 – Diagramme états-transitions décrivant la dynamique de l’interface

Retour au plan de l’article

  • Une transition d’une vue à l’autre est déclenchée par une action de l’utilisateur.
  • « Plusieurs actions possibles sont séparées par une virgule. »
  • Légendes :
    • m = sélection multiple;
    • u = sélection d’un seul élément;
    • * = sélection multiple ou unique.

La Figure 8 synthétise les aspects statique (Figure 6) et dynamique (Figure 7).

Cabanac 8

Figure 8 – Synthèse des aspects statique et dynamique de l’interface proposée

Retour au plan de l’article

3.3. Mise en œuvre de l’interface proposée

–        Modéliser les données sources (indexation) pour représenter le contenu sous forme de facettes.

3.3.1. Modélisation des composants du SI nécessaires à notre approche

–        Classes :

  • Personne (nom et prénom), login, chemin absolu de son EPI, groupes, répertoires (de système de gestion de fichiers, d’ arborescence de signets web, etc.).
  • Chaque répertoire peut contenir des sous-répertoires et des exemplaires (caractérisé par la date de création et le nom) de documents.

–        Classes des thématiques des documents :

  • Modélisation des termes qui les composent.
  • Extraits à partir du processus d’indexation :
  1. Segmentation : découper le contenu d’un document en mots;
  2. Élimination des mots vides;
  3. Lemmatisation : transformer un mot en sa forme canonique (troncature, par exemple);
  4. Pondération des termes : dénombre les occurrences de chaque terme.
  5. Stockage « au niveau de la classe Index reliée à l’association entre les classes Document et Terme, l’attribut nb représentant le nombre d’occurrences du terme dans le document. » (p.49)

Retour au plan de l’article

3.3.2. Mesures de similarité sur le contenu et sur l’usage des documents

–        « Les informations présentées dans diverses facettes de l’interface sont basées sur le calcul de similarités thématique et d’usage. » (p. 49)

3.3.2.1. Similarité basée sur le contenu des documents indexés

–        Évaluation de la similarité entre deux documents en recherche d’information.

  • Modèle vectoriel :
    • Poids des termes dépend de deux facteurs :
      • fréquence relative dans le document;
      • l’inverse de sa fréquence dans le corpus.

–        Évaluation de la similarité entre deux répertoires.

  • Approche du « méga-document » :
    • Présenter un répertoire « comme un document en concaténant le contenu textuel des documents qu’il contient » (p. 50).
    • « Même principe pour évaluer la similarité entre personnes, où une personne est représentée par un document unique créé en concaténant tous les documents de son EPI. » (p. 50)

–        Exemples :

  • Facette vDocsThé : construite à partir des valeurs de similarité calculées sur le contenu des documents pris deux à deux.
  • Facette lThé (thématiques) : termes issus de l’indexation, classés par fréquence décroissante.
  • Facette vPers : similarités entre personnes prises deux à deux.
3.3.2.2. Similarité basée sur l’usage des documents classés dans les EPI

–        Similarité d’usage repose uniquement sur la structure des EPI.

–        Évalue à quel point deux documents  sont utilisés ensemble par les individus.

–        « Les deux similarités (contenu et usage) sont complémentaires : deux documents peuvent être utilisés ensemble sans pour autant contenir les mêmes termes, et vice versa. La similarité sur l’usage repose sur l’observation suivante : les individus regroupent, au sein de leurs EPI, les documents qu’ils estiment similaires selon des critères personnels : par domaine, par objectif, etc.» (p. 50)

–        Modélisation des EPI dans un multi-arbre (exemple : voir Figure 3).

–        Deux facteurs déterminants :

  • de leur proximité dans le multi-arbre;
  • du nombre de personnes qui les ont rangés ensemble ou dans des répertoires proches (fréquence du regroupement).

–        Exemples :

  • Similarité inter-documents sur l’usage : Facettes vDocsU et lDocsReliés
  • Similarité inter-personnes : Facette lPers.

Retour au plan de l’article

3.3.3. Techniques de visualisation utilisées pour représenter documents et personnes

–        Objectif de la visualisation : offrir une vue globale du capital organisationnel.

–        Deux critères :

  • Doit permettre de « représenter des éléments en fonction de leur similarité (de thématique ou d’usage) » (p.52);
  • Doit permettre l’affichage d’un nombre d’éléments important.

–        Représentation des liens d’usage entre les documents et entre les personnes : visualisation sous forme de graphe (voir Figure 9) :

  • Favorise l’identification de groupes de documents utilisés ensemble;
  • Nœuds représentent les documents ou personnes, reliés par des arcs dont la longueur est inversement proportionnelle à leur similarité;
  • Arcs étiquetés avec les chemins absolus.
Cabanac 9

Figure 9 – Graphe de l’usage des documents

–        Représentation des thématiques des documents :

  • Cartes auto-organisatrices de Kohonen (voir Figure 2) :
    • « mettent en évidence les différentes thématiques d’un corpus et leur importance relative en nombre de documents » (p. 52);
    • Représentation arborescente.

–        Représentation d’un ensemble de documents :

  • À partir d’une arborescence de répertoires thématiques (algorithme de classification ascendante hiérarchique);
  • Créer « une arborescence binaire dont nous réduisons la profondeur afin de la rendre exploitable »;
  • Répertoires étiquetés avec les termes les plus représentatifs issus des documents qui les composent.

Retour au plan de l’article

4. Implantation de l’interface multifacette et scénario d’utilisation

Présentée sous forme d’une seule fenêtre contenant quatre onglets, un pour chacune des vues représentées en Figure 8.

La page web permet de lancer l’application et d’explorer le capital documentaire d’une organisation imaginée : http://www.irit.fr/~Guillaume.Cabanac/MultiFacettes/

Cabanac 10

Figure 10 – Vue 1 de l’interface montrant tous les documents de l’organisation

[Voir article original, pages 53 à 55 pour la mise en situation et l’exemple complet]

Retour au plan de l’article

5. Discussion

–        Objectif (rappel) : Concevoir une interface non intrusive, ne nécessitant pas d’adaptation pour les utilisateurs, pour limiter la résistance au changement.

–        Usagers peuvent cependant indiquer que certains documents restent confidentiels.

–        Possibilité éventuelle de noter les documents sur une échelle de 1 à 5 « pour mettre en

–        valeur les parties des documents jugées les plus intéressantes » (p. 56).

–        Analyse des EPI : « l’interface proposée ne permet pas l’identification d’expertise à proprement parler » (p. 56) : ce n’est pas parce qu’on individu a beaucoup de documents sur un sujet qu’il est nécessairement expert. L’inverse est aussi vrai.

–        Motivations d’archivage :

  • Première : pouvoir retrouver un document;
  • Deuxième : construction d’un « héritage documentaire ».
  • Interface proposée permet la mise en commun de l’héritage documentaire sans modifier les habitudes de travail.

–        Principe du donnant-donnant motive les différents membres organisationnels : leurs efforts d’organisation de leurs EPI bénéficient également à l’organisation dans sa globalité.

Retour au plan de l’article

6. Conclusion et perspectives

–        Résumé de la problématique :

  • « EPI forment des mines d’informations structurées de façon incrémentale » (p.56).
  • Problèmes :
    • Info accessible seulement par son propriétaire;
    • Limites du partage (automatique ou manuel) des documents : surcharge cognitive, pertinence des profils usagers.
    • Individus privilégient donc les sources externes (web) pour leurs recherches d’information.

–        Solution proposée : donner accès aux EPI avec une interface multifacette à partir des données extraites du SI.

–        Principe du donnant-donnant : bénéfices organisation / individus

–        « Utilité de l’exploration par thématique et par usage, au travers des facettes de l’interface » (p. 57)

–        Prochaines étapes de la recherche : Évaluer l’interface dans une organisation réelle.

  • Évaluations qualitative et quantitative avec des enseignants-chercheurs spécialistes;
  • Expérimentation de techniques adaptées à la visualisation de grands graphes;
  • Prendre en compte la dimension temporelle :
    • Connaissance actualisée d’un domaine (conseil, veille technologique);
    • Connaissance à long terme (recul sur une technologie, rétrospective d’un domaine).
    • « Distinguer les ressources et thématiques qui (ré)émergent par rapport à celles qui sont  progressivement abandonnées » (p. 57).
    • « L’identification de liens sociaux ainsi que les similarités de thématique, d’usage et d’utilisation de documents » (p. 57).

Retour au plan de l’article

Références sélectionnées

Baeza-Yates R. A., Ribeiro-Neto B. A., Modern information retrieval, ACM Press/Addison-Wesley, 1999.

Boutin F., Hascoët M., “Focus dependent multi-level graph clustering”, AVI’04: Proceedings of the working conference on Advanced visual interfaces, ACM, New York, NY, USA, p. 167–170, 2004.

Boyer M., Canut M.-F., Chevalier M., Péninou A., Sèdes F., “Cartographie de l’organisation : une approche topologique des connaissances”, EGC’07 : actes des 7e journées Extraction et Gestion des Connaissances, vol. RNTI-E-9 of Revue des Nouvelles Technologies de l’Information, Cépaduès, p. 557–568, 2007.

Cabanac G., Chevalier M., Chrisment C., Julien C., “An Original Usage-based Metrics for Building a Unified View of Corporate Documents”, in R. Wagner, N. Revell, G. Pernul (eds), DEXA’07: Proceedings of the 18th International Conference on Database and Expert Systems Applications, vol. 4653 of LNCS, Springer, p. 202–212, September, 2007.

Chen C., Information visualization: Beyond the horizon, 2nd edn, Springer, May, 2006.

Chevalier M., Interface adaptative pour l’aide à la recherche d’information sur le Web, Thèse de doctorat, Université Toulouse 3, France, December, 2002.

Chevalier M., Verlhac M., “ISIDOR: A Visualisation Interface for Advanced Information Retrieval”, ICEIS’00: Proceedings of the 2th International Conference on Enterprise Information Systems, p. 414–418, July, 2000.

Dmitriev P. A., Eiron N., Fontoura M., Shekita E., “Using Annotations in Enterprise Search”, WWW’06: Proceedings of the 15th international conference on World Wide Web, ACM Press, New York, NY, USA, p. 811–817, 2006.

Fekete J.-D., Plaisant C., “Interactive Information Visualization of a Million Items”, INFOVIS’ 02: Proceedings of the IEEE Symposium on Information Visualization, IEEE Computer Society, Washington, DC, USA, p. 117, 2002.

Feldman S., “The high cost of not finding information”, KM World magazine, vol. 13, n° 3, p. electronic edition http://www.kmworld.com/Articles/Editorial/Features/The-high-cost-of-not-finding-information-9534.aspx Article ID=9534, March, 2004.

Furnas G. W., Landauer T. K., Gomez L. M., Dumais S. T., “The Vocabulary Problem in Human-System Communication”, Commun. ACM, vol. 30, n° 11, p. 964–971, 1987.

Hammond T., Hannay T., Lund B., Scott J., “Social Bookmarking Tools (I): A General Review”, D-Lib Magazine, vol. 11, n° 4, p. electronic edition http://dx.doi.org/10.1045/april2005-hammond, April, 2005.

Herman I., Melançon G., Marshall M. S., “Graph Visualization and Navigation in Information Visualization: A Survey”, IEEE Transactions on Visualization and Computer Graphics, vol. 6, n° 1, p. 24–43, 2000.

Hinds P. J., Pfeffer J., “Why Organizations Don’t “Know What They Know”: Cognitive and Motivational Factors Affecting the Transfer of Expertise”, in M. S. Ackerman, V. Wulf, V. Pipek (eds), Sharing expertise: Beyond knowledge management, MIT Press, Cambridge, MA, USA, chapter 1, p. 3–26, 2003.

Jardine N., van Rijsbergen C. J., “The Use of Hierarchic Clustering in Information Retrieval”, Information Storage and Retrieval, vol. 7, n° 5, p. 217-240, 1971.

Johnson B., Shneiderman B., “Tree-Maps: a Space-Filling Approach to the Visualization of Hierarchical Information Structures”, VIS’91: Proceedings of the 2nd conference on Visualization, IEEE Computer Society Press, Los Alamitos, CA, USA, p. 284–291, 1991.

JonesW., “How People Keep and Organize Personal Information”, inW. Jones, J. Teevan (eds), Personal information management, University of Washington Press, WA, USA, chapter 3, p. 35–56, 2007.

JonesW., Phuwanartnurak A. J., Gill R., Bruce H., “Don’t Take My Folders Away!: Organizing Personal Information to Get Things Done”, CHI’05 extended abstracts on Human factors in computing systems, ACM Press, New York, NY, USA, p. 1505–1508, 2005.

Karouach S., Visualisations interactives pour la découverte de connaissances : concepts, méthodes et outils, Thèse de doctorat, Université Toulouse 3, France, July, 2003.

Kaye J. J., Vertesi J., Avery S., Dafoe A., David S., Onaga L., Rosero I., Pinch T., “To Have and to Hold: Exploring the Personal Archive”, CHI’06: Proceedings of the conference on Human Factors in computing systems, ACM Press, New York, NY, USA, p. 275–284, 2006.

Khoo C. S., Luyt B., Ee C., Osman J., Lim H.-H., Yong S., “How users organize electronic files on their workstations in the office environment: a preliminary study of personal information organization behaviour”, Information Research, vol. 11, n° 2, p. electronic edition http://informationr.net/ir/12-2/paper293.html, January, 2007.

Klas C.-P., Fuhr N., “A new Effective Approach for Categorizing Web Documents”, Proceedings of the 22th BCS-IRSG Colloquium on IR Research, April, 2000.

Kohonen T., Self-organizing maps, 3rd edn, Springer-Verlag, Secaucus, NJ, USA, 2001. Lagus K., Kaski S., Kohonen T., “Mining massive document collections by the WEBSOM method”, Inf. Sci., vol. 163, n° 1-3, p. 135–156, 2004.

Lund B., Hammond T., Flack M., Hannay T., “Social Bookmarking Tools (II): A Case Study – Connotea”, D-Lib Magazine, vol. 11, n° 4, p. electronic edition http://dx.doi.org/10.1045/april2005-lund, April, 2005.

Maarek Y. S., Ben-Shaul I., “Automatically Organizing Bookmarks per Contents”, Computer Networks and ISDN Systems, vol. 28, n° 7-11, p. 1321–1333, 1996.

Millen D. R., Feinberg J., Kerr B., “Dogear: Social Bookmarking in the Enterprise”, CHI’06: Proceedings of the SIGCHI conference on Human Factors in computing systems, ACM Press, New York, NY, USA, p. 111–120, 2006.

Mothe J., Chrisment C., Dousset B., Alaux J., “DocCube: Multi-dimensional visualisation and exploration of large document sets”, JASIST, vol. 54, n° 7, p. 650–659, 2003.

Rucker J., Polanco M. J., “Siteseer: personalized navigation for the Web”, Commun. ACM, vol. 40, n° 3, p. 73–76, 1997.

Salton G., Wong A., Yang C. S., “A Vector Space Model for Automatic Indexing”, Commun. ACM, vol. 18, n° 11, p. 613–620, November, 1975.

Sellen A. J., Harper R. H., The myth of the paperless office, MIT Press, Cambridge, MA, USA, 2003.

Wu H., Gordon M. D., “Collaborative Filing in a Document Repository”, SIGIR’04: Proceedings of the 27th annual international ACM SIGIR conference on Research and development in information retrieval, ACM Press, New York, NY, USA, p. 518–519, 2004a.

Wu H., Gordon M. D., DeMaagd K., “Document Co-Organization in an Online Knowledge Community”, CHI’04: CHI’04 extended abstracts on Human factors in computing systems, ACM Press, New York, NY, USA, p. 1211–1214, 2004b.

Yang Y., Akers L., Klose T., Barcelon Yang C., “Text mining and visualization tools – Impressions of emerging capabilities”, World Patent Information, vol. 30, n° 4, p. 280–293, December, 2008.

Retour au plan de l’article