Hypertextes et théorie de l'information

Cette partie du site rassemble des travaux qui précisent des concepts utiles lors de la classification de document. Il reprend des éléments développés dès la fin des années quatre-vingt dans un projet mené par l'Institut de recherche et de documentation pédagogique (IRDP) (L.-O. Pochon) en collaboration avec la Société Analyse et archivage d'image (A2I) (A. Favre). Le projet orienté "pédagogie" visait à répertorier, classer et retrouver des documents pédagogiques (plus particulièrement en mathématiques: exercices, didacticiels, etc.). Ce thèma non poursuivi par l'irdp est repris par ABORD.

Travaux préparatoires et annexes

Quelques documents rappellent l'historique du projet et des techniques de base pour la classification d'objets multi-indexés.

Historique: Objectif du projet et état de situation.

Analyse cluster et analyse de contenu: quelques rappels concernant l'analyse en cluster.

Décomposition en valeurs singulières et analyse de contenu: note à propos de l'apport du "Latent Semantic Indexing" (LSI) dans l'analyse de contenu.

Double décomposition: le problème est de procéder à la fois à un regroupement des "cas" et des "variables".

Deux limites à l'analyse cluster: une retombée du "ugly duckling problem".

Une méthode de classification basée sur le calcul de l'entropie.

Eléments de théorie des graphes.

Transmission et "likelihood ratio"

Définitions et concepts généraux

Définition formelle d'un hypertexte et calcul de coefficients locaux: l'hypertexte vu comme la conjonction de deux relations mots-documents et les coefficients associés.

Structure d'un hypertexte sous forme matricielle: une approche probabiliste de la structure globale d'un l'hypertexte.

Hypertextes et théorie des graphes: rappel de quelques résultats de la théorie des graphes et leur application au graphe de l'hypertexte.

Décompositions d'un hypertexte: tentative de formalisation d'opérations globales sur les hypertextes.

A propos de typage des hypertextes: différents problèmes posés par la classification des concepts et des unités d'information sont abordés.

Etude de cas, le modèle UTOPIA : cette étude de cas permet d'illustrer quelques concepts théoriques.

Un simulateur pour la création d'hypertextes: le modèle adopté (par agrégation) est celui de la "construction" du web.

Quelque manipulations pour déterminer la structure d'un hypertexte: présentation de la structure "papillon", des notions d'autorité et de hub.

Etude expérimentale de la structure d'hypertextes créés par agrégation.

Etude expérimentale de la structure d'hypertextes créés à partir des relations document-concept : les hypertextes étudiés ont une structure liée à leur contenu.

Etude expérimentale de la structure d'hypertextes créés par morceaux à partir des relations document-concept.

Tout hypertexte construit par agrégation peut être considéré comme un hypertexte créé à partir des relations document-concept.

Etude expérimentale de la structure d'hypertextes créés par agrégation à partir de 2 germes. Une des études s'effectue via le passage par les matrices R et D.

Etude expérimentale de la structure des concepts d'un hypertexte. Les techniques sont appliquées au graphe dual, constitué par les concepts.

Représentation de la proximité d'unités d'information dans le plan dR x dD.

Représentation de la proximité des concepts dR x dD.

Analyse structurelle standard. Les coefficients de structure "classiques"

Publications

Connaissance, théorie de l’information et hypertextes,
histoire d’une lecture sélective
: une première synthèse. (errata)

Etude d’hypertextes construits sur les relations « descripteur » et « référent » (proposition de communication à H2PTM'09)

Bibliographie et références

Bibliographie: références utilisées explicitement dans les articles.

Bibliographie en cours de constitution.

Latent Semantic Indexing (LSI) site web: portail concernant la méthode d'indexage LSI.

Complexity: Complexity International is a refereed journal for scientific papers dealing with any area of complex systems

ResearchIndex: ResearchIndex is a scientific literature digital library that aims to improve the dissemination and feedback of scientific literature, and to provide improvements in functionality, usability, availability, cost, comprehensiveness, efficiency, and timeliness

Références: Library and Information Science ; Encyclopaedia Autopoietica: The Encyclopaedia Autopoietica was compiled to provide an annotated compendium of the terminology developed and employed by Humberto R. Maturana and Francisco J. Varela.

Package GAP permet de calculer l'homologie simpliciale de complexes simpliciaux finis et la forme normale de Smith d'une matrice "rare" à coefficients entiers. Un manuel intéressant présente les notions théoriques (GAP is a free system for computational discrete algebra).

Projets Prof'Expert et Ermitage (Web'Expert): des cas d'utilisation du modèle HAM et de XML pour créer des hypertextes. Avec le manuel du programmeur de Prof'Expert et les aspects techniques du projet Ermitage.

Alimentation de la bibliographie (réservé aux membres du groupe)

 

(c) ABORD, 2010