A propos de typage d'unités d'information
|
|
Position du problèmeLa classification des hypertextes pose principalement quatre problèmes: celui de l'organisation des concepts, celui de la structure générale de l'hypertexte (en terme de théorie des graphes par exemple), celui de la classification des unités d'information, et celui de la relation entre les deux problèmes précédents. Le premier problème peut s'aborder de diverses manières. Tout d'abord on peut envisager un regroupement des concepts en diverses catégories construites par "subsumation" ou arbitrairement. L'analyse en "cluster" offre une autre possibilité de procéder à des regroupements de concept de façon automatique. Dans ce cas, deux concepts font parties du même groupe, s'ils ont des descripteurs et/ou des réfèrents de "presque" les mêmes unités d'information. Cette approche ne va pas sans poser quelques questions, au niveau ontologique (à ne pas confondre ce type de regroupement par distance et les opérations de réductions "vectorielles" telle que la méthode LSI), et par rapport aux typages ultérieurs des unités d'information. Introduire des types de concepts est un premier pas modeste d'une approche par "ontologies" ou par réseau sémantique qui précise diverses "propriétés" des liens: fonction (par exemple: note), type de cible, etc. A noter qu'au typage des concepts correspond le typage des liens de l'hypertexte. On trouve un exemple de cette notion dans la présentation de
UTOPIA. Le deuxième problème est abordé dans d'autres documents [1]. En ce qui concerne le troisième problème, celui du type des unités d'information certaines approches [LUC 96] introduisent les hypertextes en terme de classes et d'objets. Chaque unités d'information est une instance d'une classe définie a priori. Le problème de la classification revient donc à un problème d'analyse a priori. La classification peut aussi se faire "a posteriori": connaissant une certain nombre d'unités d'information (des objets) le problème est de définir les classes d'objets. Le quatrième problème concerne le lien entre les aspects locaux (structures des unités d'information) et globaux (structure de l'hypertexte). Ces aspects sont liés dans la mesure où une identification de certaines unités d'informations (aspect local), simplifie la mise en évidence de la structure globale. La structure d'un arbre est plus facile à appréhender lorsqu'il est dépouillé de ses feuilles ! Du point de vue matriciel, l'aspect local revient à identifier (et regrouper, voire coaguler) des lignes et des colonnes de même profil. L'aspect global est lié à une structure plus profonde. A propos du typage des conceptsUn typage des concepts est donné par un ensemble de parties de C. Un cas particulier de typage est celui où il n'y a qu'un seul concept de chaque type. Un typage sera désigné par un ensemble: T = {t1, t2, ..., tp} sous-ensemble des parties de C. En principe, et ce sera toujours le cas ici, cet ensemble constitue une partition de C.H | t est la restriction de l'hypertexte aux concepts de t. On a la formule triviale: (I) H = H | t (sommation-superposition sur T) Hypertexte quotient
|
(c) A. Favre, VisioSoft, S.A. & L.-O. Pochon, IRDP, 2000