Systèmes de communication

XML, quelques détails (2)

Caractères utilisés: ISO 10646 (UNICODE)

Constructions primitives: Name, Names (liste de Name), Nmtoken, Nmtokens qui ne peuvent qu'utiliser un jeu restreint de caractères.

Déclaration XML: <?XML version RMD=lieu ?> où lieu peut être internal (à prendre en compte la DTD interne seulement), none (pas de DTD), all

Description du type de document: <!DOCTYPE XX SYSTEM "xx.dtd" [ partie interne ]>

Eléments: comme en SGML sans possibilité de minimalisation. Par ailleurs, seuls les opérateurs suivant peuvent être utilisés pour la constitution des groupes: , | + * ? . L'inclusion et l'exclusion sont abandonnées. On considère également les éléments de type EMPTY (marqué par < ... />) et ANY (utilisés lors de la mise au point).

Attributs: Les types sont les suivants: CDATA, ID, IDREF, IDREFS, ENTITY, ENTITIES, NMTOKEN, NMTOKENS.

Les valeurs des attributs sont toujours avec des guillemets; il n'y a pas d'espace à gauche et à droite du signe d'égalité.

Entités: il y en a de trois types:

Texte intégral et parties conditionnelles:

Nouvelle déclaration: NOTATION. Ces notations permettent d'associer à une entité le processus à appliquer. Il n'y a plus ensuite de référence directe.

Par exemple:
<!NOTATION JPEG SYSTEM "program/view.exe">
<!ENTITY img1 SYSTEM "img1.jpg" NDATA JPEG>
...
<IMG SRC="&img1;">

 

Recommandation du W3C