XML et Programmation Internet

Cours 3

Évaluation des prédicats

Rappels de syntaxe


      p ::=   p or p
         |    p and p
         |    not (p)
         |    count(…), contains(…), position(), …
         |    chemin XPath
         |    e₁ op e₂

On évalue le prédicat et on converti son résultat en valeur de vérité. Si la valeur vaut vrai, on garde le nœud courant, si elle vaut faux, on ne le garde pas

XPath connait 4 types de données pour les prédicats :

Les booléens, valeur de vérité : vrai ou faux
Les nombres (flottants), valeur de vérité compliquée…
Les chaînes de caractères, chaîne vide = faux, sinon vrai
Les ensembles de nœuds, ensemble vide = faux, sinon vrai

Comparaisons (e₁ op e₂)

Les opérateurs de comparaisons sont : =, !=, <, <=, >, >=.
La manière de calculer de vérité de e₁ op e₂ dépend du typed de e₁ et e₂ :

Si e₁ et e₂ représente des ensembles de nœuds, alors la comparaison est vraie ssi il existe un élément x dans e₁ et un élément y dans e₂ tels que x op y
Si e₁ représente un ensembles de nœuds et e₂ une valeur scalaire y, alors la comparaison est vraie ssi il existe un élément x dans e₁ tel que x op y
Si e₁ et e₂ sont des valeurs scalaires, alors ont les compare en utilisant les règles de comparaison des valeurs scalaires (voir page suivante).

Comparaisons des valeurs scalaires

v₁ op v₂

Si op est != ou =, on applique les règles dans cet ordre:

Si v₁ (resp. v₂) est un booléen, alors v₂ (resp. v₁) est converti en booléen et les deux booléens sont comparés
Sinon si v₁ (resp. v₂) est un nombre, alors v₂ (resp. v₁) est converti en nombre et les deux nombres sont comparés
Sinon, v₁ et v₂ sont des chaines de caractères, on les compares

Si op est <, <=, > ou >=, on convertit v₁ et v₂ en nombres et on les compare.

Conversions

Conversion en booléen

0 et NaN sont converti en false, le reste en true
Un ensemble de nœud vaut true ssi il est non vide
Une chaine vaut true ssi elle est non vide

Conversion en nombre

Une chaine de caractère représentant un flottant au format IEEE-754 est convertie en ce nombre, sinon elle est convertie en NaN
Booléen: true est converti à 1, false est converti à 0
Un ensemble de nœud est d'abord converti en chaine de caractères puis la chaine est convertie en nombre

Conversions (suite)

Conversion en chaine de caractères

Un booléen est traduit en "true" ou "false" selon sa valeur
Nombres:
- NaN est converti en la chaine "NaN"
- Si le nombre n'a pas de partie décimale, sa représentation entière est convertie en chaine (ex: 1.000e10 ≡ "10")
- Sinon une représentation IEE-754 du nombre est utilisé (ex: "123.10e-34")
Ensemble de noœud :
- L'ensemble vide est converti en la chaine vide
- Sinon le premier élément dans l'ordre du document est converti en chaine en concatenant tous les nœuds textes dans ces descendants (y compris lui-même)

Appels de fonction

Il existe des fonctions prédéfinies (voir la spec XPath)

contains(str₁,str₂)
starts-with(str₁,str₂)
count(node_set₁)
last()
position()
…

Si les arguments ne sont pas du bon type, ils sont convertis en utilisant les règles de conversion

Exemples

Dans la suite, on se donne un document de test ayant une racine ... ]]> et une expression XPath qui sélectionne la racine si et seulement si le prédicat vaut vrai

Exemples

/child::a[ child::*/child::text() ] sélectionne la racine (l'ensemble de nœud renvoyé par child::*/cild::text() est non vide, donc il est converti en true)
/child::a[ child::*/child::text() = "2" ] sélectionne la racine (l'ensemble de nœud texte renvoyé par child::*/child::text() est comparé à "2", et il existe un élément dans cet ensemble pour lequel le test réussi )
/child::a[ child::*/child::text() != "2" ] ~~sélectionne la racine~~ (l'ensemble de nœud texte renvoyé par child::*/child::text() est comparé à "2", et il existe un élément dans cet ensemble pour lequel le test réussi )
/child::a[ not(child::*/child::text() = "2") ] ~~ne sélectionne pas la racine~~ (on prend la négation du deuxième cas ci-dessus)

Exemples

/child::a[ child::*/child::text() > 1.5 ] sélectionne la racine (l'ensemble de nœud texte renvoyé par child::*/child::text() est comparé à 1.5, et il existe un élément dans cet ensemble pour lequel le test réussi )
/child::a[ child::b/child::text() >= child::c/child::text() ] ~~sélectionne la racine~~ (les deux ensembles de nœuds sont convertis en ensmbles de nombres, car on utilise >= et on a bien que 2 >= 2 )
/child::a[ child::b/child::text() = child::c/child::text() ] ~~sélectionne la racine~~ (les deux ensembles de nœuds comportent un élément commun)
/child::a[ child::b/child::text() != child::c/child::text() ] ~~sélectionne la racine~~ (les deux comportent des éléments différents)

Exemples

1223 ]]>

/child::a[ contains(self::*, "22") ] ~~sélectionne la racine~~(l'ensemble de nœud séléctionné par self::*, i.e. la racine est converti en chaine. Pour ce faire, on colle toutes éléments textes descendants et on obtient la chaine "1223" qui contient bien "22")
/child::a[ self::* > 442.38 ] ~~sélectionne la racine~~(l'ensemble de nœud séléctionné par self::*, est converti en chaine puis en nombre pour comparer 1223 à 442.38)
/child::a[ sum(child::*) >= 7.5 ] ~~sélectionne la racine~~(la fonction sum converti la liste de valeurs passée en argument en liste de nombre et fait la somme de ces derniers)

Exemples

1toto23 ]]>

/child::a[ sum(child::*) >= 7.5 ] ~~ne sélectionne pas la racine~~(la fonction sum converti la liste de valeurs passée en argument en liste de nombres, toto n'étant pas un nombre valide, il est remplacé par NaN. La somme totale fait donc NaN, et une comparaison avec NaN renvoie toujours faux)

Prédicat imbriqués

On peut imbriquer des prédicats de manière arbitraire:

Q₁ ≡ /child::a[ child::b[ count(descendant::c) > 4 ] ]

Quelle différence avec :

Q₂ ≡ /child::a[ count(child::b/descendant::c) > 4 ]

Il suffit de considérer le document : ]]> Q₁ ~~ne séléctionne rien~~ car il n'y a aucun b ayant plus de 4 descendants c.
Q₂ ~~séléctionne~~ la racine car le nombre de descendants c de nœuds b est plus grand que 4.

`position()` et `last()`

La fonction position() renvoie la position du nœud au sein de l'ensemble de résultats en cours de filtrage. Last renvoie le nombre d'éléments dans cet ensemble (ou l'indice du dernier élément). Les indices commencent à 1 :


      AA
      BB
      CC
    ]]>

    /child::a/child::b[ position() = 2 ]          (renvoie BB]]>)
    /child::a/child::b[ position() = last() ]     (renvoie CC]]>)
    /child::a/child::b[ position() mod 2 = 1 ]    (renvoie AA
                                                           CC]]>)

Axes complexes

L'axe `attribute::`

Permet d'accéder aux attributs d'un élément.~~Attention~~, les attributs ne font pas partie des fils ni des descendants!


      AA
      BB
      CC
    ]]>

    /descendant::b[ attribute::* = "y" ]          (renvoie BB]]>)
    /descendant::b[ attribute::id = "y" ]         (ne renvoie rien)

Les axes `preceding::` et `following::`

L'axe preceding:: selectionne tous les nœuds arrivant avant le nœud courant et qui ne sont pas des ancetres de ce dernier.

L'axe following:: selectionne tous les nœuds arrivant après le nœud courant et qui ne sont pas des descendants de ce dernier.


       
	     
	   
      
      
      
       
	    
        
      
    ]]>

    /descendant::m/preceding::* (séléctionne l, i, h, b, c, d, e, f, g)
    /descendant::d/following::* (sélectionne h, i, j, k, l, m)

Autres opérateurs

On peut donner plusieurs prédicats à un chemin : /descendant::a [ descendant::b ][ position () > 4 ][ child::c ] Sélectionne l'ensemble des nœuds ~~A₁ ayant un tag a et ayant un descendant b~~. Filtre A₁ pour ne garder que A₂, l'ensemble des nœuds de A₁ étant en position supérieure à 4. Filtre A₂ pour ne garder que les nœuds ayant un fils c.

On peut prendre l'union de plusieurs chemins :
/descendant::a/parent::b | /descendant::c/following-sibling::d

Syntaxe abrégée

Abréviations

XPath étant très verbeux il existe une syntaxe abrégée pour les situations les plus courantes :

un nom de tag foo est l'abréviation de child::foo. Exemple : /a/b/c ≡ /child::a/child::b/child::c

un // est l'abréviation de /descendant-or-self::node()/. Exemple : //a ≡ /descendant-or-self::node()/child::a Prend tous les nœuds du document (y compris le nœud fictif #document et exécute child::a sur cet ensemble.

.. est un synonyme pour parent::node()

@foo est un synonyme pour attribute::foo

Exemple :
//book [ year > 2005 ]/title

XML et Programmation Internet

Cours 3

Évaluation des prédicats

Rappels de syntaxe

Comparaisons (e1 op e2)

Comparaisons des valeurs scalaires

Conversions

Conversions (suite)

Appels de fonction

Exemples

Exemples

Exemples

Exemples

Exemples

Prédicat imbriqués

position() et last()

Axes complexes

L'axe attribute::

Les axes preceding:: et following::

Autres opérateurs

Syntaxe abrégée

Abréviations

Comparaisons (e₁ op e₂)

`position()` et `last()`

L'axe `attribute::`

Les axes `preceding::` et `following::`