+++ /dev/null
-<?xml version="1.0" encoding="utf-8" ?>
-<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
- "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"
->
-<html xmlns="http://www.w3.org/1999/xhtml" >
- <head>
- <title>XPath</title>
-
- <meta http-equiv="Content-Type"
- content="text/html; charset=utf-8" />
- <meta name="copyright"
- content="Copyright © 2013 Kim Nguyễn" />
-
- <!-- Load jQuery -->
- <script src="../jquery-1.9.1.min.js" type="text/javascript" ></script>
- <!-- Load the library -->
- <script src="../simpleWebSlides.js" type="text/javascript" ></script>
-
- <link rel="stylesheet" href="../simpleWebSlides.css" type="text/css" media="all" />
- <!-- Load a custom Theme, the class-element marks this style-sheet
- a "theme" that can be swtiched dynamicaly -->
- <link class="sws-theme" rel="stylesheet" title="U-Psud style" href="../themes/uPsud.css" type="text/css" />
-
- <!-- Customize some templates and initialize -->
- <style type="text/css">
- .xml-tag { color: #00486c; }
-
- </style>
- <script type="text/javascript">
- <![CDATA[
- SWS.Config['sws-slide-change'] = SWS.Effects.slideChangeFadeOutIn;
- SWS.Config['sws-object-deactivate'] = SWS.Effects.objectDeactivateFadeOut;
- SWS.Config['sws-object-activate'] = SWS.Effects.objectActivateFadeIn;
-
- //Ensures that we load SWS at the very end, after MathJax has
- //been initialized
-
- $(window).load(function () {
- $(".inline-xml").each(function(i, elem)
- {
- var jelem = $(elem);
- var code = jelem.html();
- code = code.replace ("<![CDATA" + "[", "").replace ("]" + "]>", "");
- code = code.replace (/>/g, ">>>");
- code = code.replace (/</g, "<span class='xml-tag'><");
- code = code.replace (/>>>/g,"></span>");
-
- jelem.html(code);
- });
- });
-
- var checkSVG = function (o, i)
- {
- if (i >= 10 || SWS.Utils.isUndefined(o) || o == null) return;
- var svg = o.getSVGDocument();
- if (svg == null) {
- setTimeout(function() { checkSVG(o, i+1); }, 200);
- } else {
- var alltext = $(svg).find("text");
- alltext.css("font-family", "DIN");
- alltext.css("font-size", "70%");
-
- };
- };
- $(window).load(function() {
- $("embed").ready(function() {
- setTimeout(function() {
- $("embed").each(function(i, o) { checkSVG(this,0); });
-}, 1000);
- });
- });
- $(window).load(SWS.Presentation.init);
-
- ]]>
-
- </script>
-
- </head>
- <body>
- <a href="xpi_01.xhtml" class="sws-previous"/>
- <div class="sws-slide sws-cover sws-option-nofooter">
- <h1>XML et Programmation Internet</h1>
- <h1>Cours 2</h1>
- <a href="mailto:kn@lri.fr">kn@lri.fr</a>
- </div>
-
- <h1>Modèle d'arbre</h1>
-<div class="sws-slide">
-
-<h1>XML vu comme un arbre (1/2)</h1>
-<ul>
-<li>Tout ce qui apparait dans le document correspond à un nœud de
- l'arbre (texte, balises, commentaires, blanc, …)</li>
-<li>Il existe en plus, un nœud fictif se trouvant au dessus de
- l'élément racine, le <a>nœud document</a></li>
-<li>Un couple balise ouvrante/balise fermante correspond à <a>un seul
- nœud</a>
-<li>Les principaux types de nœuds sont: élément, attribut, texte,
- commentaire, document</li>
-</li>
-</ul>
-
-</div>
- <div class="sws-slide">
- <h1>XML vu comme un arbre (2/2)</h1>
- <p>Un document XML peut être vu comme un arbre:</p>
- <code class="inline-xml" style="font-size:80%;width:50%;position:relative;float:left;"><![CDATA[<bibliography>
-
- <book>
- <title>Foundations of Databases</title>
- <author>Abiteboul</author>
- <author>Hull</author>
- <author>Vianu</author>
- <publisher>Addison Wesley</publisher>
- <year>1995</year>
- </book>
-
- <book>
- <title>The Lord of the Rings</title>
- <author>J. R. R. Tolkien</author>
- <publisher>Houghton Mifflin</publisher>
- <year>2001</year>
- </book>
-
-</bibliography>]]></code>
- <embed src="tree.svg" style="width: 10cm; height: 13cm;" />
- </div>
-<div class="sws-slide">
- <h1>Sérialisation d'un arbre sous forme de document</h1>
- <p class="sws-pause">Étant donné un arbre, comment peut ont produire
- le document XML correspondant ?</p>
- <code> //pseudo-code
- void print(Node n)
- {
- if (n is text or comment) { output_text(n) }
- else {
- output_text ("<" + tag(n) + ">");
- for k in children(n)
- print(k);
- output_text ("</" + tag(n) + ">");
- }
- </code>
- <ul style="background:white;">
- <li>On effectue un parcours en profondeur d'abord </li>
- <li>Si le nœud courant est une feuille, on l'affiche</li>
- <li>Sinon on affiche la balise ouvrante, puis récursivement tous
- les fils, puis la balise fermante</li>
- </ul>
-</div>
-<div class="sws-slide">
-<h1>Ordre du document, parcours préfixe</h1>
-<p>On appelle <a>ordre du document</a> un ordre <a>total</a> sur les
- nœuds d'un document qui correspond à leur ordre dans un fichier
- sérialisé. Il correspond aussi à la numérotation lors du parcours
- préfixe</p>
-<ol style="float:left; width:50%">
-<li>#document</li>
-<li>bibliography</li>
-<li>book</li>
-<li>title</li>
-<li>"Foundations of Databases"</li>
-<li>author</li>
-<li>"Abiteboul"</li>
-<li>author</li>
-<li>"Hull"</li>
-<li>author</li>
-<li>"Vianu"</li>
-</ol>
- <embed src="tree.svg" style="width: 10cm; height: 13cm;" />
-
-</div>
-<div class="sws-slide">
-<h1>Construction d'un arbre à partir d'un fichier XML ?</h1>
-<p class="sws-slide">Pour simplifier on suppose un fichier sans texte, uniquement avec
- des balises ouvrantes/fermantes</p>
-<code>
- type Node = { label : string; children : List<Node> }
- Stack<Node> stack;
- stack.push (new Node("#document"), []));
- while (true) {
-
- tag = read ();
- if end_of_file () break;
- if tag is opening {
- parent = stack.peek();
- node = new Node(tag, []);
- parent.addChild(node);
- stack.push(node);
- }
- if tag is closing {
- stack.pop();
- }
- }
-</code>
-<p class="sws-pause">En pratique, on utilise des bibliothèques toutes faites pour
- lire/écrire des fichiers!</p>
-</div>
-<h1>XPath, introduction</h1>
-<div class="sws-slide">
-<h1>Intérogation de documents XML</h1>
-<p>Les documents représentant des données (semi-) structurées, on
- souhaite en extraire de l'information</p>
-<p>On va pouvoir écrire des requêtes sur des <a>critères scalaires</a>
- (
-« renvoyer tous les livres publiés après 2000 »), mais aussi sur des
- critères de <a>structure</a> (« renvoyer tous les éléments qui ont
- un fils <tt>author</tt> »)</p>
-</div>
-<div class="sws-slide">
-<h1>XPath</h1>
-<p>XPath est un langage de <a>selection de nœud</a> dans un document
- XML. Il ne permet <a>que</a> de sélectionner des nœuds, pas d'en
- construire de nouveaux. C'est un langage restreint qui ne contient
- pas de fonctions, variables, … On peut le voir comme un équivalent
- du <tt>SELECT</tt> de SQL</p>
-</div>
-
-<div class="sws-slide">
-<h1>XPath (exemple)</h1>
-<p>Sélectionner tous les titres du document (de manière compliquée)</p>
-<code> <span style="color:#00f">/</span>descendant::<s>author</s>/parent::<a>book</a>/child::<span style="color:#880088">title</span></code>
-<embed src="tree.svg" style="position:relative;left:20%;width: 10cm; height: 13cm;"/>
-<script type="text/javascript">
-var color = function (o,e, c) {
- $(o).find("*[class='" + e + "']").css("fill", c);
-}
-SWS.Presentation.registerCallback(0, function (canvas) {
- var svg = canvas.find("embed")[0].getSVGDocument();
- $(svg).find("text").css({ "font-family":"DIN", "font-size":"70%"});
- color(svg, "author", "#ff0000");
- color(svg, "document", "#0000ff");
- color(svg, "book", "#92b938");
- color(svg, "title", "#880088");
-});
-</script>
-</div>
-<div class="sws-slide">
-<h1>XPath : syntaxe</h1>
-<p>La syntaxe d'une requête XPath est:</p>
-<code> /axe<sub>1</sub>::test<sub>1</sub>[ pred<sub>1</sub> ]/ … /axe<sub>n</sub>::test<sub>n</sub>[ pred<sub>n</sub> ]</code>
-<ul>
-<li><a>axe</a>
- : <tt>self</tt>, <tt>child</tt>, <tt>descendant</tt>, <tt>parent</tt>,
- …
-</li>
-<li><a>test</a> : <tt>node()</tt>, <tt>text()</tt>, <tt>*</tt>, ou un
- nom d'élément </li>
-<li> <a>pred(icat)</a> : chemin XPath, expression arithmétique,
- comparaison, …
-</li>
-<p>exemple:</p>
-<code> /descendant::book[ child::year > 2000] / child::title </code>
-</ul>
-
-</div>
-<div class="sws-slide">
-<h1>XPath : sémantique</h1>
-<p>Étant donné la requête: </p>
-<code> /axe<sub>1</sub>::test<sub>1</sub>[ pred<sub>1</sub> ]/ … /axe<sub>n</sub>::test<sub>n</sub>[ pred<sub>n</sub> ]</code>
-<ol>
- <li>le <a>nœud contexte</a> au nœud <a>document</a></li>
- <li>on sélectionne l'ensemble A<sub>1</sub> <a>tous les nœuds</a> qui sont dans
- l'<tt>axe<sub>1</sub></tt> par rapport au nœud contexte</li>
- <li>on sélectionne l'ensemble T<sub>1</sub> des nœud de
- A<sub>1</sub> qui vérifient le test <tt>test<sub>1</sub></tt></li>
- <li>on sélectionne l'ensemble P<sub>1</sub> des nœud de
- T<sub>1</sub> qui vérifient <tt>pred<sub>1</sub></tt></li>
- <li>On réapplique le pas 2 sur <tt>P<sub>1</sub></tt></li>
- <li> … </li>
-</ol>
-</div>
-<div class="sws-slide">
-<h1>XPath : sémantique (exemple)</h1>
-<div style="width:50%;float:left;">
-<code> <span style="color:#00f">/</span>descendant::<s>author</s>/parent::<a>book</a>/child::<span style="color:#880088">title</span></code>
-<ol><li >On séléctionne le nœud document</li>
-<li >On séléctionne tous les descendants</li>
-<li>On filtre en ne gardant que les nœuds <s>author</s>
- (T<sub>1</sub> ≡ P<sub>1</sub>)</li>
-<li>Sur chacun des <s>author</s> on prend le parent (on n'obtient que
- 2 parents car on garde des ensembles de noeuds)</li>
-<li>On filtre les parents pour ne garder que ceux qui
- sont <a>book</a></li>
-<li>On sélectionne tous les fils de chacun des <a>book</a></li>
-<li>On ne garde que les fils qui ont le
- tag <span style="color:#880088">title</span></li>
-</ol>
-</div>
-<embed src="tree.svg" style="width: 10cm; height: 13cm;"/>
-<script type="text/javascript">
-SWS.Presentation.registerCallback(0, function (canvas) {
- var svg = canvas.find("embed")[0].getSVGDocument();
- $(svg).find("text").css({ "font-family":"DIN", "font-size":"70%"});
- color(svg, "author", "#ff0000");
- color(svg, "document", "#0000ff");
- color(svg, "book", "#92b938");
- color(svg, "title", "#880088");
-});
-</script>
-</div>
-<div class="sws-slide">
-<h1>XPath : axes</h1>
-<p>Le standard XPath définit un grand nombre d'axes</p>
-<ul>
-<li><a>self</a> : on reste sur le nœud courant</li>
-<li><a>child</a> : tous les fils du nœud courant</li>
-<li><a>parent</a> : le parent du nœud courant. Seul le nœud document
- n'a pas de parent</li>
-<li><a>descendant</a> : les fils, les fils des fils, etc. du nœud courant</li>
-<li><a>ancestor</a> : le parent, et le parent du parent, etc. du nœud
- courant</li>
-<li> <a>descendant-or-self</a>, <a>ancestor-or-seld</a> : comme les
- précédents mais inclus le nœud courant</li>
-<li><a>following-sibling</a>: le frères se trouvant après</li>
-<li><a>preceding-sibling</a>: les frères se trouvant avant</li>
-<li><a>following, preceding, attributes </a> : usage avancé</li>
-</ul>
-</div>
-<div class="sws-slide">
-<h1>XPath : les tests</h1>
-<p>On peut sélectionner des nœuds selon les critères suivants</p>
-<ul>
- <li> <a>node()</a> : n'importe quel nœud</li>
- <li> <a>text()</a> : un nœud texte (<tt>"The Lord of the
- Rings"</tt>)</li>
- <li> <a>*</a> : n'importe quel élément
- (<tt>author</tt>, <tt>title</tt>, …)</li>
- <li> <a><i>nom_d_element</i></a> tous les éléments ayant ce nom</li>
-</ul>
-</div>
-<div class="sws-slide">
-<h1>XPath : prédicats (syntaxe)</h1>
-<code>
- p ::= p or p
- | p and p
- | not (p)
- | count(…), contains(…), position(), …
- | chemin XPath
- | e<sub>1</sub> op e<sub>2</sub>
-</code>
-<p><tt>e<sub>1</sub></tt> et <tt>e<sub>2</sub></tt> sont des
- expressions arithmétiques, <tt>op</tt> peut être <tt><</tt>, <tt>></tt>, =, !=,
- +, -, *, /, mod, …</p>
-</div>
-<div class="sws-slide">
-<h1>XPath : prédicats (sémantique)</h1>
-<p>On évalue le prédicat et on converti son résultat en valeur de
- vérité. Si la valeur vaut vrai, on garde le nœud courant, si elle
- vaut faux, on ne le garde pas
-</p>
-<p>XPath connait <a>4 types de données</a> pour les prédicats : </p>
-<ul>
-<li>Les booléens, valeur de vérité : vrai ou faux</li>
-<li>Les nombres (flottants), valeur de vérité compliquée… </li>
-<li>Les chaînes de caractères, chaîne vide = faux, sinon vrai</li>
-<li>Les ensembles de nœuds, ensemble vide = faux, sinon vrai </li>
-</ul>
-
-</div>
-<div class="sws-slide">
-<h1>XPath : prédicats (exemples)</h1>
-
-<ul><li> <tt>/descendant::book [ child::title ]</tt> : sélectionne chaque
- élément book pour lequel l'ensemble des fils de nom title n'est
- pas vide </li>
-<li> <tt>/descendant::book [ count(child::author) > 2 ]</tt> : séléctionne
- chaque book qui a plus de deux fils author</li>
-<li> <tt>/descendant::book [ contains(child::title, "Ring") ]</tt></li>
-<li> <code>/descendant::book [ count(child::author) > 2
- or contains(child::author, "Tolk")
- ]/child::title</code></li>
-</ul>
-</div>
-<div class="sws-slide">
-<h1>Caractéristiques d'XPath</h1>
-<ul>
- <li>XPath est un langage standardisé par le W3C</li>
- <li>Assez verbeux</li>
- <li>Langage de requêtes <a>monadique</a> (on ne peut renvoyer que
- des ensembles de nœuds. Par exemple il est impossible de renvoyer
- des ensembles de paires auteur/titre de livre)</li>
- <li>Il est assez compliqué à implémenter efficacement</li>
-</ul>
-</div>
- </body>
-</html>