.

[hacks/simpleWebSlides.git] / bd / bd05.xhtml
diff --git a/bd/bd05.xhtml b/bd/bd05.xhtml

index 5c5c6f0..9ff0195 100644 (file)
--- a/bd/bd05.xhtml
+++ b/bd/bd05.xhtml
@@ -100,7 +100,7 @@
        annotés avec un algorithme particulier.
        </p>
        <ul>
-       <li>Pour une requête donnée, quels plans doit-on considérer
+       <li>Pour une requête donnée, quels plans doit on considérer
         ?</li>
         <li>Comment peut on estimer le coût total d'un plan</li>
        </ul>
@@ -116,9 +116,9 @@
  </code>
  <p><img class="sws-pause" src="simple_plan.svg" width="50%"/></p>
  <ul>
-  <li class="sws-pause">Cout: 500+500*1000 E/S (pourquoi ?)</li>
+  <li class="sws-pause">Coût: 500+500*1000 E/S (pourquoi ?)</li>
    <li> Plusieurs occasions manquées : pas d'utilisation d'index, on
-  aurait pu pousser la selection sous la jointure, …</li>
+  aurait pu pousser la sélection sous la jointure, …</li>
    <li> Notre but est de trouver des plans d'exécution plus efficaces
    qui calculent le même résultat</li>
  </ul>
@@ -127,15 +127,15 @@
        <h1>Plan alternatif 1 (sans index)</h1>
  <p><img class="sws-pause" src="simple_plan1.svg" width="50%"/></p>
  <p class="sws-pause">On pousse la sélection sous la jointure (car
-  selection <tt>AND</tt>). On suppose qu'on a 100
+  sélection <tt>AND</tt>). On suppose qu'on a 100
    bateaux, 10 notes et distributions uniformes. </p>
  <ul>
-  <li>Scan Reserves (1000 E/S) et écriture de 10 pages dans T1</li>
-  <li>Scan Sailors (500 E/S) et écriture de 250 pages dans T2</li>
+  <li>Scan <tt>Reserves</tt> (1000 E/S) et écriture de 10 pages dans T1</li>
+  <li>Scan <tt>Sailors</tt> (500 E/S) et écriture de 250 pages dans T2</li>
    <li>Tri T1 (3*10 E/S), Tri T2 (8*250 E/S), fusion (10+250 E/S)</li>
    <li>Total: <em>4050 E/S</em></li>
-  <li>Si on pousse la projection, T1 ne contient que sid, T2
-    uniquement sid et sname (cout <tt>&lt;</tt> 2000 E/S)</li>
+  <li>Si on pousse la projection, T1 ne contient que <tt>sid</tt>, T2
+    uniquement <tt>sid</tt> et <tt>sname</tt> (cout <tt>&lt;</tt> 2000 E/S)</li>
  </ul>
      </div>
      <div class="sws-slide">
@@ -260,13 +260,13 @@ Exemples de facteurs de réduction:
    <h1>Autres équivalences</h1>
    <ul>
      <li>
-Une projection commute avec une selection qui utilise uniquement
+Une projection commute avec une sélection qui utilise uniquement
    les attributs de la projection</li>
-    <li>Une selection entre des attributs de deux arguments d'un
+    <li>Une sélection entre des attributs de deux arguments d'un
      produit cartésien peut être converti en jointure:
        <tt> &sigma;<sub>&phi;</sub> (R &times; S) ≡ R &join;<sub>&phi;</sub> S</tt>
        </li>
-    <li>Une selection sur des attributs de <tt>R</tt> commute avec la
+    <li>Une sélection sur des attributs de <tt>R</tt> commute avec la
      jointure <tt>R&join;S</tt> (c'est à dire:  <tt>&sigma;(R&join;S) ≡  &sigma;(R)&join;S </tt>)
        </li>
      <li>Règle similaire pour pousser les projections sous jointure</li>
@@ -279,18 +279,18 @@ Une projection commute avec une selection qui utilise uniquement
    Les SGBD modernes utilisent un modèle de
    calcul <em><i>pull</i></em>. L'opérateur le plus «&nbsp;haut&nbsp;» (racine)
    dans l'arbre de requête «&nbsp;tire&nbsp;» (<i>pull</i>) le résultat de ses
-  sous-arbres (similaire à l'appel de <i>next</i> sur les iterateurs
+  sous-arbres (similaire à l'appel de <i>next</i> sur les itérateurs
    de la bibliothèque standard Java). Cela permet
    de <em><i>pipeliner</i></em> les opérateurs. Certains opérateurs «
    <em>bloquent</em> » le <i>pipeline</i> (en particulier les tris et
-  aggrégats).
+  agrégats).
  </p>
  
  </div>
  <div class="sws-slide">
  <h1>Cas mono-relation</h1>
  <p>Dans le cas mono-relation (i.e. sans jointure), la requête est
-  composée forcément de selections, projections et aggrégats
+  composée forcément de sélections, projections et agrégats
    (<tt>max</tt>, <tt>count</tt>, <tt>average</tt>, …)</p>
  <ol>
    <li>Pour chaque sous-terme, on considère tous les accès possibles
@@ -304,15 +304,15 @@ Une projection commute avec une selection qui utilise uniquement
  <div class="sws-slide">
  <h1>Estimation du coût pour les plans mono-relation</h1>
  <ul>
-<li> Si on a un index I pour une selection sur clé primaire :
+<li> Si on a un index I pour une sélection sur clé primaire :
    <tt><s>Hauteur(I) + 1</s></tt> pour un arbre B+, <tt><s>1.2</s></tt>
    pour un hash-index</li>
  <li> Si on a un index I groupant pour plusieurs
-  selection <tt>&sigma;<sub>1</sub></tt>, …, <tt>&sigma;<sub>n</sub></tt> :<br/>
+  sélection <tt>&sigma;<sub>1</sub></tt>, …, <tt>&sigma;<sub>n</sub></tt> :<br/>
    <tt><s>(NPages(I) + NPages(R))* RF(&sigma;<sub>1</sub>) * … * RF(&sigma;<sub>n</sub>) </s></tt>
  </li>
  <li> Si on a un index I non-groupant pour plusieurs
-  selection <tt>&sigma;<sub>1</sub></tt>, …, <tt>&sigma;<sub>n</sub></tt> :<br/>
+  sélection <tt>&sigma;<sub>1</sub></tt>, …, <tt>&sigma;<sub>n</sub></tt> :<br/>
    <tt><s>(NPages(I) + <u>NEnr</u>(R))* RF(&sigma;<sub>1</sub>) * … * RF(&sigma;<sub>n</sub>) </s></tt>
  </li>
  <li>Scan séquentiel à <tt>R</tt>: <tt><s>NPages(R)</s></tt></li>
@@ -343,7 +343,7 @@ Une projection commute avec une selection qui utilise uniquement
    <h1>Requêtes multi-relations</h1>
  <ul><li>Les choix vont être guidé par les <em>jointures</em></li>
    <li>Si on considère uniquement <tt>n</tt> jointures (pas de projections ni
-  de selections dans le plan de requête). Le nombre de plans possible
+  de sélections dans le plan de requête). Le nombre de plans possible
    est le nombre d'arbre binaires ayant <tt>n</tt> noeuds internes
    (exponentiel en <tt>n</tt>, exactement: nombre de Catalan
    d'indice <tt>n</tt>). <s>Beaucoup trop pour les énumérer tous</s>.
@@ -390,7 +390,7 @@ Une projection commute avec une selection qui utilise uniquement
      peuvent êtres faites en <em><i>pipeline</i> (ou <i>streaming</i></em> sans
      itération/matérialisation des résultats intermédiaires
    </li>
-  <li>Celà peut valoir le coup d'utiliser un <i>merge-sort</i> join
+  <li>Cela peut valoir le coup d'utiliser un <i>merge-sort</i> join
      (possiblement coûteux) si on demande les résultats dans un <em>certain
      ordre</em> (<tt>ORDER BY</tt> compatible avec celui de la jointure). Cela évite de faire
      une jointure suivie d'un tri.
@@ -452,7 +452,7 @@ uniformément réparties. Tous les sid et tous les bid sont présents
              float:left;'>
   </span>
  
-On choisi de faire d'abord une jointure entre R et S (i.e. un produit
+On choisi de faire d'abord une jointure entre B et S (i.e. un produit
  cartésien car il n'y a pas de condition de jointure entre ces deux
  tables). Puis la jointure de la table résultante avec B sur les
  attributs (bid,sid).
@@ -461,13 +461,13 @@ attributs (bid,sid).
    directement sur S, puis la jointure <tt>B &join;
    (&sigma;(S))</tt></em>. Pas d'utilisation d'index possible, jointure page
    à page (car on génère tout le produit cartésien) : <tt>100 ×
-  (100 + 200) = 300 000</tt> E/S (pages) ou 192 000 000 enr.
+  (100 + 200) = 30 000</tt> E/S (pages) ou 19 200 000 enr.
  </p>
  <p>Puis jointure <em>itérative page à page</em> avec R (<em>pas d'index sur R</em>, pas d'index
-  sur le résultat précédant qu'on vient de créer en mémoire):
-  <tt>1 000 × (300 000 + 1000) = 301 000 000 E/S.</tt>
+  sur le résultat précédent qu'on vient de créer en mémoire):
+  <tt>1 000 × (30 000 + 1000) = 31 000 000 E/S.</tt>
  </p>
-<p>Coût total: <tt>301 300 000 E/S</tt> (les projections sont faites
+<p>Coût total: <tt>31 300 000 E/S</tt> (les projections sont faites
    en pipline à la fin)</p>
  <p style="background:white">Plan complètement inefficace. On ignorera les plans contenant un
    produit cartésien, sauf si c'est le seul moyen de calculer la
@@ -502,10 +502,10 @@ sur <tt>sid</tt>.</p>
  <p>La deuxième jointure peut être faite à la volée (jointure itérative
    par index sur <tt>S.sid</tt>) et la condition de sélection testée à
    la volée. Coût total 100 000 × 3 (pour chacun des enregistrement
-  précédants, on paye un accès d'index + un accès à la ligne
+  précédents, on paye un accès d'index + un accès à la ligne
    correspondante dans S).
  </p>
-<p>Coût total: <tt>601 000 E/S</tt> (les projections sont faites en pipline à la fin)</p>
+<p>Coût total: <tt>601 000 E/S</tt> (les projections sont faites en <i>pipline</i> à la fin)</p>
  </div>
  
  <div class="sws-slide">
@@ -539,7 +539,7 @@ sur <tt>sid</tt>.</p>
  <p> On fait une jointure page à page des deux résultats
   précédents : <tt>100 + 100 × 1515 = 100 615 E/S</tt>.
  </p>
-<p>Coût total: <tt>102 630 E/S</tt> (les projections sont faites en pipline à la fin)</p>
+<p>Coût total: <tt>102 630 E/S</tt> (les projections sont faites en <i>pipline</i> à la fin)</p>
  </div>
  
  
@@ -582,7 +582,7 @@ sur <tt>bid</tt>.</p>
  
  <ul>
    <li>Utiliser l'index n'est pas toujours payant, surtout s'il est
-    non-groupant et qu'il car on ajoute un facteur qui est le nombre de
+    non-groupant, car on ajoute un facteur qui est le nombre de
      résultats, pas le nombre de pages</li>
    <li>On a fait certaines approximations « à la louche » (taille des
      enregistrements résultants d'une jointure, nombre des