On suppose dans la suite M enregistrements dans R, - P_R enregistrements/page, N enregistrement dans S, +

On suppose dans la suite M pages dans R, + P_R enregistrements/page, N pages dans S, P_S enregistrements/page.

Plan alternatif 1 (sans index)

On pousse la sÃ©lection sous la jointure (car - selection AND). On suppose qu'on a 100 + sÃ©lection AND). On suppose qu'on a 100 bateaux, 10 notes et distributions uniformes.

@@ -260,13 +260,13 @@ Exemples de facteurs de rÃ©duction:

Autres Ã©quivalences

-Une projection commute avec une selection qui utilise uniquement +Une projection commute avec une sÃ©lection qui utilise uniquement les attributs de la projection
Une selection entre des attributs de deux arguments d'un +
Une sÃ©lection entre des attributs de deux arguments d'un produit cartÃ©sien peut Ãªtre converti en jointure: σ_φ (R × S) â¡ R &join;_φ S
Une selection sur des attributs de R commute avec la +
Une sÃ©lection sur des attributs de R commute avec la jointure R&join;S (c'est Ã dire: σ(R&join;S) â¡ σ(R)&join;S )
RÃ¨gle similaire pour pousser les projections sous jointure

pull

next

pipeliner

bloquent

pipeline

Cas mono-relation

Dans le cas mono-relation (i.e. sans jointure), la requÃªte est - composÃ©e forcÃ©ment de selections, projections et aggrÃ©gats + composÃ©e forcÃ©ment de sÃ©lections, projections et agrÃ©gats (max, count, average, â¦)

Pour chaque sous-terme, on considÃ¨re tous les accÃ¨s possibles @@ -304,15 +304,15 @@ Une projection commute avec une selection qui utilise uniquement
Estimation du coÃ»t pour les plans mono-relation
- Si on a un index I pour une selection sur clÃ© primaire : +
- Si on a un index I pour une sÃ©lection sur clÃ© primaire : Hauteur(I) + 1 pour un arbre B+, 1.2 pour un hash-index
- Si on a un index I groupant pour plusieurs - selection σ₁, â¦, σ_n :
  + sÃ©lection σ₁, â¦, σ_n :
  (NPages(I) + NPages(R))* RF(σ₁) * â¦ * RF(σ_n)
- Si on a un index I non-groupant pour plusieurs - selection σ₁, â¦, σ_n :
  + sÃ©lection σ₁, â¦, σ_n :
  (NPages(I) + NEnr(R))* RF(σ₁) * â¦ * RF(σ_n)
- Scan sÃ©quentiel Ã R: NPages(R)
@@ -539,7 +539,7 @@ sur sid.

On fait une jointure page Ã page des deux rÃ©sultats prÃ©cÃ©dents : 100 + 100 Ã 1515 = 100 615 E/S.
-
CoÃ»t total: 102 630 E/S (les projections sont faites en pipline Ã la fin)
+
CoÃ»t total: 102 630 E/S (les projections sont faites en pipline Ã la fin)

@@ -582,7 +582,7 @@ sur bid.
- Utiliser l'index n'est pas toujours payant, surtout s'il est - non-groupant et qu'il car on ajoute un facteur qui est le nombre de + non-groupant, car on ajoute un facteur qui est le nombre de rÃ©sultats, pas le nombre de pages
- On a fait certaines approximations Â« Ã la louche Â» (taille des enregistrements rÃ©sultants d'une jointure, nombre des diff --git a/bd/bd06.xhtml b/bd/bd06.xhtml new file mode 100644 index 0000000..feb370b --- /dev/null +++ b/bd/bd06.xhtml @@ -0,0 +1,229 @@ + +â"> + â"> + + +] + > + + + Prise en main de Postgresql + + + + + + + + + + + + + + + + + + + + +
  +
  Bases de donnÃ©es
  +
  Polytech Paris-Sud
  +
  Apprentis 4^Ã¨me annÃ©e
  +
  Cours 6 : Prise en main de Postgresql
  + kn@lri.fr
  + http://www.lri.fr/~kn +
  + +
  Base d'exemple
  +
  +
  On considÃ¨re la base d'exemple suivante
  ++ CREATE TABLE PEOPLE (pid INTEGER PRIMARY key, + firstname VARCHAR(30), + lastname VARCHAR(30)); + + CREATE TABLE MOVIE (mid INTEGER PRIMARY KEY, + title VARCHAR(90) NOT NULL, + year INTEGER NOT NULL, + runtime INTEGER NOT NULL, + rank INTEGER NOT NULL); + + CREATE TABLE ROLE (mid INTEGER REFERENCES MOVIE, + pid INTEGER REFERENCES PEOPLE, + name VARCHAR(70), + PRIMARY KEY(mid, pid, name)); + + CREATE TABLE DIRECTOR (mid INTEGER REFERENCES MOVIE, + pid INTEGER REFERENCES PEOPLE, + PRIMARY KEY (mid, pid)); + +
  +
  EXPLAIN
  +
  +
  EXPLAIN ANALYSE
  +
  On peut demander Ã Postgresql d'afficher le plan qu'il calcule pour + une requÃªte avec les esitmations de coÃ»t : +
  + EXPLAIN requÃªte; +
  Dans ce cas, la requÃªte n'est pas Ã©valuÃ©e. On peut aussi Ã©valuer la + requÃªte :
  + EXPLAIN ANALYSE requÃªte; +
  Dans ce cas, la requÃªte est Ã©valuÃ©e et les coÃ»t rÃ©els sont + affichÃ©s. S'ils divergent des coÃ»ts estimÃ©s, l'optimiseur s'est + trompÃ©, par exemple parce que ses statistiques ne sont pas Ã + jour
  + +
  + +
  +
  EXPLAIN ANALYSE (suite)
  +
  On considÃ¨re:
  ++ EXPLAIN ANALYSE SELECT * FROM ROLE,PEOPLE WHERE + ROLE.pid = PEOPLE.pid; + +
  On obtient :
  +Hash Join (cost=312.07..822.95 rows=14535 width=37) + (actual time=14.799..44.691 rows=14535 loops=1) + Hash Cond: (role.pid = people.pid) + -> Seq Scan on role (cost=0.00..238.35 rows=14535 width=20) + (actual time=0.019..7.570 rows=14535 loops=1) + -> Hash (cost=175.92..175.92 rows=10892 width=17) + (actual time=14.711..14.711 rows=10892 loops=1) + -> Seq Scan on people (cost=0.00..175.92 rows=10892 width=17) + (actual time=0.015..5.944 rows=10892 loops=1) + +
  +
  +
  EXPLAIN ANALYSE (suite)
  ++Seq Scan on people (cost=0.00..175.92 rows=10892 width=17) + (actual time=0.015..5.944 rows=10892 loops=1) + +
  - Le nom de l'opÃ©rateur â¡ nÅud de l'arbre dans le plan de + requÃªte
  - Estimation du coÃ»t (voir suite)
  - ~~CoÃ»t rÃ©el~~ n'apparaÃ®t que si on a fait EXPLAIN + ANALYSE (voir suite)
  +
  +
  +
  Estimation des coÃ»t
  ++ (cost=0.00..175.92 rows=10892 width=17) + +
  - Estimation du coÃ»t. UnitÃ© : temps que met une lecture de + bloc de 8ko (pour Ãªtre indÃ©pendant du hardware). Le premier nombre + est le temps estimÃ© pour avoir le premier rÃ©sultat. Le deuxiÃ¨me le + temps estimÃ© pour avoir l'ensemble. +
  - Estimation du nombre de lignes dans le rÃ©sultat
  - ~~Taille des lignes en octets~~
  +
  +
  +
  CoÃ»t rÃ©el
  ++ (actual time=0.015..5.944 rows=10892 loops=1) + +
  - CoÃ»t rÃ©el. UnitÃ© : ms. Devrait Ãªtre proportionnel Ã + l'estimation si l'optimiseur ne s'est pas trompÃ©. Le premier nombre + est le temps pour avoir le premier rÃ©sultat. Le deuxiÃ¨me le + temps pour avoir l'ensemble. +
  - Nombre de lignes dans le rÃ©sultat
  - ~~looks=x~~ l'opÃ©rateur a Ã©tÃ© appelÃ© x fois
  +
  +
  +
  Lecture du plan de requÃªte
  ++ Hash Join (cost=â¦) (actual time=â¦) + Hash Cond: (role.pid = people.pid) + -> Seq Scan on role (cost=â¦) (actual time=â¦) + -> Hash (cost=â¦) (actual time=â¦) + -> Seq Scan on people (cost=â¦) (actual time=â¦) + + +
  + +
  +
  Note: les projections n'apparaissent pas, on peut les voir + avec EXPLAIN ANALYSE VERBOSE.
  +
  +
  Exemples d'opÃ©rateurs
  +
  +
  NÅuds frÃ©quements rencontrÃ©s lors d'un EXPLAIN ANALYSE
  +
  Les opÃ©rateurs sont dÃ©clinÃ©s selon les diffÃ©rents algorithmes + (jointure, tris, â¦)
  +
  - Seq Scan: Scan sÃ©quentiel
  - Nested loop: Jointure itÃ©rative page Ã page
  - Merge sort join: Jointure par tri fusion
  - Hash join: jointure par hashage (gÃ©nÃ©ralisation de la + jointure sur index)
  - Sort: Tri (le nÅud indique l'algo de tri et la fonction + de comparaison)
  - Index scan: scan d'un index (prÃ©cise l'index et la condition)
  - Hash: gÃ©nÃ©ration d'une table de hash Ã la volÃ©e
  - Bitmap Index scan/Bitmap heap scan: gÃ©nÃ©ration et + utilisation d'un index bitmap Ã la volÃ©e (voire suite)
  - Materialize: Ã©criture de rÃ©sultats intermÃ©diaires sur le disque
  + + +
  +
  +
  Retour sur les opÃ©ratuers Â« Bitmap Â»
  +
  (Cours 5) si l'index est non-groupant, l'utilisation de l'index + peut provoquer une sÃ©quence de chargement/dÃ©chargement de pages + ruinant les performances +
  +
  Solution en deux phases
  +
  - Scanner l'index et crÃ©er un bitmap de taille N oÃ¹ N est le + nombre de pages de la relation. Pour chaque entrÃ©e d'index + satisfaisant le rÃ©sultat, mettre le bit correspondant Ã 1 (phase + Bitmap Index Scan) +
  - + Parcourir la relation dans l'ordre du disque, page Ã page. Si la + page est Ã 1 dans le bitmap, on la charge, sinon on l'ignore. + Une fois la page chargÃ©e il faut rÃ©Ã©valuer la condition car on + a oubliÃ© quels Ã©taients les rÃ©sultats de l'index (phase Bitmap + Heap Scan) +
  +
  IntÃ©ret: Un bitmap est petit (si la relation contient 10000 pages, + le bitmap contient 10000 bits ou environs 1250 octets (soit moins + d'une page).
  +
  Cela permet aussi de rÃ©pondre efficacement aux requÃªtes + boolÃ©enes complexes (i.e. autre qu AND). En effet on + calcule un bitmap pour chaque sous-condition, et on fait les + opÃ©rations entre bitmap bit Ã bit. +
  +
  +
  DÃ©mo
  + + diff --git a/bd/example_plan.svg b/bd/example_plan.svg index 3c3812f..677ff8f 100644 --- a/bd/example_plan.svg +++ b/bd/example_plan.svg @@ -9,11 +9,11 @@ xmlns="http://www.w3.org/2000/svg" xmlns:sodipodi="http://sodipodi.sourceforge.net/DTD/sodipodi-0.dtd" xmlns:inkscape="http://www.inkscape.org/namespaces/inkscape" - width="568.40125" - height="122.59209" + width="572.80127" + height="126.99208" id="svg2" version="1.1" - inkscape:version="0.48.5 r10040" + inkscape:version="0.48.4 r9939" sodipodi:docname="example_plan.svg"> @@ -25,20 +25,21 @@ inkscape:pageopacity="0.0" inkscape:pageshadow="2" inkscape:zoom="1.3734375" - inkscape:cx="375.34095" - inkscape:cy="69.837239" + inkscape:cx="377.54095" + inkscape:cy="72.037241" inkscape:document-units="px" inkscape:current-layer="layer1" showgrid="true" - fit-margin-top="0.3" - fit-margin-left="0.3" - fit-margin-right="0.3" - fit-margin-bottom="0.3" - inkscape:window-width="1317" - inkscape:window-height="744" - inkscape:window-x="49" - inkscape:window-y="24" - inkscape:window-maximized="1"> + fit-margin-top="2" + fit-margin-left="2" + fit-margin-right="2" + fit-margin-bottom="2" + inkscape:window-width="1631" + inkscape:window-height="1026" + inkscape:window-x="1249" + inkscape:window-y="407" + inkscape:window-maximized="1" + units="pt"> + originx="121.30664px" + originy="-807.31591px" /> @@ -65,9 +66,9 @@ inkscape:label="Layer 1" inkscape:groupmode="layer" id="layer1" - transform="translate(119.10664,-120.25418)"> + transform="translate(121.30664,-118.05418)"> + id="g3116"> Plan 2 - - â¨ - â¨ + R - R + S - - - S + + + â¨ - â¨ + B - - - B + + + Plan 3 - - - Plan 3 + â¨ + â¨ - R - S - - - B + S + + + â¨ + â¨ - B - - - Plan 1 - + x="20" + id="tspan2997-6-33" + sodipodi:role="line">R + + + Plan 1 diff --git a/bd/explain_plan.svg b/bd/explain_plan.svg new file mode 100644 index 0000000..470239b --- /dev/null +++ b/bd/explain_plan.svg @@ -0,0 +1,306 @@ + + + + diff --git a/bd/pdf/bd04.pdf b/bd/pdf/bd04.pdf index 28eafaa..dd5d0d5 100644 Binary files a/bd/pdf/bd04.pdf and b/bd/pdf/bd04.pdf differ diff --git a/bd/pdf/bd04_print.pdf b/bd/pdf/bd04_print.pdf index 26cb610..3f26edb 100644 Binary files a/bd/pdf/bd04_print.pdf and b/bd/pdf/bd04_print.pdf differ diff --git a/bd/pdf/bd05.pdf b/bd/pdf/bd05.pdf index 767466d..5e80052 100644 Binary files a/bd/pdf/bd05.pdf and b/bd/pdf/bd05.pdf differ diff --git a/bd/pdf/bd05_print.pdf b/bd/pdf/bd05_print.pdf index 2e54095..0e96cad 100644 Binary files a/bd/pdf/bd05_print.pdf and b/bd/pdf/bd05_print.pdf differ diff --git a/bd/pdf/bd06.pdf b/bd/pdf/bd06.pdf new file mode 100644 index 0000000..4d8e52f Binary files /dev/null and b/bd/pdf/bd06.pdf differ diff --git a/bd/pdf/bd06_print.pdf b/bd/pdf/bd06_print.pdf new file mode 100644 index 0000000..4f1fdc2 Binary files /dev/null and b/bd/pdf/bd06_print.pdf differ

Apprentis 4^Ã¨me annÃ©e

Cours 4 : Optimisation des opÃ©rateurs

Motivation

Plan alternatif 1 (sans index)

Autres Ã©quivalences

Cas mono-relation

Estimation du coÃ»t pour les plans mono-relation

RequÃªtes multi-relations

Bases de donnÃ©es

Polytech Paris-Sud

Apprentis 4^Ã¨me annÃ©e

Cours 6 : Prise en main de Postgresql

Base d'exemple

On considÃ¨re la base d'exemple suivante

EXPLAIN

EXPLAIN ANALYSE

EXPLAIN ANALYSE (suite)

EXPLAIN ANALYSE (suite)

Estimation des coÃ»t

CoÃ»t rÃ©el

Lecture du plan de requÃªte

Exemples d'opÃ©rateurs

NÅuds frÃ©quements rencontrÃ©s lors d'un EXPLAIN ANALYSE

Retour sur les opÃ©ratuers Â« Bitmap Â»

DÃ©mo

Apprentis 4Ã¨me annÃ©e

Cours 4 : Optimisation des opÃ©rateurs

Motivation

Plan alternatif 1 (sans index)

Autres Ã©quivalences

Cas mono-relation

Estimation du coÃ»t pour les plans mono-relation

RequÃªtes multi-relations

Bases de donnÃ©es

Polytech Paris-Sud

Apprentis 4Ã¨me annÃ©e

Cours 6 : Prise en main de Postgresql

Base d'exemple

On considÃ¨re la base d'exemple suivante

EXPLAIN

EXPLAIN ANALYSE

EXPLAIN ANALYSE (suite)

EXPLAIN ANALYSE (suite)

Estimation des coÃ»t

CoÃ»t rÃ©el

Lecture du plan de requÃªte

Exemples d'opÃ©rateurs

NÅuds frÃ©quements rencontrÃ©s lors d'un EXPLAIN ANALYSE

Retour sur les opÃ©ratuers Â« Bitmap Â»

DÃ©mo

Apprentis 4^Ã¨me annÃ©e

Apprentis 4^Ã¨me annÃ©e

NÅuds frÃ©quements rencontrÃ©s lors d'un EXPLAIN ANALYSE