From: Kim Nguyễn Date: Tue, 30 Sep 2014 09:21:19 +0000 (+0200) Subject: ajout du cours 4 X-Git-Url: http://git.nguyen.vg/gitweb/?p=hacks%2FsimpleWebSlides.git;a=commitdiff_plain;h=e4360bf68f4a6a3ad04a7e566c3933b7ec4454ca ajout du cours 4 --- diff --git a/unix_prog_web/pdf/unix_prog_web_04.pdf b/unix_prog_web/pdf/unix_prog_web_04.pdf new file mode 100644 index 0000000..312773d Binary files /dev/null and b/unix_prog_web/pdf/unix_prog_web_04.pdf differ diff --git a/unix_prog_web/pdf/unix_prog_web_04_print.pdf b/unix_prog_web/pdf/unix_prog_web_04_print.pdf new file mode 100644 index 0000000..82e04d7 Binary files /dev/null and b/unix_prog_web/pdf/unix_prog_web_04_print.pdf differ diff --git a/unix_prog_web/unix_prog_web_04.xhtml b/unix_prog_web/unix_prog_web_04.xhtml index b0264bd..2d8f309 100644 --- a/unix_prog_web/unix_prog_web_04.xhtml +++ b/unix_prog_web/unix_prog_web_04.xhtml @@ -35,31 +35,14 @@ - +
-

Programmation Internet

+

Unix et Programmation Web

Cours 4

kn@lri.fr
http://www.lri.fr/~kn
- -
-

Plan

-
    -
  1. Systèmes d'exploitation ✔
  2. -
  3. Réseaux et Internet ✔
  4. -
  5. Le Web -
      -
    • 3.1 Internet et ses services
    • -
    • 3.2 Fonctionnement du Web
    • -
    • 3.3 Adressage des documents Web
    • -
    • 3.4 Le protocole HTTP
    • -
    • 3.5 HTML, le format des documents
    • -
    -
  6. -
-
-

Internet et ses services

+

Internet et ses services

Bref historique d'Internet (1/2)

@@ -208,22 +191,6 @@ -
-

Plan

-
    -
  1. Systèmes d'exploitation
  2. -
  3. Réseaux et Internet
  4. -
  5. Le Web -
      -
    • 3.1 Internet et ses services
    • -
    • 3.2 Fonctionnement du Web
    • -
    • 3.3 Adressage des documents Web
    • -
    • 3.4 Le protocole HTTP
    • -
    • 3.5 HTML, le format des documents
    • -
    -
  6. -
-

Fonctionnement du Web

Fonctionnement du Web

@@ -281,22 +248,6 @@
-
-

Plan

-
    -
  1. Systèmes d'exploitation
  2. -
  3. Réseaux et Internet
  4. -
  5. Le Web -
      -
    • 3.1 Internet et ses services
    • -
    • 3.2 Fonctionnement du Web
    • -
    • 3.3 Adressage des documents Web
    • -
    • 3.4 Le protocole HTTP
    • -
    • 3.5 HTML, le format des documents
    • -
    -
  6. -
-

Adressage des documents Web

Adressage des documents Web (1/3)

@@ -346,23 +297,6 @@

Le protocole HTTP

-
-

Plan

-
    -
  1. Systèmes d'exploitation
  2. -
  3. Réseaux et Internet
  4. -
  5. Le Web -
      -
    • 3.1 Internet et ses services
    • -
    • 3.2 Fonctionnement du Web
    • -
    • 3.3 Adressage des documents Web
    • -
    • 3.4 Le protocole HTTP
    • -
    • 3.5 HTML, le format des documents
    • -
    -
  6. -
-
-

Caractéristiques du protocole HTTP

    @@ -403,22 +337,6 @@

    Démo

HTML, le format des documents

-
-

Plan

-
    -
  1. Systèmes d'exploitation
  2. -
  3. Réseaux et Internet
  4. -
  5. Le Web -
      -
    • 3.1 Internet et ses services
    • -
    • 3.2 Fonctionnement du Web
    • -
    • 3.3 Adressage des documents Web
    • -
    • 3.4 Le protocole HTTP
    • -
    • 3.5 HTML, le format des documents
    • -
    -
  6. -
-

HTML

@@ -442,15 +360,16 @@

- - - ]]> +
+

Structure d'un document XHTML

+

Pour être valide un document XHTML contient au + moins les balises suivantes :

+
  • Une balise html qui est la racine (elle + englobe toutes les autres balises). La balise html + contient deux balises filles: head et body
  • +
  • La balise head représente l'en-tête du document. + Elle peut contenir diverses informations (feuilles de styles, + titre, encodage de caractères, …). La seule + balise obligatoire dans head est le titre + (title). C'est le texte qui est affiché dans la barre + de fenêtre du navigateur ou dans l'onglet. +
  • +
  • la balise body représente le contenu de la page. On y + trouve diverses balises (div, p, table, + …) qui formattent le contenu de la page
  • +
+
+

Encodage des caractères (UTF-8) (digression)

+
+

Représentation des textes

+

Avant de représenter des documents complexes, on s'intéresse + aux textes (sans structure particulière)

+

Problématique: comment représenter du texte + réaliste ?

+

Exemple de texte réaliste:
+ " و عليكم السلام,Здравей,¡Hola!, 你好,Góðan daginn,… + " +

+
+
+

Historiquement…

+

Encodage 1 caractère = 1 octet (8 bits) :

+
  • Encodage ASCII sur 7 bits (128 caractères)
  • +
  • ASCII étendu 8 bits (256 caractères, dont 128 de « + symboles »
  • +
  • Latin 1 : ASCII 7 bits + 128 caractères « ouest-européens » + (lettres accentuées française, italienne, …)
  • +
  • Latin 2 : ASCII 7 bits + 128 caractères « est-européens » + (Serbe, Hongrois, Croate, Tchèque, …)
  • +
  • Latin 3 : ASCII 7 bits + 128 caractères turques, maltais, + esperanto,
  • +
  • Latin 4 : ASCII 7 bits + 128 caractères islandais, + lituanien, …
  • +
  • …
  • +
  • Latin 15 : Latin 1 avec 4 caractères « inutiles » + remplacés (par exemple pour « € » à la place de « ¤ »)
  • +
+
+
+

… et pendant ce temps là, ailleur dans le monde

+

Encodage multi-octets:

+
    +
  • Encodages spécifiques pour le Chinois (Big5, GB, …)
  • +
  • Encodages spécifiques pour le Japonais (Shift-JIS, EUC, …)
  • +
+

Impossibilité de mettre plusieurs « alphabets » dans un même + texte

+

Chaque logiciel « interprétait » les séquences d'octet de + manière prédéfinie

+
+
+

UTF-8

+

Universal (Character Set) Transformation Format 8 bit

+
  • Encodage à taille variable « universel » (contient tous + les alphabets connus)
  • +
  • Un organisme (ISO) donne un code à chaque symbole
  • +
  • Compatible avec ASCII 7 bits
  • +
+

Encodage

+
Exemple Rendu par défaut
en gras ]]>Un +
en gras + ]]>Un texte en gras
Un lien ]]>Un lien
+
  • Premièrement
  • Deuxièmement
  • - ]]>
      +
    ]]>
    • Premièrement
    • Deuxièmement
    @@ -545,5 +464,118 @@ documents semi-structurés (SGML simplifié)
    + + + + + + + + + + +
    Nombre d'octetsOctet 1Octet + 2Octet 3Octet 4Octet 5Octet 6
    10xxxxxxx
    2110xxxxxx10xxxxxx
    31110xxxxx10xxxxxx10xxxxxx
    411110xxxx10xxxxxx10xxxxxx10xxxxxx
    5111110xxx10xxxxxx10xxxxxx10xxxxxx10xxxxxx
    61111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx10xxxxxx
    +
    +
    +

    Exemples

    +

    A  ⟶  6510 +  ⟶  0100 10102 (représenté sur un + seul octet)

    + +

    ễ  ⟶  787710 +  ⟶  0001 1110 1100 01012 (représenté + 3 octets) :
    + 11100001 1011 10 + 11 1000 0101≡ 225 187 133 +

    +

    🐵 +  ⟶  12805310  ⟶  … + ≡ 240 237 220 181

    +

    Avantages

    + +

    Inconvénients

    + +