Un web bien bruyant : la Faille du Levant (wikipedia)

Par , le .

Cette étude de cas s'intéresse à une page wikipedia prise au hasard concernant la faille de la mer Morte, sous sa forme actuelle au moment de l'étude : https://fr.wikipedia.org/wiki/Faille_du_Levant, disponible sous licence Creative Commons attribution, partage dans les mêmes conditions. On l'étudie selon le protocole établi pour l'article Un web bien bruyant.

Le contenu est le texte de l'article ainsi que les images, telles qu'elles sont affichées dans la page (format réduit, le lien amène vers le format plein). Pour le contenu brut, voici ce qui a été retenu :

fichier taille en octet
200px-DeadSeaTransform.png 161 587
310px-Système_de_rift_est-africain.jpg 32 915
550px-Jordan_Valley_Panorama.jpg 19 813
wikipedia_Faille_du_Levant.txt 2 763
total 217 078
Étude de cas n°1 : contenu brut extrait.

Et voici pour ce qui aura été téléchargé. On enregistre le contenu du moniteur web en HAR puis on le requête avec jq (jq -r '[.log.entries[]|{method: .request.method, mimetype: .response.content.mimeType, size: .response.content.size}]|group_by(.method, .mimetype)|map(.[0] + {"nombre": length, "total": (map(.size)|add)})[]|[.method, .mimetype, .nombre, .total]|@tsv') :

MéthodeType MIMENombreTaille
GETimage/jpeg252 728
GETimage/png3176 344
GETimage/svg+xml916 638
GETimage/vnd.microsoft.icon12 734
GETimage/webp22 674
GETtext/css; charset=utf-82168 089
GETtext/html; charset=UTF-8158 634
GETtext/javascript; charset=utf-82202 346
POSTtext/plain30
Total25680 187
Étude de cas n°1 : fichiers téléchargés.

Ce qui nous amène au rapport « signal / bruit » : 217 078 / 680 187 = 0,3191.