World Wide Web

Ne doit pas être confondu avec Internet ou WorldWideWeb.
Page d'aide sur l'homonymie Pour les articles homonymes, voir web (homonymie).
Logo historique du World Wide Web par Robert Cailliau.
Où la toile est née, plaque commémorant la création du World Wide Web dans les locaux du CERN.

Le World Wide Web (WWW), littéralement la « toile (d’araignée) mondiale », communément appelé le Web, et parfois la Toile, est un système hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles [note 1].

Le Web n’est qu’une des applications d’Internet [1] ; distincte d’autres applications comme le courrier électronique, la messagerie instantanée et le partage de fichiers en pair à pair. Le Web a été inventé au CERN par Tim Berners-Lee plusieurs années après Internet. C'est également lui qui a rendu les médias grand public attentifs à Internet. Depuis, le Web est fréquemment confondu avec Internet [2] ; en particulier, le mot Toile est souvent utilisé dans les textes non techniques sans dévoiler clairement s'il désigne le Web ou Internet.

Terminologie

Termes généraux

Le World Wide Web est désigné par de nombreux noms et abréviations synonymes : WorldWideWeb, World Wide Web, World-wide Web, Web, WWW, W3, Toile d’araignée mondiale, Toile mondiale, Toile. Certains ont disparu. Le nom du projet originel était WorldWideWeb [3]. Les mots ont été rapidement séparés en World Wide Web pour améliorer la lisibilité. Le nom World-Wide Web a également été utilisé par les inventeurs du Web, mais le nom désormais préconisé par le World Wide Web Consortium (W3C) sépare les trois mots sans trait d’union [4]. Bien que « mondial » s’écrive world-wide ou worldwide en anglais, l’orthographe World Wide Web et l’abréviation Web sont maintenant bien établies.

En inventant le Web, Tim Berners-Lee avait aussi pensé à d’autres noms, comme Information Mesh (maillage d’informations), Mine of Information ou encore The Information Mine (la mine d’informations, dont le sigle serait Tim). Le sigle WWW a été largement utilisé pour abréger World Wide Web avant que l’ abréviation Web prenne le pas. WWW se prononce souvent trois double V, triple double V, vévévé ou wéwéwé (en Belgique). La prononciation laborieuse (en français comme en anglais) de WWW a sans doute précipité son déclin à l’oral. À l’écrit, les lettres www restent très utilisées dans les adresses Web et quelques autres conventions techniques. WWW est parfois abrégé en W3, abréviation qu’on retrouve dans le sigle W3C du World Wide Web Consortium. Dans la seconde moitié des années 1990, une blague répandue prétendait que WWW signifiait World Wide Wait, soit « attente mondiale », car le réseau Internet était engorgé par la popularité grandissante du Web.

Pour écrire « le web », l’usage de la minuscule est de plus en plus courant. L’ Office québécois de la langue française préconise la majuscule [5], le Journal officiel français préconise l'usage du terme « toile d’araignée mondiale [6] ».

Termes rattachés au web

L’expression « en ligne » signifie « connecté à un réseau », en l’occurrence le réseau informatique Internet. Cette expression n’est donc pas propre au web, mais à Internet dans sa globalité, on la retrouve également à propos des réseaux téléphoniques.

Un hôte est un terme général qui désigne tout ordinateur (ou serveur) connecté à un réseau informatique. C'est à partir d'un hôte qu'un utilisateur se connecte pour accéder au reste du réseau. Lorsque le réseau est le World Wide Web, un hôte est un ordinateur en ligne : Chaque hôte d'Internet est alors identifié par une adresse IP à laquelle correspondent zéro, un ou plusieurs noms d'hôte.

Une ressource du World Wide Web est une entité informatique ( texte, image, forum Usenet, boîte aux lettres électronique, etc.) accessible indépendamment d’autres ressources. Une ressource en accès public est librement accessible depuis tout Internet. Lorsqu’une ressource est présente sur l’hôte de l’utilisateur, elle est dite locale ; par opposition elle est distante si elle est présente sur un hôte différent. Lorsque celle-ci est connectée et disponible au réseau, elle est en ligne. On ne peut accéder à une ressource distante qu’en respectant un protocole de communication. Les fonctionnalités de chaque protocole varient : réception, envoi, voire échange continu d’informations.

HTTP (pour HyperText Transfer Protocol) est le protocole de communication communément utilisé pour transférer les ressources du Web. HTTPS est la variante avec authentification et chiffrement de ce protocole.

Une URL (pour Uniform Resource Locator, signifiant littéralement « localisateur de ressource uniforme ») est une chaîne de caractères décrivant l’emplacement d’une ressource. Elle contient généralement dans l’ordre [7] : le nom du protocole, un deux-points (:), deux barres obliques (//), un nom d’hôte, une barre oblique (/), et un chemin composé de texte séparés par des barres obliques. Exemple : http://example.com/un/chemin/page.html.

Un hyperlien (ou dans le langage courant, un lien) est un élément dans une ressource qui est associé à une URL. Les hyperliens du web sont orientés : ils permettent d’aller d’une source à une destination. Seule la ressource à la source contient les données définissant l’hyperlien. Ainsi, il est possible d’établir un hyperlien sans la moindre intervention, ni coopération, de la ressource cible de l’hyperlien. Ce modèle unilatéral adopté par le Web ne se retrouve pas dans tous les systèmes hypertextes. Il a l’avantage prépondérant, dans un réseau public mondial, de permettre la création d’innombrables hyperliens entre partenaires décentralisés et non coordonnés.

HTML (pour HyperText Markup Language) et XHTML (Extensible HyperText Markup Language) sont les langages informatiques permettant de décrire le contenu d’un document (titres, paragraphes, disposition des images, etc.) et d’y inclure des hyperliens. Un document HTML est un document décrit avec le langage HTML.

Dans un mode de communication client-serveur, un serveur est un hôte sur lequel fonctionne un logiciel serveur auquel peuvent se connecter des logiciels clients fonctionnant sur des hôtes clients, un seul hôte peut contenir les deux.

Serveur HTTP

Un serveur HTTP (ou service web) est un logiciel utilisé pour servir des ressources à travers le protocole HTTP. Un client HTTP est un logiciel utilisé pour manipuler ces ressources.

Un serveur web est un hôte sur lequel fonctionne un serveur HTTP (ou service web). Un serveur web peut héberger les ressources qu’il dessert, peut les récupérer sur des hôtes distants, délivrer ces ressources telles quelles (on parlera alors de ressources statiques), ou bien les modifier en fonction de différents critères, on parlera alors de ressources dynamiques. Il est courant sur les services de grosse taille que les ressources soient réparties sur différents serveurs web et éventuellement différents types de serveurs HTTP, certains ayant de meilleurs performances pour les fichiers statiques, d’autre plus de souplesse pour délivrer des fichiers dynamiques. Un serveur web peut être un hôte spécialisé, une partie d’une infrastructure spécialisée ou bien encore un hôte plus généraliste. On appelle site web, l’ensemble des ressources HTTP associées à un nom de domaine et un ou plusieurs noms d’hôtes. Une adresse web est une URL de page web, généralement écrite sous une forme simplifiée limitée à un nom d’hôte. Une adresse de site web est en fait l’adresse d’une page du site prévue pour accueillir les visiteurs.

Client HTTP

Un client HTTP est un outil permettant d’utiliser les ressources fournies par un serveur HTTP. Il est chargé, en relation avec différents services, de faire traduire le nom d’hôte en adresse IP par un DNS, de rentrer en contact avec le serveur HTTP, et de lui fournir différentes informations telles que le nom du site, et la ressource désirée, ainsi que ses capacités (gestion de différents types de ressource, capacité d’affichage, possibilité de compression de données, etc.) ou sa volonté (choix des langues, protection de la vie privée) dans l’utilisation des données fournies.

Un navigateur web est un type de logiciel client HTTP à interface homme-machine et conçu pour accéder aux ressources du web. Sa fonction de base est de permettre la consultation des documents HTML disponibles sur les serveurs HTTP. Le support d’autres types de ressources et d’autres protocoles de communication dépend du type de navigateur.

Un robot d’indexation est, dans le domaine du web, un type de logiciel client HTTP, utilisé pour indexer les différentes ressources de sites web.

Un agrégateur est, dans le domaine du web, un type de logiciel client HTTP, permettant de regrouper les fils de syndication de différents sites web.

Un aspirateur de site web est un client HTTP permettant de récupérer l’intégralité d’un site web, pour le consulter ensuite hors-ligne ou en conserver une archive.

Documents

Une page web (ou page) est un document destiné à être consulté avec un navigateur web. Une page web est toujours constituée d’une ressource centrale (généralement un document HTML ou XHTML) et d’éventuelles ressources liées, automatiquement accessibles (par exemple, des images, des feuilles de style, des scripts javascript ou des fontes de caractères). Il n’est pas exceptionnel qu’un seul document HTML fasse appel à entre quelques dizaines et une centaine de ressources annexes.

Un éditeur HTML (ou éditeur web) est un logiciel conçu pour faciliter l’écriture de documents HTML et de pages web en général.

Un site web (ou site) est un ensemble de pages web et d’éventuelles autres ressources, liées dans une structure cohérente, publiées par un propriétaire (une entreprise, une administration, une association, un particulier, etc.) et hébergées sur un ou plusieurs serveurs web.

Un système de gestion de contenu (Content Management System, abrégé CMS) est un logiciel permettant de gérer le contenu d'un site.

Consultation et mesure

Visiter un site web signifie « consulter ses pages ». Le terme visite vient du fait que l’on consulte généralement plusieurs pages d’un site, comme on visite les pièces d’un bâtiment. La visite est menée par un utilisateur (visiteur ou internaute).

L’expression « surfer sur le web » signifie « consulter le web ». Elle a été inventée pour mettre l’accent sur le fait que consulter le web consiste à suivre de nombreux hyperliens de page en page. Elle est principalement utilisée par les médias ; elle n’appartient pas au vocabulaire technique.

On appelle audience, la fréquentation d’un site.

On appelle fil d’Ariane, le parcours effectué par un visiteur sur un site.

On appelle journal d’accès, la liste des accès effectués par les différents utilisateurs sur un serveur HTTP.

On appelle référent, la ressource ayant conduit un visiteur à une ressource servie. Elles sont données par défaut par la majorité des clients HTTP, mais peuvent être bloquées. Le référent est généralement également conservé dans le journal du serveur HTTP en association avec la ressource consultée.

On appelle User-Agent, la référence donnée par le client HTTP au serveur HTTP pour indiquer sa nature. Parmi les informations données, il peut y avoir le nom du client HTTP et sa version, le nom du moteur de rendu HTML utilisé, les langues préférées par l’utilisateur ou l’outil client, ainsi que différents autres critères comme les modules d’extension installés sur le client. Ces critères permettent au serveur HTTP d’évaluer quelles ressources seront plus adaptées à celui-ci. Différentes technologies dynamiques comme javascript ou les CSS, permettent également aux pages de supporter des clients hétérogènes et de s’adapter dynamiquement en utilisant ses ressources plutôt que celles du serveur.

La mesure de l’audience est l’étude des consultations effectuées sur un site, elle vise à comprendre les désirs des utilisateurs, en fonction des ressources les plus utilisées et du fil d’Ariane de ceux-ci.

La mesure d’audience peut se faire de différentes manières :

  • Analyse des journaux du serveur. Les calculs de mesure de l’audience peuvent alors être effectués en temps réel au moment de la visite, ou bien en différé.
  • Utilisation de scripts sur le serveur web lui-même.
  • Utilisation d’images invisibles déportées sur un serveur web tiers (mesure d’audience simple).
  • Utilisation de script en langage javascript et envoi des informations au serveur web ou a un serveur tiers (mesure d’audience plus complète).

Métiers du web

On appelle hébergeur web une personne physique ou morale hébergeant (rendant accessible en ligne) sur son ou ses serveurs, les ressources constituant les sites web de ses clients. Cela peut aller du simple auto-hébergement d’un particulier à celui d’une association, d’une entreprise ou d’un industriel. L’hébergement peut alors être fait à domicile sur un modem, assurant un minimum de fiabilité, dans pièce climatisée dédiée aux serveurs, dans un local généraliste au centre de données spécialisé, assurant la redondance énergétique et réseau nécessaire au fonctionnement sans interruptions 24/7.

Une agence web est une entreprise de services informatiques réalisant des sites web pour ses clients.

Types de services web

Un service web est une technologie client-serveur fondée sur les protocoles du web.

Un annuaire web est un site web répertoriant des sites web.

Un moteur de recherche est un site permettant d’effectuer des recherches sur l’ensemble des sites web selon différents critères.

Un portail web est un site web tentant de regrouper la plus large palette d’informations et de services possibles dans un site web. Certains portails sont thématiques.

Un agrégateur web est un site web qui sélectionne, organise et, éventuellement, valide des pages ( URL) concernant un sujet précis et les met en forme de façon ergonomique et/ou attractive.

Un blog est un journal web, fournissant des informations dépendantes du temps. Un blog BD est un type de blog utilisant le medium de la bande-dessinée comme support de communication.

Un webmail est un lecteur de courrier électronique utilisant une interface web.

Un wiki est un site web éditable par les utilisateurs.

Other Languages
Afrikaans: Wêreldwye web
Alemannisch: World Wide Web
aragonés: World Wide Web
Ænglisc: Woruldwīd Webb
مصرى: ويب
asturianu: Web
беларуская: World Wide Web
беларуская (тарашкевіца)‎: Сусьветнае павуціньне
български: Уеб
বিষ্ণুপ্রিয়া মণিপুরী: ওয়ার্ল্ড ওয়াইড ওয়েব
brezhoneg: World Wide Web
bosanski: World Wide Web
corsu: Reta
čeština: World Wide Web
Cymraeg: Gwe fyd-eang
emiliàn e rumagnòl: Gran Tlarè mundièl
Esperanto: TTT
español: World Wide Web
eesti: Veeb
Võro: WWW
føroyskt: Heimsvevur
贛語: 萬維網
客家語/Hak-kâ-ngî: Chhiòn-khiù Chṳ̂-sín Mióng
עברית: World Wide Web
hrvatski: World Wide Web
magyar: Világháló
interlingua: World Wide Web
Bahasa Indonesia: World Wide Web
íslenska: Veraldarvefurinn
italiano: World Wide Web
日本語: World Wide Web
Patois: Wol Waid Web
Basa Jawa: World Wide Web
Taqbaylit: World Wide Web
қазақша: Ғаламтор
Ladino: Web
Lëtzebuergesch: World Wide Web
lietuvių: Saitynas
Malagasy: Tranonkala
македонски: Светска пајажина
Bahasa Melayu: Jaringan Sejagat
မြန်မာဘာသာ: ဝက်ဘ်
مازِرونی: وب
नेपाल भाषा: वर्ल्द वाइद वेब
Nederlands: Wereldwijd web
norsk nynorsk: Verdsveven
português: World Wide Web
rumantsch: World Wide Web
română: World Wide Web
саха тыла: World Wide Web
sicilianu: World Wide Web
srpskohrvatski / српскохрватски: World Wide Web
Simple English: World Wide Web
slovenčina: World Wide Web
slovenščina: Splet
Soomaaliga: World Wide Web
српски / srpski: Веб
Türkçe: World Wide Web
татарча/tatarça: Бөтендөнья пәрәвезе
vèneto: Web
Tiếng Việt: World Wide Web
ייִדיש: World Wide Web
中文: 万维网
Bân-lâm-gú: World Wide Web
粵語: 萬維網