UTF-8

UTF-8 (abréviation de l’anglais Universal Character Set Transformation Format - 8 bits) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l’anglais de base (et quelques autres langues beaucoup moins fréquentes), mais très largement répandue depuis des décennies.

L’UTF-8 est utilisé par 82,2 % des sites web en décembre 2014 [1], puis 87.6% en 2016 [2] Par sa nature, UTF-8 est d’un usage de plus en plus courant sur Internet, et dans les systèmes devant échanger de l'information. Il s’agit également du codage le plus utilisé dans les systèmes GNU, Linux et compatibles pour gérer le plus simplement possible des textes et leurs traductions dans tous les systèmes d’écritures et tous les alphabets du monde.

Liens avec la norme internationale ISO/CEI 10646 et les standards Unicode et d’Internet

UTF-8 est un « format de transformation » issu à l’origine des travaux pour la norme ISO/CEI 10646, c’est-à-dire que UTF-8 définit un codage pour tout point de code scalaire ( caractère abstrait ou « non-caractère ») du répertoire du jeu universel de caractères codés (Universal Character Set, ou UCS). Ce répertoire est aujourd’hui commun à la norme ISO/CEI 10646 (depuis sa révision 1) et au standard Unicode (depuis sa version 1.1).

UTF-8 est officiellement défini dans la norme ISO/CEI 10646 depuis son adoption dans un amendement publié en 1996. Il fut aussi décrit dans le standard Unicode et fait partie de ce standard depuis la version 3.0 publiée en 2000. En 1996 fut publiée la RFC 2044 (« UTF-8, a transformation format of ISO 10646 ») dans le but de fournir une spécification accessible d’UTF-8 et d’entamer sa standardisation au sein de l’ Internet Engineering Task Force (IETF). Cette RFC fut révisée en 1998 (RFC 2279) puis finalement en 2003 (RFC 3629), cette dernière version faisant d’UTF-8 un des standards de l'internet (STD 63).

Other Languages
azərbaycanca: UTF-8
български: UTF-8
bosanski: UTF-8
català: UTF-8
čeština: UTF-8
Чӑвашла: UTF-8
dansk: UTF-8
Deutsch: UTF-8
Ελληνικά: UTF-8
English: UTF-8
Esperanto: UTF-8
español: UTF-8
فارسی: یوتی‌اف-۸
עברית: UTF-8
hrvatski: UTF-8
magyar: UTF-8
Bahasa Indonesia: UTF-8
italiano: UTF-8
日本語: UTF-8
한국어: UTF-8
lietuvių: UTF-8
latviešu: UTF-8
മലയാളം: യു.ടി.എഫ്-8
Bahasa Melayu: UTF-8
Nederlands: UTF-8
norsk nynorsk: UTF-8
norsk bokmål: UTF-8
polski: UTF-8
português: UTF-8
русский: UTF-8
Scots: UTF-8
slovenčina: UTF-8
slovenščina: UTF-8
српски / srpski: UTF-8
svenska: UTF-8
Türkçe: UTF-8
українська: UTF-8
Tiếng Việt: UTF-8
中文: UTF-8