Codificación UTF-8

El Formato de Transformación de Unicode de 8 bits, llamado UTF-8, es una codificación de caracteres de ancho variable que puede codificar los 1.114.112 puntos de código válidos de Unicode utilizando de uno a cuatro bytes de 8 bits. El número "8" significa que UTF utiliza bloques de 8 bits para representar un carácter.

Desde 2009, UTF-8 ha sido la codificación líder para la World Wide Web.

Para caracteres iguales o inferiores a 127 (hex 0x7F), la representación UTF-8 ocupa un solo byte. Esto es similar al valor ASCII.

Para cualquier carácter igual o inferior a 2047 (hex 0x07FF), la representación UTF-8 se distribuye en dos bytes.

Para cualquier carácter igual o superior a 2048 pero menor que 65535 (0xFFFF), la representación UTF-8 se distribuirá en tres bytes.

Para cualquier carácter igual o superior a 65536 (0x10000) hasta el punto de código máximo de Unicode (0x10FFFF), la representación UTF-8 se distribuye en cuatro bytes.

La siguiente lista muestra algunos códigos de caracteres UTF-8 que son compatibles con HTML5:

Códigos de caracteres	Decimal	Hexadecimal
Controles C0 y Latín básico	0-127	0000-007F
Controles C1 y Suplemento Latín-1	128-255	0080-00FF
Latín extendido-A	256-383	0100-017F
Latín extendido-B	384-591	0180-024F
Modificadores de espaciado	688-767	02B0-02FF
Marcas diacríticas	768-879	0300-036F
Griego y copto	880-1023	0370-03FF
Cirílico básico	1024-1279	0400-04FF
Cirílico suplemento	1280-1327	0500-052F
Puntuación general	8192-8303	2000-206F
Símbolos de moneda	8352-8399	20A0-20CF
Símbolos similares a letras	8448-8527	2100-214F
Flechas	8592-8703	2190-21FF
Operadores matemáticos	8704-8959	2200-22FF
Dibujos de cajas	9472-9599	2500-257F
Elementos de bloque	9600-9631	2580-259F
Formas geométricas	9632-9727	25A0-25FF
Símbolos varios	9728-9983	2600-26FF
Dingbats	9984-10175	2700-27BF

Práctica

¿Cuál es el propósito de Unicode en HTML, según el contenido de w3docs.com?

Mostrar símbolos especiales que de otra manera no se pueden escribir en el código.Mejorar la velocidad de carga de las páginas web.Proporcionar un número único para cada carácter, independientemente de la plataforma, el programa o el idioma.Reducir el tamaño de los archivos HTML.

Codificación UTF-8 ​

Práctica ​

Codificación UTF-8

Práctica