Codificación UTF-8
El Formato de Transformación de Unicode de 8 bits, llamado UTF-8, es una codificación de caracteres de ancho variable que puede codificar los 1.114.112 puntos de código válidos de Unicode utilizando de uno a cuatro bytes de 8 bits. El número "8" significa que UTF utiliza bloques de 8 bits para representar un carácter.
Desde 2009, UTF-8 ha sido la codificación líder para la World Wide Web.
Para caracteres iguales o inferiores a 127 (hex 0x7F), la representación UTF-8 ocupa un solo byte. Esto es similar al valor ASCII.
Para cualquier carácter igual o inferior a 2047 (hex 0x07FF), la representación UTF-8 se distribuye en dos bytes.
Para cualquier carácter igual o superior a 2048 pero menor que 65535 (0xFFFF), la representación UTF-8 se distribuirá en tres bytes.
Para cualquier carácter igual o superior a 65536 (0x10000) hasta el punto de código máximo de Unicode (0x10FFFF), la representación UTF-8 se distribuye en cuatro bytes.
La siguiente lista muestra algunos códigos de caracteres UTF-8 que son compatibles con HTML5:
| Códigos de caracteres | Decimal | Hexadecimal |
|---|---|---|
| Controles C0 y Latín básico | 0-127 | 0000-007F |
| Controles C1 y Suplemento Latín-1 | 128-255 | 0080-00FF |
| Latín extendido-A | 256-383 | 0100-017F |
| Latín extendido-B | 384-591 | 0180-024F |
| Modificadores de espaciado | 688-767 | 02B0-02FF |
| Marcas diacríticas | 768-879 | 0300-036F |
| Griego y copto | 880-1023 | 0370-03FF |
| Cirílico básico | 1024-1279 | 0400-04FF |
| Cirílico suplemento | 1280-1327 | 0500-052F |
| Puntuación general | 8192-8303 | 2000-206F |
| Símbolos de moneda | 8352-8399 | 20A0-20CF |
| Símbolos similares a letras | 8448-8527 | 2100-214F |
| Flechas | 8592-8703 | 2190-21FF |
| Operadores matemáticos | 8704-8959 | 2200-22FF |
| Dibujos de cajas | 9472-9599 | 2500-257F |
| Elementos de bloque | 9600-9631 | 2580-259F |
| Formas geométricas | 9632-9727 | 25A0-25FF |
| Símbolos varios | 9728-9983 | 2600-26FF |
| Dingbats | 9984-10175 | 2700-27BF |
Práctica
¿Cuál es el propósito de Unicode en HTML, según el contenido de w3docs.com?