Conjuntos de caracteres HTML
El navegador necesita saber qué conjunto de caracteres (codificación de caracteres) usar. Esto es necesario para mostrar correctamente una página HTML.
UTF-8 es la codificación de caracteres predeterminada para HTML5. Sin embargo, antes era diferente. ASCII era el conjunto de caracteres anterior. Y ISO-8859-1 fue el conjunto de caracteres predeterminado desde HTML 2.0 hasta HTML 4.01.
Sin embargo, todavía había problemas con la codificación, y cuando UTF-8 apareció con HTML5 y XML, se resolvieron muchos problemas.
Veamos más detalles sobre los conjuntos de caracteres.
ASCII
ASCII fue el primer estándar de codificación de caracteres, que también se llama conjunto de caracteres. Es la abreviatura de American Standard Code for Information Interchange.
Para cada carácter almacenado, ASCII definía un número binario único para admitir el alfabeto en mayúsculas y minúsculas (a-z, A-Z), los números del 0 al 9 y caracteres especiales. Originalmente se basa en el alfabeto inglés y codifica 128 caracteres en un entero binario de 7 bits. Esto funciona porque toda la información de la computadora se registra como unos y ceros binarios (01000101) en la electrónica.
A continuación, puedes ver una tabla ASCII.

El mayor problema de ASCII es que no tenía letras no inglesas. Todavía se usa, especialmente en computadoras mainframe.
Haz clic aquí para ver más sobre ASCII.
ANSI
ANSI, que también se llamaba Windows-1252, fue el conjunto de caracteres predeterminado de Windows hasta Windows 95. Es una extensión de ASCII, que agrega caracteres internacionales. Admitía 256 caracteres usando un byte completo (8 bits).
ANSI era compatible con todos los navegadores, ya que se anunció como el conjunto de caracteres predeterminado de Windows.
ISO-8859-1
ISO-8859-1 se convirtió en la codificación de caracteres predeterminada en HTML 2.0, ya que la mayoría de los países usan caracteres diferentes de ASCII. También es una extensión de ASCII, al igual que ANSI, y agrega caracteres internacionales. ISO-8859-1 también usa un byte completo para representar el doble de caracteres que ASCII.
Haz clic aquí para ver más sobre ISO-8859-1.
Conjuntos de caracteres en HTML 4
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1" />Si una página HTML 4 usa una codificación de caracteres diferente de ISO-8859-1, debe definirse en la etiqueta <meta>.
Conjuntos de caracteres en HTML 4
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8" />Todos los procesadores de HTML 4 admiten UTF-8.
Conjuntos de caracteres en HTML 5
<meta charset="UTF-8" />Coloca esta etiqueta lo antes posible dentro del elemento <head> para asegurarte de que el navegador lea correctamente la codificación.
Unicode UTF-8
UTF-8 es la codificación de caracteres predeterminada para HTML5.
Como los conjuntos de caracteres mencionados anteriormente son limitados, el Consorcio Unicode desarrolló un Estándar Unicode.
Este Estándar Unicode contiene casi todos los caracteres, signos de puntuación y símbolos usados en el mundo.
En HTML, el atributo charset especifica la codificación de caracteres.
TIP
Todos los procesadores de HTML5 admiten UTF-8. Ten en cuenta que los procesadores XML requieren estrictamente UTF-8 o UTF-16.
Practice
¿Qué es cierto sobre los conjuntos de caracteres HTML?