desmistificando o utf-8, padrão web de codificação de texto
- #Linux
- #HTML
- #Python
Porque utf-8 é superior a utf-1 e melhor que utf-16
em alguns casos substitutos do ASCII
utf-8 é uma codificação com tamanho variável usada como padrão para comunicação eletrônica em vários dispositivos, definida para a UNICODE standard.
denominada como UNICODE TRANSFORMATION FORMAT 8 bit ou simplesmente utf-8.
Ela é capaz de codificar cerca de 1.112.064 caracteres válidos nos pontos UNICODE em um bloco de 8 bits (1 byte) a quatro bloco de 8 bits dependedo do caractere a ser codificado
O padrão utf-8 foi inventado brilhantemente em 1992 para assim transmitir de maneira mais eficiente textos e códigos pela internet a codificação de dados compatível com ASCII o qual era mais difundida na época dos primórdios da internet.
Considerado superior ao UTF-1 e mais eficiente ao UTF16 (usado por exemplo na codificação do Windows) proporcionando um tamanho variável de algoritmo de codificação em contraste com o utf-16 que possui uma largura fixa para armazenar o caractere na memória, o UTF-8 conseguiu manter um baixo nível de incompatibilidade com a lista de caracteres internacionais, fazendo assim uma difusão muito popular até o dia presente.
Se tornando muito popular e dominando até a formatação de linguagens correlatados como python e javascript como também na programação do unix e sistemas linux.
veja a matéria completa em:
#--*-- coding utf-8 --*--