Article image

RS

Rogério Souza11/03/2024 17:58
Compartilhe

desmistificando o utf-8, padrão web de codificação de texto

  • #Linux
  • #HTML
  • #Python

Porque utf-8 é superior a utf-1 e melhor que utf-16

em alguns casos substitutos do ASCII

utf-8 é uma codificação com tamanho variável usada como padrão para comunicação eletrônica em vários dispositivos, definida para a UNICODE standard.

denominada como UNICODE TRANSFORMATION FORMAT 8 bit ou simplesmente utf-8.

Ela é capaz de codificar cerca de 1.112.064 caracteres válidos nos pontos UNICODE em um bloco de 8 bits (1 byte) a quatro bloco de 8 bits dependedo do caractere a ser codificado

O padrão utf-8 foi inventado brilhantemente em 1992 para assim transmitir de maneira mais eficiente textos e códigos pela internet a codificação de dados compatível com ASCII o qual era mais difundida na época dos primórdios da internet.

Considerado superior ao UTF-1 e mais eficiente ao UTF16 (usado por exemplo na codificação do Windows) proporcionando um tamanho variável de algoritmo de codificação em contraste com o utf-16 que possui uma largura fixa para armazenar o caractere na memória, o UTF-8 conseguiu manter um baixo nível de incompatibilidade com a lista de caracteres internacionais, fazendo assim uma difusão muito popular até o dia presente.

Se tornando muito popular e dominando até a formatação de linguagens correlatados como python e javascript como também na programação do unix e sistemas linux.

veja a matéria completa em:

#--*-- coding utf-8 --*--

UTF-8

Compartilhe
Comentários (0)