sexta-feira, 30 de outubro de 2015

Padrões de codificação de carateres

Codificação de carateres é um padrão de relacionamento entre um conjunto destes com um conjunto de outra coisa, como por exemplo, números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Algumas das formas de representação mais conhecidas são:

  • Código ASCII;
  • Código Unicode;
  • Código Morse;
  • EBCDIC (Extended Binary Coded Decimal Interchange Code):
  • IBM PC Extended Character;

Código ASCII

ASCII (a sigla para American Standard Code for Information Interchange) é um código binário que codifica um conjunto de sinais. Cada binário possui 8 bits (1 byte), sendo que 7 bits são para o propósito de codificação e o outro bit é de paridade (deteção de erros). O código ASCII serve para representar textos em computadores, equipamentos de comunicação, entre outros. Na tabela ASCII abaixo representada vemos vários códigos e respetivos significados.



Código Unicode

Código Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. O padrão consiste em cerca de 107 000 carateres (um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição, ordenação alfabética e renderização). Ou seja, o código Unicode define uma correspondência entre símbolos e números, só que utiliza códigos de valor bem maiores. Na tabela abaixo, vemos um exemplo de correspondência utilizando o código Unicode


Sem comentários:

Enviar um comentário