sexta-feira, 25 de outubro de 2013

Utilização do sistema multimedia- TEXTO

Padrões de codificação de caracteres

Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (representações de grafemas ou unidades similares a grafemas como as que compõem um alfabeto ou silabário utilizados na comunicação através de uma linguagem natural) com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Exemplos comuns são o código morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.

Convencionalmente, conjunto de caracteres e codificação de caracteres eram considerados sinónimos  já que o mesmo nome poderia especificar tanto quais caracteres estão disponíveis e como eles foram codificados em um fluxo de unidades de código (normalmente com um único caracter por unidade de código). No entanto, o Unicode afastou essa ideia, separando a ideia de numerar uma série de caracteres de codificar esses caracteres em um fluxo de unidades de código. Para manter as nomenclaturas históricas e os sistemas baseados nelas, usa-se o termo charset para se referir a uma codificação de caracteres.



Código ASCII

Os padrões de codificação de caracteres são definidos por tabelas contendo conjuntos de bits que representam determinados caracteres, com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. São como exemplos destes padrões o código Morse, o padrão Unicode e o padrão ASCII.



 A tabela de código ASCII (American Standard Code for Information Interchange) foi concebida na década de 60, com o intuito de criar um padrão de codificação que fosse usado universalmente por todos os computadores, facilitando deste modo a interação entre os mesmos.

Esta tabela de código carateriza-se por usar conjuntos de 7 bits para assim representar um total de 128 caracteres, sendo no entanto muitos deles concebidos para serem usados com a linguagem inglesa.





Código Unicode


Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard, o padrão consiste de pouco mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, umametodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição, ordenação alfabética erenderização.


1 comentário: