Internacionalização de Caracteres em Computadores

Esse artigo debate sobre a internacionalização de caracteres em computadores e mostra como funciona a entrada de texto no teclado japonês.

[ Hits: 12.602 ]

Por: Perfil removido em 17/12/2014


Teclado Japonês



Resolvido o problema da exibição de milhares de caracteres com o uso de páginas de código de dois bytes, agora era preciso um método que permitisse usar um teclado padrão para inserir caracteres gráficos em editores de texto adaptados para línguas orientais. O teclado padrão possui um número limitado de possibilidades. Mesmo que uma tecla possa representar até 4 símbolos, o número de combinações possíveis é inferior ao total de símbolos necessários para usar a escrita do dia-a-dia em países orientais.

Por exemplo, conhecendo 2.000 símbolos em Kanji (hanzi), é possível ler mais de 90% de um jornal, um livro ou uma revista escritos nesse formato. Esse é o número aproximado de símbolos que são ensinados durante o ensino médio no Japão. Ler no Japão é uma questão de classe social. Quanto mais símbolos você conhece, maior sua posição social e mais formal sua escrita. A quantidade total de símbolos Kanji pode chegar a mais de 4.000 (carece de fonte confiável).

Os países que utilizam símbolos como palavras, usam o teclado do computador de forma bem distinta dos países ocidentais. Enquanto digitamos letras para formar sílabas (que formam palavras), os japoneses digitam a representação gráfica dos fonemas ou silabogramas. Esses sinais são a representação gráfica do som da palavra tal como ela é soletrada. O fonema é o som de uma sílaba quando uma palavra é pronunciada. Existem dois silabários utilizados para representar fonemas do idioma Kanji: o hiragana e o katakana. Eles são chamados comumente de kanas.

Podemos afirmar, grosso modo, que o Kanji é o japonês formal (escrito com milhares de símbolos) enquanto os kanas representam o japonês falado (silabogramas) com aproximadamente cinquenta símbolos cada um.

Os kanas podem ser utilizados isoladamente, como um sistema de escrita, ou como um complemento ao Kanji. Isso ocorre quando não há um símbolo Kanji para representar o que se quer dizer, neste caso se usa um kana.

Ao todo, são quatro os sistemas de escrita vigentes na língua japonesa:
  • Kanji :: de origem chinesa e coreana, tem mais de 2.000 anos, representa ideias, verbos, nomes de pessoas, coisas e lugares. Um único símbolo pode significar várias coisas diferentes. É a língua culta do Japão, falada e escrita, conta atualmente com mais de 4.000 símbolos em uso e vários em desuso.
  • Hiragana :: caracteres fonéticos (representam sons) ou silabários, são utilizados quando não há um Kanji próprio para definir um conceito. Os símbolos hiragana são utilizados como um método de escrita atualmente no Japão.
  • Katakana :: caracteres fonéticos (representam sons) ou silabários usados para escrever palavras originadas de outros idiomas, principalmente do francês e do inglês que são as línguas que mais influenciaram o japonês moderno.
  • Romaji :: caracteres latinos (como os do alfabeto português) utilizados para representar siglas estrangeiras como ONU, NASA ou OTAN. Também é utilizado para representar nomes de cidadãos japoneses em passaportes, cartões de visita ou documentos internacionais. Os romaji são utilizados por marcas registradas, nomes de empresas ou de produtos japoneses vendidos fora do Japão. São exemplos de escrita romaji marcas como SONY, Panasonic, AIWA, Honda, Yamaha e Toyota. A escrita romaji é uma forma de "romanização" de fonemas japoneses, sendo considerada também uma forma de transliteração.

Hiragana

O hiragana é composto por 48 símbolos que representam os fonemas do japonês moderno. Esse tipo de linguagem, onde cada símbolo representa um fonema, é chamado de silabograma.

O conjunto de silabogramas hiragana é formado por:
  • 5 vogais (a, i, u, e, o) - na ordem japonesa!
  • 9 consoantes (w, r, y, m, h, n, t, s, k) que obrigatoriamente são combinadas com as 5 vogais formando 42 silabogramas (as combinações yi, ye, e wu não são utilizadas). As combinações wi, e we são obsoletas no hiragana moderno.
  • O fonema wo atualmente é usado apenas como uma partícula.
  • O "n" é uma consoante no singular e não se associa com nenhuma vogal.

O quadro a seguir, lista os 48 fonemas hiragana. As setas indicam a direção e a ordem fara realizar a escrita de cada fonema.
Linux: Internacionalização de Caracteres em Computadores

Utilizando o alfabeto hiragana, é possível representar os 48 fonemas no teclado padrão de computador. O teclado japonês é do tipo QWERTY com um layout quase idêntico ao teclado US Internacional, considerando apenas as letras latinas utilizadas na escrita romaji.

Cada um dos 48 símbolos hiragana está representados no teclado, juntamente com as letras latinas do romaji, números indo-arábicos, pontuação, sinais gráficos e matemáticos. É possível alternar entre hiragana e katakana apertando uma tecla. Mas os símbolos katakana não estão estampados no teclado sendo preciso conhecê-los.

Observe o layout do teclado japonês:
Linux: Internacionalização de Caracteres em Computadores

Por exemplo, o número um (1) em japonês tem o som ['/ichi'/] ('chi' tem som de '/tchi'/) então, basta consultar na tabela hiragana quais são os fonemas que devem ser digitados (i + chi). O editor de textos deve ser configurado para fazer a transliteração. Assim, se houver um ou mais símbolos Kanji para o fonema o editor oferecerá as opções para que o usuário escolha uma dentre aquelas encontradas em seu banco de dados IME - "Input Method Editor".

Se não houver um símbolo Kanji, será mantida a escrita hiragana ou katakana. Existem casos em que os kanas são mantidos mesmo que haja um Kanji correspondente. Esse é um recurso para maior compreensão do leitor e ocorre quando um Kanji raro, ou em desuso, for apresentado como opção.

Referências


Página anterior    

Páginas do artigo
   1. Conceitos Básicos
   2. Teclado Japonês
Outros artigos deste autor

Instalando o compiz no Arch Linux

Instalação dual boot UEFI Linux Mint/Ubuntu com Windows 8.1/10

RAID 1 em Debian com sistema já instalado

Automatic ACL Blocking List - Sistema automático de listas de bloqueio de ACLs

Chkrootkit - Como determinar se o sistema está infectado com rootkit

Leitura recomendada

Direitos do autor - e como a MS finge tê-los

O papel do Linux na atualidade

ReiserFS x Ext3: Quem ganha?

Bill Gates e Linux

Software livre, interoperabilidade, padronização e usuários leigos

  
Comentários
[1] Comentário enviado por fabio em 17/12/2014 - 12:11h

Interessante! Parabéns pelo artigo.

[2] Comentário enviado por removido em 17/12/2014 - 16:41h

Agora entendo o porque dos navegadores, principalmente o Firefox oferecer estas opções.

Muito esclarecedor.
Sempre aprendo com esse cara!

[3] Comentário enviado por sacioz em 20/12/2014 - 19:22h

Muito bom o artigo , vc deve ser parente do Carlos Morimoto , eu acho... , parabéns de qualquer forma , esse foi pros favoritos .


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts