Introdución á tradución de software

De Proxecto trasno

(Diferenzas entre revisións)
(Lingua, "Locale", sistemas de escritura e elementos susceptibles de localizar)
(Lingua, "Locale", sistemas de escritura e elementos susceptibles de localizar)
Liña 13: Liña 13:
-
=== Lingua, "Locale", sistemas de escritura e elementos susceptibles de localizar ===
+
=== O "locale" ===
-
As linguas están recollidas nunha serie de estándares internacionais co fin de identificalas. A serie ISO 639 recolle os códigos que identifican a cada lingua. Estes códigos son empregados varios ámbitos informáticos.
+
As linguas están recollidas nunha serie de estándares internacionais co fin de identificalas. A serie ISO 639 recolle os códigos que identifican a cada lingua. Estes códigos son empregados en varios ámbitos informáticos.
-
A ISO 639 consiste da 639-1, 639-2, 639-3 e 639-5. Foron redactados en diferentes momentos con variacións.  
+
-
A ISO 639 identifica a cada idioma cun código de dúas letras mentres que a 639-2 amplía a tres para permitir acoller a tódalas linguas existentes. Así o galego recibe os identificadores gl e glg na 639-1 e 639-2, respectivamente. Outros exemplos importantes:  
+
A ISO 639 consiste da 639-1, 639-2, 639-3 e 639-5. Foron redactados en diferentes momentos con variacións. A ISO 639 identifica a cada idioma cun código de dúas letras mentres que a 639-2 amplía a tres para permitir acoller a tódalas linguas existentes. Así o galego recibe os identificadores gl e glg na 639-1 e 639-2, respectivamente. Outros exemplos importantes:  
{| class="wikitable" style="text-align:center; margin: 1em auto 1em auto"
{| class="wikitable" style="text-align:center; margin: 1em auto 1em auto"
Liña 31: Liña 30:
|}
|}
-
Un "locale" denota unha lingua específica xunto cos convenios culturais de data, moeda, formato de número.... O locale nclúe o seguinte:
+
Un "locale" denota unha lingua específica xunto cos convenios culturais de data, moeda, formato de número.... Explicado máis formalmente, o locale é o subconxunto das variables ambientais que teñen impacto nun usuario e que dependen de convencións lingüísticas ou culturais. O locale inclúe o seguinte:
# Lingua
# Lingua
# Formatos numéricos
# Formatos numéricos
Liña 38: Liña 37:
# Cambios de horario de verán (de aforro enerxético)
# Cambios de horario de verán (de aforro enerxético)
# Moeda
# Moeda
 +
 +
Non abonda con especificar unha lingua para identificar un locale. Un exemplo serían as diferenzas entre o inglés británico e o americano ou entre o portugués continental e o brasileiro. Inda que non existan necesariamente diferenzas dialectais, si existen diferenzas, por exemplo, por razóns xeográficas que fan que haxa que adaptar datas, fusos horarios ou similares. Así que ademais da lingua é necesario especificar o país ou rexión de fala da lingua.
 +
 +
Cada lingua ten ademais un sistema de escritura que pode variar. As linguas poden ter sistemas alfabéticos, coas súas diferentes tipografías, ou sistemas iconográficos pero os ordenadores traballan con díxitos. Con isto, cada carácter tipográfico leva un número asociado nun estándar de representación específico. Esta asociación chámase código de caracteres. Códigos de caracteres (''eng''. charset) hai múltiples , como o ASCII ou a ISO-8859-1. O sistema Unicoide é un estándar industrial de representación de códigos de caracteres deseñado para acoller a todos os símbolos e textos posibles te todos os sistemas de escritura do mundo. O ''Unicode Transformation Format'' (UTF) é de amplo uso en programas internacionalizados. Os formatos UTF-8 e UTF-16 son probablemente os máis empregados. O UTF-8 recolle correctamente o código de caracteres do galego pois é compatible coas escrituras latinas e o ASCII.
== Aplicacións para a tradución ==
== Aplicacións para a tradución ==

Revisión como estaba ás 15:43, 26 decembro 2009

Índice

Conceptos previos

O Inglés como lingua da computación

O fin do período colonial e o resultado das grandes guerras do século XX fixeron que a lingua de uso internacional, que ata ven entrado o pasado século fora o francés, pasara a ser o inglés, pois os Estados Unidos de Norte América colócanse coma a nova gran potencia mundial. Se a finais do século XIX e comezos do XX os primeiros grandes avances na enxeñaría e informática comezaron no mundo anglo-xermano, despois da primeira gran guerra os avances prodúcense no lado dos EUA. O resultado da segunda guerra mundial, que pon na quebra as economías europeas, e o resultado da guerra fría, permítenlle aos EUA consolidarse coma un potencia tecnolóxica. Con isto, non é de estranar que o inglés sexa a lingua estándar na computación.

Internacionalización e localización

As aplicacións informáticas son desenvoltas adaptadas cultural e lingüisticamente ao inglés. Dende o texto que o usuario ve e os caracteres dese texto, as datas, o fuso horario, formatos numéricos, nomes, direccións, unidades de medida... Por isto existe a necesidade de adaptar cada aplicación informática ás realidades culturais e lingüísticas de cada rexión. As aplicacións non adaptadas, non localizadas, impiden o uso desa aplicación a persoas que non coñecen o inglés.

O proceso de de internacionalización (que se abrevia como i18n) é o proceso polo cal se adapta unha aplicación con tal de que permita esta permita outras linguas, tipografías ou convencións locais.

O proceso de axustar o software xa internacionalizado a unha lingua ou rexión cultural concreta chámase localización, que se abrevia como l10n. A i18n das aplicacións é un requisito previo á localización. Por medio da localización créanse versión da aplicación sen necesidade de cambiar o código fonte da aplicación. Isto conséguese externalizando as mensaxes de texto ou imaxes específicas que logo os localizadores se encargarán de cambialos segundo a lingua ou os convenios culturais precisos.

O proceso de globalización (g11n) emprégase habitualmente para englobar os procesos de internalización e localización. O proceso abranga ao deseño, implementación e localización.


O "locale"

As linguas están recollidas nunha serie de estándares internacionais co fin de identificalas. A serie ISO 639 recolle os códigos que identifican a cada lingua. Estes códigos son empregados en varios ámbitos informáticos.

A ISO 639 consiste da 639-1, 639-2, 639-3 e 639-5. Foron redactados en diferentes momentos con variacións. A ISO 639 identifica a cada idioma cun código de dúas letras mentres que a 639-2 amplía a tres para permitir acoller a tódalas linguas existentes. Así o galego recibe os identificadores gl e glg na 639-1 e 639-2, respectivamente. Outros exemplos importantes:

ISO 639-1ISO 639-2Name
glglgGalician
ptporPortuguese
esspaSpanish
enengEnglish

Un "locale" denota unha lingua específica xunto cos convenios culturais de data, moeda, formato de número.... Explicado máis formalmente, o locale é o subconxunto das variables ambientais que teñen impacto nun usuario e que dependen de convencións lingüísticas ou culturais. O locale inclúe o seguinte:

  1. Lingua
  2. Formatos numéricos
  3. Convencións de data e hora
  4. Fusos horarios
  5. Cambios de horario de verán (de aforro enerxético)
  6. Moeda

Non abonda con especificar unha lingua para identificar un locale. Un exemplo serían as diferenzas entre o inglés británico e o americano ou entre o portugués continental e o brasileiro. Inda que non existan necesariamente diferenzas dialectais, si existen diferenzas, por exemplo, por razóns xeográficas que fan que haxa que adaptar datas, fusos horarios ou similares. Así que ademais da lingua é necesario especificar o país ou rexión de fala da lingua.

Cada lingua ten ademais un sistema de escritura que pode variar. As linguas poden ter sistemas alfabéticos, coas súas diferentes tipografías, ou sistemas iconográficos pero os ordenadores traballan con díxitos. Con isto, cada carácter tipográfico leva un número asociado nun estándar de representación específico. Esta asociación chámase código de caracteres. Códigos de caracteres (eng. charset) hai múltiples , como o ASCII ou a ISO-8859-1. O sistema Unicoide é un estándar industrial de representación de códigos de caracteres deseñado para acoller a todos os símbolos e textos posibles te todos os sistemas de escritura do mundo. O Unicode Transformation Format (UTF) é de amplo uso en programas internacionalizados. Os formatos UTF-8 e UTF-16 son probablemente os máis empregados. O UTF-8 recolle correctamente o código de caracteres do galego pois é compatible coas escrituras latinas e o ASCII.

Aplicacións para a tradución

Editores de texto vs ferramentas especializadas

Aplicacións de escritorio

  • Poedit
  • Virtaal
  • Lokalize

Aplicacións en liña

  • Pootle
Ferramentas persoais