Chapter 11. Operar con le texto simple

1. Codification predefinite
2. Le solution de OmegaT

1. Codification predefinite

Files de texto simple - in le major parte del casos le files con un extension txt - contine justo information textual e non offere alicun modo definite clarmente pro informar le computator re su proprie linguage. Le maximo que OmegaT pote facer in tal caso, es assumer que le texto es scribite in le mesme lingua que usa le computator ipse. Isto es nulle problema pro files codificate in Unicode con un collection de codification de character a 16 bit. Si le texto es codificate in 8 bites, totevia, on pote esser affrontate con le situation difficile sequente: in vice de monstrar le texto, pro le characteres japonese...

...le systema monstrara illo como isto per exemplo:

Le computator, functionante OmegaT, ha le russo como lingua base, e assi monstra le characteres in le alphabeto cyrillic e non in Kanji.

2. Le solution de OmegaT

Il ha in basicamente tres manieras pro abbordar iste problema in OmegaT. Illos omne implica le application de filtros de file in le menu Optiones.

Cambia le codification de tu files a Unicode

aperi tu file fonte in un editor de texto que interpreta correctemente su codification e salva le file in codification "UTF-8". Cambia le extension del file de .txt a .utf8. OmegaT automaticamente interpretara le file como file UTF-8. Isto es le alternativa plus sensate, pro sparniar te problemas in le curso longe.

Specifica le codification pro tu files de texto simple

- id es files con un extension .txt - : in le section Files de texto del fenestra de dialogo Filtros de File, cambia le Codification del File Fonte de <auto> le codification que corresponde a tu file fonte .txt, per exemplo in .jp por le exemplo precedente.

Cambia le extensiones de tu files fonte de texto simple

per exemplo ab .txt in .jp pro textos simple japonese: in le section Files de texto del fenestra de dialogo del Filtros de File, adde nove Modello Nomine de File Fonte (*.jp pro iste exemplo) e elige le appropriate parametros pro le codification fonte e de destination

OmegaT ha per option predefinite le sequente curte lista disponibile pro facilitar te il le tractamento de alcun files de texto simple:

  • Le files .txt es automaticamente (<auto>) interpretate per OmegaT como codificate in le codification base prefixate del computator.

  • Le files .txt1 son in ISO-8859-1, que coperi le major parte del linguas del Europa occidental.

  • Le files .txt2 son in ISO-8859-2, que concerne le major parte del linguas del Europa Central e Oriental

  • Le files .utf8 son interpretate per OmegaT como codificate in UTF-8 (un codification que concerne quasi tote le linguas in le mundo).

Tu pote controlar que tu mesme seligente le commando Filtros de File in le menu Optiones. Per exemplo, quando tu ha un file de texto checo (multo probabilemente scribite in le codice ISO-8859-2 ) tu debe sol cambiar le extension .txt in .txt2 e OmegaT interpretara su contentos correctemente. E naturalmente, si tu vole trovar te sur le latere secur, considera converter iste genere de file a Unicode, id es al formato de file .utf8 .