Datoteke običnoga teksta – u većini slučajeva s datotečnim nastavkom txt – sadržavaju samo tekstne informacije i ne nude nikakve jasno definirane podatke na temelju kojih bi računalo moglo definirati jezik na kojemu su napisane. U takvim je slučajevima najviše što program OmegaT može napraviti jest oslanjanje na pretpostavku da je tekst napisan na istome jeziku koji koristi sâmo računalo. To nije nikakav problem za datoteke kodirane standardom Unicode uz korištenje 16-bitnoga kodiranja znakova. Međutim, za tekstove s 8-bitnim kodiranjem moguće su nezgodne situacije sljedeće vrste: umjesto prikaza teksta sastavljenoga od japanskih znakova...
...sustav će ga, primjerice, prikazati na sljedeći način:
U ovome slučaju imamo računalo na kojemu se koristi program OmegaT, a čiji je zadani jezik ruski, pa stoga znakove prikazuje na ćirilićnome pismu, a ne na japanskome pismu Kanji.
OmegaT u načelu nudi tri načina rješavanja ovoga problema. Sva tri zahtijevaju primjenu datotečnih filtara putem izbornika Mogućnosti.
Otvorite izvorišnu datoteku programom za obradu teksta koji pravilno očitava njeno kodiranje pa spremite datoteku kodiranu
kao „UTF-8”. Promijenite datotečni nastavak .txt
u .utf8.
OmegaT će zatim automatski očitavati datoteku kao UTF-8. Ovo je najmudrija alternativa, kojom ćete se lišiti problema na duge staze.
U naravi se radi o datotekama s datotečnim nastavkom .txt
: otvorite dijaloški okvir Datotečni filtri, a zatim u odjeljku Datotečni format odaberite Tekst pa pritisnite gumb Obrada i promijenite stavku <automatski> u stupcu Kodiranje izvorišnih datoteka u kodiranje koje odgovara izvorišnoj datoteci .txt
, primjerice u .jp za gore navedeni primjer.
Primjera radi, za datoteke običnoga teksta na japanskome jeziku možete promijeniti nastavak .txt
u .jp
for Japanese plain texts: otvorite dijaloški okvir Datotečni filtri, a zatim u odjeljku Datotečni format odaberite Tekst pa pritisnite gumb Obrada, a zatim u dijaloškome okviru Obrada filtra pritisnite Dodaj pa dodajte novi Uzorak naziva izvorišnih datoteka (u našemu primjeru bi to bio *.jp
) i na koncu odaberite odgovarajuće Kodiranje izvorišne datoteke i Kodiranje prevedene datoteke.
OmegaT nudi sljedeći zadani uži popis radi lakšega manipuliranja nekim datotekama običnoga teksta:
Program OmegaT automatski (<automatski>) očitava datoteke .txt
kao da su kodirane prema zadanim postavkama računala.
U to se možete i sami uvjeriti putem stavke Datotečni filtri na izborniku Mogućnosti. Primjera radi, ako imate tekstnu datoteku na hrvatskome jeziku, a koja je najvjerojatnije u kodnome sustavu ISO-8859-2, trebate promijeniti nastavak .txt
u .txt2
, čime omogućavate programu OmegaT pravilno očitavanje njenoga sadržaja. Naravno, ako želite biti apsolutno sigurni, razmislite o pretvaranju takvih datoteka
u Unicode, tj. u datotečni format .utf8
.