Testu arruntarekin lanean

Kodeketa lehenetsia
Bistaratze nahasiak
Karaktere-sortak eta kodeketa
OmegaT-ren konponbidea

Kodeketa lehenetsia

Testu arrunteko fitxategiak - gehienetan .txt luzapena daukate - testu-informazioa besterik ez daukate. Ez dago modu argirik zein hizkuntzatako testua gordetzen duten jakiteko. Asko sinplifikatuz, horrek esan nahi du ordenagailuak erabakitzen duela testua ordenagailuaren hizkuntza berean dagoela.

Bistaratze nahasiak

Errusiarra bazara, seguru asko zure ordenagailuak errusieraz egiten du lan: menuak errusieraz daude, irekitzen dituzun fitxategiak errusierazkoak dira, etab. Kasu gehienetan, ordenagailuak uste zuzena dauka fitxategi gehienen edukiari buruz: errusierazko testuak gordetzen dituzte eta, beraz, pantailan ezin dira errusierazko karaktereak besterik erakutsi.

Haatik, japonieratik errusierara itzultzen duzun itzultzailea bazara, eta testu arruntekoak diren japonierazko fitxategiak jasotzen badituzu, ordenagailuak errusiera daukaten fitxategiak direla uste izango du. Izan ere, fitxategiak berak ez dauka informaziorik barruan gorderik daukan testuaren hizkuntzari buruz. Japonierazko fitxategiaren edukia ondokoa izan daiteke:

OmegaTとは、コンピュータを利用した翻訳ツールです。

Edukia errusieraz egotea espero duenez, zure testu-editoreak beste modu honetan erakutsi dezake:

OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpВµВљЦЦуГcБ[ГЛВ≈ВЈБB

Hala ere, hori ez da errusiera, errusierazko karaktere gisa erakutsitako japonierazko karaktereak dira.

Beste edozein aplikaziotan bezala, OmegaT-ren kasuan ere arazo hau gerta daiteke. Gauza bakarra egin dezake: onartzea modu lehenetsian tesu arrunteko fitxategiak automatikoki ordenagailuak lehenetsitako moduan erakutsi daitezkeela. Horrek emaitza egokia ematen du adibidez ordenagailuak fratsesez lan egiten badu eta ingelesezko fitxategiak jasotzen badituzu, edo ordenagailua alemanezkoa bada eta italierazko fitxategiak jasotzen badituzu.

Karaktere-sortak eta kodeketa

Zergatik da emaitza ona ingelesa eta frantsesa nahastean eta okerra errusiera eta japoniera nahastean? Ingelesak eta frantsesak karaktere-sorta bera erabiltzen dutelako. Bere izena, Latin-1 edo bere aldaeretako bat. Duela gutxira arte, errusierak eta japonierak ez zuten karaktere-sortarik partekatzen. Errusierazko karaktere-sorta gehienek ez dute japoniera kontuan hartzen, ezta alderantziz ere. Emaitza goian erakutsi dena da.

Bezero japoniarrak japonierazko ordenagailu batekin egiten du lan eta japoniera daukaten testu-fitxategiak sortzen ditu. Bezeroaren ordenagailuak hautatutako karaktere-sorta sistema eragilearen eta beste hainbat ezarpenen araberakoa izango da, baina seguru asko errusierazko ordenagailuak gaizki interpretatuko du jatorrizko ordenagailuaren (japonierazko) karaktere-sorta hautatua.

Karaktere-sorta jakin bat darabilen testu-informazioa nola transmititzen den (alegia, zeintzuk diren ordenagailuak testua interpretatu eta erakusteko erabiltzen dituen zenbaki-kodeak), kodeketaren araberakoa da. Ordenagailuak fitxategia irakurtzen duenean, bere kodeketaren arabera "dekodetzen" du eta karaktere-sortaren arabera erakusten du. Oro har, kodeketa bati karaktere-sorta bat dagokio...

OmegaT-ren konponbidea

OmegaT-k hiru bide dauzka arazo hau konpontzeko. Hiru bideek Aukerak menuko fitxategi-iragazkiak erabiltzea suposatzen dute.

Zehaztu zure testu arrunteko fitxategien kodeketa - alegia, .txt luzapena duten fitxategiena - : fitxategi-iragazkien koadroko Testu-fitxategiak atalean, aldatu Sorburu-fitxategien kodeketa <auto> aukeratik zure jatorrizko .txt fitxategiari dagokion kodeketara.
Aldatu zure jatorrizko testu arrunteko fitxategien luzapenak (adibidez, .txt luzapenetik .jp luzapenera, japonierazko testu arruntak badira): fitxategi-iragazkien leihoko Testu-fitxategiak atalean, gehitu Sorburu-fitxategiaren izen-eredu berri bat (esaterako, *.jp) eta hautatu sorburu- eta helburu-kodeketetarako parametro egokiak.
Aldatu zure fitxategien kodeketa Unicode formatura: ireki zure sorburu-fitxategia bere kodeketa modu zuzenean ulertuko duen testu-editore batean eta gorde fitxategia "UTF-8" kodeketa erabiliz. Aldatu fitxategiaren luzapena .txt motatik .utf8 motara. OmegaT-k fitxategia UTF-8 motakoa bailitzan interpretatuko du.

OmegaT-k hurrengo zerrenda laburra dauka lehenetsita, testu hutseko zenbait fitxategi errazago kudeatu ahal ditzazun:

OmegaT-k automatikoki (auto) interpretatzen du .txt fitxategiek ordenagailuaren kodeketa lehenetsi bera erabiltzen dutela.
.txt1 fitxategiak ISO-8859-1 dira, hau da, Europa mendebaldeko hizkuntza gehienak barne hartzen dituen kodeketa.
.txt2 fitxategiak ISO-8859-2 dira, hau da, Europa erdialde eta ekialdeko hizkuntza gehienak barne hartzen dituen kodeketa.
OmegaT-k interpretatzen du .utf8 fitxategiek UTF-8 kodeketa (munduko hizkuntza ia guztiak barne hartzen dituena) erabiltzen dutela.

Zure kabuz egiaztatu dezakezu hori, Aukerak menuko Fitxategien iragazkiak aukera hautatuz. Esaterako, txekieraz dagoen testu-fitxategi bat edukiz gero (gehienetan ISO-8859-2 kodeketa erabiliko duena), luzapena aldatu eta .txt ordez .txt2 idatziz, OmegaT-k modu zuzenean interpretatuko ditu bere edukiak. Eta noski, seguru lan egin nahi baduzu, fitxategi-mota hauek Unicode-ra bihur ditzakezu, alegia, .utf8 formatura.

Legezko oharrak

Orri nagusia

Aurkibidea