Chapter 13. Prijevodne memorije

1. Prijevodne memorije u programu OmegaT
1.1. mape datoteka tmx – lokacija i namjena
1.2. sigurnosna kopija TMX-a
1.3. datoteke TMX i jezik
1.4. Segmenti „siročići”
2. Korištenje postojećih prijevodnih memorija
2.1. Uvoz i izvoz prijevodnih memorija
2.2. Izrada prijevodne memorije za odabrane dokumente
2.3. Zajedničko korištenje prijevodnih memorija
2.4. Korištenje TMX-ova s alternativnim jezičnim parovima
3. Izvorišni segmenti s postojećim prijevodima
4. Pseudoprevedena memorija
5. Nadogradnja prijevodnih memorija

1. Prijevodne memorije u programu OmegaT

1.1. mape datoteka tmx – lokacija i namjena

Projekti u okviru programa OmegaT mogu sadržavati prijevodne memorije, tj. datoteke s datotečnim nastavkom tmx, i to na pet različitih lokacija:

mapa omegat

Mapa omegat sadržava datoteku project_save.tmx, a eventualno i više sigurnosnih kopija datoteka TMX. Datoteka project_save.tmx sadržava sve segmente spremljene u nju od početka rada na projektu. Ta je datoteka stalni dio projekta. Njen se sadržaj poredava abecedno prema izvorišnome segmentu.

glavna mapa projekta

Glavna mapa projekta sadržava tri datoteke tmx – naziv_projekta-omegat.tmx, naziv_projekta-level1.tmx i naziv_projekta-level2.tmx (pri čemu se naziv_projekta odnosi na naziv projekta).

  • Datoteka level1 sadržava samo tekstne informacije.

  • Datoteka level2 sadržava specifične oznake teksta programa OmegaT u obliku ispravnih oznaka TMX-a, što omogućava korištenje datoteke i njenih informacija o oblikovanju u bilo kojemu alatu za prevođenje koji podržava memorije tmx razine 2, ili u samome programu OmegaT.

  • Datoteka OmegaT sadržava specifične oznake oblikovanja teksta programa OmegaT, što omogućava korištenje datoteke i u drugim projektima u sklopu programa OmegaT.

Navedene su datoteke kopije datoteke project_save.tmx, tj. glavne prijevodne memorije projekta, isključujući tzv. segmente „siročiće”. Nose odgovarajuće promijenjene nazive, tako da se njihov sadržaj i dalje može identificirati pri daljnjem korištenju, primjerice u podmapi tm nekoga drugog projekta (pogledajte u nastavku teksta).

mapa tm

Broj pomoćnih prijevodnih memorija, tj. datoteka tmx, u mapi /tm/ nije ograničen. Te je datoteke moguće izraditi na bilo koji od triju gore navedenih načina. Valja znati da se datoteke tmx mogu uvoziti i izvoziti i s pomoću drugih alata za računalno potpomognuto prevođenje, i to obično u sva tri oblika. Naravno, najbolje je koristiti datoteke TMX predviđene za program OmegaT (pogledajte tekst gore) radi očuvanja oblikovanja u tekstu segmenata.

Sadržaj prijevodnih memorija u podmapi tm služi za generiranje prijedloga za tekstove koji se prevode. Među prijedlozima djelomičnih podudaranja prikazuje se svaki već prevedeni tekst spremljen u navedenim datotekama, pod uvjetom da je dostatno sličan tekstu koji se upravo prevodi.

Kada je izvorišni segment u jednoj od pomoćnih prijevodnih memorija istovjetan tekstu koji se upravo prevodi, OmegaT funkcionira kao što je opisano u dijaloškome prozoru MogućnostiFunkcioniranje obrade.... Primjerice (i to u slučaju zadržavanja zadanih vrijednosti), prijevod iz pomoćne prijevodne memorije se usvaja i dodaje mu se prefiks [fuzzy] kao oznaka djelomičnoga podudaranja, tako da prevoditelj može naknadno pregledati prijevod i provjeriti jesu li tako označeni segmenti dobro prevedeni (pogledajte poglavlje Funkcioniranje obrade) .

Može se dogoditi i da prijevodne memorije u podmapi tm sadržavaju segmente s istovjetnim izvorišnim, ali istodobno različitim odredišnim tekstom. Datoteke TMX se čitaju prema poretku po njihovim nazivima, a njihovi segmenti pak redak po redak. Stoga prednost ima zadnji segment s istovjetnim izvorišnim tekstom. (Napomena: naravno, mudrije je to odmah izbjeći.)

Imajte na umu da datoteke TMX u mapi tm mogu biti sažete programom gzip.

mapa tm/auto

Kada je od samoga početka poznato da su prijevodi u nekoj prijevodnoj memoriji (ili više njih) dobri, možemo je (ili ih) spremiti u mapu tm/auto i time izbjeći brojne slučajeve s oznakom [fuzzy].

  1. Spremite TMX u mapu /tm/auto.

  2. Otvorite projekt. Prikazat će se izmjene.

  3. Napravite neku manju izmjenu bilo gdje u projektu. Time se mijenja datoteka project_save.tmx (dodavanjem odgovarajućih prijevodnih jedinica iz TMX-a u mapi „auto”).

Napomena: uklonite li TMX iz mape /tm/auto prije treće radnje, prijevodna jedinica neće biti dodana.

mapa tm/enforce

Ako ste sasvim sigurni da je neki TMX kvalitetniji od datoteke project_save.tmx programa OmegaT, spremite taj TMX u mapu /tm/enforce kako bi se njegova rješenja koristila umjesto postojećih zadanih prijevoda.

  1. Spremite TMX u mapu /tm/enforce.

  2. Otvorite projekt. Prikazat će se izmjene.

  3. Napravite neku manju izmjenu bilo gdje u projektu. Time se mijenja datoteka project_save.tmx.

  4. Morate donijeti odluku o izuzeću segmenata koji se zamjenjuju:

    • ako ne trebaju biti izuzeti od daljnjih izmjena, uklonite TMX iz mape /tm/enforce,

    • ako trebaju biti izuzeti od daljnjih izmjena, zadržite TMX u mapi /tm/enforce.

Napomena: uklonite li TMX iz mape /tm/enforce prije treće radnje, zamjenske se jedinice ne spremaju.

mapa tm/mt

Umetanjem podudaranja iz TMX-a spremljenog u mapu mt, pozadina otvorenoga segmenta u oknu za obradu postaje crvena. Uobičajeni izgled pozadine vraća se zatvaranjem segmenta.

mape tm/penalty-xxx

Ponekad je korisno razlikovati prijevodne memorije visoke kvalitete od onih manje pouzdanih, bilo zbog tematike, klijenta, stanja provjere ili nečega drugoga. Podudaranjima iz mapa s nazivom „penalty-xxx” (pri čemu je xxx broj između 0 i 100) automatski se smanjuje postotak, pa se tako 100-postotno podudaranje iz bilo koje prijevodne memorije spremljene u, primjerice, mapu pod nazivom Penalty-30 tretira i prikazuje kao 70-postotno. Oduzimanje postotka vrijedi za sva tri postotka podudaranja pa se tako 75, 80, 90 smanjuju na 45, 50, 60.

Povrh toga, OmegaT omogućava i korištenje dodatne datoteke tmx (prema parametrima programa OmegaT), koja sadržava sve prevodive segmente projekta, a možete je spremiti gdje god želite. Pogledajte odjeljak Pseudoprevedena memorija dolje u tekstu.

Imajte na umu da se otvaranjem projekta u memoriju učitavaju sve prijevodne memorije. Sigurnosne kopije prijevodnih memorija projekta redovito se izrađuju (pogledajte sljedeće poglavlje), dok se datoteka project_save.tmx također sprema/ažurira zatvaranjem ili ponovnim učitavanjem projekta. Primjera radi, to znači da nema potrebe za zatvaranjem projekta na kojemu radite ako mu odlučite dodati još jednu pomoćnu prijevodnu memoriju, nego možete jednostavno ponovno učitati projekt, čime se na koncu obuhvaćaju sve promjene.

Lokacije raznih prijevodnih memorija za određeni projekt određuje korisnik (više pojedinosti o tome možete pronaći u poglavlju Svojstva projekta).

Ovisno o situaciji, to omogućava različite strategije, npr.:

nekoliko projekata na istu temu: zadržava se struktura projekta, a mijenjaju se izvorišne i odredišne mape (source = source/order1, target = target/order1 itd.). Vodite računa da se segmenti iz order1 kojih nema u order2 i ostalim naknadnim zadacima označavaju kao segmenti „siročići”; međutim, i dalje su korisni zbog potencijalnih djelomičnih podudaranja.

nekoliko prevoditelja angažiranih na jednome projektu: izvorišne se datoteke razdvajaju u source/Ana, source/Branko i tako dalje pa se dodjeljuju članovima tima (Ana, Branko...). Oni mogu sastaviti svoje vlastite projekte te po okončanju rada ili određene etape dostaviti svoje datoteke project_save.tmx. Potom se prikupljaju datoteke project_save.tmx i rješavaju problemi, kao što su eventualne kolizije u terminologiji itd. Zatim se izrađuje nova inačica glavne prijevodne memorije, bilo za spremanje u podmape tm/autočlanova tima ili kao zamjena njihovih datoteka project_save.tmx. Tim također može koristiti istu strukturu podmapa za odredišne datoteke. To članovima, primjerice, omogućava da u bilo kojemu trenutku provjere valjanost odredišne inačice cijeloga projekta.

1.2. sigurnosna kopija TMX-a

OmegaT prilikom prevođenja stalno sprema rezultate rada u datoteku project_save.tmx u podmapi projekta /omegat.

OmegaT također pri svakom otvaranju ili ponovnom učitavanju projekta izrađuje sigurnosne kopije prijevodne memorije i sprema ih kao project_save.tmx.GODNMMDDHHNN.bak. GODN je četveroznamenkasta godina, MM je mjesec, DD dan u mjesecu, dok HH i NN označavaju sat i minutu spremanja prethodne prijevodne memorije.

Kad posumnjate da ste izgubili podatke prijevoda, postupite kako slijedi:

  1. Zatvorite projekt.

  2. Preimenujte tekuću datoteku project_save.tmx (npr. u project_save.tmx.privremeno).

  3. Odaberite sigurnosnu kopiju prijevodne memorije koja najvjerojatnije sadržava potrebne podatke, npr. najnoviju datoteku ili zadnju inačicu od prethodnoga dana).

  4. Preimenujte je u project_save.tmx

  5. Otvorite projekt.

1.3. datoteke TMX i jezik

Datoteke TMX sadržavaju prijevodne jedinice, sastavljene od više jednakovrijednih segmenata na nekoliko jezika. Svaka prijevodna jedinica sadržava barem dvije varijante prijevodne jedinice (VPJ). Svaka može poslužiti kao izvorišni ili odredišni segment.

Izvorišni i odredišni jezik određuju se u postavkama projekta. OmegaT stoga koristi segmente VPJ-ova koji odgovaraju oznakama izvorišnog i odredišnog jezika, i to kao odgovarajuće izvorišne i odredišne segmente. OmegaT očitava oznake jezika prema sljedećim dvjema normama:

  • dva slova (npr. HR za hrvatski) ili

  • dvoslovna ili troslovna oznaka jezika uz dodatak dvoslovne oznake države (npr. EN-US; ako vas zanima djelomičan popis oznaka jezika i država, pogledajte Appendix A, Jezici – popis oznaka ISO 639 ).

Ako se oznake jezika projekta i oznake jezika datoteka tmx u cijelosti podudaraju, segmenti se učitavaju u memoriju. Ako se podudaraju jezici, no ne i države, segmenti se svejedno učitavaju. Ako se ne podudaraju ni oznake jezika ni oznake država, segmenti se ignoriraju.

Datoteke TMX u načelu mogu sadržavati prijevodne jedinice s nekoliko jezika kandidata. Kada za određeni segment nema upisanoga sadržaja za odabrani odredišni jezik, učitavaju se svi drugi odredišni segmenti, bez obzira na jezik. Primjerice, ako je jezični par projekta HR-FR, od pomoći bi mogle biti i pronađene prijevodne jedinice para HR-EN, ako ih već nema za HR-FR.

1.4. Segmenti „siročići”

Datoteka project_save.tmx sadržava sve segmente prevedene od početka projekta. Ako promijenite pravila segmentacije za projekt ili uklonite datoteke iz izvorišne mape, moguće je da će neka podudaranja biti prikazana kao nizovi „siročići” u oknu podudaranja, što se odnosi na segmente koji ne postoje više u izvorišnoj dokumentaciji, budući da odgovaraju segmentima koji su prevedeni i spremljeni prije obavljanja izmjena.

2. Korištenje postojećih prijevodnih memorija

Na početku, tj. pri sastavljanju novoga projekta, glavna prijevodna memorija projekta (project_save.tmx) je prazna. Ta se prijevodna memorija postepeno popunjava tijekom prevođenja. Navedeni se proces može ubrzati opetovanim korištenjem postojećih prijevoda. Kada naiđemo na neku rečenicu koja je već prevedena, i to kvalitetno, nema potrebe da je ponovno prevodimo. Prijevodne memorije također mogu sadržavati i referentne prijevode, kao što su višenacionalni zakonodavni dokumenti, za što je tipičan primjer stečevina Europske zajednice.

Sastavljanjem odredišnih dokumenata za projekt u sklopu programa OmegaT, prijevodna se memorija sprema u obliku triju datoteka u korijensku mapu projekta (pogledajte opis gore u tekstu). Te tri datoteke tmx (-omegat.tmx, -level1.tmx i -level2.tmx) možete smatrati „izvoznom prijevodnom memorijom”, tj. izvozom sadržaja tekućega projekta u dvojezičnom obliku.

Ako želite iskoristiti neku postojeću prijevodnu memoriju iz jednoga od prethodnih projekata (primjerice zbog sličnosti novoga i toga projekta ili radi već obrađene terminologije), možete koristiti takve prijevodne memorije kao "ulazne prijevodne memorije", tj. za uvoz u novi projekt. U tom slučaju te prijevodne memorije valja spremiti u mapu /tm ili /tm/auto novoga projekta; u prvome slučaju nude se prijedlozi iz navedenih prijevodnih memorija u pregledniku djelomičnih podudaranja, dok se u potonjemu te prijevodne memorije koriste za pretprevođenje izvorišnoga teksta.

Prema zadanim vrijednostima, mapa /tm je na razini ispod korijenske mape projekta (npr. /MojProjekt/tm), ali u dijaloškome okviru svojstava projekta možete odabrati i neku drugu mapu. To je korisno ako često koristite postojeće prijevodne memorije iz prethodnih projekata, primjerice zbog iste tematike ili istoga naručitelja. U tom je slučaju od koristi sljedeći postupak:

  • Na odgovarajućoj lokaciji diska izradite mapu („mapa repozitorija”) za prijevodne memorije određene tematike ili za nekoga naručitelja.

  • Kad god okončate neki projekt, kopirajte jednu od triju „izvoznih” prijevodnih memorija iz korijenske mape projekta i spremite je mapu repozitorija.

  • Kada započnete novi projekt s istom tematikom ili za istoga naručitelja, putem izbornika Projekt > Svojstva otvorite dijaloški okvir Obrada projekta, odaberite mapu repozitorija i postavite je kao mapu prijevodnih memorija.

Vodite računa da se pri otvaranju projekta obrađuju sve datoteke tmx u repozitoriju /tm pa bi brojne različite prijevodne memorije spremljene u tu mapu mogle nepotrebno usporiti program OmegaT. Ne bi bilo zgorega da razmotrite uklanjanje datoteka koje više ne trebate, a nakon što njihov sadržaj iskoristite za popunjavanje datoteke project-save.tmx.

2.1. Uvoz i izvoz prijevodnih memorija

OmegaT podržava uvezene datoteke tmx inačica 1.1 do 1.4b (razina 1 i 2). Stoga OmegaT može očitavati prijevodne memorije proizvedene drugim alatima. Međutim, OmegaT ne podržava u cijelosti uvezene datoteke tmx razine 2 (koje pored prijevoda sadržavaju i informacije o oblikovanju). Datoteke tmx razine 2 svejedno se mogu uvesti, a OmegaT će prikazivati njihov tekstni sadržaj, ali uz nešto manju kvalitetu djelomičnih podudaranja.

OmegaT slijedi vrlo stroge postupke pri učitavanju datoteka prijevodnih memorija (tmx). U slučaju pronalaska pogreške u nekoj datoteci, OmegaT ukazuje na njenu lokaciju u neispravnoj datoteci.

Poznato je da neki alati izrađuju neispravne datoteke tmx pod određenim uvjetima. Ako želite koristiti takve datoteke kao referentne prijevode u programu OmegaT, valja ih popraviti ili će OmegaT prijaviti pogrešku i neće ih učitati. Popravci su vrlo jednostavne radnje, a OmegaT pomaže pri rješavanju problema pogrešaka odgovarajućim porukama. U slučaju poteškoća možete se obratiti za savjet korisničkoj skupini.

OmegaT podržava izvoz datoteka tmx inačice 1.4 (razina 1 i 2). Izvoz razine 2 nije u cijelosti u skladu s normom te razine, ali je ipak dovoljno usklađen i nudit će ispravna podudaranja u drugim alatima koji koriste prijevodne memorije i podržavaju tmx razine 2. Ako trebate samo tekstne informacije (a ne i informacije o oblikovanju), koristite datoteku razine 1 izrađenu programom OmegaT.

2.2. Izrada prijevodne memorije za odabrane dokumente

U slučajevima kada prevoditelji trebaju dijeliti svoje datoteke tmx uz izuzimanje nekih dijelova ili s prijevodima samo određenih datoteka, dijeljenje cijele datoteke NazivProjekta-omegat.tmx ne dolazi u obzir. Sljedeći prijedlog načina rada tek je jedna od mogućnosti, ali prednost mu je što je jednostavan i potpuno bezopasan za vaše resurse.

  • Sastavite zaseban projekt sa željenim jezičnim parom i odgovarajućega naziva, pri čemu vodite računa da će i izrađene datoteke tmx sadržavati taj naziv.

  • Kopirajte dokumente za koje trebate prijevodnu memoriju i spremite ih u izvorišnu mapu projekta.

  • Kopirajte prijevodne memorije koje sadržavaju prijevode navedenih dokumenata i spremite ih u podmapu tm/auto novoga projekta.

  • Otvorite projekt. Provjerite ima li kakvih pogrešaka u oznakama teksta kombinacijom tipki Ctrl+T i je li neki segment nepreveden s pomoću Ctrl+U. Kombinacijom tipki Ctrl+D možete izraditi odredišne dokumente i obaviti kompletnu provjeru njihovog sadržaja.

  • Po zatvaranju projekta, datoteke tmx u glavnoj mapi projekta (v. tekst gore) sadržavaju prijevode u odabranome jezičnom paru, i to za datoteke koje ste kopirali i spremili u izvorišnu mapu. Spremite ih na neko sigurno mjesto kako biste ih mogli koristiti i ubuduće.

  • Da biste izbjegli ponovno korištenje projekta i time moguće probleme u budućim zadacima, izbrišite mapu projekta ili je spremite u arhivu, da je ne miješate s radnim materijalima.

2.3. Zajedničko korištenje prijevodnih memorija

Prevoditeljima prilikom timskoga rada više odgovara zajedničko korištenje prijevodnih memorija od slanja njihovih lokalnih inačica.

OmegaT se povezuje koristeći SVN i Git, dva uobičajena sustava za nadziranje revizija pri timskome radu, dostupna prema licenci otvorenoga kôda. Za slučajeve korištenja odabranoga sustava za nadziranje revizija radi upravljanja cjelovitim mapama projekta u sklopu programa OmegaT, tj. prijevodnim memorijama, kao i izvorišnim mapama, postavkama projekta i inim, više pojedinosti možete naći u poglavlju

2.4. Korištenje TMX-ova s alternativnim jezičnim parovima

Može se dogoditi da ste okončali projekt prijevoda s, primjerice, engleskoga na hrvatski jezik. Recimo da sada trebate prijevod na talijanski, ali prevoditeljica ne zna engleski, dok joj je hrvatski materinji jezik. U tom slučaju prijevodna memorija EN-HR može poslužiti kao posredno sredstvo za prijevod EN-IT.

Rješenje u našemu slučaju svodi se na kopiranje postojeće prijevodne memorije u podmapu tm/tmx2source/ i njeno preimenovanje u IT_IT.tmx, čime se označava odredišni jezik datoteke tmx. Prevoditeljici će se prikazivati hrvatski prijevodi izvorišnih segmenata na engleskom, koje može koristiti za prijevod na talijanski.

Važno: pomoćni TMX mora biti preimenovan po modelu XX_YY.tmx, pri čemu je XX_YY odredišni jezik datoteke tmx, tj. u našemu primjeru IT_IT.tmx. Naravno, projekt i TMX moraju imati isti izvorišni jezik, u našemu slučaju EN. Imajte na umu da za svaki jezični par možete imati samo jedan TMX, pa stoga, ako trebate nekoliko prijevodnih memorija, sve ih morate spojiti u jednu – XX_YY.tmx.

3. Izvorišni segmenti s postojećim prijevodima

Neke su vrste izvorišnih datoteka (primjerice, PO, TTX itd.) dvojezične, tj. služe i kao izvorišne datoteke i kao prijevodne memorije. U takvim se slučajevima postojeći prijevod iz takvih datoteka uvrštava u project_save.tmx. Tretira se kao zadani prijevod kada nema pronađenih podudaranja, ili kao alternativni prijevod kada postoji isti izvorišni segment, ali s odredišnim tekstom. Ishod stoga ovisi o redoslijedu učitavanja izvorišnih segmenata.

Svi prijevodi iz izvorišnih dokumenata također se prikazuju u oknu komentara, a ne samo u oknu podudaranja. U slučaju datoteka PO primjenjuje se oduzimanje 20 % podudaranja, pa se tako, primjera radi, 100-postotno podudaranje tretira kao 80-postotno. U izvorišnome se segmentu prikazuje oznaka [Fuzzy].

Kada učitate segmentiranu datoteku TTX, segmenti u kojima je izvorišni tekst jednak odredišnome uzimaju se u obzir ako označite „Prijevod smije biti isti kao izvorišni tekst” u izborniku Mogućnosti → Funkcije obrađivanja. To može biti pomalo zbunjujuće, pa biste u takvim slučajevima možda mogli odznačiti navedenu funkciju.

4. Pseudoprevedena memorija

Note

Samo za napredne korisnike!

Može se dogoditi da prije prevođenja želite prethodno obraditi segmente ili pripremiti ih na neki način koji nije omogućen u programu OmegaT. Primjerice, ako želite napraviti pseudoprijevod radi ispitivanja, OmegaT omogućava izradu dodatne datoteke tmx, a koja sadržava sve segmente projekta. Imamo dva moguća modela prijevoda u toj datoteci tmx:

  • prijevod jednak izvorišnome tekstu (zadana vrijednost)

  • prazan prijevodni segment

Navedenu datoteku tmx možete nazvati kako god želite. Pseudoprevedenu memoriju možete izraditi sljedećim parametrima naredbenoga retka:

java -jar omegat.jar --pseudotranslatetmx=<naziv_datoteke> [pseudotranslatetype=[equal|empty]]

Vrijednost <naziv_datoteke> zamijenite nazivom datoteke koju želite izraditi, bilo u apsolutnome ili relativnome odnosu prema radnoj mapi (tj. mapi iz koje pokrećete program OmegaT). Drugi argument (--pseudotranslatetype) nije obavezan. Njegova je vrijednost ili equal (zadana vrijednost, kada želimo da izvorišni tekst bude jednak odredišnome) ili pak empty (prazan odredišni segment). Izrađenu datoteku tmx možete obraditi alatom po želji. Ako je želite koristiti u programu OmegaT, preimenujte je u project_save.tmx i spremite u mapu projekta omegat.

5. Nadogradnja prijevodnih memorija

Početne inačice programa OmegaT omogućavale su segmentiranje izvorišnih datoteka samo po odlomcima i nisu dosljedno numerirale oznake oblikovanja teksta u datotekama HTML i Open Document. OmegaT može otkriti i nadograditi takve datoteke u hodu i time poboljšati kvalitetu djelomičnih podudaranja i iskoristivost postojećih prijevoda, pa nema potrebe da vi to radite ručnim putem.

Projektna datoteka tmx nadograđuje se samo jednom i u takvome nadograđenom obliku se upisuje u project-save.tmx. Datoteke tmx koje su izvorno izrađene programom OmegaT nadograđuju se u hodu pri svakom učitavanju projekta. Vodite računa da promjene u datotečnim filtrima programa OmegaT u nekim rijetkim slučajevima mogu dovesti do sasvim drugačije segmentacije, zbog čega ćete tmx trebati nadograditi ručnim putem.