OmegaT nudi vrlo prilagodljive filtre, što omogućava podešavanje brojnih funkcija. Datotečni filtri su sadržaji kôda koji omogućavaju sljedeće:
učitavanje dokumenata u određenome datotečnom formatu, primjerice, kao datoteke običnoga teksta
izvlačenje prevodivoga sadržaja iz datoteka
automatiziranje izmjena naziva datoteka prevedenih dokumenata upisivanjem prijevoda za prevodive sadržaje
Prikaz datotečnih formata koje podržava program OmegaT možete vidjeti putem izbornika
Zadane mogućnosti datotečnih filtara dostatne su za većinu korisnika. Ako tome nije tako, otvorite glavni dijaloški okvir putem Mogućnosti → Datotečni filtri... na glavnome izborniku. Također možete uključiti i datotečne filtre za korištenje samo u okviru tekućega projekta, i to odabirom postavke Datotečni filtri... na izborniku Projekt → Svojstva.
Filtre za predmetni projekt možete uključiti putem izbornika Projekt → Svojstva.... Pritisnite i označite potvrdni kvadratić . U tom se slučaju u sklopu projekta sprema kopija postavki filtara. Prilikom naknadnoga mijenjanja filtara ažuriraju se samo filtri projekta, dok se korisnički filtri ne mijenjaju.
Pozor! Promijenite li mogućnosti filtara dok je projekt otvoren, morate ponovno učitati projekt kako bi izmjene imale učinka.
Ovaj dijaloški okvir sadržava popis raspoloživih datotečnih filtara, pri čemu su filtri koji se koriste za tekući projekt prikazani u obliku podebljanoga teksta. Ako ne želite koristiti program OmegaT za prevođenje datoteka određene vrste, možete isključiti odgovarajući filtar odznačavanjem potvrdnoga kvadratića pored njegova naziva. OmegaT će potom izostavljati odgovarajuće datoteke prilikom učitavanja projekata te će ih kopirati u neizmijenjenome obliku pri izradi odredišnih dokumenata. Ako ponovno zatrebate određeni filtar, samo označite njegov potvrdni kvadratić. Za vraćanje datotečnih filtara na zadane postavke pritisnite Zadano. Za odabir datoteka i kodnoga rasporeda njihove obrade odaberite filtar s popisa i pritisnite Obrada.
Dijaloški okvir omogućava uključivanje i isključivanje sljedećih mogućnosti:
Ukloni početne i završne oznake teksta: odznačavanje ove postavke omogućava prikaz svih oznaka teksta, kako početnih, tako i završnih. Pozor: kada su u formatima Microsoft Open XML (docx, xlsx itd.) prikazane sve oznake teksta, NEMOJTE upisivati tekst prije prve oznake, jer ona je tehnička oznaka koja se uvijek mora nalaziti na početku segmenta).
Ukloni početne i završne bjeline u nesegmentiranim projektima: program OmegaT prema zadanim postavkama uklanja početne i završne bjeline. U nesegmentiranim ih je projektima moguće zadržati odznačavanjem navedene postavke.
Zadrži razmake svih oznaka: ovu postavku odaberite ako izvorišna dokumentacija sadržava značajne razmake (radi oblikovanja), a koje svakako valja uzeti u obzir.
Zanemari datotečni kontekst pri utvrđivanju segmenata s alternativnim prijevodima: OmegaT prema zadanim postavkama koristi nazive izvorišnih datoteka prilikom utvrđivanja alternativnih prijevoda. Odabirom ove postavke isključujemo korištenje naziva izvorišnih datoteka, a alternativni će nam prijevodi biti nuđeni u svim datotekama sve dok imamo druga odgovarajuća kontekstna podudaranja (prethodne/sljedeće segmente ili pak neku vrstu identifikacije, ovisno o datotečnome formatu).
Za nekoliko filtara (datoteke formata txt, XHTML, HTML i XHTML, kao i datoteke OpenDocument i Microsoft Open XML) imamo na raspolaganju jednu ili više određenih mogućnosti. Te mogućnosti možemo mijenjati odabirom filtra s popisa, a potom odabiremo Mogućnosti. Na raspolaganju imamo sljedeće:
Tekstne datoteke
Segmentacija po odlomcima na prijelomima redaka, praznim recima ili nikada
Ako su uključena pravila segmentacije po rečenicama, tekst se dalje segmentira prema ovdje odabranoj postavci.
Datoteke PO
Dopusti segmente bez prijevoda u odredišnoj datoteci
U slučaju kada neki segment (ili eventualno cijeli odlomak) datoteke PO nije preveden, u odredišnoj datoteci ostaje prazan,
tj. bez prijevoda. Strogo govoreći, svaki segment msgstr
u odredišnoj datoteci PO ostaje prazan. Budući da je to standardan način rada s datotekama PO, ova je postavka uključena
prema zadanim vrijednostima. Isključivanjem navedene funkcije izvorišni se tekst kopira u odredišni segment.
Preskoči zaglavlje PO
Uključivanjem ove postavke ignoriramo i ostavljamo netaknutima zaglavlja PO.
Automatska zamjena 'nplurals=INTEGER; plural=EXPRESSION;' u zaglavlju
Ova postavka omogućava programu OmegaT da zanemari uvjete iz zaglavlja datoteka PO te da koristi zadane vrijednosti za odabrani odredišni jezik.
Datoteke XHTML
Prevedi sljedeće atribute: odabrani se atributi prikazuju kao segmenti u oknu za obradu.
Oznaka početka novoga odlomka: HTML oznaka <br> služi za utvrđivanje odlomaka u svrhe segmentacije.
Preskoči tekst koji se podudara s regularnim izrazima: ignoriranje teksta koji se podudara s regularnim izrazima. Oni se prilikom provjere oznaka prikazuju u crvenoj boji. Tekst koji se podudara u izvorišnim se segmentima prikazuje u kurzivu.
Ne prevodi sadržaj atributa metaoznaka... : Popis metaoznaka koje se ne prevode.
Ne prevodi sadržaj oznaka sa sljedećim atributima parova ključ-vrijednost (odvojenim zarezima): sadržaj oznaka se ignorira u slučajevima podudaranja s popisa parova ključ-vrijednost.
Ponekad je korisno odrediti da neke oznake budu neprevodive na temelju vrijednosti atributa. Primjer za to je <div class="hide"> <span translate="no">
. Možete definirati parove ključ-vrijednost za oznake koje valja ostaviti neprevedenima. U gornjemu bi primjeru polje sadržavalo
sljedeće: class=hide, translate=no
Datoteke Microsoft Office Open XML
Možete odabrati elemente za prijevod. Oni se u prijevodu prikazuju kao zasebni segmenti.
Word: nevidljivi tekst uputa, komentari, fusnote, krajnje bilješke, podnožja
Excel : komentari, nazivi listova
PowerPoint: komentari, matrice i izgled stranica
Globalno: grafikoni, dijagrami, crteži, WordArt
Ostale mogućnosti:
Združene oznake: odabirom ove funkcije združujemo oznake bez prevodivoga teksta između njih u jednu oznaku.
Zadrži razmake svih oznaka: odabirom ove funkcije zadržavamo bjeline (razmake i nove retke), čak i kada nisu postavljene u samome dokumentu.
Datoteke HTML i XHTML
Dodaj ili prepiši deklaraciju kodiranja u datotekama HTML i XHTML: odredišne datoteke često moraju imati kodne stranice drugačije od onih u izvorišnim datotekama (bez obzira je li to izrijekom definirano ili podrazumijevano). Ova postavka prevoditeljima nudi mogućnost da odaberu hoće li odredišne datoteke sadržavati i deklaraciju kodiranja. Primjera radi, ako je datotečnim filtrom kao shema kodiranja za odredišne datoteke određen UTF-8, odabirom Uvijek osiguravamo da datoteke prijevoda sadržavaju tu informaciju.
Prevedi sljedeće atribute: odabrani se atributi prikazuju kao segmenti u oknu za obradu.
Oznaka početka novoga odlomka: HTML oznaka <br> služi za utvrđivanje odlomaka u svrhe segmentacije.
Preskoči tekst koji se podudara s regularnim izrazima: ignoriranje teksta koji se podudara s regularnim izrazima. Oni se prilikom provjere oznaka prikazuju u crvenoj boji. Tekst koji se podudara u izvorišnim se segmentima prikazuje u kurzivu.
Ne prevodi sadržaj atributa metaoznaka... : Popis metaoznaka koje se ne prevode.
Ne prevodi sadržaj oznaka sa sljedećim atributima parova ključ-vrijednost (odvojenim zarezima): sadržaj oznaka se ignorira u slučajevima podudaranja s popisa parova ključ-vrijednost.
Ponekad je korisno odrediti da neke oznake budu neprevodive na temelju vrijednosti atributa. Primjer za to je <div class="hide"> <span translate="no">
. Možete definirati parove ključ-vrijednost za oznake koje valja ostaviti neprevedenima. U gornjemu bi primjeru polje sadržavalo
sljedeće: class=hide, translate=no
Sažmi bjeline u prevedenome dokumentu: višestruke bjeline u nizu pretvaraju se u jednu bjelinu u prevedenome dokumentu.
Ukloni komentare HTML-a u prevedenome dokumentu: u prevedeni se dokument ne kopira nijedan komentar (između znakova <!-- i -->).
Datoteke Open Document Format (ODF)
Možete odabrati koji će od sljedećih elemenata biti za prijevod:
stavke kazala, knjižne oznake, upute na knjižne oznake, bilješke, komentari, bilješke prezentacija, poveznice (URL-ovi), nazivi listova
Ovaj dijaloški okvir omogućava postavljanje uzoraka naziva izvorišnih datoteka za obradu filtrom, prilagodbu naziva datoteka prijevoda i odabir kodiranja za korištenje pri učitavanju datoteke i spremanju njenoga prijevoda. Uzorak datotečnoga filtra možete mijenjati bilo izravnim mijenjanjem polja ili pritiskom na Obrada. Novi uzorak datotečnoga filtra možete dodati pritiskom na Dodaj. Isti se dijaloški okvir koristi za dodavanje ili obradu uzoraka. Dijaloški je okvir koristan jer sadržava posebnu funkciju za obradu uzoraka naziva odredišnih datoteka, kojom možete prilagođavati nazive izlaznih datoteka.
OmegaT odabire odgovarajuće filtre za datoteke u izvorišnoj mapi na temelju datotečnoga nastavka. Preciznije rečeno, OmegaT
pokušava uskladiti uzorke naziva datoteka svakoga filtra na temelju naziva datoteka. Primjera radi, uzorak *.xhtml
odgovara svim datotekama s datotečnim nastavkom .xhtml
. U slučaju pronalaska odgovarajućega filtra, pridružuje mu se datoteka za obradu. Primjerice, za obradu datoteka s datotečnim
nastavkom .xhtml koriste se filtri XHTML-a. Možete mijenjati ili dodavati uzorke naziva datoteka za pridruživanje svakom pojedinom
filtru. Uzorci naziva izvorišnih datoteka koriste nadomjesne znakove slične onima koji se rabe za Pretraživanja. Znak „*” obuhvaća nula ili više znakova. Znak „?” obuhvaća isključivo jedan znak. Svi ostali znakovi predstavljaju same sebe.
Na primjer, ako želite tekstni filtar pridružiti datotekama procitajme (procitajme, procitaj.me
i procitajme.txt
), trebate koristiti uzorak procitaj*
.
Kodiranje je obavezno samo za ograničeni broj datotečnih formata. Datotečni formati za koje kodiranje nije određeno koriste
kodiranje koje postavite za datotečni nastavak prema njihovom nazivu. Primjera radi, datoteke .txt
se prema zadanim postavkama učitavaju u skladu sa zadanim kodiranjem vašeg operacijskog sustava. Kodiranje izvorišnih datoteka
možete mijenjati za svaki pojedini uzorak njihovoga naziva. Takve je datoteke moguće obrađivati prema bilo kojemu kodiranju.
Kodiranje datoteka prijevoda je prema zadanim postavkama identično kodiranju izvorišnih datoteka. Polja kodiranja izvorišnih
i odredišnih datoteka koriste kombinirane okvire koji sadržavaju sva podržana kodiranja. <auto> prepušta odluku o kodiranju
programu OmegaT. Način djelovanja je sljedeći:
OmegaT utvrđuje kodiranje izvorišne datoteke putem njene deklaracije kodiranja, ako postoji (datoteke na osnovi HTML-a i XML-a)
OmegaT dobiva nalog za korištenje obaveznoga kodiranja za određene datotečne formate (svojstva jezika Java itd.)
OmegaT koristi zadano kodiranje operacijskoga sustava za tekstne datoteke.
Ponekad se ukaže potreba za automatskim preimenovanjem datoteka za prijevod, primjerice dodavanjem oznake jezika iza naziva datoteka. Uzorak naziva odredišnih datoteka koristi posebnu sintaksu, pa ako želite promijeniti to polje, morate pritisnuti Obrada... i koristiti Dijaloški okvir obrade uzoraka. Za vraćanje zadanih postavki filtra pritisnite Zadano. Naziv možete mijenjati i izravno u polju uzorka naziva odredišne datoteke dijaloškoga okvira filtra datoteka. Dijaloški okvir obrade uzoraka nudi sljedeće mogućnosti, između ostalih:
Zadana je vrijednost je ${filename}
– puni naziv izvorišne datoteke s datotečnim nastavkom: u ovome je slučaju naziv datoteke prijevoda identičan onome izvorišne
datoteke.
${nameOnly}
– omogućava umetanje samo naziva izvorišne datoteke, a bez datotečnoga nastavka.
${extension}
– izvorni datotečni nastavak
${targetLocale}
– regionalni kôd odredišne datoteke (u obliku „xx_YY”).
${targetLanguage}
– odredišni jezik zajedno s oznakom države (u obliku „XX-YY”).
${targetLanguageCode}
– samo odredišni jezik („XX”)
${targetCountryCode}
– samo odredišna država („YY”)
${timestamp-????}
– datum i vrijeme sustava u vrijeme izrade u različitim oblicima
Primjere uzoraka za jednostavne oblike datuma i možete pronaći u dokumentaciji koju je izradio Oracle.
${system-os-name}
– operacijski sustav korištenoga računala
${system-user-name}
– korisničko ime u sustavu
${system-host-name}
– naziv glavnoga računala u sustavu
${file-source-encoding}
– kodiranje izvorišne datoteke
${file-target-encoding}
– kodiranje odredišne datoteke
${targetLocaleLCID}
– Microsoftova regionalna oznaka odredišne datoteke
Dostupne su i dodatne varijante za varijable ${nameOnly} i ${Extension}. U slučaju podvojenoga naziva, moguća je primjena
varijabli oblika ${name only
-broj datotečnoga nastavka} i ${extension
-broj datotečnoga nastavka} . Primjerice, ako je naziv izvorne datoteke Dokument.xx.docx, rezultati sljedećih varijabli bit će ovakvi:
${nameOnly-0}
Dokument
${nameOnly-1}
Dokument.xx
${nameOnly-2}
Dokument.xx.docx
${extension-0}
docx
${extension-1}
xx.docx
${extension-2}
Dokument.xx.docx