Chapter 7. Datotečni filtri

1. Dijaloški okvir datotečnih filtara
2. Mogućnosti filtara
3. Dijaloški okvir za obradu filtara
3.1. Vrsta izvorišne datoteke, uzorak naziva datoteke
3.2. Kodiranje izvorišnih i odredišnih datoteka
3.3. Naziv odredišne datoteke

OmegaT nudi vrlo prilagodljive filtre, što omogućava podešavanje brojnih funkcija. Datotečni filtri su sadržaji kôda koji omogućavaju sljedeće:

Prikaz datotečnih formata koje podržava program OmegaT možete vidjeti putem izbornika Mogućnosti > Datotečni filtri...

Zadane mogućnosti datotečnih filtara dostatne su za većinu korisnika. Ako tome nije tako, otvorite glavni dijaloški okvir putem Mogućnosti → Datotečni filtri... na glavnome izborniku. Također možete uključiti i datotečne filtre za korištenje samo u okviru tekućega projekta, i to odabirom postavke Datotečni filtri... na izborniku Projekt → Svojstva.

Filtre za predmetni projekt možete uključiti putem izbornika Projekt → Svojstva.... Pritisnite Datotečni filtri i označite potvrdni kvadratić Uključi filtre za predmetni projekt. U tom se slučaju u sklopu projekta sprema kopija postavki filtara. Prilikom naknadnoga mijenjanja filtara ažuriraju se samo filtri projekta, dok se korisnički filtri ne mijenjaju.

Pozor! Promijenite li mogućnosti filtara dok je projekt otvoren, morate ponovno učitati projekt kako bi izmjene imale učinka.

1. Dijaloški okvir datotečnih filtara

Ovaj dijaloški okvir sadržava popis raspoloživih datotečnih filtara, pri čemu su filtri koji se koriste za tekući projekt prikazani u obliku podebljanoga teksta. Ako ne želite koristiti program OmegaT za prevođenje datoteka određene vrste, možete isključiti odgovarajući filtar odznačavanjem potvrdnoga kvadratića pored njegova naziva. OmegaT će potom izostavljati odgovarajuće datoteke prilikom učitavanja projekata te će ih kopirati u neizmijenjenome obliku pri izradi odredišnih dokumenata. Ako ponovno zatrebate određeni filtar, samo označite njegov potvrdni kvadratić. Za vraćanje datotečnih filtara na zadane postavke pritisnite Zadano. Za odabir datoteka i kodnoga rasporeda njihove obrade odaberite filtar s popisa i pritisnite Obrada.

Dijaloški okvir omogućava uključivanje i isključivanje sljedećih mogućnosti:

  • Ukloni početne i završne oznake teksta: odznačavanje ove postavke omogućava prikaz svih oznaka teksta, kako početnih, tako i završnih. Pozor: kada su u formatima Microsoft Open XML (docx, xlsx itd.) prikazane sve oznake teksta, NEMOJTE upisivati tekst prije prve oznake, jer ona je tehnička oznaka koja se uvijek mora nalaziti na početku segmenta).

  • Ukloni početne i završne bjeline u nesegmentiranim projektima: program OmegaT prema zadanim postavkama uklanja početne i završne bjeline. U nesegmentiranim ih je projektima moguće zadržati odznačavanjem navedene postavke.

  • Zadrži razmake svih oznaka: ovu postavku odaberite ako izvorišna dokumentacija sadržava značajne razmake (radi oblikovanja), a koje svakako valja uzeti u obzir.

  • Zanemari datotečni kontekst pri utvrđivanju segmenata s alternativnim prijevodima: OmegaT prema zadanim postavkama koristi nazive izvorišnih datoteka prilikom utvrđivanja alternativnih prijevoda. Odabirom ove postavke isključujemo korištenje naziva izvorišnih datoteka, a alternativni će nam prijevodi biti nuđeni u svim datotekama sve dok imamo druga odgovarajuća kontekstna podudaranja (prethodne/sljedeće segmente ili pak neku vrstu identifikacije, ovisno o datotečnome formatu).

2. Mogućnosti filtara

Za nekoliko filtara (datoteke formata txt, XHTML, HTML i XHTML, kao i datoteke OpenDocument i Microsoft Open XML) imamo na raspolaganju jednu ili više određenih mogućnosti. Te mogućnosti možemo mijenjati odabirom filtra s popisa, a potom odabiremo Mogućnosti. Na raspolaganju imamo sljedeće:

Tekstne datoteke

  • Segmentacija po odlomcima na prijelomima redaka, praznim recima ili nikada

    Ako su uključena pravila segmentacije po rečenicama, tekst se dalje segmentira prema ovdje odabranoj postavci.

Datoteke PO

  • Dopusti segmente bez prijevoda u odredišnoj datoteci

    U slučaju kada neki segment (ili eventualno cijeli odlomak) datoteke PO nije preveden, u odredišnoj datoteci ostaje prazan, tj. bez prijevoda. Strogo govoreći, svaki segment msgstr u odredišnoj datoteci PO ostaje prazan. Budući da je to standardan način rada s datotekama PO, ova je postavka uključena prema zadanim vrijednostima. Isključivanjem navedene funkcije izvorišni se tekst kopira u odredišni segment.

  • Preskoči zaglavlje PO

    Uključivanjem ove postavke ignoriramo i ostavljamo netaknutima zaglavlja PO.

  • Automatska zamjena 'nplurals=INTEGER; plural=EXPRESSION;' u zaglavlju

    Ova postavka omogućava programu OmegaT da zanemari uvjete iz zaglavlja datoteka PO te da koristi zadane vrijednosti za odabrani odredišni jezik.

Datoteke XHTML

  • Prevedi sljedeće atribute: odabrani se atributi prikazuju kao segmenti u oknu za obradu.

  • Oznaka početka novoga odlomka: HTML oznaka <br> služi za utvrđivanje odlomaka u svrhe segmentacije.

  • Preskoči tekst koji se podudara s regularnim izrazima: ignoriranje teksta koji se podudara s regularnim izrazima. Oni se prilikom provjere oznaka prikazuju u crvenoj boji. Tekst koji se podudara u izvorišnim se segmentima prikazuje u kurzivu.

  • Ne prevodi sadržaj atributa metaoznaka... : Popis metaoznaka koje se ne prevode.

  • Ne prevodi sadržaj oznaka sa sljedećim atributima parova ključ-vrijednost (odvojenim zarezima): sadržaj oznaka se ignorira u slučajevima podudaranja s popisa parova ključ-vrijednost.

    Ponekad je korisno odrediti da neke oznake budu neprevodive na temelju vrijednosti atributa. Primjer za to je <div class="hide"> <span translate="no">. Možete definirati parove ključ-vrijednost za oznake koje valja ostaviti neprevedenima. U gornjemu bi primjeru polje sadržavalo sljedeće: class=hide, translate=no

Datoteke Microsoft Office Open XML

Možete odabrati elemente za prijevod. Oni se u prijevodu prikazuju kao zasebni segmenti.

  • Word: nevidljivi tekst uputa, komentari, fusnote, krajnje bilješke, podnožja

  • Excel : komentari, nazivi listova

  • PowerPoint: komentari, matrice i izgled stranica

  • Globalno: grafikoni, dijagrami, crteži, WordArt

  • Ostale mogućnosti:

    • Združene oznake: odabirom ove funkcije združujemo oznake bez prevodivoga teksta između njih u jednu oznaku.

    • Zadrži razmake svih oznaka: odabirom ove funkcije zadržavamo bjeline (razmake i nove retke), čak i kada nisu postavljene u samome dokumentu.

Datoteke HTML i XHTML

  • Dodaj ili prepiši deklaraciju kodiranja u datotekama HTML i XHTML: odredišne datoteke često moraju imati kodne stranice drugačije od onih u izvorišnim datotekama (bez obzira je li to izrijekom definirano ili podrazumijevano). Ova postavka prevoditeljima nudi mogućnost da odaberu hoće li odredišne datoteke sadržavati i deklaraciju kodiranja. Primjera radi, ako je datotečnim filtrom kao shema kodiranja za odredišne datoteke određen UTF-8, odabirom Uvijek osiguravamo da datoteke prijevoda sadržavaju tu informaciju.

  • Prevedi sljedeće atribute: odabrani se atributi prikazuju kao segmenti u oknu za obradu.

  • Oznaka početka novoga odlomka: HTML oznaka <br> služi za utvrđivanje odlomaka u svrhe segmentacije.

  • Preskoči tekst koji se podudara s regularnim izrazima: ignoriranje teksta koji se podudara s regularnim izrazima. Oni se prilikom provjere oznaka prikazuju u crvenoj boji. Tekst koji se podudara u izvorišnim se segmentima prikazuje u kurzivu.

  • Ne prevodi sadržaj atributa metaoznaka... : Popis metaoznaka koje se ne prevode.

  • Ne prevodi sadržaj oznaka sa sljedećim atributima parova ključ-vrijednost (odvojenim zarezima): sadržaj oznaka se ignorira u slučajevima podudaranja s popisa parova ključ-vrijednost.

    Ponekad je korisno odrediti da neke oznake budu neprevodive na temelju vrijednosti atributa. Primjer za to je <div class="hide"> <span translate="no">. Možete definirati parove ključ-vrijednost za oznake koje valja ostaviti neprevedenima. U gornjemu bi primjeru polje sadržavalo sljedeće: class=hide, translate=no

  • Sažmi bjeline u prevedenome dokumentu: višestruke bjeline u nizu pretvaraju se u jednu bjelinu u prevedenome dokumentu.

  • Ukloni komentare HTML-a u prevedenome dokumentu: u prevedeni se dokument ne kopira nijedan komentar (između znakova <!-- i -->).

Datoteke Open Document Format (ODF)

  • Možete odabrati koji će od sljedećih elemenata biti za prijevod:

    stavke kazala, knjižne oznake, upute na knjižne oznake, bilješke, komentari, bilješke prezentacija, poveznice (URL-ovi), nazivi listova

3. Dijaloški okvir za obradu filtara

Ovaj dijaloški okvir omogućava postavljanje uzoraka naziva izvorišnih datoteka za obradu filtrom, prilagodbu naziva datoteka prijevoda i odabir kodiranja za korištenje pri učitavanju datoteke i spremanju njenoga prijevoda. Uzorak datotečnoga filtra možete mijenjati bilo izravnim mijenjanjem polja ili pritiskom na Obrada. Novi uzorak datotečnoga filtra možete dodati pritiskom na Dodaj. Isti se dijaloški okvir koristi za dodavanje ili obradu uzoraka. Dijaloški je okvir koristan jer sadržava posebnu funkciju za obradu uzoraka naziva odredišnih datoteka, kojom možete prilagođavati nazive izlaznih datoteka.

3.1. Vrsta izvorišne datoteke, uzorak naziva datoteke

OmegaT odabire odgovarajuće filtre za datoteke u izvorišnoj mapi na temelju datotečnoga nastavka. Preciznije rečeno, OmegaT pokušava uskladiti uzorke naziva datoteka svakoga filtra na temelju naziva datoteka. Primjera radi, uzorak *.xhtml odgovara svim datotekama s datotečnim nastavkom .xhtml. U slučaju pronalaska odgovarajućega filtra, pridružuje mu se datoteka za obradu. Primjerice, za obradu datoteka s datotečnim nastavkom .xhtml koriste se filtri XHTML-a. Možete mijenjati ili dodavati uzorke naziva datoteka za pridruživanje svakom pojedinom filtru. Uzorci naziva izvorišnih datoteka koriste nadomjesne znakove slične onima koji se rabe za Pretraživanja. Znak „*” obuhvaća nula ili više znakova. Znak „?” obuhvaća isključivo jedan znak. Svi ostali znakovi predstavljaju same sebe. Na primjer, ako želite tekstni filtar pridružiti datotekama procitajme (procitajme, procitaj.me i procitajme.txt), trebate koristiti uzorak procitaj*.

3.2. Kodiranje izvorišnih i odredišnih datoteka

Kodiranje je obavezno samo za ograničeni broj datotečnih formata. Datotečni formati za koje kodiranje nije određeno koriste kodiranje koje postavite za datotečni nastavak prema njihovom nazivu. Primjera radi, datoteke .txt se prema zadanim postavkama učitavaju u skladu sa zadanim kodiranjem vašeg operacijskog sustava. Kodiranje izvorišnih datoteka možete mijenjati za svaki pojedini uzorak njihovoga naziva. Takve je datoteke moguće obrađivati prema bilo kojemu kodiranju. Kodiranje datoteka prijevoda je prema zadanim postavkama identično kodiranju izvorišnih datoteka. Polja kodiranja izvorišnih i odredišnih datoteka koriste kombinirane okvire koji sadržavaju sva podržana kodiranja. <auto> prepušta odluku o kodiranju programu OmegaT. Način djelovanja je sljedeći:

  • OmegaT utvrđuje kodiranje izvorišne datoteke putem njene deklaracije kodiranja, ako postoji (datoteke na osnovi HTML-a i XML-a)

  • OmegaT dobiva nalog za korištenje obaveznoga kodiranja za određene datotečne formate (svojstva jezika Java itd.)

  • OmegaT koristi zadano kodiranje operacijskoga sustava za tekstne datoteke.

3.3. Naziv odredišne datoteke

Ponekad se ukaže potreba za automatskim preimenovanjem datoteka za prijevod, primjerice dodavanjem oznake jezika iza naziva datoteka. Uzorak naziva odredišnih datoteka koristi posebnu sintaksu, pa ako želite promijeniti to polje, morate pritisnuti Obrada... i koristiti Dijaloški okvir obrade uzoraka. Za vraćanje zadanih postavki filtra pritisnite Zadano. Naziv možete mijenjati i izravno u polju uzorka naziva odredišne datoteke dijaloškoga okvira filtra datoteka. Dijaloški okvir obrade uzoraka nudi sljedeće mogućnosti, između ostalih:

  • Zadana je vrijednost je ${filename} – puni naziv izvorišne datoteke s datotečnim nastavkom: u ovome je slučaju naziv datoteke prijevoda identičan onome izvorišne datoteke.

  • ${nameOnly} – omogućava umetanje samo naziva izvorišne datoteke, a bez datotečnoga nastavka.

  • ${extension} – izvorni datotečni nastavak

  • ${targetLocale}– regionalni kôd odredišne datoteke (u obliku „xx_YY”).

  • ${targetLanguage}– odredišni jezik zajedno s oznakom države (u obliku „XX-YY”).

  • ${targetLanguageCode} – samo odredišni jezik („XX”)

  • ${targetCountryCode} – samo odredišna država („YY”)

  • ${timestamp-????} – datum i vrijeme sustava u vrijeme izrade u različitim oblicima

    Primjere uzoraka za jednostavne oblike datuma i možete pronaći u dokumentaciji koju je izradio Oracle.

  • ${system-os-name} – operacijski sustav korištenoga računala

  • ${system-user-name} – korisničko ime u sustavu

  • ${system-host-name} – naziv glavnoga računala u sustavu

  • ${file-source-encoding} – kodiranje izvorišne datoteke

  • ${file-target-encoding} – kodiranje odredišne datoteke

  • ${targetLocaleLCID} – Microsoftova regionalna oznaka odredišne datoteke

Dostupne su i dodatne varijante za varijable ${nameOnly} i ${Extension}. U slučaju podvojenoga naziva, moguća je primjena varijabli oblika ${name only-broj datotečnoga nastavka} i ${extension-broj datotečnoga nastavka} . Primjerice, ako je naziv izvorne datoteke Dokument.xx.docx, rezultati sljedećih varijabli bit će ovakvi:

  • ${nameOnly-0} Dokument

  • ${nameOnly-1} Dokument.xx

  • ${nameOnly-2} Dokument.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} Dokument.xx.docx