Informacije o oblikovanju iz izvorišnih datoteka obično treba reproducirati u odredišnim datotekama. Informacije o oblikovanju u tekstu koje omogućavaju podržani formati, za sada poglavito DocBook, HTML, XHTML, Open Document Format (ODF) i Office Open XML (od paketa MS Office 2007 nadalje), OmegaT prikazuje kao oznake teksta. Oznake teksta obično bivaju ignorirane prilikom utvrđivanja sličnosti različitih tekstova radi pronalaženja podudaranja. Oznake teksta reproducirane u segmentima prijevoda ostaju kao takve u prevedenome dokumentu.
Oznake teksta se sastoje od jednoga do tri znaka i broja. Jedinstveno numeriranje omogućava zajedničko grupiranje odgovarajućih oznaka teksta i razlikovanje oznaka teksta s jednakim znakom prečaca, a koje zapravo nisu iste. Znakovi prečaca služe za prikaz temeljnoga značenja oznaka teksta (npr. b za podebljani tekst, i za kurziv itd.).
Oznake teksta se numeriraju inkrementalno prema skupinama. „Skupine oznaka teksta” u ovome su kontekstu zapravo jedna oznaka teksta (npr. <i0> i </i0>). U okviru segmenta, prva skupina (par ili jedna oznaka – „samac”) dobiva broj 0, druga broj 1 itd. U prvome primjeru niže u tekstu imamo tri skupine oznaka teksta (par, samca pa još jedan par), dok se u drugome primjeru nalazi samo jedna skupina (par).
Oznake teksta su uvijek ili samci ili parovi. Samci ukazuju na informacije o oblikovanju koje ne utječu na okolni tekst (npr. dodatni razmak ili prijelom retka).
<b0><Ctr+N></b0>,
<br1><b2><Enter></b2><segment 2132>
<br1> je samac i ne utječe na bilo koji dio okolnoga teksta. Oznake u paru obično ukazuju na informacije o stilu koji se odnosi na tekst između početne i završne oznake teksta para. U sljedećem su primjeru <b0> i </b0> par i utječu na tekst log.txt. Imajte na umu da se početna oznaka uvijek mora nalaziti ispred odgovarajuće završne oznake:
<Datoteka zapisnika (<b0>log.txt</b0>) služi za praćenje postupaka i pogrešaka.<segment 3167>
OmegaT izrađuje svoje oznake teksta prije postupka segmentiranja rečenica. Ovisno o pravilima segmentiranja, par oznaka teksta može biti rastavljen i tako se naći u dva susjedna segmenta, zbog čega će provjera valjanosti oznaka teksta upozoriti na pogrešku i označiti ta dva segmenta.
Pri radu valja biti pažljiv s oznakama teksta. Ako ih nehotice izmijenite, možete oštetiti konačnu inačicu datoteke. Osnovno je pravilo da redoslijed oznaka teksta mora biti očuvan. Međutim, uz strogo pridržavanje određenih principa moguća su i stanovita odstupanja od tog osnovnog pravila.
Skupine oznaka teksta možete duplicirati njihovim jednostavnim kopiranjem na željeno mjesto. Vodite računa da se početna oznaka u paru mora nalaziti ispred završne oznake. Oblikovanje koje predstavlja duplicirana skupina primjenjuje se na oba odjeljka.
Primjer:
<b0>Ovo oblikovanje</b0> ćemo duplicirati ovdje.<segment 0001>
Nakon dupliciranja:
<b0>Ovo oblikovanje</b0> je <b0>duplicirano ovdje</b0>.<segment 0001>
Brisanje skupina oznaka teksta
Skupine oznaka teksta možemo brisati njihovim jednostavnim uklanjanjem iz segmenata. Vodite računa da za skupinu para valja izbrisati i početnu i završnu oznaku kako bi se pravilno uklonili svi tragovi oblikovanja i spriječilo oštećenje datoteke prijevoda. Brisanjem skupine oznaka uklanja se i povezano oblikovanje u datoteci prijevoda.
Primjer:
<b0>Ovo oblikovanje</b0> ćemo izbrisati.<segment 0001>
Nakon brisanja:
Ovo oblikovanje je izbrisano.<segment 0001>
Mijenjanje redoslijeda skupina oznaka teksta može izazvati gniježđenje jedne skupine oznaka u drugoj. To je prihvatljivo, pod uvjetom da potonja skupina u potpunosti obuhvaća prvu skupinu. Drugim riječima, pri premještanju parova skupina pazite da i početna i završna oznaka budu bilo unutar ili izvan drugih parova skupina. U suprotnome može doći do oštećenja datoteke prijevoda i nećete je moći otvoriti.
Primjer:
<b0>Oblikovanje</b0> <b1>broj jedan</b1> ćemo ugnijezditi unutar oblikovanja broj nula.<segment 0001>
Nakon gniježdenja
<b0>Oblikovanje <b1>broj jedan</b1></b0> je ugniježđeno unutar oblikovanja broj nula.<segment 0001>
Preklapanje nastaje uslijed pogrešnoga postupanja s parovima oznaka teksta i nedvojbeno izaziva oštećenje oblikovanja, a ponekad sprječava i samu mogućnost otvaranja datoteke prijevoda.
Primjer:
<b0>Oblikovanje</b0> <b1>broj jedan</b1> ćemo unerediti.<segment 0001>
Nakon pogrešnoga postupanja:
<b0>Oblikovanje <b1>broj jedan</b0> </b1>smo uneredili do daske.<segment 0001>
Rad s oznakama teksta možemo prilagoditi postavljanjem nekih pravila u prozoru
:Sljedeće funkcije vrijede za sve izvorišne datoteke, a ne samo za neke vrste datoteka, primjerice oblikovani tekst.
Varijable printf – bez provjere, provjera jednostavnih, provjera svega
OmegaT može provjeravati nalaze li se varijable programiranja (npr. %s) iz izvorišne datoteke i u prijevodu. Možete odabrati izbjegavanje provjere, provjeru jednostavnih varijabli printf (poput %s, %d itd.) ili varijabli print svih vrsta.
Provjera jednostavnih uzoraka java MessageFormat
Označavanjem ovoga potvrdnoga kvadratića OmegaT provjerava jesu li jednostavne oznake java MessageFormat (npr. {0}) pravilno obrađene.
Regularni izraz za prilagođene oznake teksta
Ovdje upisan regularni izraz upućuje program OmegaT da otkrivene pojavnice tretira kao korisničke oznake teksta. Pritom provjerava istovjetnost broja oznaka teksta i njihov poredak, baš kao u slučaju oznaka teksta programa OmegaT.
Regularni izraz za fragmente koje valja ukloniti iz prijevoda
U ovo polje možete upisati regularni izraz za neželjeni sadržaj u odredišnoj datoteci. Time se sve pojavnice u odredišnim segmentima bojaju u crveno, što olakšava njihovo pronalaženje i ispravljanje. Ovaj se uzorak za uklanjanje ignorira pri pretraživanju djelomičnih podudaranja. Primjenjuje se fiksno oduzimanje postotka podudaranja u vrijednosti od pet jedinica ako se uklonjeni dio ne podudara s nekim drugim segmentom, tako da se podudaranje ne prikazuje kao 100-postotno.
Funkcija provjere valjanosti oznaka teksta služi za otkrivanje promjena u sljedovima oznaka (bilo hotimičnih ili nenamjernih) i prikaz segmenata u kojima su obavljene. Pokretanjem ove funkcije –
– otvara se prozor koji prikazuje sve segmente datoteke u kojima se nalaze oznake teksta u prijevodu za koje se sumnja da su oštećene ili neispravne. Funkcija provjere valjanosti oznaka teksta omogućava jednostavno popravljanje oznaka teksta i obnovu odredišnih dokumenata. Prozor koji se otvara kombinacijom tipki sadržava tablicu od tri stupca s poveznicama na odgovarajuće segmente, tj. na izvorišne i odredišne segmente.Oznake su istaknute u obliku podebljanoga teksta plave boje radi jednostavnoga usporednog pregleda izvornog i prevedenog sadržaja. Pritiskom na željenu poveznicu otvara se odgovarajući segment u oknu za obradu. Ispravite pogrešku po potrebi (kao npr. u gornjem primjeru, gdje nedostaje par <i2></i2>) pa pritisnite
za povratak na prozor za provjeru valjanosti oznaka teksta radi ispravljanja drugih pogrešaka. Pogreške u oznakama teksta su sljedovi oznaka u prijevodu u kojima nije reproduciran isti poredak i broj oznaka teksta. Neke intervencije u oznakama teksta su nužne i bezopasne, dok druge znaju izazvati probleme pri sastavljanju prevedenoga dokumenta.Pojednostavnite izvorni tekst
Općenito uzevši, oznake teksta predstavljaju oblikovanje izvornoga teksta u određenim oblicima. Pojednostavljivanje oblikovanja izvornika uvelike doprinosi smanjenju broja oznaka. Kada to dopuštaju okolnosti, valja uzeti u obzir objedinjavanje korištenih fontova i njihovih veličina, boja i drugoga, jer time se može pojednostavniti prevođenje i smanjiti mogućnost nastanka pogrešaka u vezi s oznakama teksta. Više pojedinosti o mogućnostima rada s oznakama teksta možete pronaći u odjeljku o postupcima s oznakama teksta. Ne zaboravite da u slučaju problema s oznakama u sklopu programa OmegaT, a kada oblikovanje nije od ključnoga značaja za prijevod, vjerojatno najlakše rješenje problema leži u uklanjanju oznaka teksta.
Obratite posebnu pozornost na parove oznaka teksta
Ako vam je potreban prikaz oznaka teksta u programu OmegaT, a nije vam nužno zadržati većinu oblikovanja u prijevodu dokumenta, možete izostaviti oznake teksta iz prijevoda. U tom slučaju posebno obratite pozornost na parove oznaka teksta, jer brisanjem jedne strane para uz ostavljanje druge strane dolazi do neizbježnoga oštećenja oblikovanja dokumenta. Budući da se oznake nalaze u samome tekstu, moguće je korištenje pravila segmentacije radi sastavljanja segmenata s manjim brojem oznaka teksta. Riječ je o naprednoj funkciji za čiju je pravilnu primjenu potrebno određeno iskustvo.
Program OmegaT još nije u stanju potpuno automatski otkrivati pogreške u oblikovanju pa vas stoga ne upozorava kad napravite pogrešku ili promijenite oblikovanje radi prilagodbe odredišnome jeziku. Međutim, može se dogoditi da datoteka prijevoda izgleda neobično, a u najgoremu je slučaju nije moguće ni otvoriti.