Chapter 12. Práce s formátovaným textem

1. Formátovací tagy
2. Operace s tagy
3. Vnořování skupiny tagů
4. Překrývání skupiny tagů
5. Možnosti Ověření tagů
6. Ověření skupiny tagů
7. Tipy pro správu tagů

Formátovací informace obsažené ve zdrojovém souboru obvykle musí být opakovány v cílovém souboru. Formátovací informace, které jsou „in-line“, tzn. přímo v řádku, budou u podporovaných formátů (konkrétně jde v době psaní tohoto textu o DocBook, HTML, XHTML, Open Document Format (ODF a Office Open XML (MS Office 2007 a novější) v aplikaci OmegaT zobrazeny jako tagy. Běžně jsou tagy ignorovány s ohledem na podobnost mezi různými texty používanými pro porovnání. Tagy, které vložíte do přeloženého segmentu, budou přítomné v přeloženém dokumentu.

1. Formátovací tagy

Pojmenování tagů:

Tagy se skládají z jednoho až tří písmen a čísla. Jedinečné číslování umožňuje vzájemně si odpovídající tagy seskupovat do skupin a rozlišovat mezi tagy, které mají stejné písmeno v názvu, ale ve skutečnosti zastupují jinou vlastnost. Znaky mohou, ale nemusí odrážet hodnotu formátování, kterou reprezentují tagy (např. tučně (‚b‛ pro ‚bold‛), kurzíva (‚i‛ pro ‚italics‛), atd.)

Číslování tagů:

Tagy jsou číslovány postupně, vždy podle jednotlivých skupin. „Skupiny tagů“ reprezentují v tomto kontextu ucelené tagy (jako například <i0> a </i0>). Uvnitř segmentu pak první skupina (párový nebo samostatný tag) obdrží číslo 0, druhá číslo 1 atd. První příklad uvedený níže má tři skupiny tagů (pár, samostatný a pak další pár), druhý příklad má jen jednu skupinu (pár).

Párové a nepárové:

Tagy jsou vždy buď párové nebo nepárové. Nepárové, čili jednoduché tagy označují formátovací informaci, která neovlivňuje okolní text (např. mezera navíc nebo zalomení řádku).

<b0><Ctr+N></b0>, <br1><b2><Enter></b2><segment 2132>

<br1> je nepárový tag a neovlivňuje okolní text. Párové tagy obvykle označují informace o stylu, které se vztahují na text mezi otevíracím a uzavíracím tagem. <b0> a </b0> jsou párové tagy, které se vztahují k textu log.txt. Je nutno dbát na to, aby otevírací tag byl vždy umístěn před uzavíracím tagem:

Soubor protokolu (<b0>log.txt</b0>), ve kterém se zaznamenávají akce a chyby.<segment 3167>

OmegaT vytváří své tagy ještě před zpracováním větné segmentace. V závislost na pravidlech segmentace, páry tagů tak mohou být rozděleny do dvou po sobě jdoucích segmentů a při ověřování tagů bude hlášena chyba a tyto dva segmenty budou označeny.

2. Operace s tagy

S tagy se musí zacházet opatrně. Když je náhodou změníte, můžete tak poškodit formátování cílového dokumentu. Základní pravidlo zní, že sekvence tagů se musí zachovat ve stejném pořadí. Nicméně, pokud pevně dodržujete určitá pravidla, je možné se od tohoto základního pravidla odchýlit.

Duplikace tagů:

Skupiny tagů můžete duplikovat prostým nakopírováním na pozici dle vašeho výběru. Pamatujte ale, že v rámci páru musí být otevírací tag umístěn před uzavíracím. Formátování zapsané pomocí duplikované skupiny bude uplatněno obě části textu.

Příklad:

<b0>Toto formátování</b0> bude duplikováno sem.<segment 0001>

Po duplikaci:

<b0>Toto formátování</b0> bylo <b0>duplikováno sem</b0>.<segment 0001>

Smazání skupiny tagů:

Skupinu tagů smažete jejím prostým odstraněním ze segmentu. Nezapomeňte, že u párových tagů musí být smazán jak příslušný otevírací, tak také příslušný ukončovací tag, a jenom tak se zajistí, že jsou řádně odebrány všechny stopy formátování, jinak může dojít k poškození přeloženého souboru. Vymazáním skupiny tagů odstraníte příslušné formátování z přeloženého souboru.

Příklad:

<b0>Toto formátování</b0> bude smazáno.<segment 0001>

Po smazání:

Toto formátování bylo smazáno.<segment 0001>

3. Vnořování skupiny tagů

Úpravy pořadí párových tagů mohou vyústit do vnořování skupiny tagů do jiné skupiny tagů. Toto bude fungovat do té doby, dokud budou páry řádně uzavírány a nebudou se křížit. Jinými slovy, když budete manipulovat s párovými tagy, tak se ujistěte, že oba - jak otevírající, tak uzavírající tag – jsou buď uvnitř nebo vně jiného párového tagu, jinak může dojít k poškození přeloženého souboru, a ten by pak nešel otevřít.

Příklad:

<b0>Formátování</b0> <b1>jedna</b1> bude vnořeno do formátování nula.

Po vnoření:

<b0>Formátování<b1>jedna</b1></b0> bylo vnořeno do formátování nula.

4. Překrývání skupiny tagů

K překrývání dochází v důsledku chybné manipulace s párovými tagy, a toto pak určitě vyústí v poškození formátování a někdy může být přeložený soubor poškozen do takové míry, že už nepůjde otevřít vůbec.

Příklad:

<b0>Formátování</b0> <b1>jedna</b1> bude zpřeházeno.<segment 0001>

Po chybné manipulaci:

<b0>Formátování <b1>jedna</b0> </b1> je teď zcela špatně.<segment 0001>

5. Možnosti Ověření tagů

Sami si pro lepší přizpůsobení práce s tagy můžete nastavit pravidla v okně Možnosti > Ověření tagů...:

Nastavení, které je tu ukázané, platí pro všechny zdrojové soubory a ne jen pro některé typy souborů, jako je tomu u formátovaného textu.

  • Proměnné printf – nekontrolovat, kontrolovat jednoduché, kontrolovat všechny.

    OmegaT také může kontrolovat programové proměnné (proměnné jako %s) jak ve zdrojovém, tak i v přeloženém textu.. Můžete se rozhodnout pro možnost nekontrolovat nic, kontrolovat jen jednoduché proměnné printf (jako %s %d atd.) nebo proměnné printf všech typů

  • Zkontrolovat prosté vzory java MessageFormat

    Když bude toto zaškrtávací políčko aktivní, bude OmegaT kontrolovat, zda jsou prosté tagy java MessageFormat (like {0}) zpracovány správně.

  • Přizpůsobit regulární výraz tagu/tagů:

    Sem vložený regulární výraz zapříčiní, že OmegaT bude zacházet s nalezenými případy jako se specificky definovanými tagy. Zkontroluje, jestli počet a pořadí tagů je identický, stejně jako je tomu v případě pro tagy omegat.

  • Fragment nebo fragmenty, které mají být odstraněny z regulárního výrazu překladu:

    Můžete vložit regulární výraz pro nežádoucí obsah v překladu. Jakákoliv shoda v cílovém segmentu pak bude zobrazena červeně, tj. tak, aby mohla být snadno identifikována a opravena. Když se provádí hledání přibližných překladů, pak bude ignorován tzv. ‚remove pattern‘, čili vzor, dle kterého se postupuje při odstraňování zadaných znaků nebo částí textu. V takovém případě se počítá 5 tzv. trestných bodů, pokud odstraněná část neodpovídá jinému segmentu, takže shoda přibližného překladu se neukazuje s hodnotou 100%.

6. Ověření skupiny tagů

Funkce Ověření tagů detekuje změny v sekvenci tagů (ať už byli změněny cíleně nebo nechtěně) a ukáže dotyčný segment. Spuštění této funkce - stiskem Ctrl+Shift+V – otevřete okno obsahující všechny segmenty souboru, které obsahují pravděpodobně poškozené nebo chybné tagy v překladu. Za použití funkce Ověření tagů je oprava tagů a opětovné vytvoření cílových dokumentů opravdu jednoduché. Okno, které se otevře po stisku Ctrl+Shift+V, zobrazí tabulku se třemi sloupci, které obsahují odkaz na segment, původní segment a segment s překladem.

Figure 12.1. Záznam ověření tagů

Záznam ověření tagů

Tagy jsou zvýrazněné tučným modrým písmem a tak lze snadno srovnat původní obsah s obsahem přeloženým. Klikněte na odkaz pro přejití na segment v Editoru. Pokud je to nutné, opravte chybu (ve výše uvedeném případe je to chybějící pár <i2></i2>) a stiskněte Ctrl+Shift+V pro návrat k oknu ověření tagů a tak můžete opravit případné další chyby. Chyby tagů představují sekvence tagů v překladu, které nereflektují stejný pořádek a počet tagů, po vzoru původního segmentu. Některé změny tagů jsou nutné a neškodné, oproti tomu některé zapříčiní problémy při vytváření přeložených dokumentů.

7. Tipy pro správu tagů

Zjednodušení výchozího textu

Tagy všeobecně představují nějaký druh formátování v původním textu. Zjednodušení formátování původního textu ve velké míře přispívá ke snížení počtu tagů. Tam kde to okolnosti povolují, zkuste zvážit sjednocení použitého písma, velikosti písma, barev, atd., protože tak vám to může zjednodušit překlad a snížit potencionální množství chyb tagů. Přečtěte si část ‚Operace s tagy‛, zjistíte tam, co všechno se dá s tagy provádět. Pamatujte, že pokud vás tagy ruší a formátování není v daném překladu extrémně důležité, tak odstranění tagů může být nejjednodušší cesta ven z problémů.

Věnujte zvýšenou pozornost párovým tagům.

Pokud potřebujete vidět tagy v aplikaci OmegaT, ale nemusíte zachovat většinou formátování v přeloženém dokumentu, tak se můžete volně rozhodnout, zda tagy do překladu zařadíte. V tomto případě věnujte zvýšenou pozornost párovým tagům, protože jak se smaže jedna část a ne obě, tak si jistě poškodíte formátování dokumentu. Vzhledem k tomu, že tagy jsou obsaženy v samotném textu, je možné použít Pravidla segmentace k vytvoření segmentů s méně tagy. Toto je již pokročilé nastavení a k dobrým výsledkům bude zapotřebí mít určitou zkušenost.

OmegaT zatím neumí odhalit chyby ve formátování zcela automaticky, takže vás neupozorní, pokud uděláte chybu nebo změníte formátování tak, aby lépe vyhovovalo vašemu cílovému jazyku. Nicméně někdy může váš přeložený soubor vypadat podivně a – v nejhorším případě – třeba nepůjde vůbec otevřít.