Hoofdstuk 12. Werken met opgemaakte tekst

1. Tags voor opmaak
2. Tag-bewerkingen
3. Taggroep nesten
4. Taggroep overlappen
5. Opties voor valideren van tags
6. Taggroep validatie
7. Hints voor tagbeheer

Informatie over opmaak die aanwezig is in het bronbestand moet meestal worden gereproduceerd in het doelbestand. De in-regelige informatie over opmaak van ondersteunde formaten (momenteel DocBook, HTML, XHTML, Open Document Format en Office Open XML (MS Office 2007 en later) wordt door OmegaT weergegeven als tags. Normaal gesproken worden tags genegeerd bij het bepalen van de gelijkheid tussen de verschillende teksten ten behoeve van overeenkomsten. Tags die zijn gereproduceerd in het vertaalde segment zullen aanwezig zijn in het vertaalde document.

1. Tags voor opmaak

Namen van tags:

De tags bestaan uit één tot drie tekens en een getal. Met unieke nummers kunnen de tags die met elkaar overeenkomen worden gegroepeerd en onderscheiden zich van de tags die dezelfde tekencombinatie hebben, maar in feite verschillend zijn. De gebruikte tekens in de tags proberen de onderliggende betekenis van de tag weer te geven (bijv. b voor vet, i voor cursief, etc.)

Nummering van tags:

Tags worden oplopend genummerd per groep van tags. "Taggroepen" in deze context zijn één enkele tag (zoals <i0> en </i0>). Binnen een segment krijgt de eerste groep (paar of enkele) het nummer 0, de tweede het nummer 1, etc. Het eerste voorbeeld hieronder heeft 3 tag-groepen (een paar, een enkele en dan nog een ander paar), het tweede voorbeeld heeft slechts één groep (een paar).

Paren en enkele:

Tags zijn altijd óf enkel óf gepaard. Enkele tags geven informatie over de opmaak aan die niet van invloed is op de tekst er omheen (een extra spatie of regeleinde bijvoorbeeld).

<b0><Ctr+N></b0>, <br1><b2><Enter></b2><segment 2132>

<br1> is een enkele tag en heeft geen effect op de omringende tekst. Tagparen geven gewoonlijk informatie over de stijl weer die van toepassing is op de tekst tussen de openingstag en de sluitingstag van een paar. <b0> en </b0> hieronder zijn gepaard en beïnvloeden de tekst log.txt. Onthoud dat de openingstag altijd vóór de bijbehorende sluitingstag moet komen:

<Logbestand (<b0>log.txt</b0>) voor het bijhouden van bewerkingen en fouten.<segment 3167>

OmegaT maakt zijn tags voordat het proces van segmentatie van zinnen wordt uitgevoerd. Afhankelijk van de segmentatieregels kan het paar tags worden gescheiden naar twee opeenvolgende segmenten en zal de tagvalidatie een fout aangeven en de twee segmenten markeren.

2. Tag-bewerkingen

Voorzichtigheid is geboden met tags. Als zij per ongeluk worden gewijzigd kan de opmaak van het uiteindelijke document corrupt worden. De basisregel is dat de volgorde van de tags in dezelfde volgorde moet worden behouden. Het is echter mogelijk, als bepaalde regels strikt worden gevolgd, om van deze basisregel af te wijken.

Tags dupliceren:

Kopieer ze eenvoudigweg naar de positie van uw keuze om tags te dupliceren. Onthoud dat in een paar de openingstag vóór de sluitingstag moet komen. De opmaak die wordt vertegenwoordigd door de groep die u dupliceerde zal op beide gedeelten worden toegepast.

Voorbeeld:

<b0>Deze opmaak</b0> zal hier worden gedupliceerd.<segment 0001>

Na het dupliceren:

<b0>Deze opmaak</b0> is <b0>hier gedupliceerd</b0>.<segment 0001>

Verwijderen van taggroepen:

Verwijder ze eenvoudigweg uit het segment om taggroepen te verwijderen. Onthoud dat van een paar zowel de openings- als de sluitingstag moet worden verwijderd om er voor te zorgen dat alle sporen van de opmaak correct worden uitgewist, anders zou het vertaalde bestand mogelijk beschadigd kunnen raken. Door een taggroep te verwijderen verwijdert u de gerelateerde opmaak uit het vertaalde document.

Voorbeeld:

<b0>Deze opmaak</b0> zal worden verwijderd.<segment 0001>

Na het verwijderen:

Deze opmaak is verwijderd.<segment 0001>

3. Taggroep nesten

Wijzigen van de volgorde van een taggroep kan resulteren in het nesten van een taggroep binnen een andere taggroep. Dit is acceptabel zolang de omsluitende groep in zijn geheel de omsloten groep bevat. Met andere woorden, zorg er bij het verplaatsen van tagparen voor dat zowel de openings- als de sluitingstag ofwel binnen of buiten andere tagparen staan, anders zou het vertaalde bestand mogelijk beschadigd kunnen zijn en niet willen openen.

Voorbeeld:

<b0>Opmaak</b0> <b1>een</b1> zal worden genest binnen opmaak nul.<segment 0001>

Na het nesten:

<b0>Opmaak <b1>een</b1></b0> is genest binnen opmaak nul.<segment 0001>

4. Taggroep overlappen

Overlappen is het resultaat van slechte bewerkingen van tagparen en zal gegarandeerd leiden tot beschadiging van de opmaak en soms tot het helemaal niet openen van het vertaalde document.

Voorbeeld:

<b0>Opmaak</b0> <b1>one</b1> zal worden verminkt.<segment 0001>

Na een slechte bewerking:

<b0>Opmaak <b1>een</b0> </b1>is nu zeer verminkt.<segment 0001>

5. Opties voor valideren van tags

Men kan enkele van de regels in het venster Opties > Tags valideren... instellen om het werken met tags aan te passen:

Het hier vermelde gedrag is van toepassing op alle bronbestanden en niet op slechts enkele van de bestandstypen, zoals opgemaakte tekst.

  • Printf-variabelen - niet controleren, eenvoudige controleren, alle controleren

    OmegaT kan controleren of variabelen voor programmeren (zoals bijvoorbeeld %s) in de bron bestaan in de vertaling. U kunt bepalen om ze helemaal niet te controleren, de eenvoudige printf-variabelen te controleren (zoals %s %d etc) of alle typen printf-variabelen.

  • Eenvoudige Java MessageFormat-patronen controleren

    Activeren van dit keuzevak zal er voor zorgen dat OmegaT controleert of eenvoudige tags voor Java MessageFormat (zoals {0}) juist worden verwerkt.

  • Aangepaste tag(s) reguliere uitdrukking

    Een hier ingevoerde reguliere uitdrukking zal er voor zorgen dat OmegaT de gedetecteerde items behandelt als aangepaste tags. Het of het aantal tags en hun volgorde identiek is, net zoals dat het geval is als voor tags van OmegaT.

  • Fragment(en) die zouden moeten worden verwijderd uit de vertaling van de reguliere uitdrukking

    Men kan een reguliere uitdrukking invoeren voor ongewenste inhoud in het doel. Aanwezige overeenkomsten in het doelsegment zullen dan rood gekleurd worden, d.i. eenvoudig te identificeren en te corrigeren. Bij het zoeken naar fuzzy overeenkomsten wordt het patroon om te verwijderen genegeerd. Een vaste straf van 5 wordt toegevoegd als het verwijderde gedeelte niet overeenkomt met enig ander segment, dus de overeenkomst wordt niet weergegeven als 100%

6. Taggroep validatie

De functie Tags valideren detecteert gewijzigde tags (of dat met opzet is gedaan of per ongeluk) en toont de betrokken segmenten. Het activeren van deze functie – Ctrl+Shift+V - zal een venster openen dat alle segmenten uit het bestand, waarvan wordt vermoed dat ze zijn verbroken of slechte tags zijn, bevat. Repareren van de tags en het opnieuw samenstellen van de doeldocumenten is eenvoudig met de functie Tags valideren. Het venster, dat wordt geopend door te drukken op Ctrl+Shift+V, heeft een kolom met 3 tabellen met een koppeling naar het segment, het originele segment en het doelsegment

Afbeelding 12.1. Invoer bij tagvalidatie

Invoer bij tagvalidatie

De tags worden vet blauw geaccentueerd voor eenvoudige vergelijking tussen de originele en de vertaalde inhoud. Klik op de koppeling om het segment in het venster Bewerken te activeren. Verbeter, indien nodig, de fout (in het geval hierboven is dat het ontbrekende paar <i2></i2>) en druk op Ctrl+Shift+V om terug te keren naar het venster Tags valideren om andere fouten te corrigeren. Tagfouten zijn volgordes van tags in de vertaling die niet dezelfde volgorde en nummering van tags produceren als die in het originele segment. Sommige bewerkingen aan tags zijn noodzakelijk en zijn goedaardig, sommige zullen problemen veroorzaken als het vertaalde document wordt gemaakt.

7. Hints voor tagbeheer

Vereenvoudig de originele tekst

Tags vertegenwoordigen over het algemeen een bepaalde vorm van opmaak van de originele tekst. Vereenvoudigen van de originele opmaak draagt bij aan het verminderen van het aantal tags. Waar de omstandigheden dat toestaan, zou het gelijk maken van gebruikte lettertypen, lettertype-afmetingen, kleuren etc. moeten worden overwogen, omdat het het vertalen vereenvoudigt en mogelijke fouten in tags vermindert. Lees het gedeelte Tagbewerkingen om te zien wat er met tags gedaan kan worden. Onthoud dat als u tags een probleem vindt in OmegaT en de opmaak niet buitengewoon relevant is voor de huidige vertaling, het verwijderen van tags de eenvoudigste manier kan zijn om uit de problemen te geraken.

Wees extra voorzichtig met tagparen.

Als u de tags moet zien in OmegaT maar de meeste opmaak niet behoeft te behouden in het vertaalde document staat het u vrij om de tags niet op te nemen in het vertaalde document. Let in dit geval extra op de tagparen omdat het verwijderen van één deel van het paar, maar het vergeten te verwijderen van het andere, gegarandeerd de opmaak van uw document zal beschadigen. Omdat tags in de tekst zelf zijn opgenomen, is het mogelijk om segmentatieregels te gebruiken om segmenten te maken met minder tags. Dit is een geavanceerde voorziening en enige ervaring is vereist om die juist toe te passen.

OmegaT is nog niet in staat om fouten in de opmaak volautomatisch te detecteren, dus het zal geen signaal geven als u een fout maakt of de opmaak wijzigt zodat die beter bij uw doeltaal past. Soms kan uw vertaalde document er echter vervormd uitzien en, - in het ergste geval-, zou zelfs misschien weigeren te openen.