Hoofdstuk 7. Bestandsfilters

1. dialoogvenster Bestandsfilters
2. Filteropties
3. dialoogvenster Filter bewerken
3.1. Type bronbestand, patroon voor bestandsnaam
3.2. Coderen van bron- en doelbestanden
3.3. Doelbestandsnaam

OmegaT omvat zeer aanpasbare filters die u in staat stellen verschillende aspecten in te stellen. Bestandsfilters zijn gedeelten van code die in staat zijn om:

Bekijk het menu Opties > Bestandsfilters ... om te zien welke bestandsindelingen kunnen worden afgehandeld door OmegaT.

De meeste gebruikers zullen tevreden zijn met de standaard ingestelde opties. Als u dat niet bent opent u het hoofd dialoogvenster door in het hoofdmenu Opties → Bestandsfilters... te selecteren. U kunt ook project-specifieke bestandsfilters inschakelen, die alleen zullen worden gebruikt voor het huidige project, door de optie Bestandsfilters... in Project → Eigenschappen te selecteren.

U kunt projectspecifieke filters inschakelen via Project → Eigenschappen.... Klik op de knop Bestandsfilters en activeer het keuzevak Projectspecifieke filters inschakelen. Een kopie van de configuratie van de filters zal in dit geval met het project worden opgeslagen. Indien u later filters wijzigt zullen alleen de projectfilters worden bijgewerkt, waarbij de filters voor de gebruikers ongewijzigd zullen blijven.

Waarschuwing! Als u de segmentatie-opties wijzigt als een project geopend is moet u het project herladen vóórdat de wijzigingen effect hebben.

1. dialoogvenster Bestandsfilters

Dit dialoogvenster toont de beschikbare bestandsfilters. Als u OmegaT niet wilt gebruiken om bestanden van een bepaald type te vertalen, kunt u het betreffende filter uitschakelen door het keuzevak naast de naam niet te selecteren. OmegaT zal dan de betreffende bestanden weglaten bij het laden van projecten en zal ze ongewijzigd kopiëren bij het maken van de doeldocumenten. Als u het filter opnieuw wilt gebruiken, selecteer dan het keuzevak. Klik op Standaardinstellingen om de bestandsfilters terug te zetten naar de standaard instellingen. Selecteer het filter uit de lijst en klik op Bewerken om aan te geven welke bestanden in welke coderingen het filter moet verwerken.

Het dialoogvenster stelt u in staat de volgende opties in- of uit te schakelen:

  • Verwijder voorloop en achterliggende tags: deselecteer deze optie om alle tags weer te geven, inclusief de voorloop en achterliggende. Waarschuwing: in indelingen van Microsoft Open XML (docx, xlsx, etc.), als alle tags worden weergegeven, schrijf dan GEEN tekst vóór de eerste tag (het is een technische tag die altijd aan het begin van de tag moet staan).

  • Verwijder voor- en achterliggende witruimte in niet-gesegmenteerde projecten: standaard verwijdert OmegaT voor- en achterliggende witruimte. In niet-gesegmenteerde projecten is het mogelijk deze te behouden door deze optie te deselecteren.

  • Behoud spaties voor alle tags: selecteer deze optie als de brondocumenten significante spaties bevat (om redenen van lay-out) die niet moeten worden genegeerd.

  • Negeer context van bestand bij identificeren van segmenten met wisselende vertalingen: standaard gebruikt OmegaT de naam van het bronbestand als deel van de identificatie van een wisselende vertaling. als de optie is geselecteerd zal de naam van het bronbestand niet worden gebruikt, en alternatieve vertalingen zullen effect hebben in elk bestand zolang als de andere context (vorige/volgende segmenten, of enige soort ID afhankelijk van de bestandsindeling) overeenkomt.

2. Filteropties

Verschillende filters (Tekstbestanden, XHTML-bestanden, HTML- en XHTML-bestanden, OpenDocument-bestanden en Microsoft Open XML-bestanden) hebben één of meer specifieke opties. Selecteer, om de opties aan te passen, het filter uit de lijst en klik op Opties. De beschikbare opties zijn:

Tekstbestanden

  • Alineasegmentatie op regeleinden, lege regels of nooit:

    als regels voor zinsegmentatie actief zijn, zal de tekst verder worden gesegmenteerd overeenkomstig de hier geselecteerde optie.

PO-bestanden

  • Blanco vertalingen in het doelbestand toestaan:

    Indien ingeschakeld zal, wanneer een PO-segment (wat een gehele alinea kan zijn) niet is vertaald, de vertaling leeg zijn in het doelbestand. Technisch gesproken zal het segment msgstr in het PO-doelbestand, indien gemaakt, leeg zijn. Het staat standaard aan, omdat dit het standaard gedrag is voor PO-bestanden. Indien de optie is uitgeschakeld, zal de brontekst worden gekopieerd naar het doelsegment.

  • PO-koptekst overslaan

    De koptekst van de PO zal worden overgeslagen en niet worden gewijzigd, als deze optie is geselecteerd.

  • Automatisch vervangen van 'nplurals=INTEGER; &plural=EXPRESSION;' in koptekst

    De optie maakt het voor OmegaT mogelijk om de specificatie in de koptekst van het PO-bestand te overschrijven en de standaard voor de geselecteerde doeltaal te gebruiken.

XHTML-bestanden

  • Vertaal de volgende attributen: De geselecteerde attributen zullen als segmenten in het venster Bewerken verschijnen.

  • Start een nieuwe alinea bij: De <br> HTML-tag zal een alinea voor segmentatiedoeleinden maken.

  • Tekst die overeenkomt met reguliere uitdrukking overslaan: De tekst die overeenkomt met de reguliere uitdrukking wordt overgeslagen. Dit wordt in de tagvalidatie in rood weergegeven. Tekst in het bronsegment die overeenkomt wordt cursief weergegeven.

  • Vertaal het attribuut 'content' van metatags niet: ... : De volgende metatags zullen niet worden vertaald.

  • Vertaal NIET de inhoud van tags met de volgende paren van sleutels en waarden voor attributen (door komma's gescheiden):: een overeenkomst in de lijst met sleutel-waardenparen zorgt er voor dat de inhoud van tags zal worden genegeerd

    Het is soms handig om enkele tags niet te vertalen te maken, gebaseerd op de waarde van attributen. Bijvoorbeeld: <div class="hide"> <span translate="no"> U kunt sleutel-waardenparen definiëren voor tags die niet vertaald moeten worden. Voor het voorbeeld hierboven zou het veld bevatten: class=hide, translate=no

Microsoft Office Open XML-bestanden

U kunt selecteren welke elementen vertaald moeten worden. Zij zullen als afzonderlijke segmenten in de vertaling verschijnen.

  • Word: Niet-zichtbare tekst met instructies, Notities, Voetnoten, Eindnoten, Voetteksten

  • Excel: Notities, Werkbladnamen

  • Powerpoint: Dianotities, Diamodellen, Dia-lay-outs

  • Globaal: Grafieken, Diagrammen, Tekeningen, WordArt

  • Andere opties:

    • Hoeveelheid tags: Indien geselecteerd zullen tags, zonder vertaalbare tekst er tussen, worden samengevoegd tot enkele tags.

    • Spaties voor alle tags behouden: Indien geselecteerd zal "witruimte" (d.i. spaties en nieuwe regels) worden behouden, zelfs als dat niet technisch is ingesteld in het document.

HTML- en XHTML-bestanden

  • Codering-declaratie aan HTML- en XHTML-bestanden toevoegen of herschrijven: vaak moeten de doelbestanden een andere tekenset voor de codering hebben dan die in het bronbestand (of dat nu expliciet gedefinieerd is of als gevolg van). Met behulp van deze optie kan de vertaler specificeren of in de doelbestanden de declaratie voor de codering moet worden opgenomen. Als bijvoorbeeld het bestandsfilter UTF8 specificeert als het schema voor codering voor de doelbestanden, zal het selecteren van Altijd er voor zorgen dat deze informatie zal worden opgenomen in de vertaalde bestanden.

  • Vertaal de volgende attributen: De geselecteerde attributen zullen als segmenten in het venster Bewerken verschijnen.

  • Start een nieuwe alinea bij: De <br> HTML-tag zal een alinea voor segmentatiedoeleinden maken.

  • Tekst die overeenkomt met reguliere uitdrukking overslaan: De tekst die overeenkomt met de reguliere uitdrukking wordt overgeslagen. Dit wordt in de tagvalidatie in rood weergegeven. Tekst in het bronsegment die overeenkomt wordt cursief weergegeven.

  • Vertaal het attribuut 'content' van metatags niet: ... : De volgende metatags zullen niet worden vertaald.

  • Vertaal NIET de inhoud van tags met de volgende paren van sleutels en waarden voor attributen (door komma's gescheiden):: een overeenkomst in de lijst met sleutel-waardenparen zorgt er voor dat de inhoud van tags zal worden genegeerd

    Het is soms handig om enkele tags niet te vertalen te maken, gebaseerd op de waarde van attributen. Bijvoorbeeld: <div class="hide"> <span translate="no"> U kunt sleutel-waardenparen definiëren voor tags die niet vertaald moeten worden. Voor het voorbeeld hierboven zou het veld bevatten: class=hide, translate=no

  • Witruimte in vertaalde documenten comprimeren: meerdere doorlopende witruimten zullen worden geconverteerd naar één enkele witruimte in vertaalde documenten.

  • HTML-opmerkingen in vertaalde document verwijderen: alle delen met opmerkingen (tussen <!-- en -->) zullen niet worden gekopieerd naar het vertaalde document.

Open Document Format (ODF)-bestanden

  • U kunt selecteren welke van de volgende elementen vertaald moeten worden.

    Indexitems, bladwijzers, verwijzingen naar bladwijzers, notities, opmerkingen, notities in presentaties, koppelingen (URL), werkbladnamen

3. dialoogvenster Filter bewerken

Het dialoogvenster stelt u in staat om de patronen van de bronbestandsnaam te bewerken van de bestanden die het filter zal verwerken, de bestandsnamen van vertaalde bestanden aan te passen en te selecteren welke coderingen het zal gebruiken bij het laden van het bestand en zijn vertaalde tegenhanger. Pas de velden direct aan of klik op Bewerken om een patroon voor het bestandsfilter aan te passen. Klik op Toevoegen om een nieuw patroon voor een bestandsfilter toe te voegen. Hetzelfde dialoogvenster wordt gebruikt om een patroon toe te voegen of een bepaald patroon te bewerken. Het dialoogvenster is handig omdat het een speciale bewerker voor het patroon van de doelbestandsnaam heeft waarmee u de namen van de te maken bestanden aan kunt passen.

3.1. Type bronbestand, patroon voor bestandsnaam

Als OmegaT een bestand tegenkomt in zijn bronmap, probeert dat het filter te selecteren gebaseerd op de extensie van het bestand. Meer precies: OmegaT probeert of van elk filter het patroon van de bestandsnaam overeenkomt met de bestandsnaam. Het *.xhtml-patroon zal bijvoorbeeld overeenkomen met elk bestand met de extensie .xhtml. Als het juiste filter is gevonden wordt dat voor verdere verwerking toegepast op het betreffende bestand. Standaard zal bijvoorbeeld het XHTML-filter worden gebruikt bij het verwerken van bestanden met de extensie .xhtml. U kunt bestandsnaam-patronen toevoegen of wijzigen voor bestanden die door elk filter worden afgehandeld. Patronen voor bronbestandsnamen gebruiken jokertekens die overeenkomen met die in Zoeken. Het teken '*' komt overeen met nul of meer tekens. Het teken '?' komt overeen met exact één teken. Alle andere tekens vertegenwoordigen zichzelf. Als u bijvoorbeeld wilt dat het tekstfilter readme-bestanden (readme, read.me en readme.txt) afhandelt, zou u het patroon read* moeten gebruiken.

3.2. Coderen van bron- en doelbestanden

Slechts een beperkt aantal bestandsformaten specificeren een voorgeschreven codering. Bestandsformaten die hun codering niet specificeren zullen de codering gebruiken die u instelt voor de extensie die overeenkomt met hun naam. Standaard zullen bijvoorbeeld .txt-bestanden worden geladen met behulp van de standaard codering van uw besturingssysteem. U kunt de broncodering voor elk verschillend bronbestandsnaam-patroon wijzigen. Zulke bestanden kunnen ook in elke codering worden weggeschreven. Als standaard heeft het vertaalde bestand dezelfde codering als de codering van het bronbestand. Velden voor bron- en doelcodering gebruiken combinatievakken waarin alle ondersteunde coderingen zijn opgenomen. <auto> laat de keuze van de codering aan OmegaT over. Zo werkt het:

  • OmegaT identificeert de codering van het bronbestand door de declaratie van de codering te gebruiken, indien aanwezig (HTML-bestanden, op XML gebaseerde bestanden).

  • OmegaT is geïnstrueerd om een voorgeschreven codering te gebruiken voor bepaalde bestandsformaten ( Java-properties etc)

  • OmegaT gebruikt de standaard codering van het besturingssysteem voor tekstbestanden.

3.3. Doelbestandsnaam

Soms wilt u misschien de bestanden die u vertaalde automatisch hernoemen, bijvoorbeeld door een taalcode achter de bestandsnaam te zetten. Doelbestandsnaam-patronen gebruiken een speciale syntaxis, dus als u dit veld zou willen bewerken, moet u op Bewerken... klikken en het dialoogvenster Patroon bewerken gebruiken. Klik op Standaardinstellingen als u terug wilt keren naar de standaard configuratie van het filter. U kunt de naam ook direct aanpassen in het veld voor het patroon van het doelbestand of het dialoogvenster Bestandsfilters. Het dialoogvenster Patroon bewerken biedt, naast andere, de volgende opties:

  • Standaard is ${filename} - volledige bestandsnaam van het bronbestand met extensie: in dit geval is de naam van het vertaalde bestand hetzelfde als dat van het bronbestand.

  • ${nameOnly} - laat u alleen de naam van het bronbestand invoegen zonder de extensie.

  • ${extension} - de originele bestandsextensie

  • ${targetLocale} - locale-code voor doel (in de vorm "xx_YY").

  • ${targetLanguage} - de doeltaal en landcode samen (in de vorm "XX-YY").

  • ${targetLanguageCode} - de doeltaal - alleen "XX"

  • ${targetCoutryCode} - de doel-landcode - alleen "YY"

  • ${timestamp-????} - datum en tijd van het systeem op het moment van genereren in verschillende patronen

    Bekijk documentatie van Oracle voor voorbeelden van de patronen voor "SimpleDateFormat"

  • ${system-os-name} - besturingssysteem van de gebruikte computer

  • ${system-user-name} - systeem gebruikersnaam

  • ${system-host-name} - systeem hostnaam

  • ${file-source-encoding} - codering bronbestand

  • ${file-target-encoding} - codering doelbestand

  • ${targetLocaleLCID} - Microsoft locale voor doel

Aanvullende varianten zijn beschikbaar voor variabelen ${nameOnly} en ${Extension}. In het geval dat de bestandsnaam een niet unieke naam heeft, kan men variabelen in de vorm ${name only-aantal extensies} en ${extension-aantal extensies} toepassen. Als bijvoorbeeld het originele bestand is genaamd Document.xx.docx, zullen de volgende variabelen de volgende resultaten geven:

  • ${nameOnly-0} Document

  • ${nameOnly-1} Document.xx

  • ${nameOnly-2} Document.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} Document.xx.docx