Hoofdstuk 21. Machinevertaling

1. Introductie
2. Google Translate
3. OmegaT-gebruikers en Google Translate
4. Belazar
5. Apertium
6. Microsoft Translator
7. Yandex Translate
8. Machinevertaling - probleemoplossing

1. Introductie

Tegengesteld aan de door de gebruiker gegenereerde vertaalgeheugens (zoals in het geval van OmegaT) gebruiken programma's voor machinevertaling (MT) op regels gebaseerde linguïstische programma's om een vertaling van de bron te maken zonder dat een vertaalgeheugen nodig is. Statistische leertechnieken, gebaseerd op bron- en doelteksten, worden gebruikt om een vertaalmodel te bouwen. Services voor machinevertalingen hebben goed en steeds betere resultaten behaald in research evaluaties.

Ga naar Opties > Machinevertaling... en activeer de gewenste service om een van de services voor machinevertaling te activeren. Onthoud dat zij allemaal op het web gebaseerd zijn: u zult online moeten zijn als u ze wilt gebruiken.

2. Google Translate

Google Translate is een service waarvoor betaald moet worden en die wordt aangeboden door Google, voor het vertalen van zinnen, websites en complete teksten tussen een nog steeds groeiend aantal talen. Op het moment van schrijven bevat de lijst meer dan 50 talen, van Albanees tot Jiddisch, inclusief natuurlijk alle grote talen. De huidige versie van de service is, op het moment van schrijven, gebaseerd op het gebruiken ervan, met een prijs van 20 USD per miljoen tekens.

Belangrijk: Google Translate API v2 vereist rekeninggegevens voor alle accounts vóórdat u de service kunt gebruiken (zie Pricing and Terms of Service voor meer informatie). U gebruikt uw eigen private unieke sleutel, die door Google aan u is verzonden toen u zich registreerde bij de service, om uzelf te identificeren als een geldige gebruiker voor de services van Google. Bekijk hoofdstuk Installeren en uitvoeren van OmegaT, gedeelte OmegaT starten vanaf de opdrachtregel, voor details om deze sleutel aan de omgeving van OmegaT toe te voegen.

De kwaliteit van de vertaling is aan de ene kant afhankelijk van het reservoir aan teksten in de doeltaal en de beschikbaarheid van hun meertalige versies, aan de andere kant ook van de kwaliteit van de gebouwde modellen. Het is haast wel zeker dat, hoewel de kwaliteit in sommige gevallen onvoldoende kan zijn, het uiteindelijk mettertijd beter zal worden en niet slechter.

3. OmegaT-gebruikers en Google Translate

De gebruiker van OmegaT is niet gedwongen om Google Translate te gebruiken. Indien het wordt gebruikt zal de beslissing van de gebruiker om de vertaling te accepteren, noch de uiteindelijke vertaling beschikbaar worden gemaakt voor Google. Het volgende venster geeft een voorbeeld weer van a) de Engelse bron b) Spaanse en c) Sloveense vertaling in Google Translate.

Afbeelding 21.1. Google Translate - voorbeeld

Google Translate - voorbeeld

De Spaanse vertaling is beter dan de Sloveense. Merk op dat interesar en navegar in het Spaans correct zijn vertaald als respectievelijk de werkwoorden interest en sail. In de Sloveense versie worden beide woorden vertaald als zelfstandige naamwoorden. Het is eigenlijk zeer waarschijnlijk dat de Spaanse vertaling, ten minste gedeeltelijk, is gebaseerd op de actuele vertaling van het boek.

Vanaf het moment dat de service is geactiveerd zal er een suggestie voor de vertaling verschijnen in het venster Machinevertaling voor elk nieuw bronsegment dat wordt geopend. Indien u de suggestie acceptabel vindt, druk op Ctrl+M om het doelgedeelte van het geopende segment te vervangen. In het segment hierboven, bijvoorbeeld, zou Ctrl+M de Spaanse versie overschrijven met de Sloveense suggestie.

Indien u niet wilt dat OmegaT uw bronsegmenten verstuurt naar Google om te worden vertaald, verwijdert u het vinkje vóór het menu-item Google Translate in Opties.

Onthoud dat er niets anders dan het bronsegment wordt verzonden naar de service van de machinevertaling. De online versie van Google Translate maakt het de gebruiker mogelijk om de suggestie te corrigeren en het gecorrigeerde segment in te sturen. Deze mogelijkheid is echter niet geïmplementeerd in OmegaT.

4. Belazar

Belazar is een programma voor machinevertaling voor een Russisch - Wit-Russisch taalpaar.

5. Apertium

Apertium is een gratis/open-bron platform voor machinevertaling, initieel gericht op gerelateerde taalparen, zoals CA, ES, GA, PT, OC en FR maar recent uitgebreid om ook minder gangbare taalparen (zoals Engels-Catalaans) te behandelen. Controleer op de website voor de laatste lijst van geïmplementeerde taalparen.

Het platform levert

  • een taal-onafhankelijk programma voor machinevertaling

  • gereedschappen om de linguïstische gegevens te beheren die nodig zijn om een systeem voor machinevertaling te bouwen voor een bepaald taalpaar

  • linguïstische gegevens voor een groeiend aantal taalparen

Apertium gebruikt een oppervlakkig overdrachtprogramma voor machinevertaling die de invoer in gedeelten verwerkt, zoals in een lopende band: opmaak verwijderen, morfologische analyses, doorverwijzen van spraakgedeelten, oppervlakkige structurele overdracht, lexicografische overdracht, morfologische generatie, en opnieuw opmaken.

Het is mogelijk om Apertium te gebruiken om systemen voor machinevertalingen te bouwen voor een variëteit aan taalparen; voor dat doel gebruikt Apertium eenvoudige op XML gebaseerde standaard formaten om de benodigde linguïstische gegevens te coderen (ofwel met de hand of door het converteren van bestaande gegevens), die zijn gecompileerd met behulp van de verschafte programma's in de formaten voor hoge snelheid zoals die gebruikt worden door het programma.

6. Microsoft Translator

Volg deze stappen om inloggegevens voor MS Translator te verkrijgen:

  1. Log in op Microsoft Azure Marketplace: http://datamarket.azure.com/

    Indien u nog geen account heeft voor Azure Marketplace zult u er eerst een moeten registreren.

  2. Klik op de optie My Account bovenaan de pagina.

  3. nabij de onderzijde zult u items en waarden zien voor:

    • Primary Account Key (correspondeert met de microsoft.api.client_secret parameter voor de opdrachtregel)

    • Customer ID (correspondeert met de microsoft.api.client_id parameter voor de opdrachtregel)

Bewerk het opstartprogramma of bekijk hoofdstuk Installeren en uitvoeren om te zien hoe OmegaT vanaf de opdrachtregel te starten om MS Translator in OmegaT in te schakelen.

7. Yandex Translate

U moet een API-sleutel van Yandex verkrijgen om in staat te zijn Yandex Translate in OmegaT te gebruiken.

De verkregen API-sleutel moet worden doorgegeven bij het opstarten van OmegaT door middel van de parameter voor de opdrachtregel yandex.api.key. Bewerk het opstartprogramma voor OmegaT om dat te doen of bekijk hoofdstuk Installeren en uitvoeren om te zien hoe OmegaT vanaf de opdrachtregel te starten.

8. Machinevertaling - probleemoplossing

Indien er niets verschijnt in het venster Machinevertaling, controleer dan het volgende:

  • Bent u online? U moet online zijn om een programma voor machinevertaling te kunnen gebruiken.

  • Wat is het taalpaar dat u nodig hebt? Controleer of de geselecteerde service het aanbiedt.

  • Google Translate werkt niet: heeft u Translate API service toegepast? Onthoud dat de service Google Translate niet gratis is, bekijk hoofdstuk Installeren en uitvoeren (parameters voor runtime) voor meer daarover.

  • "Google Translate gaf HTTP antwoordcode: 403 terug ...": controleer of de sleutel van 38 tekens, ingevoerd in het bestand pinfo.list, juist is. Controleer of de service Translate API geactiveerd is.

  • Google Translate werkt niet: - met de sleutel voor de Google API ingevoerd zoals vereist. Controleer in Opties > Machinevertaling of Google Translate V2 is geselecteerd.

  • Google Translate V2 rapporteert "Bad request" - controleer de bron- en doeltalen voor uw project. Het niet gedefinieerd hebben van talen leidt tot een dergelijk soort antwoord.