Chapitre 13. Mémoires de traduction

1. Les mémoires de traduction dans OmegaT
1.1. dossiers TMX - emplacement et but
1.2. sauvegardes TMX
1.3. fichiers TMX et langue
1.4. Segments orphelins
2. Réutilisation des mémoires de traduction
2.1. Importer et exporter des mémoires de traduction
2.2. Créer une mémoire de traduction pour les documents sélectionnés
2.3. Partager des mémoires de traduction
2.4. Utiliser un fichier TMX avec des paires de langues alternatives
3. Les sources ayant des traductions existantes
4. Mémoire pseudotraduite
5. Mise à niveau des mémoires de traduction

1. Les mémoires de traduction dans OmegaT

1.1. dossiers TMX - emplacement et but

Les projets OmegaT peuvent avoir des fichiers de mémoire de traduction (fichiers dont l'extension est .tmx) à quatre endroits différents :

dossier omegat

le dossier omegat contient le fichier project_save.tmx et peut contenir un certain nombre de fichiers TMX de sauvegarde. Le fichier project_save.tmx contient tous les segments qui ont été enregistrés dans la mémoire depuis le début du projet. Ce fichier existe toujours dans le projet. Son contenu sera toujours trié par ordre alphabétique en fonction du segment source.

dossier principal du projet

le dossier principal du projet contient 3 fichiers tmx, project_name-omegat.tmx, project_name-level1.tmx et project_name-level2.tmx (project_name étant le nom de votre projet).

  • Le fichier level1 ne contient que des informations textuelles.

  • Le fichier level2 insère les balises spécifiques d'OmegaT à l'intérieur des balises TMX appropriées afin que le fichier puisse être utilisé avec ses informations de formatage dans un outil de traduction qui prend en charge les mémoires tmx level2 ou même dans OmegaT.

  • Le fichier OmegaT inclut les balises de formatage spécifiques à OmegaT afin que le fichier puisse être utilisé dans d'autres projets OmegaT

Ces fichiers sont des copies du fichier project_save.tmx, c'est-à-dire de la mémoire de traduction principale du projet, et excluent les segments dits orphelins. Ils ont des noms modifiés de manière pertinente afin que leurs contenus restent identifiables lorsqu'ils sont utilisés ailleurs, par exemple dans le sous-dossier tm d'un autre projet (voir ci-dessous).

dossier tm

Le dossier /tm/ peut contenir un nombre illimité de mémoires de traduction secondaires - c'est-à-dire de fichiers TMX. De tels fichiers peuvent être créés dans n'importe lequel des trois types cités ci-dessus. Veuillez noter que les autres outils de TAO peuvent exporter (et aussi importer) des fichiers TMX, généralement dans les trois formes. Bien sûr, la meilleure chose à faire est d'utiliser des fichiers TMX spécifiques à OmegaT (voir ci-dessus), afin que le formatage intégré soit conservé à l'intérieur des segments.

Le contenu des mémoires de traduction du sous-dossier tm sert à créer des suggestions pour le(s) texte(s) à traduire. Tout texte déjà traduit et sauvegardé dans ces fichiers apparaîtra dans les correspondances s'il est suffisamment proche du texte en cours de traduction.

Si le segment source d'une des mémoires de traduction secondaires est identique au texte en cours de traduction, OmegaT se comportera de la manière définie dans la fenêtre de dialogue OptionsLigne d'édition.... Par exemple (si le paramètre par défaut est configuré), la traduction de la mémoire de traduction secondaire est acceptée et porte le préfixe [correspondance], afin que le traducteur puisse revoir les traductions à un stade ultérieur et vérifier que les segments ainsi marqués ont été traduits correctement (voir chapitre Ligne d'édition) .

Il est possible que les mémoires de traduction contenues dans le sous-dossier tm comportent des segments ayant un texte source identique mais des textes cible différents. Les fichiers TMX sont triés en fonction de leurs noms et de leurs segments (à l'intérieur d'un fichier TMX donné). Ils sont ensuite lus ligne par ligne. Le dernier segment ayant un texte source identique va donc prédominer (Veuillez noter qu'il est bien sûr plus intéressant d'éviter que ce genre de choses arrive).

Veuillez noter que les fichiers TMX du dossier tm peuvent être compressés par gzip.

Dossier tm/auto

S'il est certain dès le début que toutes les traductions d'une ou de plusieurs mémoires de traduction sont correctes, les placer dans le dossier tm/auto permet d'éviter de devoir confirmer de nombreux cas de [correspondance].

  1. Placez la TMX dans /tm/auto.

  2. Ouvrez le projet. Les modifications sont affichées.

  3. Effectuez une légère modification à un emplacement quelconque du projet. Cela modifie project_save.tmx (en ajoutant les unités de traduction pertinentes depuis la TMX « auto »)

Note : si la TMX est supprimée de /tm/auto avant l'étape 3, no aucune traduction supplémentaire n'est ajoutée.

Dossier tm/enforce

Si vous êtes certains qu'une TMX est plus à jour que project_save.tmx d'OmegaT, placez cette TMX dans /tm/enforce pour remplacer les traductions existantes par défaut inconditionnellement.

  1. Placez la TMX dans /tm/enforce.

  2. Ouvrez le projet. Les modifications sont affichées.

  3. Effectuez une légère modification à un emplacement quelconque du projet. Cela modifie project_save.tmx.

  4. Prenez une décision sur la pérennité des segments forcés :

    • S'il n'est pas nécessaire qu'ils restent protégés de futurs changements, supprimez la TMX de /tm/enforce.

    • S'il est nécessaire qu'ils restent protégés de futurs changements, conservez la TMX dans /tm/enforce.

Note : si la TMX est supprimée de /tm/enforce avant l'étape 3, les segments forcés ne sont pas conservés.

Dossier tm/mt

Dans l'Éditeur, lorsqu'une correspondance est insérée depuis une TMX contenu dans un dossier nommé mt, l'arrière-plan du segment actuel passe en rouge. L'arrière-plan revient à la normale lorsque l'utilisateur quitte le segment.

Dossiers tm/penalty-xxx

Il peut s'avérer intéressant de distinguer les mémoires de traduction de très bonne qualité de celles qui sont moins fiables en raison du sujet, du client, du statut de la révision, etc. Pour les mémoires de traduction qui se trouvent dans les dossiers portant le nom "penalty-xxx" (xxx correspondant à un chiffre entre 0 et 100), les correspondances seront diminuées en fonction du nom de ce dossier : une correspondance à 100 % dans n'importe quelle mémoire de traduction qui se trouve, par exemple, dans un dossier appelé Penalty-30 sera abaissée à une correspondance à 70 %. La pénalité s'applique aux trois pourcentages de correspondance : les correspondances à 75, 80 et 90 seront dans ce cas abaissées à 45, 50 et 60.

Vous pouvez aussi, de manière facultative, laisser OmegaT avoir un fichier TMX supplémentaire (de style OmegaT) à l'emplacement de votre choix et qui contiendra tous les segments traduisibles du projet. Voir la mémoire pseudo-traduite du projet ci-dessous.

Veuillez noter que toutes les mémoires de traduction sont chargées dans la mémoire lorsque le projet est ouvert. Des sauvegardes de la mémoire de traduction du projet sont créées régulièrement (voir chapitre suivant), et le fichier project_save.tmx est également enregistré/mis à jour lorsque le projet est fermé ou rechargé. Ce qui signifie que vous n'avez pas besoin de quitter le projet sur lequel vous travaillez pour lui ajouter une nouvelle mémoire de traduction secondaire : il suffit de recharger le projet pour que les modifications que vous lui avez apportées soient ajoutées.

Les emplacements des différentes mémoires de traduction d'un projet donné sont définis par l'utilisateur (voir la fenêtre de dialogue du projet dans Propriétés du projet)

Selon la situation, plusieurs stratégies sont donc possibles, par exemple :

plusieurs projets concernant le même sujet : conservez la structure du projet et modifiez les dossiers sources et cibles (source = source/commande1, cible = target/commande1 etc). Veuillez noter que les segments commande1 qui ne sont pas présents dans commande2 ou dans d'autres travaux seront marqués comme segments orphelins ; ils resteront cependant utiles pour obtenir des correspondances.

plusieurs traducteurs qui travaillent sur le même projet : séparez les fichiers source en sous-dossiers source/Alice, source/Bob... et répartissez-les aux membres de l'équipe (Alice, Bob ...). Ils peuvent ainsi créer leurs propres projets et remettre leur fichier project_save.tmx, lorsqu'ils ont fini ou qu'ils ont atteint une échéance. Les fichiers project_save.tmx sont ensuite récupérés et les conflits éventuels (concernant la terminologie par exemple) sont résolus. Une nouvelle version de la mémoire de traduction principale est créée, soit pour qu'elle soit placée dans chacun des dossiers /tm/autodes membres de l'équipe soit pour qu'elle remplace leurs fichiers project_save.tmx. L'équipe peut aussi utiliser la même structure de sous-dossiers pour les fichiers cible. Cela leur permet, par exemple, de vérifier à tout moment que la version cible du projet dans son ensemble reste correcte.

1.2. sauvegardes TMX

Lorsque vous traduisez vos fichiers, OmegaT sauvegarde votre travail en continu dans le fichier project_save.tmx localisé dans le dossier /omegat du projet.

OmegaT enregistre également la mémoire de traduction dans le fichier project_save.tmx.ANNÉEMMJJHHMN.bak.bak dans le même sous-dossier à chaque fois que le projet est ouvert ou rechargé. ANNÉE correspond aux quatre chiffres de l'année, MM correspond au mois, JJ au jour du mois, et HH et MN sont les heures et les minutes de la sauvegarde de la mémoire de traduction précédente.

Si vous pensez avoir perdu des données de traduction, suivez la procédure suivante :

  1. Fermez le projet

  2. Renommez le fichier project_save.tmx actuel ( par exemple en project_save.tmx.temporary)

  3. Sélectionnez la sauvegarde de la mémoire de traduction qui contient le plus probablement les données recherchées (soit la plus récente, soir la dernière version de la veille)

  4. Copiez-la dans project_save.tmx

  5. Ouvrez le projet

1.3. fichiers TMX et langue

Les fichiers TMX contiennent des unités de traduction, constituées d'un certain nombre de segments équivalents dans plusieurs langues. Une unité de traduction se compose d'au moins deux variantes d'unité de traduction (VUT). Chacune d'entre elles peut être utilisée comme source ou comme cible.

Les paramètres de votre projet indiquent quelle est la langue source et quelle est la langue cible. OmegaT prend ainsi les variantes d'unité de traduction correspondant au code des langues source et cible du projet et les utilise respectivement en tant que segments source et cible. OmegaT reconnaît les codes de langues de ces deux conventions standards :

  • 2 lettres (par exemple, JA pour japonais), ou

  • un code de langue de 2 ou 3 lettres suivit par le code du pays de deux lettres (par exemple EN-US - Voir Annexe A, Langues - Liste de codes ISO 639 pour avoir une liste partielle des codes de langues et de pays).

Si les codes de langues du projet et le codes de langues TMX correspondent parfaitement, les segments sont chargés dans la mémoire. Si les langues correspondent mais pas le pays, les segments sont quand même chargés. Si ni le code de langue ni le code de pays ne correspondent, les segments seront ignorés.

Les fichiers TMX peuvent généralement contenir des unités de traduction comportant plusieurs langues susceptibles d'être traitées. Si, pour un segment source donné, il n'existe aucune entrée pour la langue cible sélectionnée, tous les autres segments cibles seront chargés (quelle que soit la langue). Par exemple, si la paire de langues du projet est DE-FR, il peut quand même être utile de voir les correspondances de traduction DE-EN s'il n'en existe aucune pour la paire DE-FR.

1.4. Segments orphelins

Le fichier project_save.tmx contient tous les segments qui ont été traduits depuis le début du projet. Si vous modifiez la segmentation du projet ou si vous supprimez des fichiers du dossier source, certaines correspondances peuvent s'afficher en tant que chaînes de caractères orphelines dans le volet Correspondances : ces correspondances concernent des segments qui n'existent plus dans les documents source, puisqu'ils correspondent aux segments traduits et enregistrés avant la modification.

2. Réutilisation des mémoires de traduction

Au départ, c'est-à-dire lorsque le projet est créé, la mémoire de traduction principale du projet, soit project_save.tmx, est vide. Cette mémoire de traduction se remplit au fur et à mesure de la traduction. Pour accélérer ce processus, des traductions préexistantes peuvent être réutilisées. Si une phrase donnée a déjà été traduite une fois (et traduite correctement), elle n'a pas besoin d'être retraduite. Les mémoires de traduction peuvent également contenir des traductions de référence : les législations internationales comme celles de la Communauté européenne en sont un exemple type.

Lorsque vous créez les documents cibles d'un projet OmegaT, la mémoire de traduction est produite sous la forme de trois fichiers localisés dans le dossier racine de votre projet OmegaT (voir description ci-dessus). Vous pouvez considérer ces trois fichiers TMX (-omegat.tmx, -level1.tmx et -level2.tmx) comme une « exportation de la mémoire de traduction », c'est-à-dire une exportation du contenu de votre projet actuel sous forme bilingue.

Si vous désirez réutiliser la mémoire de traduction d'un projet précédent (par ex, parce que le nouveau projet ressemble au projet précédent ou parce qu'il utilise une terminologie qui a déjà été rencontrée), il est possible d'utiliser ces mémoires de traduction en tant « qu'importation des mémoires de traduction », c'est-à-dire de les importer dans votre nouveau projet. Dans ce cas, placez la mémoire de traduction que vous voulez utiliser dans le dossier /tm ou /tm/auto de votre nouveau projet : dans le premier cas, vous obtiendrez des correspondances venant des mémoires de traduction dans le volet Correspondances ; dans le second cas, ces mémoires de traduction seront utilisées pour la prétraduction de votre texte source.

Par défaut, le dossier /tm est localisé dans le dossier racine du projet (par exemple .../MonProjet/tm), mais il est toujours possible de choisir un dossier différent dans la boîte de dialogue de propriétés du projet. Cela est utile si vous utilisez régulièrement des mémoires de traduction produites préalablement (parce qu'elles traitent, par exemple, du même sujet ou qu'elles sont destinées au même client). Dans ce cas, la procédure utile serait :

  • Créez un dossier (un « dossier référentiel ») à un emplacement pratique de votre disque dur qui soit destiné aux mémoires de traduction qui concernent un client ou un sujet en particulier.

  • Quand vous finissez un projet, copiez dans le dossier référentiel un des trois fichiers « exportés » de la mémoire de traduction (ceux-ci sont localisés dans le dossier racine du projet).

  • Lorsque vous commencez un nouveau projet sur le même sujet ou pour le même client, allez dans Projet > Propriétés > Modifier le projet et sélectionnez le dossier référentiel en tant que « dossier des mémoires de traduction ».

Veuillez noter que tous les fichiers TMX localisés dans le référentiel /tm sont analysés lorsque le projet est ouvert. Placer toutes les mémoires de traduction dont vous disposez dans ce dossier risque donc de ralentir OmegaT inutilement. Vous pouvez même supprimer celles dont vous n'avez plus besoin après avoir utilisé leur contenu pour remplir le fichier project-save.tmx.

2.1. Importer et exporter des mémoires de traduction

OmegaT prend en charge les versions importées TMX 1.1-1.4b (level1 et level2) Cela permet aux mémoires de traduction produites par d'autres outils d'être lues par OmegaT. Cependant, Omegat ne prend pas complètement en charge les fichiers importés tmx level 2 (ceux ci ne contiennent pas seulement la traduction, mais aussi le formatage). Les fichiers tmx level 2 seront quand même importés et leur contenu textuel sera visible dans OmegaT, mais la qualité des correspondances sera quelque peu altérée.

OmegaT respecte une procédure très stricte lorsqu'il charge les fichiers de mémoire de traduction (TMX). Si une erreur est détectée dans un de ces fichiers, OmegaT indiquera la position de celle-ci au sein du fichier défectueux.

Certains outils sont connus pour produire des fichiers TMX invalides sous certaines conditions. Pour utiliser ces fichiers comme traductions de référence dans OmegaT, il est nécessaire de les réparer. Dans le cas contraire, OmegaT signalera une erreur et n'arrivera pas à les ouvrir. Les réparations sont des opérations simples et OmegaT facilite le dépannage en affichant les messages d'erreur correspondants. En cas de problème, demandez conseil au groupe d'utilisateurs .

OmegaT exporte les fichiers TMX version 1.4 (level 1 et level 2). L'exportation level 2 n'est pas entièrement conforme au standard level 2 mais en est suffisamment proche et fournira des correspondances correctes dans les autres outils de mémoire de traduction qui prennent en charge les TMX level 2. Si vous n'avez besoin que d'informations textuelles (et pas d'informations de formatage), utilisez le fichier level 1 créé par OmegaT.

2.2. Créer une mémoire de traduction pour les documents sélectionnés

Pour les traducteurs qui ont besoin de partager leurs bases TMX tout en excluant certaines parties ou en n'incluant que la traduction de certains fichiers, il n'est pas question de partager le fichier ProjectName-omegat.tmx complet. La procédure suivante fait partie des nombreuses possibilités existantes. Celle-ci est toutefois facile à suivre et ne présente pas de danger pour le matériel.

  • Créez un projet séparé des autres projets dans la paire de langues désirée et donnez-lui un nom approprié. Veuillez noter que les TMX créés incluront ce nom.

  • Copiez les documents pour lesquels vous avez besoin de mémoires de traduction dans le dossier source du projet.

  • Copiez les mémoires de traduction qui contiennent les traductions des documents ci-dessus dans le sous-dossier tm/auto du nouveau projet.

  • Démarrez le projet. Vérifiez les éventuelles erreurs de balise avec Ctrl+T et les segments non traduits avec Ctrl+U. Pour vérifier que tout est comme vous le souhaitez, appuyez sur Ctrl+D pour créer les documents cibles et vérifier leur contenu.

  • Quand vous quittez le projet, les fichiers TMX du dossier principal du projet (voir ci-dessus) contiennent les traductions (dans la paire de langues sélectionnée) des fichiers que vous avez copiés dans le dossier source. Copiez-les dans un endroit sûr pour les utiliser ultérieurement en tant que références.

  • Pour éviter de réutiliser le projet et donc ne pas risquer de corrompre les cas futurs, supprimez le dossier du projet ou archivez-le à un emplacement séparé de votre poste de travail.

2.3. Partager des mémoires de traduction

Lorsqu'une équipe de traducteurs est impliquée dans un projet, les traducteurs préfèrent partager des mémoires de traduction communes plutôt que de s'échanger leurs versions locales.

OmegaT communique avec SVN et Git, deux systèmes répandus de contrôle et de gestion de version (RCS) en équipe disponibles sous une licence à code source ouvert. Dans le cas d'OmegaT, la totalité des dossiers du projet (en d'autres termes, les mémoires de traduction impliquées ainsi que les dossiers source, les paramètres du projet, etc) est gérée par le logiciel de gestion de versions sélectionné. Voir le chapitre

2.4. Utiliser un fichier TMX avec des paires de langues alternatives

Il peut arriver que vous ayez effectué un projet avec, par exemple, des sources néerlandaises et une traduction en anglais. Ensuite, vous avez par exemple besoin d'une traduction en chinois, mais votre traductrice ne comprend pas le néerlandais. Cependant, elle comprend parfaitement l'anglais. Dans ce cas, la mémoire de traduction NL-EN peut être utilisée comme intermédiaire pour aider à générer la traduction NL vers ZH.

Dans cet exemple, la solution consiste à copier la mémoire de traduction déjà existante dans le sous-dossier tm/tmx2source/ et de la renommer ZH_CN.tmx pour indiquer la langue cible de la TMX. Le traducteur verra des traductions en anglais de segments sources néerlandais et les utilisera pour créer une traduction en chinois.

Important : le fichier TMX de référence doit être renommé XX_YY.tmx, XX_YY correspondant à la langue cible du fichier TMX, par exemple ZH_CN.tmx dans l'exemple ci-dessus. La langue source du projet et du TMX doivent bien sûr être identiques - NL dans notre exemple. Notez qu'une seule TMX est utilisable pour une paire de langues donné. Si plusieurs mémoires de traduction sont impliquées dans le projet, vous devrez donc les fusionner dans le fichier XX_YY.tmx.

3. Les sources ayant des traductions existantes

Certains types de fichiers source (par exemple PO, TTX, etc.) sont bilingues, c'est-à-dire qu'ils servent à la fois de source et de mémoire de traduction. Dans ce cas, la traduction préexistante qui se trouve dans le fichier est incluse dans le fichier project_save.tmx. Elle est considérée comme une traduction par défaut si aucune correspondance n'a été trouvée, ou comme traduction alternative dans le cas où le même segment source existe mais que celui possède un texte cible. Le résultat dépendra donc de l'ordre dans lequel les segments source ont été chargés.

Toutes les traductions des documents source sont également affichées dans le volet Commentaires (en plus d'être affichées dans le volet Correspondances). Dans le cas de fichiers PO, une pénalité de 20 % est appliquée à la traduction alternative (par exemple une correspondance de 100 % devient une correspondance de 80 %). Le mot [Correspondance] est affiché sur le segment source.

Lorsque vous chargez un fichier TTX segmenté, les segments dont la source est identique à la cible seront inclus, si la case « Autoriser une traduction identique à la source » a été cochée dans Options > Ligne d'édition... Pour ne pas être embrouillé, décochez cette option.

4. Mémoire pseudotraduite

Note

N'est intéressant que pour les utilisateurs confirmés !

Avant que les segments ne soient traduits, vous pouvez les prétraiter ou les gérer d'une manière différente de celles proposées dans OmegaT. Par exemple, pour créer une pseudotraduction afin de faire des tests, OmegaT vous permet de créer un fichier TMX supplémentaire qui contient tous les segments du projet. La traduction dans ce TMX peut être soit :

  • Une traduction identique à la source (par défaut)

  • Une traduction laissant le segment vide

Vous pouvez donner n'importe quel nom au fichier TMX. Une mémoire pseudotraduite peut être créée avec les paramètres de lignes de commande suivants :

java -jar omegat.jar --pseudotranslatetmx=<nom de fichier> [pseudotranslatetype=[equal|empty]]

Remplacez <nom de fichier> par le nom du fichier que vous voulez créer, absolu ou relatif au dossier de travail en cours (le dossier à partir duquel vous lancez OmegaT). Le deuxième argument --pseudotranslatetype est optionnel. Sa valeur est soit equal (valeur par défaut avec la source identique à la cible) soit empty (le segment cible est vide). Vous pouvez traiter le fichier TMX créé avec l'outil de votre choix. Pour le réutiliser dans OmegaT, renommez le project_save.tmx et placez-le dans le dossier omegat de votre projet.

5. Mise à niveau des mémoires de traduction

Les toutes premières versions d'OmegaT ne pouvaient segmenter les fichiers sources que par paragraphe et étaient incohérentes lors de la numérotation des balises de formatage des fichiers HTML et Open Document. OmegaT peut détecter et mettre à jour immédiatement de tels fichiers TMX pour améliorer la qualité des correspondances et mieux exploiter vos traductions préexistantes, ce qui vous évite d'avoir à le faire manuellement.

Le fichier TMX d'un projet ne sera mis à jour qu'une fois et sera écrit dans sa forme mise à jour dans le fichierproject-save.tmx ; les anciens fichiers TMX seront mis à jour immédiatement à chaque fois que le projet est chargé. Notez que dans certains cas les modifications apportées aux filtres de fichiers dans OmegaT peuvent aboutir à des segmentations complètement différentes. Vous devrez donc mettre à jour votre traduction manuellement pour certains cas isolés.