Chapter 13. Memorias de traduction:

1. Le memorias de traduction in OmegaT
1.1. Le plicas pro le tmx - ubication e propositos
1.2. copia de reserva del tmx
1.3. files e lingua del tmx
1.4. Segmentos orphane
2. Reusar le memorias de traduction
2.1. Importar e exportar le memorias de traduction
2.2. Crear un memoria de traduction pro le documentos eligite
2.3. Compartir memorias de traduction
2.4. Usar le TMX con copulas de lingua alternative
3. Fontes con le traductiones existente
4. Memoria Pseudo-rendite
5. Promover le memorias de traduction

1. Le memorias de traduction in OmegaT

1.1. Le plicas pro le tmx - ubication e propositos

Le projectos de OmegaT pote tener le files memoria de traduction - id es files con le extension tmx - in cinque distincte locos:

plica omegat

Le plica omegat contine le project_save.tmx e possibilemente plure files TMX de reserva (formato project_save.tmx.AAAAMMDDHHmm.bak). Le file project_save.tmx contine omne le segmentos que esseva registrate in memoria desde tu ha initiate le projecto. Iste file existe sempre in le projecto. Su contentos essera sempre ordinate alphabeticamente per le segmento fonte.

plica principal del projecto

Le plica principal del projecto contine 3 files tmx, project_name-omegat.tmx, project_name-level1.tmx e project_name-level2.tmx (project_name es le nomine de tu projecto).

  • Le file level1 contine sol informationes textual.

  • Le file level2 incapsula le tags specific de OmegaT in tags tmx correcte al fin que on potera usar iste file, con su information de formato, in un application de traduction que supporta memorias tmx de nivello 2, o in OmegaT mesme.

  • Le file OmegaT include tags de formato specific de OmegaT de maniera que on pote usar iste file con OmegaT in altere projectos

Iste files es copias del file project_save.tmx, id es del memoria de traduction del projecto principal, sin le si-appellate segmentos orphane. Illos porta nomines appropriatemente cambiate, pro que su contentos remane ancora identificabile, quando usate alibi, per exemplo in le sub plica tm de alicun altere projecto (vider in sequito).

plica tm

Le plica /tm/ pote continer qualcunque numero de memorias de traduction auxiliar - id es files tmx. On pote crear tal files in qualcunque del tres varietates supra indicate. Nota que altere instrumentos CAT pote exportar (e importar) files tmx, habitualmente in omne le tres formas. Le melior cosa naturalmente es usar files TMX specific pro OmegaT (vide supra), de maniera que es retenite le formato intra le segmento.

Le contentos del memorias de traduction in le sub plica tm serve a generar suggestiones pro le texto(s) a traducer. Omne le textos, jam rendite e registrate in ille files, apparera inter le concordantias partial, si illo es satis simile al texto actualmente a render.

Si le segmento original in uno del TMs auxiliar es identic al texto a render, OmegaT age como definite in le fenestra de dialogo OptionesComportamento de Modification... . Per exemplo (si le concordantia base es acceptate), le traduction ex le TM auxiliar es acceptate e marcate per le prefixo [fuzzy], de maniera que le traductor pote revider le traductiones in un grado sequente e controlar si le segmentos etiquettate in iste modo, esseva rendite correctemente (Vide le capitulo Comportamento de Modification).

Il pote occurrer, que memorias de traduction, disponibile in le sub-classificator tm, contine segmentos con texto fonte identic, ma textos rendite differente. Le files TMX es legite un linea al vice, ordinate secundo lor nomines e segmentos, intra un file TMX date. Assi prevalera le ultime segmento con le identic texto fonte (Note: naturalmente ha plus senso evitar que isto occurre in le prime posto).

Nota que le le files TMX in le plica tm pote esser comprimite per gzip.

plica tm/auto

Si illo es clar a partir del initio, que le traductiones in certe TMs es omne correcte, on pote mitter los in le plica tm/auto e evitar de confirmar multe casos [fuzzy].

  1. Pone le TMX in /tm/auto.

  2. Aperi le projecto Le cambiamentos es displicate.

  3. Facer un legier cambiamento ubicunque in le projecto. Isto modifica le memoria de traduction project_save.tmx (per le addition de proprie unitates de traduction ex le TMX del plica "auto")

Nota: si le TMX es removite ab le plica /tm/auto ante le grado 3, nulle unitate de traduction extra es addite.

plica tm/enforce

Si tu non ha ulle dubita que un TMX es plus accurate del file project_save.tmx de OmegaT, pone iste TMX in le plica /tm/enforce pro superscriber inconditionatemente le traductiones base existente.

  1. Pone le TMX in /tm/enforce.

  2. Aperi le projecto Le cambiamentos es displicate.

  3. Facer un legier cambiamento ubicunque in le projecto. Isto modifica project_save.tmx.

  4. Prender decision circa le immunitate del segmentos vigente:

    • Si il non necessita remaner immune de additional cambiamentos, pois remove le TMX ab le plica /tm/enforce.

    • Si il necessita remaner immune de additional cambiamentos, pois mantene le TMX in /tm/enforce.

Nota: si TMX es removite ab /tm/enforce ante le grado 3, le fortiamentos non essera mantenite del toto.

plica tm/mt

In le quadro del Modification, quando un concordantia es inserite per un TMX continite in un plica nominate mt, le fundo del segmento active es cambiate in rubre. Quando le segmento es lassate le fundo es restaurate a normal.

plicas tm/penalty-xxx

Alicun vices, il es utile distinguer inter memorias de traduction de alte qualitate e illos que es, a causa del stato minus digne de fide del materia subjecto, del cliente, del revision, etc. Pro le memorias de traduction in le plicas con nomine "penalty-xxx" (con xxx inter 0 e 100), le concordantias essera degradate secundo le nomine del plica: un concordantia 100% in omne de TMs, residente in un plica nominate Penalty-30 per exemplo, essera diminuite a un concordantia del 70%. Le penalitate refere a omne le tres percentual de concordantia: concordantias 75, 80, 90 essera in iste caso diminuite a 45, 50, 60.

Optionalmente, tu pote permitter que OmegaT ha, alicubi tu specifica lo, un file tmx additional (OmegaT-style), continente tote segmentos traducibile del projecto. Vide memoria pseudo-rendite in ultra.

Nota que omne le memorias de traduction es cargate in memoria quando le projecto es aperte. Copias de reserva del memoria de traduction del projecto es producite regularmente (vide le capitulo successive), e project_save.tmx es alsi salvate/renovate quando le projecto es clause o cargate de nove. Isto significa per exemplo que tu non necessita exir de un projecto re le qual tu actualmente labora, si tu decide de adder a illo un altere TM auxiliar: tu recarga simplemente le projecto, e le cambiamentos tu ha facite essera includite.

Le locationes del varie differente memorias de traduction pro un projecto date es definite per le usator (vide le fenestra de dialogo Projecto in Proprietates de Projecto)

Dependente del situation, es assi possibile strategias differente, per exemplo:

plure projectos sur le mesme subjecto: retene le structura del projecto, e cambia plicas fonte e destination (Fonte = source/order1, destination = target/order1 etc). Nota que tu segmenta ex order1, illo que non es presente in order2 e altere obras subsequente, essera taggate como segmentos orphane; comocunque, illos essera ancora utile pro concordantias partial.

plure traductores laborante sur le mesme projecto: finde le files fonte in source/Alice, source/Bob... e ubica los a membros del equipa (Alice, Bob ...). Illes pote ergo crear lor proprie projectos e, committer lor proprie project_save.tmx, quando finite o quando un certe petra milliari esseva attingite. Le files project_save.tmx es alora colligite e per exemplo es resolute conflictos eventual re le respecto del terminologia. Es alora create un nove version del TM maestro, o pro ser placiate in le sub plicas tm/auto del membros del equipa o pro reimplaciar lor files project_save.tmx. Le equipa pote alsi usar le mesme structura de sub plica pro le files final. Isto permitte los per exemplo a verificar in omne momento, si le version final pro le projecto complete es ancora OK

1.2. copia de reserva del tmx

Quando tu rende tu files, OmegaT registra tu labor a omne instante in project_save.tmx in le sub plica del projecto /omegat.

OmegaT alsi face copias de reserva del memoria de traduction a project_save.tmx.YEARMMDDHHNN.bak in le mesme sub plica quandocunque un projecto es aperte o recargate. YEAR es le anno in 4 cifras, MM es le mense, DD le die del mense, e HH e NN son le horas e minutas quando le previe memoria de traduction esseva salvate.

Si tu crede que tu ha perdite datos del traduction, seque le procedura sequente:

  1. Claude le projecto

  2. Renomina le file project_save.tmx actual ( per exemplo a project_save.tmx.temporary)

  3. Elige le copia de reserva del memoria de traduction que es le plus probabile a continer le data correcte pro le qual tu quere - per exemplo le plus recente, o le ultime version ex le die precedente

  4. Copia lo in project_save.tmx

  5. Aperi le projecto

1.3. files e lingua del tmx

Le files Tmx contine unitates de traduction, facite de plure segmentos equivalente in alicun linguas. Un unitate de traduction include al minus duo variantes de unitate de traduction (TUV). Cata uno pote esser usate como le fonte o le destination.

Le preparationes in tu projecto indica qual es le lingua fonte e qual le lingua de destination. OmegaT assi sume le segmentos TUV correspondente al codices fonte e destination del projecto e usa los ut segmentos fonte e destination respectivemente. OmegaT recognosce le codices lingua usante le duo conventiones standard sequente:

  • codice de lingua de 2 litteras (e.g. JA pro japonese), o

  • codice de lingua de 2 o 3 litteras sequite per le codice del pais de 3 litteras (per exemplo EN-US - Vide Appendix A, Linguas - lista del codices ISO 639 pro un lista partial de codices de lingua e pais).

Si le codices lingua del projecto e le codices lingua del tmx concorda in detalio, le segmentos son cargate in memoria. Si le linguas concorda me non le pais, le segmentos ancora es cargate. Si ni le codice lingua ni le codice pais concorda, le segmentos essera ignorate.

Le files TMX pote continer generalmente unitates de traduction con plure linguas candidate. Si pro un date segmento fonte il ha nulle entrata pro le lingua de destination eligite, omne altere segmentos destination es cargate, sin reguardo del lingua. Per exemplo, si le copula de lingua del projecto es DE-FR, il pote esser ancora de alicun adjuta vider in le traduction DE-EN, si il ha necun in le par DE-FR.

1.4. Segmentos orphane

Le file project_save.tmx contine omne le segmentos que esseva rendite depois que tu initiava tu projecto. Si tu modifica le segmentation del projecto o dele files in le fonte, alcun concordantias pote apparer como lineas de characteres orphane in le quadro del concordantia: tal concordantias se refere a segmentos que non existe alicun plus in le documentos fonte, pois que illos corresponde a segmentos rendite e registrate ante que le modificationes habeva loco.

2. Reusar le memorias de traduction

Initialmente, id es quando le projecto es create, le TM principal del projecto, project_save.tmx es vacue. Iste TM gradualmente deveni plen durante le traduction. Pro accelerar iste processo, pote esser reusate traductiones existente. Si un phrase date esseva jam rendite un vece, e rendite correctemente, il non ha necessitate pro retraducer lo. Le memorias de traduction pote alsi continer traductiones de referentia: legislation multinational, assi como celle del Communitate Europee, es un exemplo typic.

Quando tu crea le documentos final in un projecto OmegaT, le memoria de traduction del projecto es emittite in le forma de tres files in le plica radice de tu projecto OmegaT (vide le description precedente). Tu pote considerar iste tres files TMX (-omegat.tmx, -level1.tmx e -level2.tmx) como un "memoria de traduction pro exportation", id es como un exportation de tu contento del projecto actual in forma bilingue.

debe tu desirar de reusar un memoria de traduction de un projecto previe (per exemplo quia le nove projecto es simile al projecto previe, o usa terminologia que poteva esser usate antea), tu pote usar iste memorias de traduction como "memorias de traduction de ingresso", id es pro importar los in tu nove projecto. In iste caso, pone le memorias de traduction tu desidera usar in le plica /tm o /tm/auto de tu nove projecto: in le prime caso tu obtenera occurrentias ex iste memorias de traduction in the quadro del concordantias partial, e in le ultime caso iste TMs essera usate pro pre-traducer tu texto fonte.

Normalmente, le plica /tm es sub le plica radice del projecto (per exemplo .../MyProject/tm), ma tu pote eliger un plica differente in le fenestra de dialogo Proprietates de projecto si tu lo desira. Isto es utile si tu usa frequentemente memorias de traduction producite in le passato, per exemplo quia illos son re le identic subjecto o pro le mesme cliente. In iste caso, un procedura utile poterea esser:

  • Crear un plica (un "plica repositorio") in un position commode sur tu disco dur, pro le memorias de traduction, re un cliente o subjecto particular.

  • Quandocunque tu fini un projecto, copia uno del tres files memoria de traduction "exportation" ex le plica radice del projecto al plica repositorio.

  • Quando tu initia un nove projecto re le mesme subjecto o pro le mesme cliente, naviga al plica repositorio in le fenestra de dialogo Projecto > Proprietates > Modification Projecto e selige lo como le plica del memoria de traduction.

Nota que omne le files TMX in le repositorio /tm es analysate quando le projecto es aperte, assi tu, ponente omne le varie TMs que tu pote haber per manos in iste plica, pote inutilemente retardar OmegaT. Tu pote etiam considerar de remover illos que non son plus necessari, un vice que tu ha usate lor contentos pro reimpler le file project-save.tmx.

2.1. Importar e exportar le memorias de traduction

OmegaT supporta versiones de tmx importate 1.1-1.4b (tote le duo nivello 1 e nivello 2). Isto habilita le memorias de traduction producite per altere instrumentos a ser legite per OmegaT. Totevia, OmegaT non supporta in detalio le files TMX nivello 2 importate (istos registra non sol le traduction, ma alsi le formattation). Le files TMX nivello 2 essera ancora importate e lor contento textual pote esser vidite in OmegaT, ma le qualitate del concordantias partial essera alquanto inferior.

OmegaT seque proceduras multo stricte quando carga files memoria de traduction (tmx). Si es trovate un error in tal file, OmegaT marcara le position, intra le file defective, ubi es localisate le error.

Qualque applicationes son note producer files tmx invalide sub certe conditiones. Si tu desira usar tal files como traductiones de referentia in OmegaT, illos debe esser reparate, o OmegaT reportara un error e fallera a cargar los. Le reparationes es operationes trivial e OmegaT assiste le chassa al defecto con le message de error message pertinente. Tu pote demandar al Gruppo del usator pro le consilio si tu ha problemas.

OmegaT exporta files TMX version 1.4 (ambe nivello 1 e nivello 2). Le exportation nivello 2 non es plenmente conforme con le standard nivello 2, ma es satis prope e generara concordantias correcte in altere applicationes pro memorias de traduction que supporta le TMX nivello 2. Si tu necessita solmente information textual (e non information de formattation), usa le file nivello 1 que OmegaT ha create.

2.2. Crear un memoria de traduction pro le documentos eligite

In caso que plus traductores necessita compartir lor bases de TMX e excluder alicun de lor partes o includer justo traductiones de certe files, participar le complete ProjectName-omegat.tmx es foras question. Le procedura sequente es justo uno del possibilitates, ma bastante simplice pro sequer e sin ulle periculos pro le avantages.

  • Crear un projecto, separate pro altere projectos, in le par de linguas desiderate, con un nomine appropriate - nota que le TMXs create includera iste nomine.

  • Copia le documentos, pro le qual tu necessita le memoria de traduction, in le plica fonte del projecto.

  • Copia le memorias de traduction, continente le traductiones del documentos precedente, in le sub plica tm/auto del nove projecto.

  • Aperi le projecto. Controla pro eventual errores de Tag con Ctrl+T e segmentos non rendite con Ctrl+U. Pro controlar que omne cosa es como expectate, tu pote pulsar Ctrl+D pro crear le documentos final e controlar lor contentos.

  • Quando tu termina le projecto. le files TMX in le plica principal del projecto (vide supra) ora contine le traductiones in le copula de linguas seligite pro le files que tu ha copiate in le plica /source. Copia los in un posto secur pro referentias futur.

  • Pro evitar de reusar le projecto e ita possibilemente contaminar casos futur, dele le plica del projecto o archiva lo foras de tu posto del labor.

2.3. Compartir memorias de traduction

In casos ubi un equipa de traductores es implicate, le traductores preferera compartir le memorias de traduction commun plus tosto que distribuer lor versiones local.

OmegaT functiona con SVN e Git, duo commun systemas software pro equipa de controlo de version e revision (RCS), disponibile sub licentia open source. In caso de plicas Projecto complete OmegaT - in in altere parolas le memorias de traduction implicate assi como le plicas fonte, le preparationes del projecto etc - son tractate per le RCS eligite. vide plus in le Capitulo

2.4. Usar le TMX con copulas de lingua alternative

Poterea esser le casos ubi tu ha facite un projecto con, per exemplo, fontes nederlandese, e un traduction in anglese. Pois tu necessita un traduction in, per exemplo, chinese, ma tu traductor non comprende le nederlandese; ille, comocunque, comprende a perfection le anglese. In iste caso le memoria de traduction NL-EN pote servir como un medio pro adjutar a generar le traduction de NL a ZH.

Le solution in nostre exemplo es de copiar le memoria de traduction existente in le sub plica tm/tmx2source/ e renominar lo ZH_CN.tmx pro indicar le nove lingua de destination del TMX. Al traductor essera monstrate le traductiones anglese pro le segmentos fonte in nederlandese e usar los pro crear le traduction chinese.

Importante: le TMX que supporta debe esser renominate XX_YY.tmx, ubi XX_YY es le lingua de destination del TMX, per exemplo a ZH_CN.tmx in le exemplo precedente. Le linguas fonte del projecto e del TMX debe naturalmente esser identic: - NL, in nostre exemplo. Nota que sol un TMX pro un date copula de linguas es possibile, ergo si debe implicar plure memorias de traduction, tu necessitara funder los omne in le XX_YY.tmx.

3. Fontes con le traductiones existente

Alicun typos de Files fonte (per exemplo PO, TTX, etc.) son bilingue, id es illos serve ambe como un fonte e como un memoria de traduction. In tal casos, un traduction existente, trovate in le file, es includite in le project_save.tmx. Illo es tractate como un traduction base, si nulle concordantia esseva trovate, o como traduction alternative, in caso le identic segmento fonte existe, ma con un texto de destination. Le resultato dependera assi ab le ordine in le qual le segmentos fonte esseva cargate.

Omne le traductiones ex le documentos fonte son alsi monstrate in le quadro del Commento, in ultra al quadro del Concordantia. In caso de files PO, es applicate un penalitate del 20% al traduction alternative (id es, un concordantia del 100% deveni un concordantia del 80%). Le parola [Fuzzy] es monstrate sur the segmento fonte.

Quando tu carga un file TTX segmentate, le segmentos con fonte = destination essera includite, si esseva marcate le cassa "Permitte traduction equal a fonte " in Optiones → Comportamento de Modification... Isto pote generar confusion, ita tu pote considerar de levar le marca a iste option in iste caso.

4. Memoria Pseudo-rendite

Note

Interessante sol pro usatores experte!

Ante que le segmentos sia rendite, tu pote desirar pre-processar o adressar los in alicun altere maniera que es possibile con OmegaT. Per exemplo, si tu desira crear un pseudo-traduction pro le fines de proba, OmegaT habilita te a crear un file TMX additional que contine omne le segmentos del projecto. Le traduction in iste TMX pote esser o

  • un traduction equal al fonte (base prefixate initial) o

  • le segmento rendite es vacue

Al file TMX pote esser date omne nomine que tu attribue. Un memoria pseudo-rendite pote esser generate con le parametros de linea de commando sequente:

java -jar omegat.jar --pseudotranslatetmx=<filename> [pseudotranslatetype=[equal|empty]]

Replacia <filename> con le nomine del file que tu desira crear, o absolute o relative al plica currente (le plica ex le qual tu lancea OmegaT). Le secunde argumento --pseudotranslatetype es optional. Su valor es o equal (valor prefixate initial, pro source=target) o empty (le segmento de destination es vacue). Tu pote processar le TMX generate con qualcunque instrumento tu vole. Pro reusar lo in OmegaT renomina lo in project_save.tmx e pone lo in le plica omegat- de tu projecto.

5. Promover le memorias de traduction

Le versiones initial de OmegaT esseva capabile de segmentar le Files fonte in paragraphos solmente e esseva inconsistente le numeration del tags de formattation in files HTML e Open Document. OmegaT pote discoperir e promover tal files TMX al volo pro accrescer le qualitate del Concordantia partial e elevar melio tu traduction existente, sparniante te del travalio de facer isto manualmente.

Un TMX del projecto essera promovite sol un vice, e essera scripte in forma promovite in le project-save.tmx; le files TMX hereditage essera promovite al volo cata vece le projecto es cargate. Nota que in alicun casos le cambiamentos in le filtros de file in OmegaT pote ducer a segmentation totalmente differente; in consequentia, tu debera promover tu traduction manualmente in tal rar casos.