Chapter 9. Ficheiros a traducir

1. Formatos de ficheiro
1.1. Ficheiros de texto plano
1.2. Ficheiros de texto formatados
2. Outros formatos de ficheiro
3. Linguas de escritura de dereita a esquerda (RTL)
3.1. Mestura de cadeas RTL e LTR nos segmentos
3.2. Etiquetas de OmegaT en segmentos RTL
3.3. Crear documentos RTL traducidos

1. Formatos de ficheiro

Pode empregar OmegaT para traducir ficheiros en varios formatos. Hai basicamente dous tipos de formatos: texto plano e texto formatado.

1.1. Ficheiros de texto plano

Os ficheiros de texto plano só conteñen texto, polo que a súa tradución é tan sinxela como escribila. Hai moitos métodos para especificar a codificación dun ficheiro de modo que os contidos non se líen cando se abran en OmegaT. Estes ficheiros non conteñen ningunha información de formatado mais aló de espazos en branco empregados para aliñar o texto, indicar parágrafos e inserir saltos de liña. Non poden conter ou manter información relacionada á cor, fonte, etc. do texto. Actualmente, OmegaT é compatíbel cos seguintes formatos de texto plano:

  • Texto ASCII (.txt, etc.)

  • Texto codificado (*.UTF8)

  • Paquetes de recursos Java (*.properties)

  • Ficheiros PO (*.po)

  • Ficheiros (clave=valor) INI (*.ini)

  • Ficheiros DTD (*.DTD)

  • Ficheiros DokuWiki (*.txt)

  • Ficheiros de título SubRip (*.srt)

  • Ficheiros de Magento CE Locale CSV (*.csv)

OmegaT pode xestionar outros tipos de ficheiro de texto plano asociando a extensión de ficheiro a un tipo de ficheiro compatíbel (por exemplo, os ficheiros .pod poden asociarse a un filtro de texto ASCII) e preprocesándoos con regras de segmentación específicas.

Os ficheiros PO poden conten tanto o texto de orixe coma o de destino. Desde este punto de vista, hai ficheiros de texto plano máis memorias de tradución. Se para un segmento de orixe dado aínda non hai unha tradución existente na memoria de tradución do proxecto (project_save.tmx), a tradución actual gardarase en project_save.tmx como a tradución predeterminada. Aínda si, se xa existe o segmento de orixe cunha tradución diferente, gardarase a nova tradución como unha tradución alternativa.

1.2. Ficheiros de texto formatados

Os ficheiros de texto formatado conteñen información como o tipo de fonte, tamaño, cor, etc. así como o texto. Créanse normalmente en procesadores de texto ou editores de HTML. Estes formatos de texto están deseñados para manter a información do formato. A información do formato pode ser tan simple como «isto está en negra», ou tan complexo como datos en táboas con diferentes tamaños de fonte, cores, posicións, etc. Na maioría dos traballos de tradución, se considera importante que se manteña o formato do texto orixinal na tradución. OmegaT permite facer isto marcando os caracteres/palabras que teñan un formato especial con etiquetas sinxelas de xestionar. A simplificación do formato do texto orixinal contribúe enormemente para reducir o número de etiquetas. Cando sexa posíbel, a unificación de fontes, tamaño de fontes, cores, etc. empregados nun documento, simplifica a tarefa de tradución e reduce o número posíbel de erros de etiquetas. Cada tipo de ficheiro xestiónase de modo diferente en OmegaT. Pode configurarse un comportamento específico nos filtros de ficheiro. Cando se redactou este texto, OmegaT era compatíbel cos seguintes formatos de texto formatado:

  • ODF - OASIS Open Document Format (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)

  • Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)

  • (X)HTML (*.html, *.xhtml,*.xht)

  • Compilador de axuda HTML (*.hhc, *.hhk)

  • DocBook (*.xml)

  • XLIFF (*.xlf, *.xliff, *.sdlxliff) - da variedade orixe=destino

  • QuarkXPress CopyFlowGold (*.tag, *.xtg)

  • Ficheiros ResX (*.resx)

  • Recursos para Android (*.xml)

  • LaTex (*.tex, *.latex)

  • Ficheiros de Axuda (*.xml) e Manuais (*.hmxp)

  • Typo3 LocManager (*.xml)

  • Localización WiX (*.wxl)

  • Iceni Infix (*.xml)

  • Exportación a Flash XML (*.xml)

  • TXML de Wordfast (*.txml)

  • Camtasia para Windows (*.camproj)

  • Visio (*.vxd)

OmegaT tamén pode aceptar outros tipos de ficheiro de texto formatado asociando a súa extensión a un tipo de ficheiro compatíbel, asumindo que as regras de segmentación correspondentes os segmentará correctamente.

2. Outros formatos de ficheiro

Poden existir outros formatos de texto plano ou formatado apropiados para o seu procesamento en OmegaT.

Poden empregarse ferramentas externas para converter ficheiros a un formato compatíbel. Os ficheiros traducidos necesitarán ser convertidos de novo ao formato orixinal. Por exemplo, se ten unha versión desactualizada de Microsoft Word, que non é compatíbel co formato ODT, aquí vai un pequeno truco para ficheiros coa extensión DOC:

  • importe o ficheiro nun procesador de textos ODF

  • garde o ficheiro en formato ODT

  • tradúzao no ficheiro ODT de destino

  • cargue o ficheiro de destino nun procesador de textos ODF

  • garde o documento coma un ficheiro DOC

A calidade do formato do ficheiro traducido dependerá na calidade das varias conversións. Antes de facer estas conversións, asegúrese ter probado todas as opcións. Comprobe a páxina web de OmegaT para unha lista actualizada de ferramentas de asistencia á tradución.

3. Linguas de escritura de dereita a esquerda (RTL)

A xustificación dos segmentos de orixe e destino depende das linguas do proxecto. De xeito predeterminado, se emprega unha xustificación á esquerda para as linguas de escritura de esquerda a dereita (LTR) e unha xustificación á dereita para as linguas de escritura de dereita á esquerda (RTL) Pode cambiar entre os distintos modos premendo Shift+Ctrl+O (é a letra O, non o numeral 0). A combinación Shift+Ctrl+O ten tres estados:

  • xustificación predeterminada, que é a definida polo idioma

  • xustificación á esquerda

  • xustificación á dereita

O emprego do modo RTL en OmegaT non ten ningunha influencia nin sequera na disposición dos documentos traducidos creados en OmegaT. O modo dos documentos traducidos debe cambiarse na aplicación (como Microsoft Word) empregada comunmente para amosar ou modificalos (comprobe os manuais relevantes para máis detalles). O emprego de Shift+Ctrl+O fai que tanto o texto inserido coma a aparencia de OmegaT cambien. Pode empregarse por separado para os tres paneis (editor, coincidencias parciais e glosario) facendo clic no panel e activando o modo. Tamén pode empregarse nos campos de inserción de OmegaT (na xanela de buscas, para as regras de segmentación, etc.)

Nota para os usuarios de Mac OS X: empregade o atallo Shift+Ctrl+O e non cmd+Ctrl+O.

3.1. Mestura de cadeas RTL e LTR nos segmentos

Cando está escribindo un texto puramente RTL, pode empregar a vista predeterminada (LTR). Porén, en moitos casos é necesario inserir texto LTR en texto RTL. Por exemplo, nas etiquetas de OmegaT, nomes de produtos que teñen que permanecer no idioma LTR orixinal, marcadores de posición en ficheiros de localización e números en texto. En casos coma este, é necesario cambiar ao modo RTL, de modo que o texto RTL (en realidade bidireccional) se amose correctamente. Deberiamos destacar que cando OmegaT está en modo RTL, tanto a orixe coma o destino amósanse en modo RTL. Isto significa que se o idioma de orixe é LTR e o idioma de destino é RTL, ou viceversa, pode ser necesario cambiar alternativamente entre os modos RTL e LTR para ver o segmento de orixe e inserir o de destino dun xeito fácil nos seus respectivos modos.

3.2. Etiquetas de OmegaT en segmentos RTL

Como se dixo anteriormente, as etiquetas de OmegaT son cadeas LTR. Cando traducimos entre un idioma RTL e LTR, ler correctamente as etiquetas do orixinal e inserilas propiamente na tradución pode requirir que o tradutor cambie entre os modos LTR e RTL varias veces.

Se o documento o permite, animamos ao tradutor a que retire información en canto ao estilo do documento orixinal de modo que aparezan o menor número de etiquetas posíbel na interface ce OmegaT. Siga as indicacións que lle damos nos Consellos para a xestión de etiquetas. Valide as etiquetas frecuentemente (vexa Validación de etiquetas) e produza os documentos traducidos (vexa máis abaixo e Menú) a intervalos regulares para facer máis fácil atopar calquera problema que poida xurdir. Un consello: traducir unha versión en texto plano do texto e engadir despois as marcas de estilo necesarias na aplicación adecuada despois de realizar a tradución pode ser menos complicado.

3.3. Crear documentos RTL traducidos

Cando se crea o documento traducido, a súa dirección será a mesma que a do documento orixinal. Se o documento orixinal era LTR, a dirección do documento de destino debe cambiarse manualmente a RTL na aplicación adecuada. Cada formato ten os seus modos específicos de xestionar a disposición RTL: comprobe os manuais das aplicacións relevantes para máis detalles.

Para os ficheiros .docx, fanse algúns cambios automaticamente:

  • Os parágrafos, seccións e táboas configúranse en bidi
  • Os elementos do texto configúranse en RTL

Para evitar o cambio de parámetros de disposición dos ficheiros de destino cada vez que se abren os ficheiros, pode que sexa posíbel cambiar os parámetros de disposición do ficheiro orixe para que eses parámetros sexan herdados polos ficheiros de destino. Estas modificacións son posíbeis nos ficheiros ODF, por exemplo.