Chapter 9. File da tradurre

1. Formati di file
1.1. File di solo testo
1.2. File di testo formattato
2. Altri formati di file
3. Lingue da destra a sinistra
3.1. Unire stringhe RTL e LTR in segmenti
3.2. Tag OmegaT nei segmenti RTL
3.3. Creare documenti di arrivo RTL

1. Formati di file

Con OmegaT si possono tradurre vari tipi di formati di file. Vi sono due tipi principali di formati di file: il formato solo testo e il testo formattato.

1.1. File di solo testo

I file di solo testo sono composti da testo semplice, pertanto la loro traduzione richiede unicamente di digitare la traduzione corrispondente. Esistono diversi metodi per specificare la codifica del file, affinché il suo contenuto non sia alterato quando aperto in OmegaT. Tali file non contengono alcuna informazione di formattazione oltre lo "spazio bianco" usato per allineare il testo, indicare paragrafi o inserire interruzioni di pagina. Essi non sono in grado di contenere o mantenere informazioni sul colore, il carattere, e via discorrendo, del testo. Attualmente, OmegaT è in grado di riconoscere i seguenti formati di file di solo testo:

  • File di testo ASCII (.txt, ecc.)

  • Testo codificato (*.UTF8)

  • Java resource bundles (*.properties)

  • file PO (*.po)

  • INI (codice=valore) files (*.ini)

  • file DTD (*.DTD)

  • file DokuWiki (*.txt)

  • file di titoli SubRip (*.srt)

  • File CSV locale Magento CE (*.csv)

Gli altri tipi di file di solo testo possono essere gestiti associando la loro estensione a un tipo di file supportato da OmegaT (per esempio, i file .pod si possono associare al filtro di testo ASCII) e pre-elaborandoli con regole di segmentazione specifiche.

I file PO possono contenere sia il testo di partenza, sia quello di destinazione. Da questo punto di vista, possono essere considerati come file di solo testo più le memorie di traduzione. Se per uno specifico segmento di partenza non è ancora presente una traduzione nella memoria di traduzione del progetto (file project_save.tmx), l'attuale traduzione verrà salvata come traduzione predefinita nel file project_save.tmx. Nel caso in cui, tuttavia, per lo stesso segmento di partenza esistesse una traduzione diversa, la nuova traduzione verrà salvata come alternativa.

1.2. File di testo formattato

I file di testo formattato contengono sia le informazioni relative al tipo di carattere, alla sua dimensione, al suo colore, ecc., sia il testo vero e proprio. Vengono di solito creati da software di elaborazione del testo o da editor HTML. Questi formati di file vengono strutturati per conservare le informazioni di formattazione. Le informazioni di formattazione possono essere di tipo semplificato, come nel caso di "questo è un neretto", oppure di tipo complesso, come nel caso di dati contenuti in tabella con diverse dimensioni di carattere, colori, allineamenti, ecc. Nella maggior parte dei lavori di traduzione, l'elemento importante è che la formattazione del documento originale sia mantenuta nel documento tradotto. OmegaT consente di ottenere questo risultato racchiudendo fra marcatori (o tag) i caratteri/parole associati a un particolare tipo di formattazione, con una facile gestione di tali marcatori. La semplicità della formattazione del testo originale contribuisce in modo sostanziale alla riduzione del numero dei tag. Quando è possibile, si dovrebbe prendere in considerazione l'uniformazione dei caratteri utilizzati, della loro dimensione, dei loro colori ecc., in modo da semplificare il processo di traduzione e ridurre la quantità di possibili errori nei tag. OmegaT gestisce in modo differente i vari tipi di file. Gli specifici comportamenti possono essere impostati nei filtri dei file. Al momento della stesura di questa guida, OmegaT è in grado di riconoscere i seguenti formati di file formattati:

  • ODF - OASIS Open Document Format (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)

  • Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)

  • (X)HTML (*.html, *.xhtml,*.xht)

  • compilatore HTML Help (*.hhc, *.hhk)

  • DocBook (*.xml)

  • XLIFF (*.xlf, *.xliff, *.sdlxliff) - della varietà origine=destinazione

  • QuarkXPress CopyFlowGold (*.tag, *.xtg)

  • file ResX (*.resx)

  • risorsa Android (*.xml)

  • LaTex (*.tex, *.latex)

  • file di Guide (*.xml) e Manuali (*.hmxp) files

  • Typo3 LocManager (*.xml)

  • localizzazione WiX (*.wxl)

  • Iceni Infix (*.xml)

  • esportazione Flash XML (*.xml)

  • Wordfast TXML (*.txml)

  • Camtasia per Windows (*.camproj)

  • Visio (*.vxd)

  • Java property XML (*.xml)

  • Schematron (*.sch)

  • schema RELAX NG per XML (*.rng)

Gli altri tipi di file di testo formattato possono essere gestiti da OmegaT associando le loro estensioni di file a un tipo supportato, presupponendo che le regole di segmentazione corrispondenti li segmentino correttamente.

2. Altri formati di file

Possono esistere anche altri formati di file di solo testo o formattati che OmegaT è in grado di elaborare.

Per convertire i nei formati supportati possono essere usati gli strumenti esterni. I file tradotti dovranno poi essere riconvertiti nel formato originale. Per esempio, se si possiede una versione datata di Microsoft Word che non gestisce il formato ODT, esiste un modo per aggirare i file Word con estensione DOC:

  • importare il file nel writer ODF

  • salvare il nel formato ODT

  • tradurlo nel file di arrivo ODT

  • caricare il file di destinazione nel writer ODF

  • salvare il file con estensione DOC

La qualità della formattazione dei file tradotti dipenderà dalla qualità della prima e della seconda conversione. Prima di procedere alla conversione, assicurarsi di aver verificato tutte le opzioni. Consultare l'elenco aggiornato degli strumenti ausiliari alla traduzione nel sito web di OmegaT.

3. Lingue da destra a sinistra

La giustificazione dei segmenti di partenza e di arrivo dipende dalle lingue del progetto. Per impostazione predefinita, la giustificazione a sinistra è usata per le lingue da sinistra a destra (LTR), e quella a destra per le lingue da destra a sinistra (RTL). È possibile commutare tra i diversi modi di visualizzazione premendo Maiusc+Ctrl+O (lettera O e non il numerale 0). Il comando di commutazione Maiusc+Ctrl+O ha tre stati:

  • giustificazione predefinita, ossia quella definita dalla lingua

  • giustificazione a sinistra

  • giustificazione a destra

L'uso della modalità RTL in OmegaT non ha alcuna influenza sulla modalità di visualizzazione dei documenti tradotti creati in OmegaT. La modalità di visualizzazione dei documenti tradotti deve essere modificata all'interno dell'applicazione (come Microsoft Word)comunemente usata per visualizzarli o modificarli (consultare i manuali appropriati per i dettagli). L'uso di Maiusc+Ctrl+O modifica l'immissione e la visualizzazione del testo in OmegaT. Può essere usata in modo separato per i tre pannelli (Editor, Concordanze parziali e Glossario) facendo clic sul pannello e commutando la modalità di visualizzazione. Può essere usata anche in tutti i campi di immissione di OmegaT - nella finestra della ricerca, per le regole di segmentazione, ecc.

Nota per gli utenti di Mac OS X: usare la scorciatoia Maiusc+Ctrl+O e non cmd+Ctrl+O.

3.1. Unire stringhe RTL e LTR in segmenti

Quando si scrive semplicemente del testo RTL, può essere usata la visualizzazione predefinita (LTR). In molti casi, tuttavia, si rende necessario incorporare testo LTR in testo RTL. Per esempio, nei tag OmegaT, possono essere nomi di prodotto che si devono mantenere nella lingua LTR di partenza, segnaposto nei file di localizzazione e numeri nel testo. In questi casi è necessario passare alla modalità RTL, affinché il testo RTL (di fatto bidirezionale) venga visualizzato correttamente. Bisogna notare che quando OmegaT è in modalità RTL, sia i segmenti di partenza che quelli di arrivo vengono visualizzati in modalità RTL. Ciò significa che se la lingua di partenza è LTR e quella di arrivo è RTL, o viceversa, potrebbe essere necessario alternare le due modalità per visualizzare agevolmente i segmenti di partenza e digitare quelli di arrivo nella modalità relativa.

3.2. Tag OmegaT nei segmenti RTL

Come detto poc'anzi, i tag OmegaT sono stringhe LTR. Quando si traduce tra lingue RTL e LTR, il traduttore potrebbe aver bisogno di alternare spesso le modalità LTR e RTL per leggere correttamente i tag dal file di partenza e digitarli correttamente in quello di arrivo.

Se il documento lo consente, al traduttore si raccomanda caldamente di rimuovere le informazioni di stile dal documento originale, affinché appaiano meno tag possibili nell'interfaccia di OmegaT. Seguire le indicazioni fornite in Consigli per la gestione dei tag. Convalidare i tag frequentemente (consultare Convalida dei tag) e produrre i documenti di arrivo (vedere sotto e Menu) a intervalli regolari per rendere più semplice individuare qualsiasi problema che possa sorgere. Suggerimento: potrebbe essere meno complicato tradurre una versione del documento in solo testo e aggiungere gli stili necessari in un momento successivo, all'interno dell'applicazione appropriata.

3.3. Creare documenti di arrivo RTL

Quando viene creato un documento di arrivo, la sua direzione di visualizzazione sarà quella del documento originale. Se il documento originale era LTR, la direzione di visualizzazione del documento di arrivo deve essere cambiata manualmente in RTL nella sua applicazione per la visualizzazione. Ciascun formato di uscita ha un modo specifico di trattare la visualizzazione RTL; per i dettagli consultare i manuali delle applicazioni appropriate.

Per i file .docx, vengono comunque eseguite automaticamente una serie di modifiche:

  • I paragrafi, le sezioni e le tabelle sono impostate nel formato bidirezionale
  • Le direzioni (elementi di testo) sono impostate a RTL

Per evitare la modifica dei parametri di visualizzazione dei file di arrivo ogni volta che i file sono aperti, può essere possibile cambiare i parametri di visualizzazione dei file di partenza, affinché essi vengano passati a quelli di arrivo. Tali modifiche sono possibili nei file ODF, per esempio.