Chapter 9. Файлы да перакладу

1. Фарматы файлаў
1.1. Файлы нефарматаванага тэксту
1.2. Файлы фарматаванага тэксту
1.3. Файлы PDF
2. Іншыя фарматы файлаў
3. Мовы зь пісьмовасьцю справа-налева
3.1. Радкі з рознымі напрамкамі пісьмовасьці ў сэгмэнтах
3.2. Тэгі OmegaT OmegaT у сэгмэнтах зь пісьмовасьцю справа-налева
3.3. Кампіляцыя перакладаў зь пісьмовасьцю справа-налева

1. Фарматы файлаў

OmegaT можа ўжывацца для перакладаньня файлаў у розных фарматах. Ёсьць два базавыя тыпы фарматаў файлаў: нефарматаваны тэкст і фарматаваны тэкст.

1.1. Файлы нефарматаванага тэксту

Файлы нефарматаванага тэксту ўтрымліваюць толькі тэкст, і трэба проста ўдрукоўваць пераклад. Ёсьць некалькі спосабаў задаць кадоўку файла, каб зьмесьціва не пашкодзілася пры адкрыцьці ў OmegaT. Падобныя файлы не ўтрымліваюць інфармацыю аб фарматаваньні апроч прабельных сымбаляў для выраўноўваньня тэксту, абзацных водступаў або разрываў старонак. Яны не ў стане ўтрымліваць або захоўваць інфармацыю аб колеры, гарнітуры і іншых уласьцівасьцях тэксту. Цяпер OmegaT падтрымлівае наступныя фарматы нефарматаванага тэксту:

  • Тэкст ASCII (.txt і да г. п.)

  • Кадаваны тэкст (*.UTF8)

  • Файлы рэсурсаў Java (.properties)

  • Файлы PO (.po)

  • Файлы INI (ключ=значэньне, .ini)

  • Файлы DTD (*.DTD)

  • Файлы DokuWiki (*.txt)

  • Файлы субтытраў SubRip (*.srt)

  • Файлы CSV Magento CE Locale (*.csv)

Іншыя тыпы файлаў нефарматаванага тэксту можна апрацоўваць з дапамогай OmegaT, зьвязваючы пашырэньне назвы файла з тыпам файла, які падтрымліваецца (напрыклад, файлы .pod могуць быць зьвязаныя з тэкставым фільтрам ASCII), і робячы папярэднюю апрацоўку іх з канкрэтнымі правіламі сэгмэнтаваньня.

Файлы PO могуць утрымліваць як крыніцу, так і пераклад. З улікам гэтага яны — адначасова файлы нефарматаванага тэксту плюс файлы памяці перакладаў. Калі для пэўнага сэгмэнта крыніцы няма пакуль існуючых перакладаў у памяці перакладаў праекта (project_save.tmx), бягучы пераклад будзе захаваны ў project_save.tmx як пераклад па змаўчаньні. Аднак калі ў памяці перакладаў ужо ёсьць такі самы зыходны сэгмэнт зь іншым перакладам, новы пераклад будзе захаваны ў якасьці альтэрнатывы.

1.2. Файлы фарматаванага тэксту

Файлы фарматаванага тэксту ўтрымліваюць тэкст, а таксама інфармацыю пра гарнітуру, кегель, колер шрыфту і да г. п. Яны ствараюцца ў тэкставых рэдактарах або ў HTML-рэдактарах. Падобныя фарматы файлаў задуманыя, каб утрымліваць інфармацыю пра фарматаваньне. Гэта можа быць простая інфармацыя, тыпу “гэта паўтлусты шрыфт”, або складаная, напрыклад, таблічныя данія з розным кегелем, колерам, пазыцыяй і да г. п. Звычайна ад перакладчыка патрабуецца захоўваць фармат арыгінала ў перакладзе. OmegaT дазваляе рабіць гэта, адзначаючы сымбалі/словы з адмысловым фарматаваньнем тэгамі, якімі можна маніпуляваць. Спрашчэньне фармату зыходнага тэкста значна зьмяншае колькасьць тэгаў. Па магчымасьці сьлед уніфікаваць выкарыстаныя ў зыходным дакумэньце гарнітуры, кегелі, колеры і да г.п., каб спрасьціць перакладаньне і скараціць колькасьць магчымых памылак тэгаў. Кожны тып файлаў апрацоўваецца ў OmegaT асобным чынам. Для файлавых фільтраў можна задаць спэцыфічныя паводзіны. На момант напісаньня гэтай дакумэнтацыі OmegaT падтрымлівае наступныя фарматы фарматаванага тэксту:

  • ODF — фармат OASIS Open Document (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)

  • Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)

  • (X)HTML (*.html, *.xhtml,*.xht)

  • Файлы кампілятара дапамогі HTML (*.hhc, *.hhk)

  • DocBook (*.xml)

  • XLIFF (*.xlf, *.xliff, *.sdlxliff) — тыпу крыніца = пераклад

  • QuarkXPress CopyFlowGold (*.tag, *.xtg)

  • Файлы ResX (*.resx)

  • Файлы рэсурсаў Android (*.xml)

  • LaTex (*.tex, *.latex)

  • Файлы даведкі (*.xml) і дапаможніка (*.hmxp)

  • Typo3 LocManager (*.xml)

  • Файлы лякалізацыі WiX (*.wxl)

  • Iceni Infix (*.xml)

  • Экспарт Flash XML (*.xml)

  • Wordfast TXML (*.txml)

  • Camtasia для Windows (*.camproj)

  • Visio (*.vxd)

  • Уласьцівасьці Java у XML (.xml)

  • Schematron (*.sch)

  • Схема RELAX NG для XML (*.rng)

Іншыя тыпы файлаў фарматаванага тэксту можна апрацоўваць з дапамогай OmegaT, зьвязваючы пашырэньне назвы файла з тыпам файла, які падтрымліваецца (зыходзячы з таго, што адпаведныя правілы сэгмэнтаваньня будуць карэктна ўжывацца).

1.3. Файлы PDF

Файлы PDF — гэта асобны выпадак. Яны зьмяшчаюць Інфармацыю пра фарматаваньне, але OmegaT ня можа ўжыць гэтую інфармацыю, каб скампіляваць файлы перакладаў. Такім чынам, файлы PDF апрацоўваюцца як файлы нефарматаванага тэксту, і на выхадзе атрымліваюцца файлы нефарматаванага тэксту.

Калі трэба аднавіць фарматаваньне тэксту ў перакладзе (а таксама іншыя элемэнты, напрыклад, малюнкі), ёсьць тры варыянты, якія можна паспрабаваць:

  1. Скарыстацца з фільтра па змаўчаньні OmegaT (увод PDF), перакласьці, скампіляваць файл перакладу (атрымаецца файл нефарматаванага тэксту), дадаць адпаведнае фарматаваньне і элемэнты ўручную.

  2. Скарыстацца зь фільтра Iceni Infix. Гл. Howto - Translating PDF files with Iceni Infix and OmegaT.

  3. Імпартаваць зыходны файл у LibreOffice Draw, захаваць яго як файл ODG, перакласьці, экспартаваць у PDF пры неабходнасьці.

Заўвага: гэтая інфармацыя тычыцца толькі файлаў PDF з тэкставым слоем. Калі файл PDF створаны з адсканаваных старонак, спатрэбіцца скарыстацца з праграмы аптычнага распазнаваньня сымбаляў, каб распазнаць тэкст і пераўтварыць яго ў фармат файла, які OmegaT можа апрацаваць.

2. Іншыя фарматы файлаў

У OmegaT могуць апрацоўвацца іншыя фарматы файлаў нефарматаванага або фарматаванага тэксту.

Для пераўтварэньня файлаў у падтрыманыя фарматы можна скарыстацца са зьнешніх інструмэнтаў. Перакладзеныя файлы затым спатрэбіцца пераўтварыць назад у арыгінальны фармат. Напрыклад, калі ў вас састарэлая вэрсія Microsoft Word, якая не падтрымлівае фармат ODT, вось што можна зрабіць з файламі Word з пашырэньнем DOC:

  • імпартаваць файл у Apache OpenOffice/LibreOffice Writer

  • захаваць файл у фармат ODT:

  • перакласьці яго, атрымаць пераклад у ODT

  • загрузіць файл перакладу ў Apache OpenOffice/LibreOffice Writer

  • захаваць файл у фармаце DOC

Якасьць фарматаваньня перакладзенага файла будзе залежаць ад якасьці пераўтварэньня туды і назад. Перш чым ужываць падобныя пераўтварэньні, абавязкова праверце ўсе варыянты. Актуальны пералік дапаможных сродкаў для перакладу гл. на вэб-старонцы OmegaT.

3. Мовы зь пісьмовасьцю справа-налева

Выраўнованьне зыходных сэгмэнтаў і перакладаў залежыць ад моваў праекта. Па змаўчаньні тэкст выраўноваецца па левым баку для моваў зь пісьмовасьцю зьлева-направа (LTR) і для моваў зь пісьмовасьцю справа-налева (RTL). Можна пераключацца паміж рознымі рэжымамі адлюстраваньня, націскаючы Shift+Ctrl+O (лацінская літара O, ня лічба 0). Пераключэньне па Shift+Ctrl+O адбываецца паміж трыма рэжымамі:

  • выраўноўваньне па змаўчаньні, у залежнасьці ад мовы

  • выраўноўваньне па левым баку

  • выраўноўваньне па правым баку

Выкарыстаньне рэжыму для моваў зь пісьмовасьцю справа-налева ў OmegaT не ўплывае на рэжым адлюстраваньня перакладзеных дакумэнтаў, створаных у OmegaT. Рэжым адлюстраваньня перакладзеных дакумэнтаў трэба зьмяняць у адпаведнай праграме (напрыклад, у Microsoft Word), якая звычайна выкарыстоўваецца для іх адлюстраваньня або рэдагаваньня (падрабязнасьці гл. у адпаведным дапаможніку карыстальніка). Пры націску Shift+Ctrl+O зьмяняюцца і рэжым уводу, і рэжым адлюстраваньня тэксту ў OmegaT. Гэта можа ўжывацца асобна да ўсіх трох панэляў (рэдагаваньня, супадзеньняў і глясара), трэба клікнуць па адпаведнай панэлі і пераключыць рэжым адлюстраваньня. Яно таксама можа ўжывацца ва ўсіх палёх уводу ў OmegaT — у вакне пошуку, для правілаў сэгмэнтаваньня і г. д.

Заўвага для карыстальнікаў Mac OS X: націскайце Shift+Ctrl+O, а не cmd+Ctrl+O.

3.1. Радкі з рознымі напрамкамі пісьмовасьці ў сэгмэнтах

Пры напісаньні тэксту толькі з пісьмовасьцю справа-налева можна ўжываць выгляд па змаўчаньні (зьлева-направа). У многіх выпадках, аднак, патрабуецца мець урыўкі тэксту зьлева-направа ў тэксьце справа-налева. Напрыклад, у тэгах OmegaT, назвах вырабаў, якія павінны быць пакінутыя ў напрамку пісьмовасьці зыходнай мовы зьлева-направа, сымбалі-запаўняльнікі ў файлах лякалізацыі і лікі ў тэксьце. У падобных выпадках узьнікае неабходнасьць пераключыцца ў рэжым справа-налева для належнага адлюстраваньня тэксту зь пісьмовасьцю справа-налева (насамрэч, двухнапрамкавага). Варта адзначыць, што ў рэжыме справа-налева ў OmegaT і зыходны тэкст, і пераклад паказваюцца ў рэжыме справа-налева. Гэта значыць, што калі зыходная мова мае пісьмовасьць зьлева-направа, а мова перакладу — справа-налева (ці наадварот), можа патрабавацца пераключацца паміж рэжымамі зьлева-направа і справа-налева для зручнага прагляду крыніцы і перакладу ў іх адпаведных рэжымах.

3.2. Тэгі OmegaT OmegaT у сэгмэнтах зь пісьмовасьцю справа-налева

Як сказана вышэй, тэгі OmegaT — гэта радкі зьлева-направа. Пры перакладзе паміж мовамі з рознымі напрамкамі пісьмовасьці можа патрабавацца пераключацца паміж рэжымамі зьлева-направа і справа-налева некалькі разоў, каб правільна чытаць тэгі крыніцы і правільна ўводзіць іх у тэкст перакладу.

Калі дакумэнт дазваляе, перакладчыку вельмі пажадана выдаліць інфармацыю пра стылі з арыгінала, каб па магчымасьці паменшыць колькасьць тэгаў, якія будуць паказавацца ў OmegaT. Гл. “Парады наконт тэгаў”. Для выяўленьня магчымых праблемаў варта часьцей правяраць тэгі (гл. “Праверка тэгаў”) і рэгулярна кампіляваць пераклады (гл. ніжэй і “Мэню”). Парада: найлягчэйшым варыянтам можа быць пераклад нефарматаванага тэксту і даданьне патрэбнага фарматаваньня і стыляў пазьней у дакумэньце зь перакладам.

3.3. Кампіляцыя перакладаў зь пісьмовасьцю справа-налева

Пасьля кампіляцыі перакладу напрамак адлюстраваньня тэксту будзе такім самым, як у зыходным дакумэньце. Калі тэкст арыгінала быў зьлева-направа, зьмяніць напрамак тэксту ў дакумэньце перакладу на справа-налева трэба будзе ўручную ў адпаведнай праграме. Кожны фармат на выхадзе мае свае спэцыфічныя спосабы апрацоўкі тэкстаў з напрамкам справа-налева; падрабязнасьці гл. у адпаведных кіраўніцтвах карыстальнікаў праграмаў.

У выпадку файлаў .docx пэўныя зьмены, аднак, адбываюцца аўтаматычна:

  • Для абзацаў, разьдзелаў і табліцаў задаецца двухнапрамкавы рэжым
  • Для прагонаў (тэкставых элемэнтаў) задаецца напрамак справа-налева

Каб парамэтры адлюстраваньня тэксту ў файлах перакладаў не мяняліся кожны раз пры адкрыцьці, можа быць магчымым зьмяніць парамэтры адлюстраваньня зыходных файлаў, каб гэтыя парамэтры аднаўляліся ў файлах перакладаў. Такія мадыфікацыі магчымыя, напрыклад, у файлах ODF.