Chapter 7. Файлавыя фільтры

1. Дыялёг файлавых фільтраў
2. Налады фільтра
3. Дыялёг рэдагаваньня фільтра
3.1. Тып зыходных файлаў, шаблён назваў
3.2. Кадоўка зыходных файлаў і файлаў перакладаў
3.3. Назва файла перакладу

OmegaT мае фільтры з шырокімі магчымасьцямі дапасаваньня, дазваляючы наладзіць большасьць аспэктаў іхняй працы. Файлавыя фільтры — гэта фрагмэнты кода, якія могуць:

Каб даведацца, якія фарматы файлаў можа апрацоўваць OmegaT, гл. мэню Налады → Файлавыя фільтры…

Для большасьці карыстальнікаў налады файлавых фільтраў па змаўчаньні будуць дастатковымі. Калі трэба нешта іншае, сьлед адчыніць галоўны дыялёг, выбраўшы мэню Налады → Файлавыя фільтры…. Можна таксама задаць адмысловыя налады файлавых фільтраў для пэўнага праекта, націснуўшы ”Файлавыя фільтры” ў вакне ўласьцівасьцяў праекта.

Каб задаць налады файлавых фільтраў для канкрэтнага праекта, трэба выбраць Праект → Уласьцівасьці…. Націсьнеце кнопку ”Файлавыя фільтры” і пазначце “Ужываць налады файлавых фільтраў толькі для гэтага праекта”. У гэтым выпадку ў праекце будзе захаваная копія файла канфігурацыі фільтраў. Далейшыя зьмены наладаў фільтраў будуць адбывацца толькі для гэтага праекта, а агульныя налады фільтраў застануцца нязьменнымі.

Увага! Зьмяніўшы налады фільтраў пры адчыненым праекце, абавязкова перазагрузеце праект, каб зьмены сталі дзейснымі.

1. Дыялёг файлавых фільтраў

У гэтым дыялёгу паказваюцца даступныя файлавыя фільтры (тыя, якія ўжываюцца ў бягучым праекце, вылучаюцца паўтлустым шрыфтом). Калі ня трэба перакладаць файлы пэўнага тыпу, можна проста зьняць пазнаку насупраць назвы адпаведнага фільтра. OmegaT прапусьціць адпаведныя файлы пры загрузцы праектаў і будзе капіяваць іх бязь зьменаў пры стварэньні перакладаў. Пазьней, калі будзе пажадана зноў ужыць фільтар, трэба проста аднавіць пазнаку. Каб вярнуцца да наладаў па змаўчаньні, націсьнеце Аднавіць змаўчаньні. Для праўкі таго, якія файлы і ў якіх кадоўках будзе апрацоўваць фільтар, трэба выбраць яго са сьпісу і націснуць “Зьмяніць”.

Дыялёг дазваляе ўключыць або адключыць наступныя парамэтры:

  • Выдаліць пачатковыя і канчатковыя тэгі: трэба зьняць гэтую пазнаку, каб паказваліся ўсе тэгі, і пачатковыя, і канечныя. Увага: у фарматах Microsoft Open XML (DOCX, XLSX, і да г. п.), калі тэгі паказваюцца, НЕЛЬГА нешта ўпісваць перад першым тэгам (гэта — тэхнічны тэг, зь якога заўсёды павінен пачынацца сэгмэнт).

  • Выдаліць пачатковыя і канечныя прабельныя сымбалі ў несэгмэнтаваных праектах: па змаўчаньні OmegaT выдаляе пачатковыя і канечныя прабельныя сымбалі. У несэгмэнтаваных праектах іх можна захаваць, адключыўшы гэты парамэтар.

  • Захоўваць прабелы для ўсіх тэгаў: пазначце гэтую вопцыю, калі зыходныя дакумэнты ўтрымліваюць значную колькасьць прабелаў (з прычыны асаблівасьцяў макету), якія нельга ігнараваць.

  • Ігнараваць кантэкст файла пры вызначэньні сэгмэнтаў з альтэрнатыўнымі перакладамі: па змаўчаньні OmegaT ужывае назву зыходнага файла дзеля ідэнтыфікацыі альтэрнатыўнага перакладу. Калі гэтая опцыя ўключана, назва зыходнага файла ня будзе ўжывацца, і альтэрнатыўныя пераклады будуць ужывацца ў любым файле, калі дазваляе іншы кантэкст (папярэдні/наступны сэгмэнты, або нейкі ідэнтыфікатар, у залежнасьці ад фармату файла) адпавядае.

2. Налады фільтра

Некалькі фільтраў (тэкставыя файлы, файлы XHTML, файлы HTML і XHTML, файлы OpenDocument і Microsoft Open XML) маюць пэўныя спэцыфічныя налады. Каб зьмяніць налады, абярэце фільтр са сьпісу і націсьнеце Налады. Даступныя варыянты:

Тэкставыя файлы

  • Сэгмэнтаваць тэкст у абзацы па разрывах радкоў, пустых радкох, або не сэгмэнтаваць:

    Калі ўключана сэгмэнтаваньне па сказах, тэкст далей будзе разьбівацца ў адпаведнасьці з абраным тут варыянтам.

Файлы PO

  • Дазваляць пустыя пераклады ў файле перакладаў:

    Калі ўключана, то калі сэгмэнт PO (якім можа быць увесь абзац) не перакладзены, пераклад будзе пустым у файле перакладу. З тэхнічнага гледзішча, сэгмэнт msgstr у створаным файле PO будзе пакінуты пустым. Паколькі гэта стандартна для PO-файлаў, опцыя ўключана па змаўчаньні. Калі опцыя адключана, зыходны тэкст будзе капіявацца ў пераклад.

  • Прамінаць загаловак PO

    Калі гэтая опцыя ўключана, загаловак PO будзе прамінуты і пакінуты нязьменным.

  • Аўтаматычна замяняць 'nplurals=INTEGER; plural=EXPRESSION;' у загалоўку

    Опцыя дазваляе OmegaT перавызначаць спэцыфікацыю ў загалоўку файла PO і ўжываць значэньне па змаўчаньні для абранай мовы перакладу.

Файлы XHTML

  • Перакладаць наступныя атрыбуты: выбраныя атрыбуты зьявяцца ў выглядзе сэгмэнтаў у вакне рэдагаваньня.

  • Пачынаць новы абзац з: HTML-тэг <br> будзе зьяўляцца як абзац для мэтаў сэгмэнтаваньня.

  • Абмінаць тэкст, які супадае з рэгулярным выразам: тэкст, адпаведны рэгулярнаму выразу, будзе прамінуты. Ён будзе вылучацца чырвоным пры праверцы тэгаў. Адпаведны тэкст у зыходным сэгмэньце будзе вылучаны курсівам.

  • Не перакладаць атрыбут зьмесьціва мэта-тэгаў…: Наступныя мэта-тэгі ня будуць перакладацца.

  • Не перакладаць зьмесьціва атрыбуту мэта-тэгаў з наступным атрыбутам тыпу пара “ключ-значэньне” (падзяляць коскамі):: пры наяўнасьці супадзеньня ў сьпісе пар “ключ-значэньне” зьмесьціва тэгаў будзе ігнаравацца.

    Гэта часам карысна, каб мець магчымасьць зрабіць пэўныя тэгі неперакладальнымі на аснове значэньня атрыбутаў. Напрыклад, <div class="hide"> <span translate="no"> Можна вызначыць пары ключ-значэньне, каб вызначыць тэгі, якія ня трэба перакладаць. Для прыклада вышэй поле мусіць утрымліваць: class=hide, translate=no

Файлы Microsoft Office Open XML

Можна выбраць элемэнты, якія павінны быць перакладзены. Яны зьявяцца ў выглядзе асобных сэгмэнтаў у перакладзе.

  • Word: нябачны тэкст інструкцыяў, камэнтары, зноскі, вынаскі, калянтытулы

  • Excel: камэнтары, назвы аркушоў

  • Power Point: камэнтары да слайдаў, майстры слайдаў, макеты слайдаў

  • Глябальна: схемы, дыяграмы, малюнкі, аб’екты WordArt

  • Іншыя магчымасьці:

    • Агрэгаваньне тэгаў: калі пазначана, тэгі, калі паміж імі няма тэксту, які падлягае перакладу, будуць зьбірацца ў адзіныя тэгі.

    • Захоўваць прабелы для ўсіх тэгаў: калі пазначана, прабелы і пераводы радкоў будуць захоўвацца, нават калі гэта не зададзена тэхнічна ў дакумэньце

Файлы HTML і XHTML

  • Дадаваць ці перапісваць дэклярацыю кадоўкі файлаў HTML і XHTML: часта файлы перакладаў павінны мець кадоўку, адрозную ад кадоўкі зыходнага файла (яўна вызначанай або падразумяванай). Выкарыстоўваючы гэтую вопцыю, перакладчык можа вызначыць, ці мусяць файлы перакладаў уключаць дэклярацыю кадоўкі. Напрыклад, калі ў наладах файлавага фільтра UTF-8 вызначана ў якасьці схемы кадаваньня для файлаў перакладаў, выбар варыянта “Заўсёды” будзе гарантаваць уключэньне гэтай інфармацыі ў файлы перакладаў.

  • Перакладаць наступныя атрыбуты: выбраныя атрыбуты зьявяцца ў выглядзе сэгмэнтаў у вакне рэдагаваньня.

  • Пачынаць новы абзац з: HTML-тэг <br> будзе зьяўляцца як абзац для мэтаў сэгмэнтаваньня.

  • Абмінаць тэкст, які супадае з рэгулярным выразам: тэкст, адпаведны рэгулярнаму выразу, будзе прамінуты. Ён будзе вылучацца чырвоным пры праверцы тэгаў. Адпаведны тэкст у зыходным сэгмэньце будзе вылучаны курсівам.

  • Не перакладаць атрыбут зьмесьціва мэта-тэгаў…: Наступныя мэта-тэгі ня будуць перакладацца.

  • Не перакладаць зьмесьціва атрыбуту мэта-тэгаў з наступным атрыбутам тыпу пара “ключ-значэньне” (падзяляць коскамі):: пры наяўнасьці супадзеньня ў сьпісе пар “ключ-значэньне” зьмесьціва тэгаў будзе ігнаравацца.

    Гэта часам карысна, каб мець магчымасьць зрабіць пэўныя тэгі неперакладальнымі на аснове значэньня атрыбутаў. Напрыклад, <div class="hide"> <span translate="no"> Можна вызначыць пары ключ-значэньне, каб вызначыць тэгі, якія ня трэба перакладаць. Для прыклада вышэй поле мусіць утрымліваць: class=hide, translate=no

  • Сьціскаць прабельныя сымбалі ў дакумэнтах перакладаў: ланцужкі зь некалькіх прабельных сымбаляў у перакладах будуць пераўтварацца ў адзіночныя прабелы.

  • Выдаляць камэнтары HTML у дакумэнтах перакладаў: усе закамэнтаваныя часткі (паміж <!-- і -->) ня будуць капіявацца ў перакладзены дакумэнт.

Файлы фармату Open Document (ODF)

  • Можна выбраць, што з наступных элемэнтаў будзе перакладацца:

    элемэнты індэксаў, закладкі, спасылкі на закладкі, зацемкі, камэнтары, зацемкі да прэзэнтацыяў, гіпэрспасылкі (URL), назвы аркушоў

3. Дыялёг рэдагаваньня фільтра

Праз гэты дыялёг можна задаць шаблёны імёнаў зыходных файлаў, якія будзе апрацоўваць фільтар, наладзіць імёны файлаў зь перакладамі і выбраць кадоўкі для загрузкі файла і захаваньня ягонага перакладзенага варыянта. Каб зьмяніць шаблён файлавага фільтра, зьмянеце палі наўпрост або націсьнеце Зьмяніць. Каб дадаць новы шаблён файлавага фільтра, націсьнеце Дадаць. Аднолькавы дыялёг ужываецца, і каб дадаць шаблён, і каб адрэдагаваць канкрэтны шаблён. Дыялёг карысны тым, што ўключае асобны рэдактар шаблёнаў назваў файлаў, праз які можна задаць назвы выніковых файлаў.

3.1. Тып зыходных файлаў, шаблён назваў

Выявіўшы файл у каталёгу з зыходнымі файламі, OmegaT спрабуе падабраць фільтар паводле пашырэньня назвы файла. Дакладней, OmegaT спрабуе супаставіць шаблёны назваў зыходных файлаў кожнага фільтра з назвай файла. Напрыклад, шаблён *.xhtml ужываецца да любога файла з пашырэньнем .xhtml. Калі знойдзены адпаведны фільтар, ён назначаецца файлу для апрацоўкі. Напрыклад, па змаўчаньні фільтар XHTML будзе выкарыстаны для апрацоўкі файлаў з пашырэньнем .xhtml. Для кожнага файлавага фільтра можна дадаць або выдаліць шаблёны назваў файлаў, якія ён будзе апрацоўваць. У шаблёнах назваў зыходных файлаў ужываюцца сымбалі падстаноўкі падобным чынам, як і ў пошуку. Сымбаль “*” прадстаўляе 0 або больш сымбаляў. Сымбаль “?” прадстаўляе роўна адзін сымбаль. Усе астатнія сымбалі азначаюць самі сябе. Напрыклад, калі трэба, каб тэкставы фільтар апрацоўваў файлы тыпу “прачытанка” (readme, read.me і readme.txt), трэба выкарыстоўваць шаблён read*.

3.2. Кадоўка зыходных файлаў і файлаў перакладаў

Толькі для абмежаванай колькасьці фарматаў файлаў пэўная кадоўка зьяўляецца вызначанай. Калі для пэўнага фармату файла няма фіксаванай кадоўкі, яе можна вызначыць для адпаведнага пашырэньня назвы файла. Напрыклад, па змаўчаньні файлы тыпу .txt будуць загружацца з ужываньнем кадоўкі па змаўчаньні для апэрацыйнай сыстэмы. Зыходную кадоўку можна задаваць для кожнага шаблёна назваў файлаў. Падобныя файлы таксама могуць запісвацца ў адвольнай кадоўцы. Па змаўчаньні кадоўка файла перакладу супадае з кадоўкай зыходнага файла. У палёх кадоўкі зыходнага тэксту і перакладу выкарыстоўваюцца сьпісы з усімі падтрыманымі кадоўкамі. Калі пазначыць <auto>, OmegaT самастойна вызначыць кадоўку. Як гэта працуе:

  • OmegaT вызначае кадоўку зыходнага файла на падставе дэклярацыі кадоўкі, калі яна наяўная (файлы HTML, файлы на аснове XML).

  • Для шэрагу фарматаў файлаў OmegaT заўсёды ўжывае пэўную кадоўку (уласьцівасьці Java і да г. п.).

  • Для тэкставых файлаў OmegaT ужывае кадоўку апэрацыйнай сыстэмы па змаўчаньні.

3.3. Назва файла перакладу

Часам можа патрабавацца аўтаматычна пераймяноўваць перакладаныя файлы, напрыклад, дадаючы код мовы пасьля назвы файла. Шаблён назваў файлаў перакладаў выкарыстоўвае адмысловы сынтаксыс, і каб адрэдагаваць гэтае поле, трэба клікнуць Зьмяніць…, каб перайсьці ў акно рэдагаваньня фільтра. Каб вярнуць фільтар да зыходнай канфігурацыі, націсьнеце Аднавіць змаўчаньні. Назву таксама можна зьмяніць непасрэдна ў полі шаблёна назваў файлаў перакладаў у дыялёгавым акне файлавых фільтраў. У дыялёгавым акне рэдагаваньня шаблёна назваў файлаў прапануюцца наступныя варыянты:

  • Па змаўчаньні ўжываецца ${filename} — поўная назва зыходнага файла з пашырэньнем, так каб назвы зыходнага і перакладзенага файлаў былі аднолькавымі.

  • ${nameOnly} дазваляе ўстаўляць толькі назву зыходнага файла без пашырэньня;

  • ${extension} — пашырэньне назвы зыходнага файла;

  • ${targetLocale} — код лякалі перакладу (у форме “xx_YY”).

  • ${targetLanguage} — код мовы перакладу і краіны разам (у форме “XX-YY”).

  • ${targetLanguageCode} — толькі код мовы перакладу (”XX”).

  • ${targetCoutryCode} — толькі код краіны (”YY”).

  • ${timestamp-????} — сыстэмная дата/час падчас генэрацыі ў розных фарматах

    Прыклады шаблёнаў “SimpleDateFormat” гл. у дакумэнтацыі Oracle

  • ${system-os-name} — апэрацыйная сыстэма кампутара, якая выкарыстоўваецца

  • ${system-user-name} — імя карыстальніка сыстэмы

  • ${system-host-name} — назва хоста сыстэмы

  • ${file-source-encoding} — кадоўка зыходнага файла

  • ${file-target-encoding} — кадоўка файла перакладу

  • ${targetLocaleLCID} — лякаль перакладу Microsoft

Ёсьць дадатковыя варыянты для зьменных ${nameOnly} і ${Extension}. У выпадку неадназначнасьці назвы файла можна ўжыць зьменныя ў форме ${nameOnly-колькасьць пашырэньняў} і ${extension-колькасьць пашырэньняў} . Калі, напрыклад, зыходны файл называецца Document.xx.docx, вось якія вынікі дадуць наступныя зьменныя:

  • ${nameOnly-0} Document

  • ${nameOnly-1} Document.xx

  • ${nameOnly-2} Document.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} Document.xx.docx