Chapter 21. Машынны пераклад

1. Уводзіны
2. Google Translate
3. Карыстальнікі OmegaT і Google Translate
4. Белазар
5. Apertium
6. MyMemory (машынны)
7. Microsoft Translator
8. Yandex Translate
9. Машынны пераклад — Выпраўленьне непаладак

1. Уводзіны

У адрозьненьне ад памяці перакладаў, якую стварае карыстальнік (як гэта робіцца ў OmegaT), праграмы машыннага перакладу (МП) ужываюць лінгвістычныя інструмэнты на аснове правілаў для стварэньня перакладу безь зьвяртаньня да памяці перакладаў. Для стварэньня мадэлі перакладу выкарыстоўваюцца таксама статыстычныя мадэлі на базе зыходных тэкстаў і перакладаў. Паводле шэрагу дасьледваньняў вынікі сэрвісаў машыннага перакладу ўжо даволі добрыя і працягваюць паляпшацца.

Для ўключэньня аднаго з сэрвісаў машыннага перакладу перайдзеце ў Налады → Машынны пераклад… і ўключэце патрэбны сэрвіс. Заўважце, што ўсе яны працуюць празь Інтэрнэт, для чаго патрабуецца сталае злучэньне з Інтэрнэтам.

2. Google Translate

Google Translate — гэта платны сэрвіс ад Google для перакладу сказаў, вэб-сайтаў і цэлых тэкстаў паміж мноствам моваў, колькасьць якіх узрастае. На час напісаныя гэтага тэксту гэты шэраг уключае болей за 50 моваў, ад азэрбайджанскай да японскай, у тым ліку ўсе значныя мовы. У бягучай вэрсіі плата бярэцца за аб’ём і складае 20 долараў ЗША за міліён сымбаляў на момант напісаньня.

Увага: У выпадку Google Translate API v2 перад пачаткам працы з сэрвісам спатрэбіцца пазначыць зьвесткі для выстаўленьня рахункаў для ўсіх уліковых запісаў (дадатковыя зьвесткі гл.: Pricing and Terms of Service). У мэтах ідэнтыфікацыі ў якасьці дзейснага карыстальніка сэрвісаў Google вам спатрэбіцца скарыстацца з прыватнага ўнікальнага ключа, атрыманага ад Google пры рэгістрацыі на сэрвісе. Каб даведацца, як дадаць гэты ключ да асяродзьдзя OmegaT, гл. “Усталёўка і запуск”, падразьдзел “Аргумэнты каманды запуску”.

Якасьць перакладаў ад Google Translate залежыць з аднаго боку ад аб’ёма тэкстаў на мове перакладу і іхніх дзвюхмоўных вэрсіяў, а з другога боку ад якасьці створаных мадэляў. Хаця якасьць можа быць недастатковай у пэўных выпадках, яна, несумніўна, будзе паляпшацца з часам.

3. Карыстальнікі OmegaT і Google Translate

Карыстальнікам OmegaT не абавязкова карыстацца з Google Translate. Калі карыстацца, то ні рашэньне карыстальніка прыняць пераклад, ні канчатковы варыянт перакладу не становяцца даступнымі для Google. У наступным вакне паказаны прыклад, які ўключае арыгінал на англійскай і пераклады на іспанскай і славенскай мовах ад Google Translate.

Figure 21.1. Google Translate — прыклад

Google Translate — прыклад

Іспанскі пераклад лепшы за славенскі. Заўважце, што дзеясловы “interest” і “sail” на іспанскую правільна перакладзеныя як дзеясловы (“interesar” і “navegar” адпаведна). На славенскую абодва словы перакладзеныя як назоўнікі. Цалкам верагодна, што іспанскі пераклад базуецца прынамсі часткова на рэальным перакладзе кнігі.

Пасьля ўключэньня сэрвісу пры адкрыцьці кожнага новага сэгмэнта на панэлі машыннага перакладу будзе зьяўляцца прапанова пераклад. Калі прапанова падаецца прымальнай, націсьнеце Ctrl+M, каб замяніць тэкст у полі перакладу сэгмэнта на гэтую прапанову. У прыкладзе, паказаным вышэй, пасьля націску Ctrl+M іспанская вэрсія заменіцца на славенскую.

Калі вы не жадаеце, каб OmegaT адсылала зыходныя сэгмэнты ў Google для атрыманьня перакладаў, здымеце пазнаку з пункта мэню Google Translate у Наладах.

Заўважце, што ў сэрвіс машыннага перакладу ў любым выпадку адсылаецца толькі зыходны сэгмэнт. Браўзэрная вэрсія Google Translate дазваляе карыстальніку выпраўляць прапановы і накіроўваць у Google выпраўленыя варыянты. Гэтая функцыя, аднак, недаступная ў OmegaT.

4. Белазар

Белазар — гэта праграма машыннага перакладу для моўнай пары расейская-беларуская.

5. Apertium

Apertium — гэта свабодная/адкрытая плятформа машыннага перакладу, першапачаткова прызначаная для перакладу паміж блізкімі мовамі (такімі як CA, ES, GA, PT, OC і FR), але зь нядаўняга часу пашыраная на іншыя моўныя пары (напрыклад, ангельская-каталянская). Пра магчымасьць перакладу ў пэўнай моўнай пары можна даведацца на вэб-сайце.

Плятформа забясьпечвае наступнае:

  • незалежны ад мовы рухавік машыннага перакладу

  • інструмэнты для кіраваньня лінгвістычнымі данімі ў мэтах рэалізацыі сыстэмы машыннага перакладу для пэўнай моўнай пары

  • лінгвістычныя данія для шэрагу моўных пар (колькасьць стала ўзрастае).

Apertium выкарыстоўвае рухавік машыннага перакладу тыпу shallow-transfer, які апрацоўвае арыгінал паэтапна, як на канвэеры: выдаленьне фарматаваньня, марфалягічны аналіз, вырашэньне неадназначнасьцяў наконт часьцінаў мовы, паверхневая перадача структуры, лексычная перадача, марфалягічная генэрацыя, аднаўленьне фарматаваньня.

Apertium можна ўжываць для стварэньня сыстэмаў машыннага перакладу для розных моўных параў. Для гэтага ў Apertium выкарыстоўваюцца простыя фарматы на аснове XML для кадаваньня патрэбных лінгвістычных даніх (уручную або шляхам канвэрсыі існых даніх), якія кампілююцца з дапамогай інструмэнтаў, уключаных у камплект праграмы, у высакахуткасныя фарматы, якія ўжываюцца ў рухавіку.

6. MyMemory (машынны)

Па змаўчаньні MyMemory дазваляе ня болей за 100 запытаў за суткі. Падаўшы свой адрас электроннай пошты, можна адпраўляць 1000 запытаў за суткі замест 100.

Падаць адрас электроннай пошты можна прынамсі 3 спосабамі:

  • У файле OmegaT.l4J.ini (толькі ў Windows) зьмяніць:

    # MyMemory email

    на:

    MyMemory vash@adras.com

  • Пры запуску OmegaT з каманднага радка пазначыць у каманьдзе:

    -Dmymemory.api.email=vash@adras.com

  • У запускальніку Kaptain (толькі ў Linux) увесьці адрас у адпаведным полі на ўкладцы “Online Services”.

MyMemory прадстаўляе таксама пераклады, зробленыя чалавекам, ад прафэсійных перакладчыкаў, бюро перакладаў, кліентаў і са зьмесьціва шматмоўных сайтаў. Каб атрымаць гэтыя пераклады, трэба запампаваць зыходны файл на іхні сайт, які створыць файл TMX. Затым гэты файл TMX трэба памясьціць у каталёг /tm/ або /tm/auto/ праекта OmegaT.

MyMemory таксама дае магчымасьць кіраваньня прыватнымі файламі памяці перакладаў. Заўвага: OmegaT ня мае дынамічнага ўзаемадзеяньня зь імі (экспартаваць/імпартаваць файлы TMX трэба ўручную).

7. Microsoft Translator

Каб атрымаць уліковыя данія для MS Translator, выканайце наступнае:

  1. Увайдзеце ў Microsoft Azure Marketplace: http://datamarket.azure.com/

    Калі яшчэ ня маеце ўліковага запісу на Azure Marketplace, спачатку трэба зарэгістравацца.

  2. Клікнеце па спасылцы My Account у верхняй частцы старонкі.

  3. Бліжэй да нізу вы пабачыце наступныя элемэнты і значэньні:

    • Primary Account Key (адпавядае парамэтру каманднага радка microsoft.api.client_secret)

    • Customer ID (адпавядае парамэтру каманднага радка microsoft.api.client_id)

Каб уключыць MS Translator у OmegaT, адрэдагуйце запускальнік або гл. разьдзел “Усталёўка і запуск”, каб даведацца, як запускаць OmegaT з каманднага радка.

8. Yandex Translate

Каб выкарыстоўваць Yandex Translate у OmegaT, трэба атрымаць ключ API ад Яндэкса.

Атрыманы ключ API трэба перадаць у OmegaT пры запуску праз парамэтар каманднага радка yandex.api.key. Каб зрабіць гэта, адрэдагуйце запускальнік OmegaT або гл. разьдзел “Усталёўка і запуск”, каб даведацца, як запускаць OmegaT з каманднага радка.

9. Машынны пераклад — Выпраўленьне непаладак

Калі на панэлі машыннага перакладу нічога не зьяўляецца, праверце наступнае:

  • Ці ёсьць злучэньне з Інтэрнэтам? Каб карыстацца машынным перакладам, трэба быць у сетцы.

  • Якая моўная пара вам трэба? Праверце, ці даступная яна ў выбраным сэрвісе.

  • Google Translate не працуе: вы падпісаліся на сэрвіс Translate API? Заўважце, што сэрвіс Google Translate не бясплатны, дадатковыя зьвесткі гл. у разьдзеле “Усталёўка і запуск” (парамэтры запуску).

  • “Google Translate returned HTTP response code: 403 …”: праверце, ці сапраўдны 38-значны ключ, пазначаны ў файле pinfo.list. Праверце, ці актываваны сэрвіс Translate API.

  • Google Translate не працуе, хаця ключ Google API пазначаны належным чынам. Пазначце пункт Google Translate V2 у мэню Налады → Машынны пераклад.

  • Google Translate V2 выдае паведамленьне “Bad request” — мовы арыгінала і перакладу для праекта. Калі мовы ня вызначаныя, гэта спрычыняецца да падобнага адказу.