Sorburuaren segmentazioa

Itzulpen-memoriak kudeatzeko tresnek segmentu deritzen testu-unitateekin egiten dute lan. OmegaT-k testu bat segmentatzeko bi modu dauzka: paragrafo mailako segmentazioa eta esaldi mailako segmentazioa. Segmentazio-mota ezartzeko, hautatu Proiektua → Propietateak menu nagusian eta erabili bertan dagoen kontrol-laukia. Kontuan izan paragrafo mailako segmentazioa zaharkitua dagoela eta proiekturik gehienetan esaldi mailako segmentazioa erabiltzea komeni dela. Esaldi mailako segmentazioa hautatu bada, joan menu nagusiko Aukerak → Segmentazioa... atalera arauak ezartzeko.

Kontuan izan garapenaren zati handi bat segmentazio-arau fidagarriak garatzen eman dela; beraz, kasurik gehienetan ez da beharrezkoa izango segmentazio-arau propioak idaztea. Bestalde, funtzionaltasun hau oso erabilgarria da kasu berezietan, batez ere benetan itzuli nahi dena itzultzeko aldaketarik gabe geratu behar duena aldatzeko arriskutik salbu utziz.

Oharra! Proiektua irekita dagoen bitartean iragazkien aukerak aldatzeak datu-galerak eragin ditzake. Segmentazio-ezarpenak proiektua hasi ondoren aldatzen badituzu, proiektua birkargatu egin beharko duzu aldaketak indarrean sartzeko.


Egitura mailako segmentazioa

OmegaT-k, hasteko, testua egitura-mailan segmentatzen du. Prozesu honetan zehar, sorburu-fitxategiaren egitura erabiltzen da soilik segmentuak sortzeko.

Esaterako, testu-fitxategiak segmentatzeko lerro-jauziak, lerro hutsak eta antzekoak erabiltzen dira. Gertatu daiteke egitura-mailako segmentaziorik ez sortzea. Formatua daukaten fitxategiak (OpenOffice.org-eko dokumentuak, HTML dokumentuak, etab.) bloke (paragrafo) mailako etiketak erabiliz segmentatzen dira. XHTML edo HTML fitxategietan itzulgai diren objektuen atributuak ere segmentuak banatzeko erauzi daitezke.


Esaldi mailako segmentazioa

Sorburu-fitxategia unitate logikoetan segmentatu ondoren, OmegaT-k bloke hauek esaldietan segmentatuko ditu.

Segmentazio-arauak

Segmentazio-prozesu honelakoa da: irudikatu kurtsorea testuan zehar mugitzen ari dela, bakoitzean karaktere bat igaroz. Kurtsorearen posizio bakoitzerako arau bakoitza aplikatzen da, taulan adierazitako ordenan, eta Aurretik eredua aplikatzen zaio kurtsorearen ezkerraldean dagoen testuari eta Ondoren eredua kurtsoaren eskuinaldean dagoenari. Araua testuarekin bat badator, aplikazioak gelditu egiten du arauen azterketa (salbuespen-arauaren kasuan) edo segmentu berri bat sortzen du (eten-arauaren kasuan).

Esaldien segmentazioa garatzeko Segmentation Rules eXchange (SRX) estandarra jarraitu da - hala ere, OmegaT-k ez ditu SRX formatuaren ezaugarri guztiak onartzen. Eta ezin dira SRX formatuan definitutatko arauak inportatu/esportatu. Hala ere, SRX-a ezagutzen baduzu, orduan badakizu OmegaT-k nola egiten duen segmentazioa.

Bi arau-mota daude.

Aurredefinitutako eten-arauek aski izan beharko lukete Europako hizkuntza gehienetan eta japonieran. Zure hizkuntzetarako salbuespen-arau gehiago definitu zenitzake,segmentu esanguratsu eta koherenteagoak sortzeko.

Arauen konfigurazioa

Lehentasuna

Hizkuntza-eredu bati dagozkion segmentazio-arauen multzoak hizkuntzaren lehentasun ordenan aplikatzen dira, alegia, hizkuntza espezifikoetarako arauak lehenetsitako hizkuntzetarako arauen gainetik egongo dira. Esaterako, Kanadako frantsesaren (FR-CA) arauek lehentasuna izango dute frantsesaren (FR.*) arauen gainetik, eta azken hau, lehenetsitakoen (.*) gainetik egongo da. Beraz, Kanadako frantsesetik itzultzen bada, proiektuak hizkuntza horretarako definitutako arauak, frantseserako definitutakoak eta lehenetsitakoak erabiliko ditu, ordena horretan.

Arauen sorrera

Arauen multzo hutsa editatu edo hedatzeko, sakatu bere izenean koadroan. Hautatutako multzoaren arauak koadroaren azpiko leihoan agertuko dira.

Hizkuntza berri baterako arau-multzo hutsa sortzeko, sakatu koadroaren goiko aldean ageri den Gehitu... botoia. Lerro hutsa ageriko da taularen behealdean (agian beherantz mugitu beharko duzu korritze-barra hura ikusteko). Aldatu arauen multzoaren izena eta hizkuntza-eredua. Hizkuntza-ereduaren sintaxia adierazpen erregularren sintaxiaren moldekoa da. Zure arauen multzoa hizkuntza-herrialdea bikote bati badagokio, Mugitu gora botoia erabiliz taularen goialdera eraman dezazun gomendatzen dizugu. 

Etena/Salbuespena

Etena/Salbuespena zutabeko kontrol-laukiak arauaren izaera ezartzen du: kontrol-laukia markatuta badago, arauak etenak sortuko ditu, eta markatu gabe badago, salbuespenak sortuko ditu. Bi adierazpen erregularrek, Aurretik eta Ondoren zutabeetan adierazten direnek, kokapen baten aurretik eta ondoren zerk egon behar duen zehazten dute, eten- edo salbuespen-araua eratuz.

Adibide sinple batzuk

Asmoa

Aurretik

Ondoren

Oharra

sortu segmentu bat puntu baten ('.') eta zuriune baten artean

\.

\s

"\." zeinuak "." karakterea ordezkatzen du. "\s" zeinuak edozein espazio zuri ordezkatzen du

ez sortu segmentua Mr. ondoren

Mr\.

\s

Salbuespen-araua da, beraz arauaren kontrol-laukiak markatu gabe egon behar du

sortu segmentu bat "。" ondoren (japonierako puntua)

Begiratu nola ondoren hutsik dagoen

ez sortu segmentua M., Mr., Mrs. eta Ms. ondoren

Mr??s??\.

\s

salbuespen-araua - ikusi ?-ren erabilera Adierazpen erregularretan (identifikatzaile asea)


Adierazpen erregularrak

Segmentazio-arauetan erabiltzen diren adierazpen erregularrak Javak onartzen dituenak dira. Adierazpen erregularren formak eranskinean laburpen bat dago. Informazio zehatzagoa behar baduzu, kontsultatu http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html.

Sarean gai honi buruzko tutorial errazak aurki ditzakezu (esaterako, http://www.regular-expressions.info/quickstart.html.)


Legezko oharrak Orri nagusia Aurkibidea