Itzulpen-memoriak kudeatzeko tresnek segmentu deritzen testu-unitateekin egiten dute lan. OmegaT-k testu bat segmentatzeko bi modu dauzka: paragrafo mailako segmentazioa eta esaldi mailako segmentazioa. Segmentazio-mota ezartzeko, hautatu Proiektua → Propietateak menu nagusian eta erabili bertan dagoen kontrol-laukia. Kontuan izan paragrafo mailako segmentazioa zaharkitua dagoela eta proiekturik gehienetan esaldi mailako segmentazioa erabiltzea komeni dela. Esaldi mailako segmentazioa hautatu bada, joan menu nagusiko Aukerak → Segmentazioa... atalera arauak ezartzeko.
Kontuan izan garapenaren zati handi bat segmentazio-arau fidagarriak garatzen eman dela; beraz, kasurik gehienetan ez da beharrezkoa izango segmentazio-arau propioak idaztea. Bestalde, funtzionaltasun hau oso erabilgarria da kasu berezietan, batez ere benetan itzuli nahi dena itzultzeko aldaketarik gabe geratu behar duena aldatzeko arriskutik salbu utziz.
Oharra! Proiektua irekita dagoen bitartean iragazkien aukerak aldatzeak datu-galerak eragin ditzake. Segmentazio-ezarpenak proiektua hasi ondoren aldatzen badituzu, proiektua birkargatu egin beharko duzu aldaketak indarrean sartzeko.
OmegaT-k, hasteko, testua egitura-mailan segmentatzen du. Prozesu honetan zehar, sorburu-fitxategiaren egitura erabiltzen da soilik segmentuak sortzeko.
Esaterako, testu-fitxategiak segmentatzeko lerro-jauziak, lerro hutsak eta antzekoak erabiltzen dira. Gertatu daiteke egitura-mailako segmentaziorik ez sortzea. Formatua daukaten fitxategiak (OpenOffice.org-eko dokumentuak, HTML dokumentuak, etab.) bloke (paragrafo) mailako etiketak erabiliz segmentatzen dira. XHTML edo HTML fitxategietan itzulgai diren objektuen atributuak ere segmentuak banatzeko erauzi daitezke.
Sorburu-fitxategia unitate logikoetan segmentatu ondoren, OmegaT-k bloke hauek esaldietan segmentatuko ditu.
Segmentazio-prozesu honelakoa da: irudikatu kurtsorea testuan zehar mugitzen ari dela, bakoitzean karaktere bat igaroz. Kurtsorearen posizio bakoitzerako arau bakoitza aplikatzen da, taulan adierazitako ordenan, eta Aurretik eredua aplikatzen zaio kurtsorearen ezkerraldean dagoen testuari eta Ondoren eredua kurtsoaren eskuinaldean dagoenari. Araua testuarekin bat badator, aplikazioak gelditu egiten du arauen azterketa (salbuespen-arauaren kasuan) edo segmentu berri bat sortzen du (eten-arauaren kasuan).
Esaldien segmentazioa garatzeko Segmentation Rules eXchange (SRX) estandarra jarraitu da - hala ere, OmegaT-k ez ditu SRX formatuaren ezaugarri guztiak onartzen. Eta ezin dira SRX formatuan definitutatko arauak inportatu/esportatu. Hala ere, SRX-a ezagutzen baduzu, orduan badakizu OmegaT-k nola egiten duen segmentazioa.
Bi arau-mota daude.
Eten-arauek testua segmentuetan banatzen dute. Adibiez, "Ba al zuen zentzurik? Ez nago ziur." bi segmentutan banatu beharko litzateke, eten-araua egon beharko litzateke "?
" ikurrerako.
Salbuespen-arauek banatu behar EZ diren testu-zatiak zehazten dituzte. Puntua duen arren, "XX. mendea" ez litzateke banatu behar; beraz, salbuespen-arau bat finkatu beharko litzateke XX hitzerako (eta XIX, XVIII, etab-etarako), puntu bat badaukate ondoren.
Aurredefinitutako eten-arauek aski izan beharko lukete Europako hizkuntza gehienetan eta japonieran. Zure hizkuntzetarako salbuespen-arau gehiago definitu zenitzake,segmentu esanguratsu eta koherenteagoak sortzeko.
Hizkuntza-eredu bati dagozkion segmentazio-arauen multzoak hizkuntzaren lehentasun ordenan aplikatzen dira, alegia, hizkuntza espezifikoetarako arauak lehenetsitako hizkuntzetarako arauen gainetik egongo dira. Esaterako, Kanadako frantsesaren (FR-CA) arauek lehentasuna izango dute frantsesaren (FR.*) arauen gainetik, eta azken hau, lehenetsitakoen (.*) gainetik egongo da. Beraz, Kanadako frantsesetik itzultzen bada, proiektuak hizkuntza horretarako definitutako arauak, frantseserako definitutakoak eta lehenetsitakoak erabiliko ditu, ordena horretan.
Arauen multzo hutsa editatu edo hedatzeko, sakatu bere izenean koadroan. Hautatutako multzoaren arauak koadroaren azpiko leihoan agertuko dira.
Hizkuntza berri baterako arau-multzo hutsa sortzeko, sakatu koadroaren goiko aldean ageri den Gehitu... botoia. Lerro hutsa ageriko da taularen behealdean (agian beherantz mugitu beharko duzu korritze-barra hura ikusteko). Aldatu arauen multzoaren izena eta hizkuntza-eredua. Hizkuntza-ereduaren sintaxia adierazpen erregularren sintaxiaren moldekoa da. Zure arauen multzoa hizkuntza-herrialdea bikote bati badagokio, Mugitu gora botoia erabiliz taularen goialdera eraman dezazun gomendatzen dizugu.
Etena/Salbuespena zutabeko kontrol-laukiak arauaren izaera ezartzen du: kontrol-laukia markatuta badago, arauak etenak sortuko ditu, eta markatu gabe badago, salbuespenak sortuko ditu. Bi adierazpen erregularrek, Aurretik eta Ondoren zutabeetan adierazten direnek, kokapen baten aurretik eta ondoren zerk egon behar duen zehazten dute, eten- edo salbuespen-araua eratuz.
Asmoa |
Aurretik |
Ondoren |
Oharra |
sortu segmentu bat puntu baten (' |
|
|
" |
ez sortu segmentua Mr. ondoren |
|
|
Salbuespen-araua da, beraz arauaren kontrol-laukiak markatu gabe egon behar du |
sortu segmentu bat "。" ondoren (japonierako puntua) |
|
Begiratu nola ondoren hutsik dagoen |
|
ez sortu segmentua M., Mr., Mrs. eta Ms. ondoren |
|
|
salbuespen-araua - ikusi ?-ren erabilera Adierazpen erregularretan (identifikatzaile asea) |
Segmentazio-arauetan erabiltzen diren adierazpen erregularrak Javak onartzen dituenak dira. Adierazpen erregularren formak eranskinean laburpen bat dago. Informazio zehatzagoa behar baduzu, kontsultatu http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html.
Sarean gai honi buruzko tutorial errazak aurki ditzakezu (esaterako, http://www.regular-expressions.info/quickstart.html.)
Legezko oharrak | Orri nagusia | Aurkibidea |