Puna me Tekstet E Thjeshta

Përmbajtja

Teksti i thjeshtë në OmegaT

Teksti i thjeshtë përbënë ekskluzivisht informata tekstuale. Skedarët me tekst të thjeshtë nuk kanë mënyrë të caktuar preras për t'i treguar kompjuteri se çfarë gjuhet përmbajnë. Duke folur në përgjithësi, kjo nënkupton që përmbajtja e skedarit është e njëjtë me gjuhën që e ka vet kompjuteri.

Një skedar me tekst të thjeshtë në shumicën e rasteve ka emrin që mbaron me .txt.

Paraqitjet e ngatërruar?

Nëse ju jeni Rus, është shumë e mundshme që kompjuteri juaj punon gjithashtu në gjuhën Ruse: menytë janë në Rusisht, skedarët që ju do t'i hapni gjithashtu do të jeni në Rusisht etj. Në shumicën e rasteve, në përgjithësi kompjuteri bën supozimin e saktë në lidhje me përmbajtjen e skedarëve: ata të gjithë përmbajnë Rusishten dhe asnjë karakter jo-Rusisht nuk do të mund të paraqitet.

Tani, nëse ju jeni një përkthyes Rus që përkthen nga Japonishtja, skedarët Japonisht që do t'i merrni, nëse ata janë skedar me tekst të thjeshtë skedarët me gjasë do të konsiderohen nga kompjuteri si skedarë me përmbajtje Ruse. Pasi që aty nuk ka informata në skedarë që i tregojnë kompjuterit se në cilën gjuhë janë shkruar.

Përmbajtja e një skedari Japonez mund të jetë:

   OmegaTとは、コンピュータを利用した翻訳ツールです。

Por tekst redaktori i juaj do të mund të paraqes diçka të tillë si:

   OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≈ВЈБB

Për shkak se pret që përmbajtja të jetë në Rusisht... Por nuk është Rusisht. Këto janë karaktere Japoneze të paraqitura keq si karaktere Ruse.

OmegaT nuk është ndryshe. OmegaT konsideron që skedarët me tekste të thjeshta që përmbajnë tekst automatikisht mund të paraqiten duke përdorur të rëndomtat e kompjuterit. Kjo punon mirë kur kompjuteri juaj punon në Frëngjisht dhe nëse ju merrni skedarët Anglisht, ose kur kompjuteri juaj është në Gjermanisht dhe nëse ju merrni skedarë në Italisht.

Bashkësitë e karaktere dhe enkodimet

Pse kjo mund të punon me Anglisht dhe Frëngjisht por jo me Rusisht dhe Japonisht? Pasi që Anglishtja dhe Frëngjishtja ndajnë bashkësi karakteresh të njëjta. Te emërtuar Latin-1, ose një variacion.

Deri së fundmi, Rusishtja dhe Japonishtja nuk kanë ndarë çfarëdo bashkësi karakteresh. Shumica e tanishme e bashkësive të karaktereve të Rusishten nuk mbulojnë Japonishten dhe reciprokisht. Rezultate shihen më lart.

Klienti Japonez punon me një kompjuter Japonez dhe krijon tekst skedarët që përmbajnë Japonisht. Bashkësia e karaktere të përzgjedhur të kompjuterit të klientit varet nga sistemi operative dhe nga përcaktimet tjera, por ngjanë që bashkësia e karaktereve të përzgjedhura (Japoneze) me saktësi do të paraqitet nga kompjuteri në Rusisht.

Tani, si transmetohen fizikisht informatat tekstuale në bashkësinë e specifikuar të karaktereve (p.sh., se si shkruhen në skedarin për kompjuter që ta interpretoj dhe ta paraqes) varet nga enkodimi. Kur kompjuteri e lexon skedarin, ai i "dekodon" informatat në lidhje me enkodimin dhe e paraqet atë sipas bashkësisë së karaktereve. Duke folur në përgjithësi, një enkodim i korrespondon një bashkësie karakteresh...

Zhgjidhja e OmegaT-së

Ka tri mënyra bazike për ta përmirësuar këtë në OmegaT.

  1. Mënyra drastike:
  2. Mënyra përzgjedhëse:
  3. Mënyra "Unicode":

Tani për tani, OmegaT është në gjendje të kuptoj skedarët me tekst të thjeshtë në mënyrat në vijim: (ju mund ta bëni atë duke përzgjedhur termin Filtrat E Skedarëve te menyja Mjetet. Shtyp në rreshtin Skedarët Tekstual dhe pastaj në pullën Redakto.)

Natyrisht, skedarët me mbaresa .txt1, .txt2, dhe .utf8 nuk ekzistojnë në jetën reale. OmegaT ka përgatitur për ju një listë të shkurtë që do t'iu bënte më të lehtë punën me disa skedar të huaj .

Kështu që, tani, kur ju keni një skedar në Frëngjisht (për shembull in_french.txt) për ta përkthyer atë në një kompjuter në Japonisht, pasi që ai është i krijuar si një skedar i enkoduar në ISO-8859-1, ju me së miri do të ishte të shtoni një 1 në fund të emrit të tij (in_french.txt1) ashtu që OmegaT të interpretoj përmbajtjen e tij si të ishte në ISO-8859-1... Et voilà!


Njoftimet Legale