Kodiranje teksta u datotekama digitalnih dokumenata odnosi se na način na koji se sekvence bajtova preslikavaju u znakove u jeziku. Postoji mnogo različitih kodiranja za različite jezike. Kodiranje tekstualne datoteke možete odrediti pomoću brojnih softverskih alata.
Neophodno je
- - Microsoft Office Word;
- - KWrite;
- - Mozilla Firefox;
- - enca.
Instrukcije
Korak 1
Koristite Microsoft Office Word, ako je instaliran na računaru, za određivanje kodiranja tekstualne datoteke. Pokrenite ovu aplikaciju. U glavnom izborniku odaberite stavke "Datoteka" i "Otvori …" ili pritisnite tipkovničku prečicu Ctrl + O. U dijaloškom okviru koji se pojavi dođite do željenog direktorija i odaberite datoteku. Kliknite gumb "Otvori". Ako se kodiranje teksta razlikuje od CP1251, automatski će se otvoriti dijalog "Pretvori datoteku". U njemu aktivirajte opciju "Ostalo" i odaberite kodiranje pomoću liste s desne strane. Ako je odabrano ispravno kodiranje, u polju "Uzorak" prikazat će se čitljiv tekst.
Korak 2
Primijenite uređivače teksta koji omogućavaju odabir kodiranja izvornog teksta. Dobar primjer takve aplikacije je KWrite (radi na KDE-u na sistemima sličnim UNIX-u). Učitajte tekstualnu datoteku u editor. Zatim samo pređite preko kodiranja dok se ne prikaže čitljiv tekst (u KWrite, to se radi pomoću odjeljka Kodiranje u izborniku Alati).
Korak 3
Slično uređivaču teksta, pomoću preglednika možete odrediti kodiranje datoteke. Koristite Mozilla Firefox. Pokrenite ovu aplikaciju. Ako nije instaliran, preuzmite odgovarajuću distribuciju s mozilla.org i instalirajte je. Otvorite tekstualnu datoteku u svom pregledaču. Da biste to učinili, odaberite stavke "Datoteka" i "Otvori datoteku …" u glavnom izborniku ili pritisnite Ctrl + O. Ako se učitani tekst pravilno prikazuje, proširite odjeljak "Kodiranje" u izborniku "Pogled" i saznajte kodiranje iz naziva stavke na kojoj je postavljena oznaka. U suprotnom, odaberite ovaj parametar odabirom različitih stavki istog izbornika, kao i njegovog odjeljka "Dodatno".
Korak 4
Primijenite specijalizirane uslužne programe za određivanje kodiranja tekstualnih datoteka. Na sistemima sličnim UNIX-u možete koristiti enca. Ako je potrebno, instalirajte ovaj program pomoću raspoloživih upravitelja paketa. Izvođenjem naredbe navedite dostupne jezike:
enca --list jezika
Odredite kodiranje tekstualne datoteke navodeći njeno ime opcijom -g, a jezik dokumenta opcijom -L. Na primjer:
enca -L ruski -g /home/vic/tmp/aaa.txt.