Codificarea informațiilor despre text pe computer

Un computer este un dispozitiv complex cu care puteți crea, converti și stocați informații. Cu toate acestea, calculatorul nu funcționează destul de inteligent pentru noi - datele grafice, textuale și numerice sunt stocate ca arrays de binar codificarea informațiilor textualenumere. În acest articol, vom analiza modul în care sunt codate informațiile text.

Ce este un text pentru noi este o secvență de simboluri pentru un computer. Fiecare simbol reprezintă un set specific de zero și unul. Prin simboluri se înțelege nu numai literele mici și majuscule litere latine alfabet, dar și semne de punctuație, semne aritmetice, simboluri de serviciu, simboluri speciale și chiar un spațiu.

Codificarea binară a informațiilor textuale

Atunci când se apasă o anumită tastă, se transmite un semnal electric la controlerul intern, la care se convertește cod binar. Codul se potrivește cu un anumit caracter, care este afișat. Pentru a reprezenta alfabetul latin În format digital, a fost creat un sistem internațional ASCII de codificare. Aceasta necesită un octet pentru scrierea unui caracter, de aici simbolul constă dintr-o secvență de zerouri de opt cifre și una. Intervalul de înregistrare este de la 00000000 la 11111111, adică codarea informațiilor textuale prin intermediul acestui sistem permite prezentarea a 256 de simboluri. În cele mai multe cazuri, acest lucru este suficient.codificarea binară a informațiilor textuale



ASCII este împărțit în două părți. Primele 127 de caractere (de la 00000000 la 01111111) sunt internaționale și reprezintă caracterele și literele specifice ale alfabetului englez. A doua parte - extensia (10,000,000-11111111) - este destinat să reprezinte alfabetul național, al cărui scriere este diferită de latină.

Codificarea informațiilor textuale în ASCII este construită pe principiul creșterii succesive, adică cu cât este mai mare numărul literei latine, cu atât este mai mare valoarea codului său ASCII. Cifrele și partea rusă a tabelului sunt construite pe același principiu.

Cu toate acestea, în lume există mai multe tipuri de codificare pentru literele chirilice. Cele mai frecvente - este KOI-8 (codificare de opt biți, care a fost folosit în anii `70 în sistemul de operare primul ruifitsirovannyh Unix), ISO 8859-5 (dezvoltat de către Biroul Internațional de Standardizare), CP 1251 (codificare informații textuale utilizate în codarea și procesarea informațiilor textualemodern Windows OS), precum și codarea Unicode de 2 octeți, cu care puteți trimite 65.536 de caractere. O astfel de varietate de codificări se datorează faptului că acestea au fost dezvoltate la momente diferite, pentru diferite sisteme de operare și din diverse motive. Din acest motiv, de multe ori au dificultăți atunci când transferul de text dintr-un mediu în altul - de la o nepotrivire care codifică utilizatorul va vedea un set de pictograme confuze. Cum puteți remedia această situație? În Word, de exemplu, când deschideți un document, primiți un mesaj despre problemele legate de afișarea textului și oferă mai multe opțiuni pentru transcodare.

Deci, codarea și procesarea informațiilor textuale în adâncimile computerului este un proces destul de complicat și consumator de timp. Toate simbolurile oricărui alfabet reprezintă doar o anumită secvență de numere sistem binar, o celulă este un octet de informație.

Distribuiți pe rețelele sociale:

înrudit
Reprezentarea datelor într-un calculator: codificarea binară a informațiilorReprezentarea datelor într-un calculator: codificarea binară a informațiilor
ASCII (cod standard american pentru schimbul de informații) - codificarea textului de bază pentru…ASCII (cod standard american pentru schimbul de informații) - codificarea textului de bază pentru…
ASCII, simboluri: descriere, tabel de cod și vizualizăriASCII, simboluri: descriere, tabel de cod și vizualizări
O modalitate de codificare a informațiilor folosind numere. Codificare binarăO modalitate de codificare a informațiilor folosind numere. Codificare binară
Pentru ce este sistemul de numere hexazecimale?Pentru ce este sistemul de numere hexazecimale?
Câți biți în octeți? Ce este un pic și octet?Câți biți în octeți? Ce este un pic și octet?
Unități de informatică în informatică. Unitatea minimă de informațiiUnități de informatică în informatică. Unitatea minimă de informații
O abordare semnificativă și alfabetică a măsurării informațiilorO abordare semnificativă și alfabetică a măsurării informațiilor
Ce este codarea și decodificarea? Exemple. Metode de codare și decodificare a informațiilor…Ce este codarea și decodificarea? Exemple. Metode de codare și decodificare a informațiilor…
Care este codificarea informațiilor și procesarea acestora?Care este codificarea informațiilor și procesarea acestora?
» » Codificarea informațiilor despre text pe computer