Informatică Alte teme

Cum se reprezinta caracterele in calculator ASCII Unicode?

Caracterele sunt reprezentate în calculator prin coduri numerice în standarde precum ASCII și Unicode. ASCII (American Standard Code for Information Interchange) folosește 7 biți pentru 128 de caractere, în timp ce Unicode suportă peste 1.000.000 de caractere, incluzând alfabete globale. De exemplu, în ASCII, 'A' are codul 65, iar în Unicode, '€' are codul U+20AC.

Standardul ASCII

  • Structura ASCII ASCII este un tabel de 128 de caractere, numerotate de la 0 la 127. Primele 32 sunt caractere de control (de exemplu, codul 10 pentru linie nouă), iar 33-126 sunt caractere imprimabile, cum ar fi litere, cifre și simboluri. 'A' este 65, 'a' este 97, '0' este 48.
  • Limitări ASCII ASCII suportă doar caracterele englezești de bază și nu include diacritice (cum ar fi ă, â) sau simboluri din alte limbi. Aceasta a condus la dezvoltarea Unicode pentru suport global.
  • Exemplu de cod ASCII Pentru șirul 'Hi', codurile sunt: H = 72, i = 105. În binar, 72 este 01001000 și 105 este 01101001. Calculatorul stochează aceste coduri ca biți.

Standardul Unicode

  • Scopul Unicode Unicode acoperă toate sistemele de scriere din lume, inclusiv latin, chirilic, arab, chinez etc. Folosește puncte de cod, reprezentate în hexazecimal, de exemplu U+0041 pentru 'A'. Versiunea curentă include peste 150.000 de caractere.
  • Codificări Unicode UTF-8, UTF-16 și UTF-32 sunt metode de codificare a punctelor de cod Unicode în biți. UTF-8 este cea mai folosită, fiind compatibilă cu ASCII: folosește 1-4 octeți per caracter. Exemplu: '€' este codificat ca 3 octeți în UTF-8: E2 82 AC.
  • Exemplu Unicode Caracterul 'ă' are punctul de cod U+0103. În UTF-8, este codificat ca doi octeți: C4 83. Aceasta permite reprezentarea în documente web sau software fără probleme de compatibilitate.

Folosește UTF-8 pentru documente web pentru a asigura afișarea corectă a diacriticelor și a caracterelor internaționale.

Mai multe din Alte teme