Unicode

Unicode je univerzální Kódování znaků Standard. Definuje způsob individuální znaků jsou zastoupeny v textových souborech, webové stránkya další typy dokumenty.

Na rozdíl od ASCII, který byl navržen tak, aby představoval pouze základní anglické znaky, byl Unicode navržen tak, aby podporoval znaky ze všech jazyků po celém světě. Standardní znaková sada ASCII podporuje pouze 128 znaků, zatímco Unicode může podporovat zhruba 1,000,000 XNUMX XNUMX znaků. Zatímco ASCII používá pouze jeden byte k reprezentaci každého znaku podporuje Unicode až 4 bajty pro každý znak.

Existuje však několik různých typů kódování Unicode UTF-8 a UTF-16 jsou nejběžnější. UTF-8 se stalo standardním kódováním znaků použitým na Web a je také výchozím kódováním používaným mnoha uživateli software programy. Zatímco UTF-8 podporuje až čtyři bajty na znak, bylo by neúčinné použít čtyři bajty k reprezentaci často používaných znaků. Proto UTF-8 používá pouze jeden bajt k reprezentaci běžných anglických znaků. Evropské (latinské), hebrejské a arabské znaky jsou reprezentovány dvěma bajty, zatímco tři bajty jsou použity pro čínské, japonské, korejské a další asijské znaky. Další znaky Unicode lze reprezentovat čtyřmi bajty.

Domů : Bity a bajty : Definice Unicode

Unicode

TechLib - počítačový slovník Tech Lib

‹Nepřátelé | Unix ›