Utf
Znamená „Unicode Transformační formát. „UTF označuje několik typů Unicode kódování znaků, včetně UTF-7, UTF-8, UTF-16 a UTF-32.
- UTF-7 - používá 7 bitů pro každou postavu. Byl navržen tak, aby reprezentoval ASCII znaky v e-mail zprávy, které vyžadovaly kódování Unicode.
- UTF-8 - nejoblíbenější typ kódování Unicode. Používá jeden byte pro standardní anglická písmena a symboly, dva bajty pro další znaky latinky a Středního východu a tři bajty pro asijské znaky. Další znaky lze reprezentovat pomocí čtyř bajtů. UTF-8 je zpětně kompatibilní s ASCII, protože prvních 128 znaků je mapováno na stejné hodnoty.
- UTF-16 - rozšíření kódování Unicode "UCS-2", které pomocí dvou bajtů představuje 65,536 16 znaků. UTF-XNUMX však také podporuje čtyři bajty pro další znaky do jednoho milionu.
- UTF-32 - vícebajtové kódování, které představuje každý znak se 4 bajty.
Většina textu v dokumenty a webové stránky je kódováno pomocí jednoho z výše uvedených kódování UTF. Mnoho zpracování textu programy neumožňují zobrazit kódování znaků otevřených dokumentů, i když některé zobrazují kódování ve spodní části okna dokumentu nebo ve vlastnostech souboru. Chcete-li vidět typ kódování znaků používaný webovou stránkou, můžete vybrat zobrazit HTML stránky. Kódování znaků, pokud je definováno, bude v části záhlaví v horní části kódu HTML. Stránka, která používá kódování UTF-8, může v závislosti na verzi HTML obsahovat jeden z následujících textových úryvků níže.
XHTML: <meta http-equiv = "Content-Type" content = "text / html; charset = utf-8" />
HTML 5: <meta charset = "UTF-8">