Mojibake
Mojibake (文字化け, vyslovuje se /modʑibake/) je označení pro nesprávné, nečitelné znaky, které se zobrazují, když počítačový software nezobrazuje text správně. Při používání počítačů je text kódován pomocí kódování znaků. Při přenosu je každý znak nahrazen svou pozicí (nebo číslem) v kódování. Při opětovném zobrazení znaku je pozice opět nahrazena znakem. Pokud není původní kódování uvedeno, může být použit jiný znak, kdy je číslo opět nahrazeno znakem pro zobrazení. Pro vyřešení tohoto problému bylo zavedeno kódování Unicode: UTF-8 dokáže zakódovat většinu běžných znaků ve 2 bajtech.
Před zavedením Unicode se používala jiná kódování znaků. Například ISO-8859 obsahuje 15 různých kódování. Ta jsou stejná pro znaky běžně používané v angličtině. Mají několik "bloků" "speciálních znaků", které jsou pro každé kódování podány jinak.
Takto může vypadat webová stránka, pokud je použito nesprávné kódování písma.
Japonský článek na Wikipedii pro Mojibake používá kódování UTF-8. Tento snímek obrazovky ukazuje, jak vypadá, když je dekódován pomocí standardního kódování CP1252 systému Windows.
Původ slova
Mojibake je japonské slovo. Slovo 文字化け ([moʥibake]) se skládá ze dvou částí. 文字 (moji) znamená písmeno, znak. 化け (bake), od slovesa 化ける (bakeru), znamená objevit se v přestrojení, vzít na sebe podobu, změnit se k horšímu. Doslova to znamená "charakterová mutace".
Otázky a odpovědi
Otázka: Co je to "mojibake"?
A: Mojibake je výraz pro nesprávné a nečitelné znaky, které se objevují, když počítačový software nedokáže správně zobrazit text.
Otázka: Jak je kódován text při používání počítačů?
Odpověď: Text je kódován pomocí kódování znaků, kde je každý znak nahrazen svou pozicí nebo číslem v kódování.
Otázka: Co se stane, když při přenosu textu není zadáno původní kódování?
Odpověď: Pokud není zadáno původní kódování, může být při nahrazení čísla znakem pro zobrazení použit jiný znak.
Otázka: Co je Unicode a jak tento problém řeší?
Odpověď: Unicode je standard kódování znaků, který dokáže reprezentovat většinu znaků ve dvou bajtech. Řeší problém používání různých kódování znaků a zajišťuje správné zobrazení znaků.
Otázka: Jaké jsou příklady jiných kódování znaků, která se používala před Unicode?
Odpověď: ISO-8859 je příkladem jiného kódování znaků, které se používalo před Unicode.
Otázka: Kolik různých kódování obsahuje ISO-8859?
Odpověď: ISO-8859 obsahuje 15 různých kódování.
Otázka: Jsou speciální znaky v ISO-8859 stejné pro všechna jeho kódování?
Odpověď: Ne, speciální znaky v ISO-8859 jsou pro každé kódování podány jinak.