Errore di codificazione: differenze tra le versioni

Versione attuale delle 17:04, 28 feb 2026

Screenshot di un testo non codificato correttamente, proveniente da un file di testo scritto con i caratteri giapponesi.

Per errore di codificazione si intende un fenomeno informatico che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di codifica non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non latini utilizzati per codificare lingue come l'arabo, il russo, il cinese od il giapponese, vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili.

Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come Giappone, Cina, Corea del Sud, ecc..., che si imbattono frequentemente in errori di codificazioni di questo genere^[1]. Il fenomeno è meglio conosciuto con il termine nipponico mojibake (文字化け)^[2].

Etimologia

Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico mojibake viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri.

Il termine mojibake (文字化け) è una parola macedonia in giapponese ottenuta dai termini 文字 (moji, trad. lettera, carattere) e 化ける (bakeru, trad. trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi) dando il significato letterale di "caratteri corrotti"^[2]. Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.

In alcune lingue, come nel russo, il fenomeno viene chiamato кракозябры^[3], mentre in tedesco viene chiamato zeichensalat ^[4]ed in cinese luànmǎ (亂碼 / 乱码)^[5].

Caratteristiche

Un errore di codificazione testuale può essere confuso con la riproduzione di un file corrotto, dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file.

I mojibake si verificano quando un testo viene interpretato con una codifica dei caratteri diversa da quella con cui è stato originariamente salvato. In pratica, se un programma non riconosce correttamente la codifica utilizzata, tenterà di leggere i valori numerici dei caratteri applicando uno schema differente, producendo così simboli privi di senso.

Ad esempio, la seguente frase in lingua giapponese “Xitsoftが開発したビデオゲーム”, se codificata in UTF-8, può comparire come “Xitsoft‚ªŠJ”‚µ‚½ƒrƒfƒIƒQ[ƒ€” in diversi software Windows quando questi interpretano erroneamente il testo come Windows-1252^[6].

Un caso analogo può verificarsi nei browser: se una pagina è scritta in EUC-JP ma viene letta come Shift-JIS (o viceversa), e la codifica non è dichiarata esplicitamente nell’intestazione HTTP o nel codice HTML, il browser non è in grado di determinarla automaticamente e mostrerà caratteri alterati.

Questo fenomeno si verifica spesso quando dei software sviluppati per una determinata regione geografica vengono riprodotti su dei computer provenienti da altre regioni geografiche. Il motivo è dovuto spesso e volentieri ad esigenze regionali che comportano l'uso di codifiche di caratteri diverse a seconda dell'area geografica di riferimento. Un esempio iconico è l'esecuzione di un eseguibile (.exe) di un videogioco giapponese che utilizza la codifica CP932, derivata dello Shift-JIS, su un sistema operativo Microsoft Windows italiano, che adopera la codifica Windows-1252. Da ciò si verificano errori di mojibake che possono causare una esecuzione anomala del programma interessato. Tuttavia l'utente può valutare l'utilizzo di strumenti come Microsoft AppLocale e Locale Emulator per poter riprodurre un applicazione od un file usando la codifica originale.

Voci correlate

Fonti

Display Problems? - Unicode (in inglese)
Mojibake - Buku Ensiklopedia Dunia (in indonesiano)
Mojibake - Wiki Andrafarm (in inglese)

Note

↑ Lingua - Pokémon Central wiki
↑ ^2,0 ^2,1 Leandro Alegsa (2021): Mojibake - AlegsaOnline
↑ Как расшифровать кракозябры вместо русских букв - Miassman (in russo)
↑ Zeichenkodierung erklärt: Von ASCII bis UTF-8 - RunToolz (in tedesco)
↑ 乱码 - Baike Baidu (in cinese)
↑ Mojibake. What is it? - Pinapelz's Blog (in inglese)

[1] Lingua - Pokémon Central wiki

[:0-2] 2,0 ^2,1 Leandro Alegsa (2021): Mojibake - AlegsaOnline

[3] Как расшифровать кракозябры вместо русских букв - Miassman (in russo)

[4] Zeichenkodierung erklärt: Von ASCII bis UTF-8 - RunToolz (in tedesco)

[5] 乱码 - Baike Baidu (in cinese)

[6] Mojibake. What is it? - Pinapelz's Blog (in inglese)

[1]

[2]

[3]

[4]

[5]

[6]

@@ Riga 1: / Riga 1: @@
-{{S}}
 [[File:Mojibake.png|thumb|right|Screenshot di un testo non codificato correttamente, proveniente da un file di testo scritto con i caratteri giapponesi.]]
 Per '''errore di codificazione''' si intende un fenomeno [[informatica|informatico]] che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di [[Codifica di caratteri|codifica]] non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non [[Alfabeto latino|latini]] utilizzati per codificare lingue come l'[[arabo]], il [[Lingua russa|russo]], il [[Lingua cinese|cinese]] od il [[Lingua giapponese|giapponese]], vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili.
-Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come [[Giappone]], [[Cina]], [[Corea del Sud]], ecc..., chi imbattono frequentemente in errori di codificazioni di questo genere. Il fenomeno è meglio conosciuto con il termine nipponico '''''mojibake''''' (文字化け).
+Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come [[Giappone]], [[Cina]], [[Corea del Sud]], ecc..., che si imbattono frequentemente in errori di codificazioni di questo genere<ref>[https://wiki.pokemoncentral.it/Lingua Lingua - Pokémon Central wiki]</ref>. Il fenomeno è meglio conosciuto con il termine nipponico '''''mojibake''''' (文字化け)<ref name=":0">[https://it.alegsaonline.com/art/65823 Leandro Alegsa (2021): Mojibake - AlegsaOnline]</ref>.
 == Etimologia ==
 Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico ''mojibake'' viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri.
-Il termine mojibake (文字化け) è una [[parola macedonia]] in giapponese ottenuta dai termini 文字 (''moji'', trad. ''lettera'', ''carattere'') e 化ける (''bakeru'', trad. ''trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi'') dando il significato letterale di "''caratteri corrotti''". Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.
+Il termine mojibake (文字化け) è una [[parola macedonia]] in giapponese ottenuta dai termini 文字 (''moji'', trad. ''lettera'', ''carattere'') e 化ける (''bakeru'', trad. ''trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi'') dando il significato letterale di "''caratteri corrotti''"<ref name=":0" />. Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.
-In alcune lingue, come nel russo, il fenomeno viene chiamato ''кракозябры'', mentre in tedesco viene chiamato ''zeichensalat'' ed in cinese ''luànmǎ'' (亂碼 / 乱码).
+In alcune lingue, come nel russo, il fenomeno viene chiamato ''кракозябры''<ref>[https://miassman.livejournal.com/632490.html Как расшифровать кракозябры вместо русских букв - Miassman] (in russo)</ref>, mentre in tedesco viene chiamato ''zeichensalat'' <ref>[https://www.runtoolz.com/de/blog/character-encoding-utf8-explained Zeichenkodierung erklärt: Von ASCII bis UTF-8 - RunToolz] (in tedesco)</ref>ed in cinese ''luànmǎ'' (亂碼 / 乱码)<ref>[https://baike.baidu.com/item/%E4%B9%B1%E7%A0%81/86091 乱码 - Baike Baidu] (in cinese)</ref>.
 == Caratteristiche ==
 Un errore di codificazione testuale può essere confuso con la riproduzione di un [[file corrotto]], dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file.
+I mojibake si verificano quando un testo viene interpretato con una codifica dei caratteri diversa da quella con cui è stato originariamente salvato. In pratica, se un programma non riconosce correttamente la codifica utilizzata, tenterà di leggere i valori numerici dei caratteri applicando uno schema differente, producendo così simboli privi di senso.
+Ad esempio, la seguente frase in lingua giapponese “Xitsoftが開発したビデオゲーム”, se codificata in [[UTF-8]], può comparire come “Xitsoft‚ªŠJ”‚µ‚½ƒrƒfƒIƒQ[ƒ€” in diversi software Windows quando questi interpretano erroneamente il testo come [[Windows-1252]]<ref>[https://blog.pinapelz.com/blog/mojibake/ Mojibake. What is it? - Pinapelz's Blog] (in inglese)</ref>.
+Un caso analogo può verificarsi nei browser: se una pagina è scritta in [[EUC-JP]] ma viene letta come [[Shift-JIS]] (o viceversa), e la codifica non è dichiarata esplicitamente nell’intestazione HTTP o nel codice HTML, il browser non è in grado di determinarla automaticamente e mostrerà caratteri alterati.
+Questo fenomeno si verifica spesso quando dei software sviluppati per una determinata regione geografica vengono riprodotti su dei computer provenienti da altre regioni geografiche. Il motivo è dovuto spesso e volentieri ad esigenze regionali che comportano l'uso di codifiche di caratteri diverse a seconda dell'area geografica di riferimento. Un esempio iconico è l'esecuzione di un [[eseguibile]] (.exe) di un videogioco giapponese che utilizza la codifica [[CP932]], derivata dello Shift-JIS, su un sistema operativo [[Microsoft Windows]] italiano, che adopera la codifica Windows-1252. Da ciò si verificano errori di mojibake che possono causare una esecuzione anomala del programma interessato. Tuttavia l'utente può valutare l'utilizzo di strumenti come [[Microsoft AppLocale]] e [[Locale Emulator]] per poter riprodurre un applicazione od un file usando la codifica originale.
 == Voci correlate ==
+* [[Unicode]]
+* [[Informatica]]
+* [[Codifica di caratteri]]
 == Fonti ==
+* [https://www.unicode.org/help/display_problems.html Display Problems? - Unicode] (in inglese)
+* [https://wiki.andrafarm.com/id3/2887-2783/Mojibake_125740_utn_wiki-andrafarm.html Mojibake - Buku Ensiklopedia Dunia] (in indonesiano)
+* [https://wiki.andrafarm.com/IT/114-10/question-marks%2C-boxes%2C-or-other-symbols_11678_eduNitas.html Mojibake - Wiki Andrafarm] (in inglese)
 == Note ==
-[[Categoria:informatica]]
+<references />
-[[Categoria:Codifica di caratteri]]
+[[Categoria:informatica]] [[Categoria:Codifica di caratteri]]

Errore di codificazione: differenze tra le versioni

Versione attuale delle 17:04, 28 feb 2026

Indice

Etimologia

Caratteristiche

Voci correlate

Fonti

Note

Menu di navigazione

Azioni sulla pagina

Azioni sulla pagina

Strumenti personali

Navigazione

Ricerca

Strumenti