Errore di codificazione: differenze tra le versioni

Da Konspedia.
Vai alla navigazioneVai alla ricerca
Nessun oggetto della modifica
Nessun oggetto della modifica
 
(2 versioni intermedie di uno stesso utente non sono mostrate)
Riga 1: Riga 1:
{{S}}
[[File:Mojibake.png|thumb|right|Screenshot di un testo non codificato correttamente, proveniente da un file di testo scritto con i caratteri giapponesi.]]
[[File:Mojibake.png|thumb|right|Screenshot di un testo non codificato correttamente, proveniente da un file di testo scritto con i caratteri giapponesi.]]


Per '''errore di codificazione''' si intende un fenomeno [[informatica|informatico]] che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di [[Codifica di caratteri|codifica]] non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non [[Alfabeto latino|latini]] utilizzati per codificare lingue come l'[[arabo]], il [[Lingua russa|russo]], il [[Lingua cinese|cinese]] od il [[Lingua giapponese|giapponese]], vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili.
Per '''errore di codificazione''' si intende un fenomeno [[informatica|informatico]] che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di [[Codifica di caratteri|codifica]] non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non [[Alfabeto latino|latini]] utilizzati per codificare lingue come l'[[arabo]], il [[Lingua russa|russo]], il [[Lingua cinese|cinese]] od il [[Lingua giapponese|giapponese]], vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili.


Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come [[Giappone]], [[Cina]], [[Corea del Sud]], ecc..., chi imbattono frequentemente in errori di codificazioni di questo genere. Il fenomeno è meglio conosciuto con il termine nipponico '''''mojibake''''' (文字化け).
Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come [[Giappone]], [[Cina]], [[Corea del Sud]], ecc..., che si imbattono frequentemente in errori di codificazioni di questo genere<ref>[https://wiki.pokemoncentral.it/Lingua Lingua - Pokémon Central wiki]</ref>. Il fenomeno è meglio conosciuto con il termine nipponico '''''mojibake''''' (文字化け)<ref name=":0">[https://it.alegsaonline.com/art/65823 Leandro Alegsa (2021): Mojibake - AlegsaOnline]</ref>.


== Etimologia ==
== Etimologia ==
Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico ''mojibake'' viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri.
Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico ''mojibake'' viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri.


Il termine mojibake (文字化け) è una [[parola macedonia]] in giapponese ottenuta dai termini 文字 (''moji'', trad. ''lettera'', ''carattere'') e 化ける (''bakeru'', trad. ''trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi'') dando il significato letterale di "''caratteri corrotti''". Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.
Il termine mojibake (文字化け) è una [[parola macedonia]] in giapponese ottenuta dai termini 文字 (''moji'', trad. ''lettera'', ''carattere'') e 化ける (''bakeru'', trad. ''trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi'') dando il significato letterale di "''caratteri corrotti''"<ref name=":0" />. Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.


In alcune lingue, come nel russo, il fenomeno viene chiamato ''кракозябры'', mentre in tedesco viene chiamato ''zeichensalat'' ed in cinese ''luànmǎ'' (亂碼 / 乱码).
In alcune lingue, come nel russo, il fenomeno viene chiamato ''кракозябры''<ref>[https://miassman.livejournal.com/632490.html Как расшифровать кракозябры вместо русских букв - Miassman] (in russo)</ref>, mentre in tedesco viene chiamato ''zeichensalat'' <ref>[https://www.runtoolz.com/de/blog/character-encoding-utf8-explained Zeichenkodierung erklärt: Von ASCII bis UTF-8 - RunToolz] (in tedesco)</ref>ed in cinese ''luànmǎ'' (亂碼 / 乱码)<ref>[https://baike.baidu.com/item/%E4%B9%B1%E7%A0%81/86091 乱码 - Baike Baidu] (in cinese)</ref>.


== Caratteristiche ==
== Caratteristiche ==
Un errore di codificazione testuale può essere confuso con la riproduzione di un [[file corrotto]], dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file.
Un errore di codificazione testuale può essere confuso con la riproduzione di un [[file corrotto]], dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file.
I mojibake si verificano quando un testo viene interpretato con una codifica dei caratteri diversa da quella con cui è stato originariamente salvato. In pratica, se un programma non riconosce correttamente la codifica utilizzata, tenterà di leggere i valori numerici dei caratteri applicando uno schema differente, producendo così simboli privi di senso.
Ad esempio, la seguente frase in lingua giapponese “Xitsoftが開発したビデオゲーム”, se codificata in [[UTF-8]], può comparire come “Xitsoft‚ªŠJ”­‚µ‚½ƒrƒfƒIƒQ[ƒ€” in diversi software Windows quando questi interpretano erroneamente il testo come [[Windows-1252]]<ref>[https://blog.pinapelz.com/blog/mojibake/ Mojibake. What is it? - Pinapelz's Blog] (in inglese)</ref>.
Un caso analogo può verificarsi nei browser: se una pagina è scritta in [[EUC-JP]] ma viene letta come [[Shift-JIS]] (o viceversa), e la codifica non è dichiarata esplicitamente nell’intestazione HTTP o nel codice HTML, il browser non è in grado di determinarla automaticamente e mostrerà caratteri alterati.
Questo fenomeno si verifica spesso quando dei software sviluppati per una determinata regione geografica vengono riprodotti su dei computer provenienti da altre regioni geografiche. Il motivo è dovuto spesso e volentieri ad esigenze regionali che comportano l'uso di codifiche di caratteri diverse a seconda dell'area geografica di riferimento. Un esempio iconico è l'esecuzione di un [[eseguibile]] (.exe) di un videogioco giapponese che utilizza la codifica [[CP932]], derivata dello Shift-JIS, su un sistema operativo [[Microsoft Windows]] italiano, che adopera la codifica Windows-1252. Da ciò si verificano errori di mojibake che possono causare una esecuzione anomala del programma interessato. Tuttavia l'utente può valutare l'utilizzo di strumenti come [[Microsoft AppLocale]] e [[Locale Emulator]] per poter riprodurre un applicazione od un file usando la codifica originale.


== Voci correlate ==
== Voci correlate ==
* [[Unicode]]
* [[Informatica]]
* [[Codifica di caratteri]]


== Fonti ==
== Fonti ==
* [https://www.unicode.org/help/display_problems.html Display Problems? - Unicode] (in inglese)
* [https://wiki.andrafarm.com/id3/2887-2783/Mojibake_125740_utn_wiki-andrafarm.html Mojibake - Buku Ensiklopedia Dunia] (in indonesiano)
* [https://wiki.andrafarm.com/IT/114-10/question-marks%2C-boxes%2C-or-other-symbols_11678_eduNitas.html Mojibake - Wiki Andrafarm] (in inglese)


== Note ==
== Note ==
[[Categoria:informatica]]
<references />
[[Categoria:Codifica di caratteri]]
 
[[Categoria:informatica]] [[Categoria:Codifica di caratteri]]

Versione attuale delle 17:04, 28 feb 2026

Screenshot di un testo non codificato correttamente, proveniente da un file di testo scritto con i caratteri giapponesi.

Per errore di codificazione si intende un fenomeno informatico che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di codifica non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non latini utilizzati per codificare lingue come l'arabo, il russo, il cinese od il giapponese, vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili.

Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come Giappone, Cina, Corea del Sud, ecc..., che si imbattono frequentemente in errori di codificazioni di questo genere[1]. Il fenomeno è meglio conosciuto con il termine nipponico mojibake (文字化け)[2].

Etimologia

Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico mojibake viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri.

Il termine mojibake (文字化け) è una parola macedonia in giapponese ottenuta dai termini 文字 (moji, trad. lettera, carattere) e 化ける (bakeru, trad. trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi) dando il significato letterale di "caratteri corrotti"[2]. Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.

In alcune lingue, come nel russo, il fenomeno viene chiamato кракозябры[3], mentre in tedesco viene chiamato zeichensalat [4]ed in cinese luànmǎ (亂碼 / 乱码)[5].

Caratteristiche

Un errore di codificazione testuale può essere confuso con la riproduzione di un file corrotto, dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file.

I mojibake si verificano quando un testo viene interpretato con una codifica dei caratteri diversa da quella con cui è stato originariamente salvato. In pratica, se un programma non riconosce correttamente la codifica utilizzata, tenterà di leggere i valori numerici dei caratteri applicando uno schema differente, producendo così simboli privi di senso.

Ad esempio, la seguente frase in lingua giapponese “Xitsoftが開発したビデオゲーム”, se codificata in UTF-8, può comparire come “Xitsoft‚ªŠJ”­‚µ‚½ƒrƒfƒIƒQ[ƒ€” in diversi software Windows quando questi interpretano erroneamente il testo come Windows-1252[6].

Un caso analogo può verificarsi nei browser: se una pagina è scritta in EUC-JP ma viene letta come Shift-JIS (o viceversa), e la codifica non è dichiarata esplicitamente nell’intestazione HTTP o nel codice HTML, il browser non è in grado di determinarla automaticamente e mostrerà caratteri alterati.

Questo fenomeno si verifica spesso quando dei software sviluppati per una determinata regione geografica vengono riprodotti su dei computer provenienti da altre regioni geografiche. Il motivo è dovuto spesso e volentieri ad esigenze regionali che comportano l'uso di codifiche di caratteri diverse a seconda dell'area geografica di riferimento. Un esempio iconico è l'esecuzione di un eseguibile (.exe) di un videogioco giapponese che utilizza la codifica CP932, derivata dello Shift-JIS, su un sistema operativo Microsoft Windows italiano, che adopera la codifica Windows-1252. Da ciò si verificano errori di mojibake che possono causare una esecuzione anomala del programma interessato. Tuttavia l'utente può valutare l'utilizzo di strumenti come Microsoft AppLocale e Locale Emulator per poter riprodurre un applicazione od un file usando la codifica originale.

Voci correlate

Fonti

Note