Errore di codificazione: differenze tra le versioni
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
| Riga 5: | Riga 5: | ||
Per '''errore di codificazione''' si intende un fenomeno [[informatica|informatico]] che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di [[Codifica di caratteri|codifica]] non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non [[Alfabeto latino|latini]] utilizzati per codificare lingue come l'[[arabo]], il [[Lingua russa|russo]], il [[Lingua cinese|cinese]] od il [[Lingua giapponese|giapponese]], vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili. | Per '''errore di codificazione''' si intende un fenomeno [[informatica|informatico]] che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di [[Codifica di caratteri|codifica]] non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non [[Alfabeto latino|latini]] utilizzati per codificare lingue come l'[[arabo]], il [[Lingua russa|russo]], il [[Lingua cinese|cinese]] od il [[Lingua giapponese|giapponese]], vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili. | ||
Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come [[Giappone]], [[Cina]], [[Corea del Sud]], ecc..., | Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come [[Giappone]], [[Cina]], [[Corea del Sud]], ecc..., che si imbattono frequentemente in errori di codificazioni di questo genere<ref>[https://wiki.pokemoncentral.it/Lingua Lingua - Pokémon Central wiki]</ref>. Il fenomeno è meglio conosciuto con il termine nipponico '''''mojibake''''' (文字化け)<ref name=":0">[https://it.alegsaonline.com/art/65823 Leandro Alegsa (2021): Mojibake - AlegsaOnline]</ref>. | ||
== Etimologia == | == Etimologia == | ||
Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico ''mojibake'' viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri. | Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico ''mojibake'' viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri. | ||
Il termine mojibake (文字化け) è una [[parola macedonia]] in giapponese ottenuta dai termini 文字 (''moji'', trad. ''lettera'', ''carattere'') e 化ける (''bakeru'', trad. ''trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi'') dando il significato letterale di "''caratteri corrotti''". Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno. | Il termine mojibake (文字化け) è una [[parola macedonia]] in giapponese ottenuta dai termini 文字 (''moji'', trad. ''lettera'', ''carattere'') e 化ける (''bakeru'', trad. ''trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi'') dando il significato letterale di "''caratteri corrotti''"<ref name=":0" />. Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno. | ||
In alcune lingue, come nel russo, il fenomeno viene chiamato ''кракозябры'', mentre in tedesco viene chiamato ''zeichensalat'' ed in cinese ''luànmǎ'' (亂碼 / 乱码). | In alcune lingue, come nel russo, il fenomeno viene chiamato ''кракозябры''<ref>[https://miassman.livejournal.com/632490.html Как расшифровать кракозябры вместо русских букв - Miassman] (in russo)</ref>, mentre in tedesco viene chiamato ''zeichensalat'' <ref>[https://www.runtoolz.com/de/blog/character-encoding-utf8-explained Zeichenkodierung erklärt: Von ASCII bis UTF-8 - RunToolz] (in tedesco)</ref>ed in cinese ''luànmǎ'' (亂碼 / 乱码)<ref>[https://baike.baidu.com/item/%E4%B9%B1%E7%A0%81/86091 乱码 - Baike Baidu] (in cinese)</ref>. | ||
== Caratteristiche == | == Caratteristiche == | ||
Un errore di codificazione testuale può essere confuso con la riproduzione di un [[file corrotto]], dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file. | Un errore di codificazione testuale può essere confuso con la riproduzione di un [[file corrotto]], dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file. | ||
I mojibake si verificano quando un testo viene interpretato con una codifica dei caratteri diversa da quella con cui è stato originariamente salvato. In pratica, se un programma non riconosce correttamente la codifica utilizzata, tenterà di leggere i valori numerici dei caratteri applicando uno schema differente, producendo così simboli privi di senso. | |||
Ad esempio, la seguente frase in lingua giapponese “Xitsoftが開発したビデオゲーム”, se codificata in [[UTF-8]], può comparire come “Xitsoft‚ªŠJ”‚µ‚½ƒrƒfƒIƒQ[ƒ€” in diversi software Windows quando questi interpretano erroneamente il testo come [[Windows-1252]]. | |||
Un caso analogo può verificarsi nei browser: se una pagina è scritta in [[EUC-JP]] ma viene letta come [[Shift-JIS]] (o viceversa), e la codifica non è dichiarata esplicitamente nell’intestazione HTTP o nel codice HTML, il browser non è in grado di determinarla automaticamente e mostrerà caratteri alterati. | |||
== Voci correlate == | == Voci correlate == | ||
* [[Unicode]] | |||
* [[Informatica]] | |||
* [[Codifica di caratteri]] | |||
== Fonti == | == Fonti == | ||
* [https://www.unicode.org/help/display_problems.html Display Problems? - Unicode] (in inglese) | |||
* [https://wiki.andrafarm.com/id3/2887-2783/Mojibake_125740_utn_wiki-andrafarm.html Mojibake - Buku Ensiklopedia Dunia] (in indonesiano) | |||
* [https://wiki.andrafarm.com/IT/114-10/question-marks%2C-boxes%2C-or-other-symbols_11678_eduNitas.html Mojibake - Wiki Andrafarm] (in inglese) | |||
== Note == | == Note == | ||
[[Categoria:informatica]] | [[Categoria:informatica]] | ||
[[Categoria:Codifica di caratteri]] | [[Categoria:Codifica di caratteri]] | ||
Versione delle 15:52, 28 feb 2026

ATTENZIONE: Riteniamo la seguente voce un abbozzo (stub), pertanto è incompleta e va ampliata.
Questo avviso verrà rimosso da questa pagina solo quando questa voce sarà ritenuta completata.

Per errore di codificazione si intende un fenomeno informatico che si verifica quando un programma riproduce un testo digitale che utilizza un sistema di codifica non supportato. I caratteri permessi dalle codifiche non supportate, come nel caso di caratteri testuali non latini utilizzati per codificare lingue come l'arabo, il russo, il cinese od il giapponese, vengono riprodotti con altri sistemi di codificazione che vengono invece supportati dal sistema o dal programma, che porta così ad una sostituzione di caratteri illeggibili.
Questo fenomeno è spesso collegato a comunità di videogiocatori e retrogamers interessati a riprodurre, tradurre o informarsi su videogiochi sviluppati nei paesi estremorientali come Giappone, Cina, Corea del Sud, ecc..., che si imbattono frequentemente in errori di codificazioni di questo genere[1]. Il fenomeno è meglio conosciuto con il termine nipponico mojibake (文字化け)[2].
Etimologia
Le espressioni "errore di codificazione" od "errore di codifica", in ambito informatico, sono molto generiche e possono essere utilizzate anche in altri contesti che non riguardano il fenomeno descritto da questa pagina (tipo in caso di errori in un algoritmo di compressione, errore nella codifica video/audio (codec), errore nella serializzazione di dati binari, bug nella conversione tra formati). Per questa ragione, il termine nipponico mojibake viene preferito quando ci stiamo rivolgendo ad un errore di codificazione dei caratteri.
Il termine mojibake (文字化け) è una parola macedonia in giapponese ottenuta dai termini 文字 (moji, trad. lettera, carattere) e 化ける (bakeru, trad. trasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi) dando il significato letterale di "caratteri corrotti"[2]. Il termine viene utilizzato anche in testi ed articoli in lingua inglese, francese ed araba che descrivono il fenomeno.
In alcune lingue, come nel russo, il fenomeno viene chiamato кракозябры[3], mentre in tedesco viene chiamato zeichensalat [4]ed in cinese luànmǎ (亂碼 / 乱码)[5].
Caratteristiche
Un errore di codificazione testuale può essere confuso con la riproduzione di un file corrotto, dal momento che in entrambi i casi il testo presenta una sequenza di "caratteri strani". I due fenomeni possono essere distinti dal fatto che nel primo caso il problema è causato dal sistema o dal programma, incapace di riprodurre correttamente il file, mentre nel secondo caso il responsabile del problema è proprio il file.
I mojibake si verificano quando un testo viene interpretato con una codifica dei caratteri diversa da quella con cui è stato originariamente salvato. In pratica, se un programma non riconosce correttamente la codifica utilizzata, tenterà di leggere i valori numerici dei caratteri applicando uno schema differente, producendo così simboli privi di senso.
Ad esempio, la seguente frase in lingua giapponese “Xitsoftが開発したビデオゲーム”, se codificata in UTF-8, può comparire come “Xitsoft‚ªŠJ”‚µ‚½ƒrƒfƒIƒQ[ƒ€” in diversi software Windows quando questi interpretano erroneamente il testo come Windows-1252.
Un caso analogo può verificarsi nei browser: se una pagina è scritta in EUC-JP ma viene letta come Shift-JIS (o viceversa), e la codifica non è dichiarata esplicitamente nell’intestazione HTTP o nel codice HTML, il browser non è in grado di determinarla automaticamente e mostrerà caratteri alterati.
Voci correlate
Fonti
- Display Problems? - Unicode (in inglese)
- Mojibake - Buku Ensiklopedia Dunia (in indonesiano)
- Mojibake - Wiki Andrafarm (in inglese)