Korvaava hahmo

�

Kuva

◄

￹

￺

￻

�

🐀

►

Ominaisuudet

Nimi

korvaava hahmo

Unicode

U+FFFD

HTML-koodi

� tai �

UTF-16

0xFFFD

URL-koodi

%EF%BF%BD

Korvausmerkki � on tietojenkäsittelytieteen merkki, jota käytetään, kun merkin merkitystä ei tunneta tai sitä ei voida ilmaista Unicodessa .

Tämä hahmo on kohdassa U+FFFD [1] Erikoismerkit - ryhmässä. Se on monikielisen perustason viimeinen merkki (seuraavat paikat U+FFFE ja U+FFFF eivät ole merkkien varassa, vaan niitä käytetään virheraportointiin) [2] .

Kirjoitus

Tämä symboli näyttää mustalta timantilta, jonka sisään on kaiverrettu kysymysmerkki . Se muistuttaa kuvamerkkiä , jossa on kysymysmerkki, ja se tarkoittaa tuntematonta, epävarmuutta. Quivira-fontin reunojen ympärillä on musta reunus, joka on erotettu timantista. Tämä tekee symbolista vieläkin enemmän kuvamerkin kaltaisen.

Käyttö

Merkkiä käytetään, kun näytetään tekstit, jotka on muunnettu muista koodauksista Unicode-muotoon, osoittamaan, että lähdetekstin merkillä ei ole Unicode-vastinetta [2] . Tämä voi johtua väärästä merkkikoodausasetuksesta.

Oletetaan, että meillä on tekstitiedosto, joka sisältää saksankielisen sanan fürISO 8859-1 -koodauksessa. Tämä tekstitiedosto lähetettiin Internetin kautta käyttäjälle, jonka oletuskoodaus on UTF-8. Ensimmäinen tavu ( 0x66) on välillä 0x00-0x7F, UTF-8 tekee sen oikein muodossa "f". Toinen tavu ( 0xFC) ei ole kelvollinen arvo minkään merkin alussa UTF-8:ssa, joten selain näyttää korvaavan merkin tämän tavun tilalla varoittaakseen käyttäjää, että jokin meni pieleen. Kolmas tavu ( 0x72) on myös 0x00-0x7F:n sisällä, UTF-8 tekee sen oikein muodossa "r". Ja koko sana näytetään muodossa f�r.

Tekstieditori voi näyttää korvaavan merkin UTF-8:ssa, ja kun lähetät tiedoston takaisin ISO 8859-1 -standardiin, tämä merkki korvataan epäjohdonmukaisella kolmen merkin yhdistelmällä: . Tämä johtuu siitä, että UTF-8-korvausmerkki on . 0xEF - ï, 0xBF - ¿, 0xBD - ½ ja yhdessä - ï¿½. fï¿½r0xEF 0xBF 0xBD

Java - ohjelmointikielessä U+FFFD-asemaa käytetään perinteisesti merkitsemään NaN , joka ei vastaa Unicode-arvoa [2] .

Muistiinpanot

↑ U+ FFFD - VAIHTOMERKKI . Käyttöpäivä: 6. tammikuuta 2013. Arkistoitu alkuperäisestä 27. tammikuuta 2013.
↑ 1 2 3 Jukka K. Korpela. Unicode selitetty . - "O'Reilly Media, Inc.", 21.6.2006. — 702 s. — ISBN 978-0-596-10121-3 . Arkistoitu 7. heinäkuuta 2020 Wayback Machinessa

Linkit

� osoitteessa Scriptsource.org
Sivu osoitteessa Unicode.org

Kirjallisuus

Luciano Ramalho. Python. Huippuosaamisen korkeuksiin . - Litraa, 2019-11-01. – 770 s. - ISBN 978-5-04-041745-2 . Arkistoitu 20. heinäkuuta 2020 Wayback Machinessa
Jukka K. Korpela. Unicode selitetty . - "O'Reilly Media, Inc.", 21.6.2006. — 702 s. — ISBN 978-0-596-10121-3 . Arkistoitu 20. heinäkuuta 2020 Wayback Machinessa
Unicode-konsortio. Unicode-standardi: Maailmanlaajuinen merkkikoodaus . - Addison-Wesley Pub., 1991. - 710 s. - ISBN 978-0-201-56788-5 . Arkistoitu 20. heinäkuuta 2020 Wayback Machinessa