Nollapäätteinen merkkijono

Nollapäätteinen merkkijono tai C-merkkijono ( C-kielen nimestä ) tai ASCIIZ-merkkijono on tapa esittää merkkijonoja ohjelmointikielissä, jossa käytetään merkkijonoa sen sijaan, että ottaisi käyttöön erityistä merkkijonotyyppiä, ja ensimmäinen erikoisnullamerkki ( NUL ASCII -koodista , arvolla 0).

Kuvaus

Esimerkiksi merkkijonopuskurissa (merkkijonon tallentamiseen varattu muistialue), jonka koko on 11 tavua, nollapäätteinen merkkijono "STRING" Windows-1251- koodauksessa voidaan esittää seuraavasti:

FROM	T	R	O	Vastaanottaja	MUTTA	NUL	F	%	NUL	neljä
0xD1	0xD2	0xD0	0xCE	0xCA	0xC0	0x00	0x46	0x25	0x00	0x34

Tässä esimerkissä esitetään 11 tavun muistialue, vaikka todellisuudessa rivi vie vain 7. Nollamerkin jälkeisiä merkkejä (8 - 11 tavua) kutsutaan roskiksi - tämä on data, joka on voinut jäädä puskuriin aiemmista riveistä tai muista muistin käyttötavoista. Ne voivat sisältää myös nollamerkkejä.

Yksitavuisia koodauksia ( ASCII ) käytettäessä N merkin merkkijonon esittämiseen tarvittava muisti on N + 1 tavua. Kun Unicodea käytetään merkkien koodaamiseen , merkkijonon pituus riippuu käytetystä Unicode-muodosta (esimerkiksi 2N + 2 tavua UCS-2 :lle ).

Tällaiset merkkijonot ovat vakiona C :ssä ja joissakin muissa ohjelmointikielissä. Koska niitä käytetään välittämään merkkijonoargumentteja vakiofunktioille monissa käyttöjärjestelmissä , nollapääteisten merkkijonojen käsittelyyn liittyviä toimintoja on ilmestynyt Pascalissa ja muissa kielissä.

Nollapääteiseen merkkijonoon viitattaessa käytetään osoitinta sen ensimmäiseen merkkiin. Tämä on yksinkertainen, nopea ja joustava lähestymistapa, mutta virhealtis [1] [2] . Ohjelmoijan on jatkuvasti seurattava koodiaan, nimittäin:

varmista, että puskurissa ei ole ylivuotoja ;
hallitse merkkijonoille varattua muistia huolellisesti ;
tarkkaile merkkijonojen oikeaa nollapäätettä, kun käytät toimintoja, jotka eivät takaa sitä (esimerkiksi strncpy );
harvoissa tapauksissa, kun merkkijonon koko voi olla hyvin suuri, varmista, että kokonaislukujen ylivuotoa ei tapahdu pituutta laskettaessa ja muita pituuteen liittyviä laskelmia.

Myös jotkin merkkijonotoiminnot, kuten ketjutus , ovat hitaampia nollapäätteisille merkkijonoille kuin muille merkkijonotyypeille.

Vertailu vaihtoehtoihin

Vaihtoehto nollapäätteisille merkkijonoille ovat Pascalissa ja nykyaikaisissa OOP-kielissä omaksutut menetelmät. Pascalissa merkkijono alkaa taulukon ensimmäisestä elementistä ja merkkijonon pituus tallennetaan nollaelementtiin. Tässä tapauksessa ei tarvita erityistä päätettä merkitsemään rivin loppua. Toisaalta tässä merkkijonon pituutta rajoittaa taulukon nollaelementin kapasiteetti, eli yksitavuisten elementtien tapauksessa merkkijonon pituus ei saa ylittää 255 merkkiä. Tämä rajoitus ei koske nollapääteisiä merkkijonoja, ja ne voivat teoriassa tallentaa minkä tahansa pituisia merkkijonoja. Oliopohjaiset kielet tallentavat tietueen, jossa on merkkijonon pituus ja viittaus (tai osoitin) merkkijonoon. Nämä menetelmät eivät kärsi nollapääteisten merkkijonojen haitoista: ne voivat tallentaa nollamerkkejä ilman vääristymiä ja erityistä koodausta.

Useat rajapinnat käyttävät kaksoisnolla-pääteisiä merkkijonoja, joiden päätemerkki on kaksi peräkkäistä nollapäätettä [3] .

C-kielellä

Työskennelläkseen nollapääteisten merkkijonojen kanssa C - ohjelmointikieli käyttää useita toimintoja :

strcpy , wcscpy - merkkijonojen kopiointi;
strlen , wcslen - merkkijonon pituuden laskeminen;
strchr - etsi merkkijonosta;
strdup - merkkijonojen monistus;
strstr - etsi alimerkkijonoa;
strtok - merkkijonon jakaminen erottimien kautta osamerkkijonoiksi;
strbrk - löytää ensimmäisen esiintymän toisen merkkijonon merkkijonosta.

Assemblykielellä

Jotkut kokoonpanokielen maut käyttävät erityistä direktiiviä NUL-päätteisten merkkijonojen määrittelemiseen. Joten GNU Assemblerissä on ohje .asciz[4] [5] tätä varten .

Katso myös

merkkijonotyyppi

Muistiinpanot

↑ Joel ohjelmistosta - Takaisin perusteisiin (linkki ei ole käytettävissä) . Haettu 17. syyskuuta 2016. Arkistoitu alkuperäisestä 25. syyskuuta 2016. (määrätön)
↑ Kallein yhden tavun virhe - ACM-jono . Haettu 17. syyskuuta 2016. Arkistoitu alkuperäisestä 19. syyskuuta 2016. (määrätön)
↑ Mikä on kaksoisnollapäätteisen merkkijonon muoto, jossa ei ole merkkijonoja? Arkistoitu 13. helmikuuta 2019 Wayback Machinessa / MSDN:ssä, 2009
↑ GNU assemblerin käyttö: Kokoonpanoohjeet . Haettu 17. syyskuuta 2016. Arkistoitu alkuperäisestä 17. syyskuuta 2016. (määrätön)
↑ Arkistoitu kopio . Haettu 17. syyskuuta 2016. Arkistoitu alkuperäisestä 17. syyskuuta 2016. (määrätön)

Kirjallisuus

Poul-Henning Kamp, kallein yhden tavun virhe. Ovatko Ken, Dennis ja Brian valinneet väärin NUL-päätteisten tekstijonojen suhteen? Arkistoitu 19. syyskuuta 2016 Wayback Machine / ACM Queue, osa 9, numero 7, 25. heinäkuuta 2011
Back to Basics (venäjäksi) - Back to Basics by Joel Spolsky Arkistoitu 5. syyskuuta 2016 Wayback Machinessa 11. joulukuuta 2001 (englanniksi)

Linkit

http://c2.com/cgi/wiki?StringWithoutLength Arkistoitu 19. heinäkuuta 2016 Wayback Machinessa
http://c2.com/cgi/wiki?NonNullTerminatedString Arkistoitu 20. syyskuuta 2016 Wayback Machinessa

C-ohjelmointikieli
ANSI C C89 ja C90 C99 C11 C17 C2x Upotettu C MISRA C
Kääntäjät	Borland Turbo C Kalahtaa GCC LCC Pelles C PCC TCC Visuaalinen C++ C++/CLI C++/CX Watcom C/C++ -kääntäjä
Kirjastot	C Standard Library glibc dietlibc uclibc Newlib eglibc Bionic lihas
Erikoisuudet	Operaattorit C-merkkijono Syntaksi Esiprosessori otsikkotiedostot windows.h Tietotyypit Toiminnot
Jotkut jälkeläiset	C++ C-- C# D Tavoite-C Swift Java Alef_ Limbo mennä Vala
C ja muut kielet	C ja C++ ( yhteensopivuus operaattorit ) Pascalin ja C:n vertailu C-kääntäjä Java-tavukoodiin
Luokka: C-ohjelmointikieli