ASCII

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 19. maaliskuuta 2022 tarkistetusta versiosta . tarkastukset vaativat 19 muokkausta .

ASCII ( englanninkielinen  amerikkalainen standardikoodi i nformation i nterchangelle , [ ˈ æ s . k i ] [ 1] ) on taulukon nimi (koodaus, joukko), jossa numeeriset koodit liittyvät joihinkin yleisiin painettuun ja ei- - tulostettavat merkit. Taulukko kehitettiin ja standardisoitiin Yhdysvalloissa vuonna 1963.


ASCII-taulukko määrittää merkkien koodit:

Historia

Alun perin (1963) ASCII kehitettiin koodaamaan merkkejä, joiden koodit mahtuvat 7 bittiin (128 merkkiä; 2 7 \u003d 128), ja merkittävintä bittiä nro 7 (numerointi nollasta) käytettiin tiedonsiirron aikana tapahtuneiden virheiden ohjaamiseen. . Ensimmäisessä versiossa vain isot kirjaimet koodattiin. Kaistoja (16 merkin ryhmät) nro 6 ja 7 (numerointi alkaa 0:sta) varattiin lisälaajennuksia varten. On keskusteltu siitä, käytetäänkö tätä aluetta pienille kirjaimille vai ohjausmerkeille.

Vuonna 1965 valmistettiin uusi ASCII-painos, jota ei koskaan julkaistu. Sitä ei käytetty muualla kuin IBM 2260/2848 -päätteissä . Seuraava eritelmä julkaistiin vuonna 1967, ja kaikki sen sisältämät merkit eivät ole muuttaneet asemaansa taulukossa sen jälkeen.

Ajan myötä koodaus laajeni 256 merkkiin (2 8 = 256); ensimmäisten 128 merkin koodit eivät ole muuttuneet. ASCII alettiin käsittää puoleksi 8-bittisestä koodauksesta, ja "laajennettua ASCII:ta" kutsuttiin ASCII:ksi, jossa oli mukana 8. bitti (esimerkiksi KOI-8 ).

Symbolipeitto

Käyttämällä tulostimen askelpalautinta (BS) (askelpalautin ) voit tulostaa yhden merkin toisen päälle. ASCII:ssa voit lisätä diakriittisiä kirjaimia samalla tavalla , esimerkiksi:

Huom . Vanhemmissa kirjasimissa heittomerkki "'" piirrettiin vinosti vasemmalle (vertaa: " ` " ja " ´ "), ja aaltoviiva "~" siirrettiin ylöspäin (vertaa: " ~ " ja " ˜ "), joten ne sopii vain symbolien akuutti "´" ja "tilde päällä" rooliin.

Jos tulostat saman merkin kahdesti yhteen kohtaan, saat lihavoitun merkin; jos tulostat merkin yhteen kohtaan ja sitten  alaviivan "_" , saat alleviivatun merkin:

Tätä tekniikkaa käytetään vielä nykyäänkin esimerkiksi apujärjestelmässä man.

ASCII:n kansalliset muunnelmat

ISO 646 (ECMA-6) -standardi mahdollistaa kansallisten merkkien sijoittamisen ASCII-koodiin. Tätä varten ehdotetaan korvaavan merkit " @ ", " [ ", " \ ", " ] ", " ^ ", " ` ", " { ", " | "", " } ", " ~ ". Lisäksi punnan merkin "#" sijaan voidaan sijoittaa punnan symboli "£" ja dollarin tunnuksen "$"  tilalle valuuttamerkki "¤" . ASCII-muunnelmaa, joka ei sisällä kansallisia merkkejä, kutsutaan nimellä "US-ASCII" tai "kansainvälinen viiteversio".

Joillakin kielillä (muilla kuin latinalaisilla kirjaimilla : venäjä , kreikka , arabia , heprea jne.) ASCII:sta tehtiin radikaalimpia muutoksia:

Myöhemmin osoittautui kätevämmäksi käyttää 8-bittisiä koodauksia ( koodisivuja ), joissa kooditaulukon alapuoli (0-127) on US-ASCII-merkkien ja ylempi puolikas (128-255) ) sisältää lisämerkkejä, mukaan lukien joukko kansallisia merkkejä. Siten ASCII-taulukon yläosaa (ennen Unicoden laajaa käyttöönottoa ) käytettiin voimakkaasti edustamaan paikallisia merkkejä, paikallisen kielen kirjaimia. Yhden standardin puute kyrillisten merkkien sijoittamiselle ASCII-taulukkoon aiheutti monia ongelmia koodauksissa ( KOI-8 , Windows-1251 jne.). Myös muiden kielten puhujat, joilla oli ei-latinalaisia ​​kirjoituksia, kärsivät useiden eri koodausten läsnäolosta.

Unicode -standardin ensimmäiset 128 merkkiä ovat samat kuin vastaavat US-ASCII-merkit.

ASCII-taulukko
  .0 .yksi .2 .3 .neljä .5 .6 .7 .kahdeksan .9 .A .B .C .D .E .F
0. NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR NIIN SI
yksi. DLE DC1 DC2 DC3 DC4 NAK SYN ETB VOI EM SUB POISTU FS GS RS MEILLE
2.     ! " # $ % & ' ( ) * + , - . /
3. 0 yksi 2 3 neljä 5 6 7 kahdeksan 9 : ; < = > ?
neljä. @ A B C D E F G H minä J K L M N O
5. P K R S T U V W X Y Z [ \ ] ^ _
6. ` a b c d e f g h i j k l m n o
7. s q r s t u v w x y z { | } ~ DEL

ASCII-standardin ensimmäisessä versiossa (1963) - kohdissa 0x5e (94) ja 0x5f (95) olivat vastaavasti merkit "nuoli ylös" ja "nuoli vasemmalle". ECMA-6-standardi (1965) korvasi ne caretilla ja alaviivalla "_" vastaavasti.

Neuvostoliitossa standardi hyväksyttiin taulukon muodossa koodin KOI-7 H0 GOST 27463-87 (ST SEV 356-86) kansainvälisestä viiteversiosta ”Tiedonkäsittelyjärjestelmät. 7-bittiset koodatut merkistöt". [2]

Ohjausmerkit

ASCII - taulukko luotiin tiedonvaihtoa varten teletypen kautta . Sarja sisälsi ei-tulostettavia merkkejä, joita käytettiin komentoina teletypen ohjaamiseen. Samanlaisia ​​komentoja käytettiin muissa tietokonetta edeltävissä viestintätyökaluissa ( morsekoodi , semaforiaakkoset ) laitteen erityispiirteiden vuoksi. Suurin osa ASCII-ohjausmerkeistä menetti pian tarkoituksensa, eikä niitä käytetä nykyaikaisissa tietokonejärjestelmissä.

Huomaa: luettelossa edelleen - merkkikoodit kirjoitetaan heksadesimaalilukujärjestelmässä merkkien nimien jälkeen.

Viestintäkanavan kautta välitetyt viestit jaettiin kahteen osaan:

"Otsikko" sisälsi: lähettäjän ja vastaanottajan osoitteet, tarkistussumman jne .; voidaan sijoittaa ennen "tekstiä" tai sen jälkeen. Termi "teksti" oli se osa viestiä, joka oli tarkoitettu tulostettavaksi.

Symboli HEX-koodi Salauksen purku Käännös Kuvaus
SOH 01 s tart o f h heading "otsikon" alku SOH (aloitus-of-header) -symboli merkitsee ei-datadatan erottelua: virran osaa, joka sisältää osoitteita ja muita lisäkustannuksia.
STX 02 s hapokas t e x t "tekstin" alku Kytke tulostimeen virta (TTY). Tulostettava teksti sijaitsi symbolien " STX" ja " ETX" välissä.
ETX 03 t e x t : n loppu "tekstin" loppu Sammuta tulostin (TTY). Nykyään koodia " 03" käytetään lähettämään " SIGINT " -signaali prosessiin ja se voidaan kirjoittaa painamalla näppäinyhdistelmää + . Vastaanotettuaan tällaisen signaalin prosessin on poistuttava .  CtrlC
EOT 04 luovutuksen loppu _ _ _ _ lähetyksen loppu Pääteemulaattorit käyttävät symbolia " Tiedoston loppu " ( EOF: englanniksi  e nd o f file ) merkityksessä, ja se voidaan lähettää painamalla näppäinyhdistelmää Ctrl+ D. Vastaanotettuaan tällaisen signaalin pääteemulaattori määrittää prosessin, joka toimii tällä hetkellä päätelaitteen kanssa, ja asettaa tiedoston loppu -lipun tämän prosessin vakiotulovirralle ( stdin : eng.  st andar d in put stream ) . Tämän seurauksena prosessi lopettaa stdinin lukemisen ja alkaa käsitellä luettuja tietoja.
ENQ 05 enq uire "Ole hyvä ja vahvista!"
ACK 06 ack now ledge "Vahvistan!" Symboli " NAK" tarkoittaa päinvastaista: "En vahvista!".
BEL 07 bel l piippaus : kello Merkki esitetään usein nimellä "\a" ja sitä käytetään äänimerkin antamiseen. Nykyaikaisessa henkilökohtaisessa tietokoneessa ääni toistetaan sisäänrakennetun kaiuttimen avulla . Esimerkiksi seuraavat komennot voivat toistaa tämän äänen:
  • echo -e "\a"tai echo -e "\007"- jos tämä komento on annettu ohjelman " bash" kautta ;
  • echo ^G- jos tämä komento annetaan ohjelman " cmd.exe" kautta (syöttääksesi symbolin " ^G", paina Ctrl+ G);
  • printf( "\a" );- jos tämä komento suoritetaan ohjelman lähdekoodina " C" -kielellä .
BS 08 takaisin vauhtiin_ _ _ palauttaa yhden merkin Näppäintä käytetään edellisen merkin pyyhkimiseen. ← Backspace
TAB 09 taulukko _ vaakasuora välilehti Merkitään " \t ". Joskus kutsutaan nimellä " HT" ( englanninkielisestä  horisontaalisesta t abulaatiosta ) .
LF 0A linja syötetty _ _ rivin käännös Komento laskea tulostinvaunua yhden rivin alaspäin. Tekstitiedoston rivin lopun nimitys vaihtelee käyttöjärjestelmäperheissä:

Monissa ohjelmointikielissä symboli esitetään muodossa " \n ". Näppäimen painaminen tekstiä tulostettaessa kääntää rivin. ↵ Enter

VT 0B pystyvälilehti _ _ _ pystysuora välilehti
FF 0C lomake syötetty _ _ sivu käynnissä, uusi sivu Tulostinkomento : Jatka tulostusta seuraavan arkin alusta.
CR 0D c arriage return_ _ vaunun paluu Tulostimen komento on jatkaa tulostusta nykyisen rivin alusta ( ei uudelta riviltä). Monissa ohjelmointikielissä symboli " CR" on merkitty nimellä " \r ". Mac - käyttöjärjestelmässä merkki " CR" (aiemmin) merkitsi tekstitiedoston rivin loppua. Symboli “ CR” voidaan syöttää näppäimistöltä painamalla näppäinyhdistelmää: Ctrl+ M.
NIIN 0E s hift o ut "Vaihda toiselle nauhalle (koodaus)" Toinen nauha oli yleensä värjätty punaiseksi. Jatkossa symbolilla vaihdettiin kansalliseen koodaukseen.
SI 0F s vuoro i n "Vaihda alkuperäiseen nauhaan (koodaus)" Toiminnon suorittamiskomento, toiminnon käänteinen " SO".
DLE kymmenen d ata l ink e scape "Datakanavan suojaaminen" Kaikkia " DLE":n jälkeisiä merkkejä tulee käsitellä datana , ei ohjausmerkkinä.
DC1 yksitoista d laiteohjaus 1 _ _ Ensimmäinen laitteen ohjausmerkki Komento rei'itetyn nauhan lukijan käyttöön ottamiseksi .
DC2 12 laiteohjaus 2 _ _ _ Toinen laitteen ohjausmerkki Käsky käynnistää rei'itys .
DC3 13 laiteohjaus 3 _ _ _ Kolmannen laitteen ohjausmerkki Komento sammuttaa rei'itetyn nauhan lukija.
DC4 neljätoista laiteohjaus 4 _ _ _ Neljäs laitteen ohjaussymboli Käsky sammuttaa rei'itys.
NAK viisitoista n negatiivinen a c k n ä i t ö "En hyväksy!" Käänteinen merkki " ACK".
SYN 16 synkronointi _ Tämä merkki lähetettiin, kun (synkronointia varten) oli tarpeen lähettää jotain.
ETB 17 e nd of t ext b lock tekstilohkon loppu Joskus teksti (teknisistä syistä) jaettiin lohkoihin.
VOI kahdeksantoista voi cel "Peruuttaa" Aiemmin siirretyn peruuttaminen.
EM 19 e n d of m medium "Kantajan loppu" Rei'itetyt teipit, paperit jne. ovat loppuneet.
SUB 1A sijainen _ "korvaava" Symboli sijoitetaan:
  • Sellaisen symbolin tilalle, jonka merkitys on kadonnut (tai vioittunut) lähetyksen aikana;
  • Ennen merkkiä, jonka tulkinta vaatii vaihtamista lisämerkistöön;
  • Ennen kuin merkki tulostetaan eri värillä...

Tällä hetkellä merkki lisätään painamalla näppäinyhdistelmää Ctrl+ Zja sitä käytetään osoittamaan tiedoston loppu käyttöjärjestelmissä "DOS" ja "Windows" .

POISTU 1B esc apina Merkki siitä, että merkkiä " ESC" seuraavalla merkillä on jokin muu (ei-ASCII) merkitys. Tyypillisesti " ESC" -merkkiä seuraa escape-sekvenssi ; DOS - käyttöjärjestelmässä ne toteutetaan ANSI.SYS- ohjaimella .
DEL 7F del ete poista viimeinen merkki Symboli " DEL" (joka koostuu kaikista binäärikoodin yksiköistä) voi "vasaroida" minkä tahansa merkin. Laitteet ja ohjelmat ohitettiin " DEL" samalla tavalla kuin " NUL".

Tämän merkin koodi on peräisin ensimmäisistä tekstinkäsittelyohjelmista , joissa on rei'itetty nauhamuisti : niissä merkin poistaminen tapahtui "vasaroimalla" sen koodiin reikiä (merkitsemällä loogisia yksiköitä ).

Tietojen erottelu 4 tasoon tuettiin:

Symboli Koodi Salauksen purku Käännös Kuvaus
FS 1C tiedostoerotin _ _ _ tiedostojen erotin viesti voi koostua tiedostoista
GS 1D g - ryhmän erotin ryhmän erotin tiedostot voidaan ryhmitellä
RS 1E r ecordin erotin _ tietueen erotin ryhmät voivat koostua kirjoituksista
MEILLE 1F u nit s erotin yksikön erotin tietueet voivat koostua yksiköistä

Taulukon rakenteelliset ominaisuudet

ASCII:n tietokoneesitys

Suurimmassa osassa nykyaikaisia ​​tietokoneita pienin osoitettava muistiyksikkö on tavu (8 bitin kokoa ); joten se käyttää 8-bittisiä merkkejä 7-bittisten sijaan. Tyypillisesti ASCII-merkki laajennetaan 8-bittiseksi lisäämällä yksi bitti nollaa merkittävimmäksi bitiksi.

IBM / 360 -tietokoneissa (ascii : n käytön tapauksessa) käytettiin kuitenkin erilaista menetelmää: kuudes bitti (jos vähiten merkitsevä bitti katsotaan ensimmäisenä) siirretään 7:nneksi ja entinen 7. "haaroitetaan" ja kopioitu 8. bitille ja 6. bitille. Tuloksena on taulukko [4] :

  .0 .yksi .2 .3 .neljä .5 .6 .7 .kahdeksan .9 .A .B .C .D .E .F
0. NUL SOM EOA EOM EQT WRU FI BELL BKSP HT LF VT FF CR NIIN SI
yksi. DC 0 DC 1 DC 2 DC 3 DC 4 ERR SYNK LEM S0 _ S1_ _ S2_ _ S3_ _ S4_ _ S5_ _ S6_ _ S7_ _
2.                                
3.                                
neljä. TYHJÄ ! " # $ % & ' ( ) * + , - . /
5. 0 yksi 2 3 neljä 5 6 7 kahdeksan 9 : ; < = > ?
6.                                
7.                                
kahdeksan.                                
9.                                
A. @ A B C D E F G H minä J K L M N O
b. P K R S T U V W X Y Z [ \ ]
C.                                
D.                                
E.   a b c d e f g h i j k l m n o
F. s q r s t u v w x y z       POISTU DEL

Tietokoneissa, joiden osoitettava muistiyksikkö on vähintään 36 bittiä, käytettiin aluksi 6-bittisiä merkkejä (1 sana = 6 merkkiä). ASCII:een siirtymisen jälkeen tällaiset tietokoneet alkoivat sijoittaa joko 5 seitsemän bitin merkkiä yhteen sanaan (1 bitti jäi tarpeettomaksi) tai 4 yhdeksänbittistä merkkiä.

ASCII-koodeja käytetään ohjelmoinnissa alustanvälisinä välikoodeina näppäinpainalluksia varten (toisin kuin IBM PC - skannauskoodeja ja muita sisäisiä koodeja). QWERTY- näppäimistöasettelussa kooditaulukko näyttää seuraavan taulukon [5] mukaiselta .

Katso myös

Muistiinpanot

  1. ASCII  . _ Cambridgen englannin sanakirja . dictionary.cambridge.org. Haettu 9. huhtikuuta 2018. Arkistoitu alkuperäisestä 27. syyskuuta 2017.
  2. GOST 27463-87 (ST SEV 356-86) Tietojenkäsittelyjärjestelmät. 7-bittiset koodatut merkistöt (muutos N 1), GOST päivätty 29. lokakuuta 1987 nro 27463-87 . docs.cntd.ru. Haettu 9. huhtikuuta 2018. Arkistoitu alkuperäisestä 23. huhtikuuta 2018.
  3. ↑ Koodatut merkistöt , historia ja kehitys  . - 1. - Addison-Wesley Publishing Company, Inc. , 1980. - s. 6, 66, 211, 215, 217, 220, 223, 228, 236-238, 243-245, 247-253, 423, 425-428, 435-439. — ISBN 978-0-201-14460-4 .
  4. Amdahl GM, Blaauw GA, Brooks FP, Jr. "IBM-järjestelmän/360:n arkkitehtuuri". 1964
  5. Näppäimet Enum . Microsoft.com . Haettu 11. kesäkuuta 2022. Arkistoitu alkuperäisestä 11. kesäkuuta 2022.

Linkit