ASCII ( englanninkielinen amerikkalainen standardikoodi i nformation i nterchangelle , [ ˈ æ s . k i ] [ 1] ) on taulukon nimi (koodaus, joukko), jossa numeeriset koodit liittyvät joihinkin yleisiin painettuun ja ei- - tulostettavat merkit. Taulukko kehitettiin ja standardisoitiin Yhdysvalloissa vuonna 1963.
ASCII-taulukko määrittää merkkien koodit:
Alun perin (1963) ASCII kehitettiin koodaamaan merkkejä, joiden koodit mahtuvat 7 bittiin (128 merkkiä; 2 7 \u003d 128), ja merkittävintä bittiä nro 7 (numerointi nollasta) käytettiin tiedonsiirron aikana tapahtuneiden virheiden ohjaamiseen. . Ensimmäisessä versiossa vain isot kirjaimet koodattiin. Kaistoja (16 merkin ryhmät) nro 6 ja 7 (numerointi alkaa 0:sta) varattiin lisälaajennuksia varten. On keskusteltu siitä, käytetäänkö tätä aluetta pienille kirjaimille vai ohjausmerkeille.
Vuonna 1965 valmistettiin uusi ASCII-painos, jota ei koskaan julkaistu. Sitä ei käytetty muualla kuin IBM 2260/2848 -päätteissä . Seuraava eritelmä julkaistiin vuonna 1967, ja kaikki sen sisältämät merkit eivät ole muuttaneet asemaansa taulukossa sen jälkeen.
Ajan myötä koodaus laajeni 256 merkkiin (2 8 = 256); ensimmäisten 128 merkin koodit eivät ole muuttuneet. ASCII alettiin käsittää puoleksi 8-bittisestä koodauksesta, ja "laajennettua ASCII:ta" kutsuttiin ASCII:ksi, jossa oli mukana 8. bitti (esimerkiksi KOI-8 ).
Käyttämällä tulostimen askelpalautinta (BS) (askelpalautin ) voit tulostaa yhden merkin toisen päälle. ASCII:ssa voit lisätä diakriittisiä kirjaimia samalla tavalla , esimerkiksi:
Huom . Vanhemmissa kirjasimissa heittomerkki "'" piirrettiin vinosti vasemmalle (vertaa: " ` " ja " ´ "), ja aaltoviiva "~" siirrettiin ylöspäin (vertaa: " ~ " ja " ˜ "), joten ne sopii vain symbolien akuutti "´" ja "tilde päällä" rooliin.
Jos tulostat saman merkin kahdesti yhteen kohtaan, saat lihavoitun merkin; jos tulostat merkin yhteen kohtaan ja sitten alaviivan "_" , saat alleviivatun merkin:
Tätä tekniikkaa käytetään vielä nykyäänkin esimerkiksi apujärjestelmässä man.
ISO 646 (ECMA-6) -standardi mahdollistaa kansallisten merkkien sijoittamisen ASCII-koodiin. Tätä varten ehdotetaan korvaavan merkit " @ ", " [ ", " \ ", " ] ", " ^ ", " ` ", " { ", " | "", " } ", " ~ ". Lisäksi punnan merkin "#" sijaan voidaan sijoittaa punnan symboli "£" ja dollarin tunnuksen "$" tilalle valuuttamerkki "¤" . ASCII-muunnelmaa, joka ei sisällä kansallisia merkkejä, kutsutaan nimellä "US-ASCII" tai "kansainvälinen viiteversio".
Joillakin kielillä (muilla kuin latinalaisilla kirjaimilla : venäjä , kreikka , arabia , heprea jne.) ASCII:sta tehtiin radikaalimpia muutoksia:
Myöhemmin osoittautui kätevämmäksi käyttää 8-bittisiä koodauksia ( koodisivuja ), joissa kooditaulukon alapuoli (0-127) on US-ASCII-merkkien ja ylempi puolikas (128-255) ) sisältää lisämerkkejä, mukaan lukien joukko kansallisia merkkejä. Siten ASCII-taulukon yläosaa (ennen Unicoden laajaa käyttöönottoa ) käytettiin voimakkaasti edustamaan paikallisia merkkejä, paikallisen kielen kirjaimia. Yhden standardin puute kyrillisten merkkien sijoittamiselle ASCII-taulukkoon aiheutti monia ongelmia koodauksissa ( KOI-8 , Windows-1251 jne.). Myös muiden kielten puhujat, joilla oli ei-latinalaisia kirjoituksia, kärsivät useiden eri koodausten läsnäolosta.
Unicode -standardin ensimmäiset 128 merkkiä ovat samat kuin vastaavat US-ASCII-merkit.
.0 | .yksi | .2 | .3 | .neljä | .5 | .6 | .7 | .kahdeksan | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | NIIN | SI |
yksi. | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | VOI | EM | SUB | POISTU | FS | GS | RS | MEILLE |
2. | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |
3. | 0 | yksi | 2 | 3 | neljä | 5 | 6 | 7 | kahdeksan | 9 | : | ; | < | = | > | ? |
neljä. | @ | A | B | C | D | E | F | G | H | minä | J | K | L | M | N | O |
5. | P | K | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6. | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7. | s | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
ASCII-standardin ensimmäisessä versiossa (1963) - kohdissa 0x5e (94) ja 0x5f (95) olivat vastaavasti merkit "nuoli ylös" ja "nuoli vasemmalle". ECMA-6-standardi (1965) korvasi ne caretilla ja alaviivalla "_" vastaavasti.
Neuvostoliitossa standardi hyväksyttiin taulukon muodossa koodin KOI-7 H0 GOST 27463-87 (ST SEV 356-86) kansainvälisestä viiteversiosta ”Tiedonkäsittelyjärjestelmät. 7-bittiset koodatut merkistöt". [2]
ASCII - taulukko luotiin tiedonvaihtoa varten teletypen kautta . Sarja sisälsi ei-tulostettavia merkkejä, joita käytettiin komentoina teletypen ohjaamiseen. Samanlaisia komentoja käytettiin muissa tietokonetta edeltävissä viestintätyökaluissa ( morsekoodi , semaforiaakkoset ) laitteen erityispiirteiden vuoksi. Suurin osa ASCII-ohjausmerkeistä menetti pian tarkoituksensa, eikä niitä käytetä nykyaikaisissa tietokonejärjestelmissä.
Huomaa: luettelossa edelleen - merkkikoodit kirjoitetaan heksadesimaalilukujärjestelmässä merkkien nimien jälkeen.
Viestintäkanavan kautta välitetyt viestit jaettiin kahteen osaan:
"Otsikko" sisälsi: lähettäjän ja vastaanottajan osoitteet, tarkistussumman jne .; voidaan sijoittaa ennen "tekstiä" tai sen jälkeen. Termi "teksti" oli se osa viestiä, joka oli tarkoitettu tulostettavaksi.
Symboli | HEX-koodi | Salauksen purku | Käännös | Kuvaus |
---|---|---|---|---|
SOH | 01 | s tart o f h heading | "otsikon" alku | SOH (aloitus-of-header) -symboli merkitsee ei-datadatan erottelua: virran osaa, joka sisältää osoitteita ja muita lisäkustannuksia. |
STX | 02 | s hapokas t e x t | "tekstin" alku | Kytke tulostimeen virta (TTY). Tulostettava teksti sijaitsi symbolien " STX" ja " ETX" välissä. |
ETX | 03 | t e x t : n loppu | "tekstin" loppu | Sammuta tulostin (TTY). Nykyään koodia " 03" käytetään lähettämään " SIGINT " -signaali prosessiin ja se voidaan kirjoittaa painamalla näppäinyhdistelmää + . Vastaanotettuaan tällaisen signaalin prosessin on poistuttava . CtrlC |
EOT | 04 | luovutuksen loppu _ _ _ _ | lähetyksen loppu | Pääteemulaattorit käyttävät symbolia " Tiedoston loppu " ( EOF: englanniksi e nd o f file ) merkityksessä, ja se voidaan lähettää painamalla näppäinyhdistelmää Ctrl+ D. Vastaanotettuaan tällaisen signaalin pääteemulaattori määrittää prosessin, joka toimii tällä hetkellä päätelaitteen kanssa, ja asettaa tiedoston loppu -lipun tämän prosessin vakiotulovirralle ( stdin : eng. st andar d in put stream ) . Tämän seurauksena prosessi lopettaa stdinin lukemisen ja alkaa käsitellä luettuja tietoja. |
ENQ | 05 | enq uire | "Ole hyvä ja vahvista!" | |
ACK | 06 | ack now ledge | "Vahvistan!" | Symboli " NAK" tarkoittaa päinvastaista: "En vahvista!". |
BEL | 07 | bel l | piippaus : kello | Merkki esitetään usein nimellä "\a" ja sitä käytetään äänimerkin antamiseen. Nykyaikaisessa henkilökohtaisessa tietokoneessa ääni toistetaan sisäänrakennetun kaiuttimen avulla . Esimerkiksi seuraavat komennot voivat toistaa tämän äänen:
|
BS | 08 | takaisin vauhtiin_ _ _ | palauttaa yhden merkin | Näppäintä käytetään edellisen merkin pyyhkimiseen. ← Backspace |
TAB | 09 | taulukko _ | vaakasuora välilehti | Merkitään " \t ". Joskus kutsutaan nimellä " HT" ( englanninkielisestä horisontaalisesta t abulaatiosta ) . |
LF | 0A | linja syötetty _ _ | rivin käännös | Komento laskea tulostinvaunua yhden rivin alaspäin. Tekstitiedoston rivin lopun nimitys vaihtelee käyttöjärjestelmäperheissä:
Monissa ohjelmointikielissä symboli esitetään muodossa " \n ". Näppäimen painaminen tekstiä tulostettaessa kääntää rivin. ↵ Enter |
VT | 0B | pystyvälilehti _ _ _ | pystysuora välilehti | |
FF | 0C | lomake syötetty _ _ | sivu käynnissä, uusi sivu | Tulostinkomento : Jatka tulostusta seuraavan arkin alusta. |
CR | 0D | c arriage return_ _ | vaunun paluu | Tulostimen komento on jatkaa tulostusta nykyisen rivin alusta ( ei uudelta riviltä). Monissa ohjelmointikielissä symboli " CR" on merkitty nimellä " \r ". Mac - käyttöjärjestelmässä merkki " CR" (aiemmin) merkitsi tekstitiedoston rivin loppua. Symboli “ CR” voidaan syöttää näppäimistöltä painamalla näppäinyhdistelmää: Ctrl+ M. |
NIIN | 0E | s hift o ut | "Vaihda toiselle nauhalle (koodaus)" | Toinen nauha oli yleensä värjätty punaiseksi. Jatkossa symbolilla vaihdettiin kansalliseen koodaukseen. |
SI | 0F | s vuoro i n | "Vaihda alkuperäiseen nauhaan (koodaus)" | Toiminnon suorittamiskomento, toiminnon käänteinen " SO". |
DLE | kymmenen | d ata l ink e scape | "Datakanavan suojaaminen" | Kaikkia " DLE":n jälkeisiä merkkejä tulee käsitellä datana , ei ohjausmerkkinä. |
DC1 | yksitoista | d laiteohjaus 1 _ _ | Ensimmäinen laitteen ohjausmerkki | Komento rei'itetyn nauhan lukijan käyttöön ottamiseksi . |
DC2 | 12 | laiteohjaus 2 _ _ _ | Toinen laitteen ohjausmerkki | Käsky käynnistää rei'itys . |
DC3 | 13 | laiteohjaus 3 _ _ _ | Kolmannen laitteen ohjausmerkki | Komento sammuttaa rei'itetyn nauhan lukija. |
DC4 | neljätoista | laiteohjaus 4 _ _ _ | Neljäs laitteen ohjaussymboli | Käsky sammuttaa rei'itys. |
NAK | viisitoista | n negatiivinen a c k n ä i t ö | "En hyväksy!" | Käänteinen merkki " ACK". |
SYN | 16 | synkronointi _ | Tämä merkki lähetettiin, kun (synkronointia varten) oli tarpeen lähettää jotain. | |
ETB | 17 | e nd of t ext b lock | tekstilohkon loppu | Joskus teksti (teknisistä syistä) jaettiin lohkoihin. |
VOI | kahdeksantoista | voi cel | "Peruuttaa" | Aiemmin siirretyn peruuttaminen. |
EM | 19 | e n d of m medium | "Kantajan loppu" | Rei'itetyt teipit, paperit jne. ovat loppuneet. |
SUB | 1A | sijainen _ | "korvaava" | Symboli sijoitetaan:
Tällä hetkellä merkki lisätään painamalla näppäinyhdistelmää Ctrl+ Zja sitä käytetään osoittamaan tiedoston loppu käyttöjärjestelmissä "DOS" ja "Windows" . |
POISTU | 1B | esc apina | Merkki siitä, että merkkiä " ESC" seuraavalla merkillä on jokin muu (ei-ASCII) merkitys. Tyypillisesti " ESC" -merkkiä seuraa escape-sekvenssi ; DOS - käyttöjärjestelmässä ne toteutetaan ANSI.SYS- ohjaimella . | |
DEL | 7F | del ete | poista viimeinen merkki | Symboli " DEL" (joka koostuu kaikista binäärikoodin yksiköistä) voi "vasaroida" minkä tahansa merkin. Laitteet ja ohjelmat ohitettiin " DEL" samalla tavalla kuin " NUL".
Tämän merkin koodi on peräisin ensimmäisistä tekstinkäsittelyohjelmista , joissa on rei'itetty nauhamuisti : niissä merkin poistaminen tapahtui "vasaroimalla" sen koodiin reikiä (merkitsemällä loogisia yksiköitä ). |
Tietojen erottelu 4 tasoon tuettiin:
Symboli | Koodi | Salauksen purku | Käännös | Kuvaus |
---|---|---|---|---|
FS | 1C | tiedostoerotin _ _ _ | tiedostojen erotin | viesti voi koostua tiedostoista |
GS | 1D | g - ryhmän erotin | ryhmän erotin | tiedostot voidaan ryhmitellä |
RS | 1E | r ecordin erotin _ | tietueen erotin | ryhmät voivat koostua kirjoituksista |
MEILLE | 1F | u nit s erotin | yksikön erotin | tietueet voivat koostua yksiköistä |
Suurimmassa osassa nykyaikaisia tietokoneita pienin osoitettava muistiyksikkö on tavu (8 bitin kokoa ); joten se käyttää 8-bittisiä merkkejä 7-bittisten sijaan. Tyypillisesti ASCII-merkki laajennetaan 8-bittiseksi lisäämällä yksi bitti nollaa merkittävimmäksi bitiksi.
IBM / 360 -tietokoneissa (ascii : n käytön tapauksessa) käytettiin kuitenkin erilaista menetelmää: kuudes bitti (jos vähiten merkitsevä bitti katsotaan ensimmäisenä) siirretään 7:nneksi ja entinen 7. "haaroitetaan" ja kopioitu 8. bitille ja 6. bitille. Tuloksena on taulukko [4] :
.0 | .yksi | .2 | .3 | .neljä | .5 | .6 | .7 | .kahdeksan | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOM | EOA | EOM | EQT | WRU | FI | BELL | BKSP | HT | LF | VT | FF | CR | NIIN | SI |
yksi. | DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ERR | SYNK | LEM | S0 _ | S1_ _ | S2_ _ | S3_ _ | S4_ _ | S5_ _ | S6_ _ | S7_ _ |
2. | ||||||||||||||||
3. | ||||||||||||||||
neljä. | TYHJÄ | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
5. | 0 | yksi | 2 | 3 | neljä | 5 | 6 | 7 | kahdeksan | 9 | : | ; | < | = | > | ? |
6. | ||||||||||||||||
7. | ||||||||||||||||
kahdeksan. | ||||||||||||||||
9. | ||||||||||||||||
A. | @ | A | B | C | D | E | F | G | H | minä | J | K | L | M | N | O |
b. | P | K | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ↑ | ← |
C. | ||||||||||||||||
D. | ||||||||||||||||
E. | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
F. | s | q | r | s | t | u | v | w | x | y | z | POISTU | DEL |
Tietokoneissa, joiden osoitettava muistiyksikkö on vähintään 36 bittiä, käytettiin aluksi 6-bittisiä merkkejä (1 sana = 6 merkkiä). ASCII:een siirtymisen jälkeen tällaiset tietokoneet alkoivat sijoittaa joko 5 seitsemän bitin merkkiä yhteen sanaan (1 bitti jäi tarpeettomaksi) tai 4 yhdeksänbittistä merkkiä.
ASCII-koodeja käytetään ohjelmoinnissa alustanvälisinä välikoodeina näppäinpainalluksia varten (toisin kuin IBM PC - skannauskoodeja ja muita sisäisiä koodeja). QWERTY- näppäimistöasettelussa kooditaulukko näyttää seuraavan taulukon [5] mukaiselta .
Sanakirjat ja tietosanakirjat | |
---|---|
Bibliografisissa luetteloissa |
Merkkien koodaukset | |
---|---|
Historialliset koodaukset | lisäkomp. semafori (Makarov) morsia Bodo MTK-2 comp. 6-bittinen SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderni 8-bittinen esitys | symboleja ASCII ei-ASCII 8-bittiset koodisivut Kyrillinen KOI-8 Peruskoodaus MacCyrillic ISO 8859 1 (lat.) 2 3 neljä 5 (kir.) 6 7 kahdeksan 9 kymmenen yksitoista 12 13 neljätoista 15 (€) 16 Windows 1250 1251 (kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM ja DOS 437 850 852 855 866 "vaihtoehto" MIC |
Monitavu | perinteinen DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 merkkiluettelo Kyrillinen |
käyttöliittymä näppäimistöasettelu alue rivin käännös fontti translitterointi mukautettuja fontteja apuohjelmia iconv ennätys |