Digitaalinen ääni

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 8. joulukuuta 2021 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Digitaalinen ääni on tulosta analogisen äänisignaalin muuntamisesta digitaaliseen audiomuotoon .

Yksinkertaisin muunnosmenetelmä, pulssikoodimodulaatio (PCM), koostuu analogia-digitaalimuuntimen ( ADC ) mittaamien hetkellisten signaalitasojen sarjan esittämisestä säännöllisin väliajoin.

PCM:n muunnelma on delta-modulaatio , jossa jokaisella näytteen hetkellä signaalia verrataan sahanhammasjännitteeseen jokaisessa näytteenottovaiheessa .

Sigma-delta-modulaatio - signaalin esitysmenetelmä, joka perustuu ylinäytteistys- ja kvantisointikohinan generointiperiaatteeseen , jonka avulla voit vähentää melutasoa .

Nykyaikaiset menetelmät käyttävät monimutkaisempia muunnosalgoritmeja . Sen lisäksi, että äänivärähtelyt esitetään digitaalisessa muodossa, käytetään myös erityisten komentojen luomista automaattista toistoa varten erilaisilla elektronisilla soittimilla. Selkein esimerkki tällaisesta tekniikasta on MIDI .

Bittikoodin etuja hyödynnetään koodatun signaalin siirrossa etäisyyden yli, signaalin salauksessa , signaalin digitaalisessa allekirjoituksessa, siirtohäiriöiden aiheuttamien häviöiden palauttamisessa sekä muissa sovelluksissa.

Digitaalinen äänen tallennus on tekniikka, jolla analoginen ääni muunnetaan digitaaliseksi, jotta se tallennetaan fyysiselle tallennusvälineelle, jotta tallennettu signaali voidaan toistaa myöhemmin.

Äänitietojen esittäminen digitaalisessa muodossa mahdollistaa erittäin tehokkaan lähdemateriaalin vaihtamisen erityisillä laitteilla tai tietokoneohjelmilla - äänieditoreilla , joita käytetään laajasti teollisuudessa, mediateollisuudessa ja jokapäiväisessä elämässä.

Digitaalisen äänen toistamiseen käytetään erikoislaitteita, kuten musiikkikeskuksia , digitaalisia soittimia , tietokoneita, joissa on äänikortti ja asennettu ohjelmisto: äänisoitin tai mediasoitin .

Historia

Vuonna 1928 Harry Nyquist määritti teoksessaan "Tietyt ongelmat lennätinsiirron teoriassa" viestintälinjan tarvittavan kaistanleveyden pulssisignaalin lähettämiseen - digitaalisen äänen perustan [1]
Vuonna 1933 V. A. Kotelnikov ehdotti ja todisti työssään "Eetterin ja langan suorituskyvystä televiestinnässä" Kotelnikovin lauseen , jonka mukaan analoginen signaali, jolla on rajoitettu spektri, voidaan palauttaa yksilöllisesti ja ilman häviötä sen erillisistä näytteistä, jotka on otettu taajuus, joka on ehdottomasti suurempi kuin kaksi kertaa spektrin maksimitaajuus [2]
Vuonna 1937 brittiläinen tiedemies Alec Reeves patentoi ensimmäisen pulssikoodimodulaation kuvauksen [3]
Vuonna 1948 Claude Shannon julkaisi teoksen "Mathematical Theory of Communication" [4] ja vuonna 1949 - "Tiedonsiirto kohinan läsnä ollessa", jossa hän Kotelnikovista riippumatta osoitti lauseen, jolla on samanlaiset tulokset kuin Kotelnikovin lause . Länsimaisessa kirjallisuudessa tätä lausetta kutsutaan usein Shannonin lauseeksi. [5]
Vuonna 1950 Richard Hamming julkaisi artikkelin virheiden havaitsemisesta ja korjaamisesta [6]
Vuonna 1952 David Huffman loi minimiredundanssin etuliitekoodausalgoritmin (tunnetaan nimellä Huffman-algoritmi tai koodi ) [6]
Vuonna 1959 Alex Hockwingham loi virheenkorjauskoodin, joka tunnetaan nykyään Bowes-Chowdhury-Hockwingham-koodina [6]
Vuonna 1960 Massachusetts Institute of Technologyn Lincoln Laboratoryn työntekijät Irwin Reid ja Gustav Solomon keksivät Reed-Solomon Coden [6]
Vuonna 1967 NHK:n tekninen tutkimuslaitos esitteli ensimmäisen digitaalisen kelasta kelaan stereonauhurin 1 tuuman videonauhalle. Laite käytti PCM -tallennusta 12-bitin bittisyvyydellä ja 30 kHz:n näytteenottotaajuudella käyttämällä kompanderia dynaamisen alueen laajentamiseen [6]
Vuonna 1969 Sony esitteli 13-bittisen digitaalisen stereonauhurin, jonka näytteenottotaajuus on 47,25 kHz ja joka on tallennettu 2 tuuman videonauhalle [6]
Vuonna 1972 julkaistiin ensimmäinen Nippon Columbian digitaaliselta master-nauhalta äänitetty albumi [7]
Vuonna 1977 Tokion ääninäyttelyssä Mitsubishi , Sony ja Hitachi esittelivät digitaalisten fonografilevyjen tai äänilevyjen prototyyppejä [6]
Vuonna 1979 Euroopassa Philips esitteli CD-prototyyppiä, jonka halkaisija on 115 mm, tarkoituksenaan tehdä siitä maailmanstandardi. 14-bittinen tallennus taajuudella 44,050 kHz ei sopinut Sonylle, joka tarjosi 16-bittistä tallennusta 50 kHz:llä, mutta lopulta formaattirajoitusten vuoksi päätettiin valita 44,1 kHz:n näytteenottotaajuus ja kasvattaa levyn koko 120:een. mm. Levylle mahtuu 74 minuuttia tallennusta.
Vuonna 1980 CD- standardia esitettiin virallisesti, mutta kaikki hyväksynnät ja parannukset kesti kaksi vuotta [6]
Vuonna 1982 CD - järjestelmästandardi otettiin käyttöön Euroopassa ja Japanissa [6]
Myös vuonna 1982 otettiin käyttöön digitaalinen äänen tallennusmuoto kelasta kelaan -nauhalle DASH , jota Sony ehdotti monikanavaiseen studiotallennukseen.
Vuonna 1987 Sony ja Philips esittelivät digitaalisen DAT - kasettiformaatin.
Vuonna 1992 Philips ja Matsushita esittelivät Digital Compact Cassette -muodon, jossa käytetään MPEG1-kerros 1 -pakkausta.
Myös vuonna 1992 Sony esitteli henkilökohtaisen MiniDisc -äänijärjestelmän ja ATRAC -pakkausalgoritmiin perustuvan SDDS - elokuvateatterijärjestelmän .
Vuonna 1999 Sony ja Philips kehittivät SACD -standardin.
DVD-Audio- muoto otettiin käyttöön vuonna 2000

Digitaalisen äänen tallennuksen periaate jaksollisen näytteenoton ja signaalin kvantisoinnin menetelmällä

Äänitallennuksen värähtelyjen digitaalisen esittämisen periaate on melko yksinkertainen:

ensin sinun on muutettava analoginen signaali digitaaliseksi , tämän suorittaa laite - analogia-digitaalimuunnin (ADC)
tallenna vastaanotetut digitaaliset tiedot medialle: magneettinauha ( DAT ), kiintolevy , optinen levy tai flash-muisti
tallennetun tallenteen kuuntelemiseksi on tarpeen toistaa tallennettu tallennus medialta ja muuntaa se takaisin digitaalisesta signaalista analogiseksi käyttämällä digitaali-analogiamuunninta (DAC).

ADC:n toimintaperiaate on myös melko yksinkertainen: mikrofoneista ja sähköisistä soittimista vastaanotettu analoginen signaali muunnetaan digitaaliseksi. Tämä muunnos sisältää seuraavat toiminnot:

Kaistan rajoitus suoritetaan alipäästösuodattimella vaimentamaan spektrikomponentteja, joiden taajuus ylittää puolet näytteenottotaajuudesta.
Diskretisointi ajassa, toisin sanoen jatkuvan analogisen signaalin korvaaminen sen arvojen sarjalla diskreetissä ajankohdassa - näytteet. Tämä ongelma ratkaistaan käyttämällä erityistä piiriä ADC:n tulossa - näyte- ja pitolaite .
Tasokvantisointi on signaalinäytteen arvon korvaaminen lähimmällä arvolla kiinteiden arvojen joukosta - kvantisointitasoja.
Koodaus tai digitointi, jonka seurauksena kunkin kvantisoidun näytteen arvo esitetään kvantisointitason järjestysnumeroa vastaavana numerona.

Tämä tehdään seuraavasti: jatkuva analoginen signaali "leikataan" osiin, näytteenottotaajuudella, saadaan digitaalinen diskreetti signaali, joka käy läpi kvantisointiprosessin tietyllä bittisyvyydellä ja sitten koodataan, eli korvataan koodisymbolien sarjalla. Korkealaatuiseen äänen tallentamiseen taajuuskaistalla 20-20 000 Hz käytetään vähimmäisstandardin näytteenottotaajuutta 44,1 kHz tai korkeampaa (tällä hetkellä on ilmestynyt ADC- ja DAC-laitteita, joiden näytteenottotaajuus on 192,3 ja jopa 384,6 kHz). Melko laadukkaan tallenteen saamiseksi riittää 16 bitin bittisyvyys, mutta dynaamisen alueen laajentamiseksi ja äänen tallennuksen laadun parantamiseksi käytetään 24 (harvemmin 32) bitin bittisyvyyttä.

Kohinankorjaus ja kanavakoodaus

Kohinaa korjaavan koodauksen avulla signaalin toiston aikana voidaan tunnistaa ja eliminoida (tai vähentää niiden esiintymistiheyttä) median lukuvirheet. Tätä varten tallennusprosessin aikana ADC:n lähdössä saatuihin näytteisiin lisätään keinotekoista redundanssia (ohjausbittejä), mikä myöhemmin auttaa palauttamaan vaurioituneen näytteen. Äänentallennuslaitteet käyttävät tyypillisesti kahden tai kolmen virheenkorjauskoodin yhdistelmää. Jos valittu koodausredundanssitaso ei salli referenssin oikean arvon palauttamista, se korvataan interpoloinnilla , jotta vältetään signaalitason äkillinen muutos (napsautus).

Lomitusta käytetään myös suojaamaan paremmin median korruption aiheuttamilta purskevirheiltä (CD-naarmut, magneettinauhan taitokset) .

Hyödylliseen signaaliin lisätään myös lisädataa myöhemmän dekoodauksen helpottamiseksi. Nämä voivat olla aikakoodisignaaleja , palvelusignaaleja, synkronointisignaaleja.

Kanavakoodausta käytetään sovittamaan digitaaliset signaalit lähetyskanavan parametreihin (tallennus / toisto). Esimerkiksi tallennettaessa digitaalisia signaaleja magneettiselle välineelle, on välttämätöntä sulkea pois jatkuvan komponentin ja spektrin matalataajuisten komponenttien esiintyminen tallennusvirrassa (joka syntyy, kun esiintyy pitkiä nollien tai ykkösten sarjoja). Tätä varten käytetään muunnostaulukoita, joiden mukaan sanat m databitistä korvataan sanoilla n kanavabitistä ja aina n > m. Digitaalisissa signaalintoistolaitteissa kanavadekooderi poimii kellosignaalit yleisestä datavirrasta ja muuntaa käänteisesti n-bittiset kanavasanat m-bittisiksi datasanoiksi. Virheenkorjauksen jälkeen signaali menee DAC:hen.

DAC:n toimintaperiaate

Dekooderista vastaanotettu digitaalinen signaali muunnetaan analogiseksi. Tämä muunnos tapahtuu seuraavasti:

DAC-dekooderi muuntaa numerosarjan diskreetiksi kvantisoiduksi signaaliksi
Tasoittamalla aikatasoa, diskreeteistä näytteistä muodostetaan ajassa jatkuva signaali
Lopullinen signaalin palautus tehdään vaimentamalla sivuspektrit analogisessa alipäästösuodattimessa.

Digitaalisen äänen tallennusmenetelmät

Tallennusperiaatteen mukaan erotetaan seuraavat menetelmät:

Magneettinen äänen tallennus - digitaaliset signaalit tallennetaan magneettinauhalle. Tietueita on kahdenlaisia:
- rivi riviltä -tallennusjärjestelmä - jossa nauha liikkuu kiinteiden magneettisten tallennus-/toistopäiden lohkoa pitkin ( DASH , DCC )
- vinoviivatallennusjärjestelmä - jossa nauha liikkuu pyörivien magneettipäiden rumpua pitkin ja tallennus suoritetaan vinosti erillisillä raidoilla, mikä tuottaa suuremman tiheyden kuin pitkittäisviivatallennusjärjestelmä. ( R-DAT , ADAT ja varhaiset järjestelmät, jotka koostuvat PCM -digisovittimesta ja videonauhurista)
Magneto-optinen tallennus - tallennus suoritetaan käyttämällä magneettipäätä erityiselle magneto-optiselle kerrokselle ja lämmitetään magnetointihetkellä hetkeksi laserilla Curie-pistelämpötilaan. ( Minidisc , Hi-MD )
Lasertallennus - tallennus suoritetaan lasersäteellä, joka polttaa syvennyksiä (kuoppia) optisen välineen valoherkkään kerrokseen . ( CD , DVD-Audio , DTS , SACD )
Optinen (valokuvaus) äänentallennus perustuu valovirran vaikutukseen kantoaineen (filminauhan) valoherkälle kerrokselle. ( Dolby Digital , SDDS )
Äänen tallennus sähköiselle medialle - äänidata tallennetaan tietokoneella tiedostoina eri tietovälineille ( kovalevyt , uudelleenkirjoitettavat optiset levyt , flash-kortit , solid-state-asemat ), kun taas äänimuodon pakollista vastaavuutta ei ole rajoitettu. mediamuoto.

Digitaalisissa medioissa ja henkilökohtaisissa tietokoneissa äänen (musiikki, ääni jne.) tallentamiseen käytetään erilaisia formaatteja , joiden avulla voit valita hyväksyttävän pakkaussuhteen , äänenlaadun ja datan äänenvoimakkuuden.

Suositut tiedostomuodot henkilökohtaisille tietokoneille ja niihin liittyville laitteille:

Ääniä voidaan tallentaa mikrofonilla, joka muuntaa äänivärähtelyn ilmassa sähköiseksi signaaliksi. Tämä signaali voidaan sitten kvantifioida, mutta digitoinnin tulee sisältää kvantifioinnin koko (tilavuus) ja aika.

Hieman lisää eri äänitiedostomuodoista:

WAV (lausutaan kuten englannin sana "aalto") on muoto, joka tallentaa digitoidun arvon joka kerta. Tämä johtaa paljon dataa keskipitkän aikavälin tietueita varten. Muut muodot puolestaan käyttävät joitain tiedonpakkausmenetelmiä. WAV-muoto on erittäin suosittu ja sitä käytetään laajalti ammattisovelluksissa, jotka käsittelevät digitoituja äänisignaaleja. Eduista - hyvä äänenlaatu; tuettu selaimissa ilman laajennusta. Formaatin haittoja ovat kuitenkin se, että äänidata on tyypillisesti tallennettu raakana, pakkaamattomassa muodossa, joten tiedostot ovat yleensä suuria.
MP3 on toinen suosittu äänen digitointimuoto, joka poistaa äänisignaalin osia, joita ihmiskorva ei kuule helposti. Tuloksena oleva ääni kuulostaa edelleen lähes täsmälleen samalta kuin alkuperäinen, mutta huomattavasti vähemmän bittejä. Tämä tekee tästä muodosta suositun erityisesti Internetissä, koska monet käyttäjät haluavat korkealaatuista musiikkia, mutta suhteellisen lyhyillä latausajoilla. Muodin puutteista käyttäjät huomauttavat, että äänitiedoston toistamiseen voidaan tarvita erillinen soitin tai selainlaajennus.
AAC ( Advanced Audio Coding) -muoto on hyvin samanlainen kuin edellä mainittu tuettu MP3, mutta se on suunniteltu seuraajaksi ja tarjoaa paremman laadun ja pienempiä tiedostokokoja. Haittapuolena on, että tiedostot voidaan kopiosuojata, joten käyttäjä on rajoitettu hyväksyttyihin laitteisiin. Muotoa käytetään iTunes-musiikkiin.
Ogg Vorbis on tiedostomuoto, joka on suunniteltu äänitiedostojen tehokkaaseen jakeluun kohtuullisen kaistanleveyden yhteyksissä. Vorbis-koodausta voidaan käyttää suuremmilla bittinopeuksilla tarkkuuden lisäämiseksi. Edut ovat, että ohjelma on ilmainen, avoin standardi; joidenkin selaimien (Firefox 3.5, Chrome 4 ja Opera 10.5) tuettu. Tämän muodon suosio tuli vähitellen.
FLAC (Free Lossless Audio Compression) on tiedostomuoto, joka tallentaa musiikin tai äänen häviöttömänä laaduna. Jos tiedosto on pakattu, pakkaus ei vaikuta musiikin laatuun millään tavalla, koska tiedot ja käsittely tapahtuu eri tavalla kuin muissa formaateissa (esim. MP3).
WMA (Windows Media Audio) on Microsoftin kehittämä lisensoitu tiedostomuoto äänimateriaalin tallentamiseen ja lähettämiseen. WMA julkistettiin alun perin MP3:n vaihtoehdoksi, mutta nyt MP3:n seuraaja on AAC (suositun iTunes-kaupan käyttämä, kuten yllä mainittiin). WMA:n edut - erittäin hyvä äänenlaatu; käytetään laajasti internetissä. Haitat - tiedostot voidaan suojata kopiointilta; Jotkut laitteet vaativat sinun lataavan soittimen erikseen.

On huomattava, että digitaalisen äänitiedoston toistamiseksi sinun on käytettävä joitain lisäohjelmistoja, kuten soittimia, äänilaajennuksia ja ääniohjelmistoja.

Digitaalisen äänen laatuun vaikuttavat parametrit

Tärkeimmät parametrit, jotka vaikuttavat digitaalisen äänitallenteen laatuun, ovat:

Tärkeitä ovat myös digitaalisten äänen tallennus- ja toistolaitteiden analogisen polun parametrit:

Signaali-kohinasuhde
THD
Intermodulaatiosärö
Amplitudi -taajuusominaisuuden epätasaisuus
Kanavien vuorovaikutus
Dynaaminen alue

Digitaalinen äänitekniikka

Digitaalinen äänitys tehdään tällä hetkellä äänitysstudioissa henkilökohtaisten tietokoneiden ja muiden kalliiden ja laadukkaiden laitteiden ohjauksessa. "Kotistudion" käsite on myös melko laajalti kehitetty, jossa käytetään ammattimaisia ja puoliammattimaisia tallennuslaitteita, joiden avulla voit luoda laadukkaita tallenteita kotona.

Äänikortteja käytetään osana tietokoneita, jotka prosessoivat ADC:issä ja DAC:issa - useimmiten 24 bittiä ja 96 kHz, bittisyvyyden ja näytteenottotaajuuden lisääminen ei käytännössä paranna tallennuslaatua .

On olemassa koko luokka tietokoneohjelmia - äänieditoreja , joiden avulla voit työskennellä äänen kanssa:

tallentaa tuleva äänivirta
luoda (luoda) ääntä
muokata olemassa olevaa tallennetta (lisää näytteitä , muuta sointia , äänen nopeutta , leikkaa osia jne.)
kirjoittaa uudelleen yhdestä muodosta toiseen
muuntaa erilaisia äänikoodekkeja

Jotkut yksinkertaiset ohjelmat sallivat vain tiedostomuotojen ja koodekkien muuntamisen.

Jotkut digitaalisen äänen tyypit vertailussa

Muotoile nimi	Hieman syvyys, vähän	Näytteenottotaajuus, kHz	Kanavien lukumäärä	Levytietovirta, kbit/s	Puristus/pakkaussuhde
CD	16	44.1	2	1411.2	1:1 tappioton
Dolby Digital (AC3)	16-24	48	6	640 asti	~12:1 tappiollinen
DTS	20-24	48; 96	8 asti	ennen vuotta 1536	~3:1 tappiollinen
DVD Audio	16; kaksikymmentä; 24	44,1; 48; 88,2; 96	6	6912	2:1 tappioton
DVD Audio	16; kaksikymmentä; 24	176,4; 192	2	4608	2:1 tappioton
MP3	kelluva	48 asti	2	320 asti	~11:1 tappiollinen
AAC	kelluva	96 asti	48 asti	529 asti	tappioiden kanssa
AAC+ ( SBR )	kelluva	48 asti	2	320 asti	tappioiden kanssa
Ogg Vorbis	32 asti	192 asti	255 asti	1000 asti	tappioiden kanssa
WMA	24 asti	96 asti	8 asti	768 asti	2:1, on häviötön versio

Katso myös

Muistiinpanot

↑ H. Nyquist, "Tietyt aiheet lennätinsiirtoteoriassa", Trans. AIEE, voi. 47, s. 617-644, huhtikuu 1928
↑ Kotelnikov V. A. "Eetterin" ja langan suorituskyvystä televiestinnässä // Uspekhi fizicheskikh nauk : Journal. - 2006. - Nro 7 . - S. 762-770 .
↑ Robertson, David. Alec Reeves 1902-1971 Privateline.com: Puhelinhistoria Arkistoitu 11. toukokuuta 2014. (Englanti)
↑ Claude Shannon - Viestinnän matemaattinen teoria
↑ C.E. Shannon. Viestintä melun läsnä ollessa. Proc. Radioinsinöörien instituutti. Voi. 37. Ei. 1. P. 10-21. tammikuu 1949.
↑ 1 2 3 4 5 6 7 8 9 CD-levy: teorian ja käytön käsikirja Tekijät: Ken C. Pohlmann
↑ Billboard 22. elokuuta 1981 - Japanin denon-yhtiö 10-vuotias digitaalinen veteraani

Kirjallisuus

Shkritek P. Äänipiirien viiteopas: Per. saksan kanssa - M. Mir, 1991.-446 s.: ill.
Zolotukhin I.P., Izyumov A.A., Raizman M.M. Digitaaliset äänen tallentimet. - Tomsk: "Radio ja viestintä", 1990. - 160 s. — ISBN 5-256-00559-6 .

Linkit

Äänimediat ja äänitallennustyypit

Analoginen

Äänikirjoitus (1857)
Vahasylinteri (1877)
Äänilevy (1894)
Langallinen tallennin (1898)
Magneettinauha kelassa (1942)
SoundScriber (1945)
Gray Audiograph (1945)
Sanelunauha (1947)
LP (1948)
RCA-kasetti (1958)
Fidelipac (1959)
Stereo Pack (1962)
Kompakti kasetti (1963) ja kasetti single (1982)
Stereo 8 (1964)
DC International (1965)
Play Tape (1966)
Minikasetti (1967)
Mikrokasetti (1969)
Steno Cassette (1971)
Elcaset (1976)
Picocassette (1985)

Digitaalinen

Digitaaliset äänimuodot
Äänivirta (1976)
X80/ProDigi (1980)
DASH (1982)
CD-ääni (1982)
Digitaalinen ääninauha (1987)
ADAT (1991)
MiniDisc (1991)
Digitaalinen kompakti kasetti (1992)
NT (1992)
Extended Resolution Compact Disc (1995)
High Definition Compatible Digital (1995)
5.1-musiikkilevy (1997)
Super Audio CD (1999)
DVD Audio (2000)
Hi-MD (2004)
K2 High Definition (2007)
SlotMusic (2008)