Tietoteoriassa Shannonin salauslähdelause (tai hiljainen salauslause) asettaa rajan datan enimmäispakkaukselle ja numeerisen arvon Shannonin entropialle .
Lause osoittaa, että (kun datan määrä pyrkii äärettömään itsenäisesti ja tasaisesti jakautuneiden (IED) satunnaismuuttujien virrassa) on mahdotonta pakata dataa niin, että koodiestimaatti (keskimääräinen bittien määrä symbolia kohti) on pienempi kuin alkuperäisen tiedon Shannonin entropia ilman tietojen tarkkuuden menetystä. Shannonin entropiaa lähellä oleva koodi on kuitenkin mahdollista saada ilman merkittäviä häviöitä.
Merkkikoodien salauslähdelause tuo ylä- ja alarajat salattujen sanojen minimipituuteen syötesanan entropian (joka esitetään satunnaismuuttujana) ja vaaditun aakkoston koon funktiona.
Lähdekoodi on kartoitus (sekvenssi) tietovarastosta aakkosmerkkien (yleensä bittien) sekvenssiin siten, että lähdemerkki voidaan saada yksiselitteisesti binäärinumeroista (häviötön koodauslähde) tai jollain erolla (häviöinen koodauslähde) . Tämä on tietojen pakkaamisen idea.
Tietojenkäsittelytieteessä salauslähdelause (Shannon 1948) sanoo, että:
N satunnaismuuttuja, jolla on entropia H ( X ) , voidaan pakata useammaksi kuin N H ( X ) bitiksi ilman mitätöntä datan menetyksen riskiä, jos N menee äärettömään, mutta jos pakkaus on pienempi kuin N H ( X ) bittiä, tiedot todennäköisesti menetetään. (MacKay 2003).Olkoon , tarkoittaa kahta äärellistä aakkostoa ja anna ja merkitse kaikkien näiden aakkosten äärellisten sanojen joukkoa (järjestyksessä).
Oletetaan, että X on satunnaismuuttuja, joka saa arvon kohdasta , ja f on purettavissa oleva koodi kohdasta , jossa . Olkoon S sanan pituuden f ( X ) antama satunnaismuuttuja .
Jos f on optimaalinen siinä mielessä, että sillä on minimisanan pituus X :lle , niin
(Shannon 1948).
Koska se on NOR, sen aikasarja X 1 , …, X n on myös NOR, jonka entropia on H ( X ) diskreettien arvojen tapauksessa ja differentiaalisen entropian kanssa jatkuvien arvojen tapauksessa. Salauslähdelause sanoo, että jokaiselle, jokaiselle resurssin entropiaa suuremmalle arviolle on riittävän suuri n ja salaaja, joka ottaa n NOP-kopiota resurssista , , ja kartoittaa sen binääribitteihin sellaisella tavalla. että alkuperäinen merkki voidaan palauttaa binääribitistä, X todennäköisyydellä vähintään .
Todiste
Otetaan vähän . kaava, , näyttää tältä:
AEP osoittaa, että riittävän suurella n :llä lähteestä generoitu sekvenssi on epäluotettava tyypillisessä tapauksessa - , konvergentti. Jos kyseessä on riittävän suuri: n , (katso AEP)
Tyypillisten joukkojen määritelmä tarkoittaa, että ne sekvenssit, jotka sijaitsevat tyypillisessä joukossa, täyttävät:
Huomaa, että:
enemmän kuin
Biteillä aloittaminen riittää erottamaan minkä tahansa merkkijonon
Salausalgoritmi: kooderi tarkistaa, onko saapuva sekvenssi epätosi, jos on, palauttaa sekvenssin saapuvan taajuuden indeksin, jos ei, palauttaa satunnaisen numeroluvun. numeerinen arvo. Jos syötteen todennäköisyys on väärä sekvenssissä (taajuudella noin ), kooderi ei tuota virhettä. Eli virheen todennäköisyys on suurempi kuin
Todiste kääntyvyydestä Käänteisyyden todistaminen perustuu siihen tosiasiaan, että vaaditaan osoittamaan, että jokaiselle sekvenssille, jonka koko on pienempi kuin (eksponentin merkityksessä), kattaa 1:n rajoittaman sekvenssin taajuuden.
Olkoon sanan pituus jokaiselle mahdolliselle ( ). Määritellään , missä C valitaan siten, että: .
Sitten
jossa toinen rivi on Gibbsin epäyhtälö ja viides rivi on Kraft-epäyhtälö , .
toiselle epätasa-arvolle, jonka voimme asettaa
niin
ja sitten
ja
Näin ollen minimi S täyttää