Kielen absoluuttinen entropia

Kielen absoluuttinen entropia  on arvo, joka on yhtä suuri kuin enimmäisinformaatio , jonka tietyn kielen yksikkö voi lähettää . Tietoteoriassa kieliyksikkö ymmärretään yleensä yhdeksi vastaavan aakkoston symboliksi (kirjaimeksi), ja absoluuttinen entropia lasketaan sillä ehdolla, että kaikki symbolisarjat ovat yhtä todennäköisiä.

Jos kielen aakkosissa käytetään eri kirjaimia, kielen absoluuttinen entropia ( bittiä kirjainta kohti) voidaan laskea seuraavasti:

Tämä arvo ei ota huomioon vastaanotettujen "sanojen" mahdollista ääntämättä jättämistä.

Englannin kielellä tämä arvo on noin 4,7 bittiä kirjainta kohden. Tämä arvo on paljon suurempi kuin kielen todellinen entropia , koska englannin kielellä, kuten kaikilla luonnollisilla kielillä, on redundanssia .

Kirjallisuus