Kielen entropia

Kielen entropia on tietyllä kielellä olevan tekstin tai itse kielen  tilastollinen funktio , joka määrittää tiedon määrän tekstiyksikköä kohti.

Matemaattisesta näkökulmasta kielen entropia määritellään seuraavasti

missä  on viesti,  onko sen entropia ,  on viestin pituus.

Claude Shannonin ja Thomas Coverin ( engl.  Thomas Cover ) mukaan englannin kielellä tämä arvo on 1,3–2,3 bittiä per kirjain.

Kirjallisuus