Tilastoissa teholaki ( eng. power law ) on sellainen kahden suuren välinen toiminnallinen suhde, jossa suhteellinen muutos yhdessä suuressa johtaa suhteelliseen suhteelliseen muutokseen toisessa suureen alkuarvoista riippumatta. nämä suureet: yhden suuren riippuvuus toisesta on tehofunktio . Harkitse esimerkiksi neliön alueen riippuvuutta sen sivun pituudesta. Jos pituus kaksinkertaistuu, pinta-ala nelinkertaistuu. [yksi]
Monissa fysikaalisissa, biologisissa ja keinotekoisissa ilmiöissä havaitaan jakautumia, jotka vastaavat suunnilleen voimalakia eri mittakaavassa: esimerkiksi kuun kraatterien ja auringonpurkausten koko [2] , eri lajien ravintotavat [3] , hermosolujen populaatiot [4] , sanojen käyttötiheys useimmilla kielillä, sukunimien yleisyys , lajien lukumäärä organismien ryhmissä [5] , onnettomuuksien laajuus sähköjärjestelmissä , rikossyytteiden määrä rikosta kohti, tulivuorenpurkausten määrä [6] , ihmisen arviot ärsykkeiden intensiteetistä [7] [8] ja monet muut suuret [9] . Empiiriset jakaumat voivat vastata potenssilakia koko arvojensa alueella tai esimerkiksi pyrstössä. Äänen värähtelyjen vaimennus noudattaa teholakia laajoilla taajuuskaistoilla monissa monimutkaisissa ympäristöissä. Biologisten muuttujien välisten suhteiden allometriset mallit ovat tunnetuimpia esimerkkejä luonnon voimalaeista .
Pottilakille on ominaista asteikkoinvarianssi . Jos on tosi , argumentin skaalaaminen vakiokertoimella saa itse funktion skaalaamaan suhteellisesti. Tuo on:
missä tarkoittaa suoraa suhteellisuutta . Toisin sanoen argumentin kertominen vakiolla johtaa funktion arvon kertomiseen vakiolla . Siten kaikki potenssilait tietyllä eksponentilla ovat ekvivalentteja vakiolla kertomiseen asti, koska ne ovat kaikki vain skaalattuja versioita toisistaan. Tästä syntyy lineaarinen suhde logaritmien ja logaritmien välille ja suora viiva log-log-kaaviossa , jota usein pidetään potenssilain ominaisuutena. Todellisissa tiedoissa tämä ominaisuus on välttämätön, mutta ei riittävä, jotta voidaan päätellä, että on olemassa teholaki. On monia tapoja tuottaa rajallisia määriä dataa, jotka jäljittelevät teholakia, mutta poikkeavat siitä asymptoottisessa rajassa (esimerkiksi jos tiedon luontiprosessi noudattaa lognormaalijakaumaa ). Mallien teholain noudattamisen tarkistaminen on varsinainen tilastojen tutkimusalue, katso alla.
Pottilailla on hyvin määritelty keskiarvo kohdassa , vain jos , ja sillä on äärellinen varianssi , vain jos . Useimmille tunnetuille luonnossa tunnetuille teholaeille eksponentin arvot ovat sellaisia, että keskiarvo on tiukasti määritelty, mutta varianssi ei ole, joten niille on olemassa mahdollisuus " mustan joutsenen " tapahtumiin. tyyppi. [10] Tätä voidaan havainnollistaa seuraavalla ajatuskokeella: [11] Kuvittele olevasi huoneessa ystävien kanssa ja arvioi keskimääräiset kuukausitulot siinä huoneessa. Kuvittele nyt, että tähän huoneeseen tuli maailman rikkain henkilö, jonka kuukausitulot ovat noin miljardi US$. Miten keskimääräisen kuukausitulon arvo huoneessa muuttuu? Tulojen jakautuminen noudattaa Pareton jakaumana tunnettua teholakia (esimerkiksi amerikkalaisten varallisuus jakautuu potenssilain mukaan eksponentti 2:lla).
Toisaalta tämä ei mahdollista perinteisten varianssiin ja keskihajontaan perustuvien tilastojen (esimerkiksi regressioanalyysin ) oikeaa käyttöä. Toisaalta se mahdollistaa kustannustehokkaan toimenpiteen. [11] Oletetaan esimerkiksi, että autojen pakokaasut jakautuvat voimalain mukaan autojen kesken (eli suurin osa saasteista tulee hyvin pienestä määrästä autoja). Sitten riittää, että tämä pieni määrä autoja poistetaan teiltä, jotta päästöjen kokonaismäärä vähenee merkittävästi. [12]
Mediaani on olemassa: potenssilaille x - k , jossa on eksponentti, se saa arvon 2 1/( k - 1) x min , missä x min on minimiarvo, jolle potenssilaki pätee [13]
Vaikka teholaki on houkutteleva monista teoreettisista syistä, sen osoittaminen, että data todellakin noudattaa teholakia, vaatii enemmän kuin vain malliparametrien sovittamista. [14] On tärkeää ymmärtää, miten jakaumat syntyvät: näennäisesti samanlaiset jakaumat voivat syntyä merkittävästi eri syistä, ja erilaiset mallit antavat erilaisia ennusteita esimerkiksi ekstrapoloinnissa. [15] [16]