Tietojen vaihtelun monimutkaisuus on informaatioteoreettinen arvo, joka määritellään informaation vaihteluksi suhteessa informaation entropiaan . Se on johdettu järjestyksen ja kaaoksen esiintyvyyden vaihteluista dynaamisessa järjestelmässä, ja sitä käytetään monilla tiedon aloilla monimutkaisuuden mittaamiseen . Teoria esiteltiin Batesin ja Shepardin teoksissa vuonna 1993 [1] .
Diskreetin dynaamisen järjestelmän informaation vaihtelun monimutkaisuus on funktio tämän järjestelmän satunnaisten datasyötteiden tilojen todennäköisyysjakaumasta . Runsaan tietolähteen, kuten satunnaislukugeneraattorin tai valkoisen kohinasignaalin , järjestelmän ohjaamisen tavoitteena on tutkia järjestelmän sisäistä dynamiikkaa samalla tavalla kuin signaalinkäsittelyssä käytetään taajuista pulssia .
Jos järjestelmällä on mahdollisia tiloja ja tilojen todennäköisyydet tunnetaan, niin sen informaatioentropia on yhtä suuri kuin
missä on oma tilatieto .
Järjestelmän informaation vaihtelun monimutkaisuus määritellään standardipoikkeamaksi tai vaihteluksi sen keskiarvosta :
tai
Tilainformaation vaihtelu on nolla maksimaalisessa epäjärjestyneessä järjestelmässä, jossa on kaikki ; järjestelmä yksinkertaisesti simuloi satunnaisia datasyötteitä. on myös nolla, kun järjestelmä on täysin järjestetty ja sillä on vain yksi kiinteä tila tuloista riippumatta. on nollasta erilainen näiden kahden ääripään välillä, kun sekä suuren todennäköisyyden tilat että pienen todennäköisyyden tilat ovat mahdollisia täyttämään tila-avaruuden.
Kun monimutkainen dynaaminen järjestelmä kehittyy ajan myötä, se siirtyy tilasta toiseen. Kuinka nämä siirtymät tapahtuvat, riippuu ulkoisista ärsykkeistä epäsäännöllisellä tavalla. Joissakin tapauksissa järjestelmä voi olla herkempi ulkoisille ärsykkeille (epävakaa), kun taas toisissa se voi olla vähemmän herkkä (vakaa). Jos tietyssä tilassa on useita mahdollisia seuraavaa tiloja, ulkoinen tieto määrittää, mikä niistä on seuraava, ja järjestelmä saa tämän tiedon seuraamalla tiettyä liikerataa tila-avaruudessa. Mutta jos useat eri tilat johtavat samaan seuraavaan tilaan, niin siihen tullessa järjestelmä menettää tiedon siitä, mikä tila sitä edelsi. Siten monimutkainen järjestelmä kehittyy ajan myötä, ja se tuottaa vuorotellen tiedon hyötyjä ja menetyksiä. Tiedon vuorottelut tai heilahtelut merkitsevät muistamista ja unohtamista - tiedon tai muistin väliaikaista tallentamista - tämä on ei-triviaalisten laskelmien olennainen piirre.
Tilasiirtymien mukana tuleva tiedon saanti tai menetys voidaan liittää sen omaan tilatietoon. Tiedon nettovoitto tilasta tilaan siirtymisen aikana on tiedosta, joka saadaan tilasta poistuttaessa miinus tiedon menetys tilaan siirtyessä :
Tässä on suora ehdollinen todennäköisyys sille , että jos nykyinen tila on , niin seuraava tila on ja on käänteinen ehdollinen todennäköisyys sille , että jos nykyinen tila on , niin edellinen tila oli . Ehdolliset todennäköisyydet liittyvät siirtymän todennäköisyyteen, todennäköisyyteen, että siirtyminen tilasta tilaan tapahtuu , seuraavilla tavoilla:
Eliminoimalla ehdolliset todennäköisyydet, saamme:
Siksi järjestelmän siirtymän seurauksena saama nettoinformaatio riippuu vain tilainformaation lisääntymisestä alkutilasta lopputilaan. Voidaan osoittaa, että tämä pätee jopa useille peräkkäisille siirtymille [1] .
Kaava muistuttaa voiman ja potentiaalisen energian suhdetta . on samanlainen kuin potentiaalienergia ja on kaavan voima . Ulkoinen informaatio "työntää" järjestelmän "ylös", tilaan, jossa on korkeampi tietopotentiaali muistin säilyttämiseksi, aivan kuten jonkin massan omaavan kehon työntäminen ylämäkeen tilaan, jossa on korkeampi gravitaatiopotentiaali, johtaa energian kertymiseen. Varastoidun energian määrä riippuu vain loppukorkeudesta, ei matkasta ylämäkeen. Samoin tallennetun tiedon määrä on riippumaton kahden tilan välisestä siirtymäpolusta. Kun järjestelmä saavuttaa harvinaisen korkean informaatiopotentiaalin tilan, se voi "pudota" takaisin normaalitilaan ja menettää aiemmin tallennetun tiedon.
Voi olla hyödyllistä laskea standardipoikkeama sen keskiarvosta (joka on nolla), eli nettoinformaatiovahvistuksen vaihtelu [1] , mutta se ottaa huomioon usean siirtymän tila-avaruusmuistin syklit ja sen pitäisi olla tarkempi. järjestelmän prosessointitehon indikaattori. Lisäksi se on helpompi laskea, koska siirtymiä voi olla paljon enemmän kuin tiloja.
Dynaaminen järjestelmä, joka on herkkä ulkoiselle informaatiolle (epävakaa) , käyttäytyy kaoottisesti , kun taas järjestelmä, joka ei ole herkkä ulkoiselle informaatiolle (stabiili), käyttäytyy järjestyneesti. Runsaan tietolähteen vaikutuksen alaisena monimutkainen järjestelmä osoittaa molempia käyttäytymismalleja, värähteleen niiden välillä dynaamisessa tasapainossa. Vaihtelun aste mitataan kvantitatiivisesti ; se vangitsee kaaoksen ja järjestyksen vallitsevan vaihtelun monimutkaisessa järjestelmässä, kun se kehittyy ajan myötä.
On osoitettu , että säännön 110 mukainen alkeissoluautomaatin muunnos kykenee universaaleihin laskelmiin . Todistus perustuu toisiinsa yhdistettyjen ja itsesäilyttävien solukokoonpanojen olemassaoloon ja vuorovaikutukseen, joka tunnetaan nimellä "liittimet" tai " avaruusalukset ", ilmaantumisen ilmiö , joka tarkoittaa automaatiosoluryhmien kykyä muistaa, että purjelentokone kulkee niiden läpi. Siksi on odotettavissa, että tila-avaruudessa esiintyy muistisilmukoita tiedon saannin ja menetyksen, epävakauden ja vakauden, kaaoksen ja järjestyksen vuorottelun seurauksena.
Tarkastellaan soluautomatin kolmen vierekkäisen solun ryhmää, jotka noudattavat sääntöä 110:pää-keskus-pää. Keskisolun seuraava tila riippuu sen nykyisestä tilasta ja lehtisoluista säännön mukaisesti:
3 solun ryhmä | 1-1-1 | 1-1-0 | 1-0-1 | 1-0-0 | 0-1-1 | 0-1-0 | 0-0-1 | 0-0-0 |
---|---|---|---|---|---|---|---|---|
seuraava keskisolu | 0 | yksi | yksi | 0 | yksi | yksi | yksi | 0 |
Tämän järjestelmän informaation vaihtelun monimutkaisuuden laskemiseksi kiinnittäisi ajurisolu 3 solun ryhmän kumpaankin päähän, jotta saataisiin satunnainen ulkoinen ärsyke, esim.kuljettaja→päätekeskus-pään←ohjain, jotta sääntöä voidaan soveltaa kahteen päätysoluun. Sen on sitten määritettävä, mikä on seuraava tila kullekin mahdolliselle nykyiselle tilalle ja kullekin mahdolliselle ajurisolujen sisällön yhdistelmälle laskeakseen suorat ehdolliset todennäköisyydet.
Tämän järjestelmän tilakaavio on esitetty alla. Siinä ympyrät edustavat tiloja ja nuolet tilojen välisiä siirtymiä. Tämän järjestelmän kahdeksan tilaa alkaen1-1-1ennen0-0-0on numeroitu 3 solun ryhmän 3-bittisen sisällön desimaalivastineilla: 7 - 0. Siirtymänuolien lähellä näytetään suorien ehdollisten todennäköisyyksien arvot. Kaaviossa näkyy vaihtelua nuolien hajoamisessa ja konvergenssissa, mikä vastaa vaihtelua kaaoksessa ja järjestyksessä, herkkyyttä ja epäherkkyyttä, ulkoisen tiedon hankintaa ja menetystä kuljettajasoluista.
Suorat ehdolliset todennäköisyydet määräytyvät tietyn siirtymän ohjaavan ajurisolun mahdollisen sisällön osuuden perusteella. Esimerkiksi neljälle mahdolliselle kahden ohjainsolun sisällön yhdistelmälle tila 7 johtaa tiloihin 5, 4, 1 ja 0, joten , , ja ovat 1/4 tai 25%. Samoin tila 0 johtaa tiloihin 0, 1, 0 ja 1, joten 1/2 eli 50 % vastaa . Ja niin edelleen.
Tilatodennäköisyydet suhteutetaan kaavalla
jaNämä lineaariset algebralliset yhtälöt voidaan ratkaista manuaalisesti tai tilatodennäköisyyksien tietokoneohjelmalla seuraavin tuloksin:
p0 _ | p1_ _ | p2 _ | p 3 | p4 _ | p5_ _ | p6 _ | s. 7 |
2/17 | 2/17 | 1/34 | 5/34 | 2/17 | 2/17 | 2/17 | 4/17 |
Tiedon entropia ja monimutkaisuus voidaan laskea tilatodennäköisyyksistä:
lepakko, bitti.On huomattava, että suurin mahdollinen entropia kahdeksalle tilalle on yhtä suuri kuin bitti, mikä vastaa tapausta, jossa kaikki kahdeksan tilaa ovat yhtä todennäköisiä, todennäköisyyksillä 1/8 (kaaoottinen). Siksi säännöllä 110 on suhteellisen korkea entropia tai tilan käyttö 2,86 bittiä. Tämä ei kuitenkaan sulje pois tilatiedon merkittävää vaihtelua suhteessa entropiaan ja näin ollen suurta monimutkaisuutta. Suurin entropia sulkee pois monimutkaisuuden.
Vaihtoehtoista menetelmää voidaan käyttää tilatodennäköisyyksien saamiseksi, kun edellä kuvattu analyyttinen menetelmä ei ole käyttökelpoinen. Se koostuu järjestelmän ohjaamisesta sen tulojen (ohjainsolujen) läpi satunnaisen lähteen kautta useiden sukupolvien ajan ja tilatodennäköisyyksien tarkkailemisesta empiirisesti. Kun tietokonesimulaatioita tehdään 10 miljoonan sukupolven ajan, tulokset ovat seuraavat: [2]
solujen määrä | 3 | neljä | 5 | 6 | 7 | kahdeksan | 9 | kymmenen | yksitoista | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|
(bitti) | 2.86 | 3.81 | 4.73 | 5.66 | 6.56 | 7.47 | 8.34 | 9.25 | 10.09 | 10.97 | 11.78 |
(bitti) | 0,56 | 0,65 | 0,72 | 0,73 | 0,79 | 0,81 | 0,89 | 0,90 | 1.00 | 1.01 | 1.15 |
0,20 | 0,17 | 0,15 | 0.13 | 0.12 | 0.11 | 0.11 | 0.10 | 0.10 | 0.09 | 0.10 |
Koska molemmat parametrit ja , kasvavat järjestelmän koon myötä, erikokoisten järjestelmien paremman vertailun vuoksi ehdotetaan dimensioimatonta suhdetta , suhteellinen informaation vaihtelun monimutkaisuus. Huomaa, että empiiriset ja analyyttiset tulokset ovat yhdenmukaisia 3-kennoisen automaatin kohdalla.
Batesin ja Shepardin [1] teoksessa se on laskettu kaikille alkeissoluautomaattien säännöille, ja havaittiin, että ne, joissa on hitaasti liikkuvia "liitolaitteita" ja mahdollisesti paikallaan olevia esineitä, esimerkiksi sääntö 110, liittyvät läheisesti suurilla arvoilla . Siksi sitä voidaan käyttää suodattimena valittaessa yleiseen laskemiseen kykeneviä sääntöjä, minkä todistaminen on työlästä.
Vaikka tiedon vaihtelun monimutkaisuuskaavan johtaminen perustuu dynaamisen järjestelmän informaation vaihteluihin, itse kaava riippuu vain tilatodennäköisyyksistä ja siksi sitä voidaan soveltaa myös mihin tahansa todennäköisyysjakaumaan, mukaan lukien staattisista kuvista tai tekstistä johdettuihin.
Alkuperäiseen artikkeliin [1] ovat vuosien varrella viitanneet useiden eri alojen tutkijat: monimutkaisuusteoria [3] , monimutkainen järjestelmätiede [4] , kaoottinen dynamiikka [5] , ympäristötekniikka [6] , ekologinen monimutkaisuus [7] . , ekologinen aikasarjaanalyysi [8] , ekosysteemin sietokyky [9] , ilmansaasteet [10] ja vesi [11] , hydrologinen aallokeanalyysi [12] , vesivirtausten mallintaminen maaperässä [13] , maaperän kosteus [14] , vedenjakaja valuma [15] , pohjaveden syvyys [16] , lennonjohto [17] , virtauskuvio [18] , topologia [19] , metallien [20] ja sähkön [21] hintojen markkinaennuste , terveysinformatiikka [22] , ihmisen kognitio [23] , ihmisen kävelykinematiikka [24] neurologia [25] EEG-analyysi [26] puheanalyysi [27] koulutus [28] investoiminen [29] estetiikka [30] .