Zipfin laki

Zipfin laki ("rank-frekvenssi") on empiirinen säännönmukaisuus luonnollisen kielen sanojen esiintymistiheyden jakautumisesta : jos kielen kaikki sanat (tai vain melko pitkä teksti ) on järjestetty niiden esiintymistiheyden mukaan laskevaan järjestykseen . käyttöä, silloin n :nnen sanan esiintymistiheys tällaisessa luettelossa on suunnilleen kääntäen verrannollinen sen järjestysnumeroon n ( tämän sanan ns. arvo , katso järjestysasteikko ). Esimerkiksi toiseksi eniten käytetty sana on noin kaksi kertaa niin yleinen kuin ensimmäinen, kolmas on kolme kertaa harvinaisempi kuin ensimmäinen ja niin edelleen.

Luontihistoria

Säännöllisyyden löydön tekijä on ranskalainen pikakirjoittaja Jean-Baptiste Estoup ( fr.  Jean-Baptiste Estoup ), joka kuvaili sitä vuonna 1908 teoksessaan "Range of shorthand" [1] . Saksalainen fyysikko Felix Auerbach käytti lakia kuvaamaan kaupunkien kokojakaumaa ensimmäisen kerran teoksessaan "Väestökeskittymän laki" vuonna 1913 [2] , ja se on nimetty amerikkalaisen kielitieteilijän George Zipfin mukaan, joka vuonna 1949 aktiivisesti popularisoi tätä mallia. , ehdottaa ensin sen käyttämistä kuvaamaan jakelun taloudellisia voimia ja sosiaalista asemaa [2] .

Zipfin lain selitys, joka perustuu additiivisten Markov-ketjujen korrelaatioominaisuuksiin (askelmuistitoiminnolla), annettiin vuonna 2005 [3] .

Zipfin laki kuvataan matemaattisesti Pareton jakaumalla . Se on yksi infometriikassa käytetyistä perussäännöistä .

Lain sovellukset

George Zipf vuonna 1949 esitti ensimmäisen kerran ihmisten tulojen jakautumisen heidän koonsa mukaan: rikkaimmalla on kaksi kertaa enemmän rahaa kuin seuraavaksi rikkaimmalla ja niin edelleen. Tämä väite osoittautui todeksi useissa maissa (Englanti, Ranska, Tanska, Hollanti, Suomi, Saksa, USA) vuosina 1926-1936 [2] .

Tämä laki toimii myös kaupunkijärjestelmän jakautumisen suhteen: minkään maan suurin väkiluku on kaksi kertaa suurempi kuin seuraavaksi suurin kaupunki ja niin edelleen [2] . Jos järjestät luettelossa kaikki tietyn maan kaupungit laskevassa väestöjärjestyksessä, kullekin kaupungille voidaan määrittää tietty sijoitus, toisin sanoen numero, jonka se saa tässä luettelossa. Samanaikaisesti populaation koko ja sijoitus noudattavat yksinkertaista kaavalla [4] ilmaistavaa kaavaa :

,

missä on n :nnen sijan  kaupungin väestö ;  - maan pääkaupungin väestö (1. sija).

Empiiriset tutkimukset tukevat tätä väitettä [5] [6] [7] [8] [9] .

Taloustieteilijä Xavier Gabet kuvaili vuonna 1999 Zipfin lakia esimerkkinä valtalaista : jos kaupungit kasvavat satunnaisesti samalla keskihajonnalla, jakauma pienenee rajalla Zipfin laiksi [10] .

Venäjän federaation kaupunkiasutusta koskevien tutkijoiden päätelmien mukaan Zipfin lain [11] mukaisesti :

Kritiikki

Amerikkalainen bioinformaatikko Wentian Li ehdotti tilastollista selitystä Zipfin laille, joka osoittaa, että myös satunnainen merkkijono noudattaa tätä lakia [12] . Kirjoittaja päättelee, että Zipfin laki on ilmeisesti puhtaasti tilastollinen ilmiö, jolla ei ole mitään tekemistä tekstin semantiikan kanssa ja jolla on pinnallinen suhde kielitieteeseen.

Yleisesti ottaen tämän teorian todiste on seuraava. Todennäköisyys n -pituisen sanan satunnaiselle esiintymiselle satunnaisten merkkien ketjussa pienenee n:n kasvaessa samassa suhteessa kuin tämän sanan järjestys taajuusluettelossa (järjestysasteikko) kasvaa. Siksi sanan arvon ja sen tiheyden tulo on vakio .

Katso myös

Muistiinpanot

  1. Alain Lelu. Jean-Baptiste Estoup ja Zipfin lain alkuperä: tieteellinen pikakirjoittaja (1868-1950)  // Boletín de Estadística e Investigación Operativa. - 2014. - T. 30 , nro 1 . - S. 66-77 .
  2. ↑ 1 2 3 4 Zipf GK Ihmisen käyttäytyminen ja vähiten vaivannäön periaate . - Addison-Wesley Press, 1949. - S.  484-490 . — 573 s.
  3. KE Kechedzhy, OV Usatenko, VA Yampol'skii. Sanojen järjestysjakaumat additiivisissa monivaiheisissa Markov-ketjuissa ja Zipf-laki   // Phys . Rev. E.. - 2004. - Voi. 72 . — P. 046138(1)-046138(6) . — arXiv : physics/0406099 .
  4. Zanadvorov V.S., Zanadvorova A.V. Kaupungin taloustiede: johdantokurssi . ISBN 5-94628-099-6 . Akateeminen kirja (2003). Haettu 31. elokuuta 2015. Arkistoitu alkuperäisestä 25. syyskuuta 2015.
  5. Jiang B., Jia T. Zipfin laki kaikille luonnollisille kaupungeille Yhdysvalloissa: geospatiaalinen näkökulma . International Journal of Geographical Information Science 25(8), 1269-1281 (2011). Haettu 31. elokuuta 2015. Arkistoitu alkuperäisestä 20. syyskuuta 2014.
  6. Kali R. Kaupunki jättimäisenä komponenttina: satunnainen graafinen lähestymistapa Zipfin lakiin. - Applied Economics Letters 10: 717-720(4), 2003.
  7. Axtell, Robert L. Zipf-jakauma yhdysvaltalaisten yritysten kokoista (downlink) . American Association for the Advanced of Science (2001). Arkistoitu alkuperäisestä 23. syyskuuta 2015. 
  8. Rozenfeld H., Rybski D., Andrade J.S., Batty M., Stanley. Väestönkasvun lait (linkki ei saatavilla) . Proc. Nat. Acad. sci. 105, 18702-18707 (2008). Arkistoitu alkuperäisestä 16. helmikuuta 2015. 
  9. O'Sullivan A. Kaupungin taloustiede. - M .: Infra-M, 2002. - S. 122. - 706 s. — ISBN 5-16-000673-7 .
  10. Gabaix, Xavier. Zipfin kaupunkilaki: Selitys . Quarterly Journal of Economics 114(3): 739–67 (1999). Haettu 31. elokuuta 2015. Arkistoitu alkuperäisestä 24. helmikuuta 2021.
  11. Fattakhov R.V., Stroev P.V. Venäjän aluekehitys: nykyaikaiset haasteet ja talouskasvupisteiden muodostuminen (pääsemätön linkki) . Venäjän federaation hallituksen alainen talousyliopisto (22. kesäkuuta 2015). Arkistoitu alkuperäisestä 25. syyskuuta 2015. 
  12. Wentian Li. Zipfin laki toimii myös satunnaisille teksteille  = Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution. - Santa Fe Institute, 1991. - s. 8 . Arkistoitu alkuperäisestä 24. lokakuuta 2022.