Zipf törvénye

A Zipf-törvény („rang-gyakoriság”) a szavak gyakoriságának eloszlásának empirikus szabályszerűsége egy természetes nyelvben : ha egy nyelv összes szava (vagy csak egy meglehetősen hosszú szöveg ) csökkenő sorrendbe van rendezve . használata, akkor az n- edik szó gyakorisága egy ilyen listában megközelítőleg fordítottan arányos lesz az n sorszámmal (e szó ún. rangja , lásd sorrendskála ). Például a második leggyakrabban használt szó körülbelül kétszer olyan gyakori, mint az első, a harmadik háromszor olyan ritka, mint az első, és így tovább.

Létrehozási előzmények

A szabályszerűség felfedezésének szerzője Jean-Baptiste Estoup ( fr.  Jean-Baptiste Estoup ) francia gyorsíró, aki 1908-ban írta le "Range of shorthand" [1] című munkájában . A törvényt először Felix Auerbach német fizikus használta a városméretek eloszlásának leírására 1913-ban "A népesedés törvénye" című munkájában [2] , és George Zipf amerikai nyelvészről nevezték el , aki 1949-ben aktívan népszerűsítette ezt a mintát. , először az elosztási gazdasági erők és a társadalmi státusz leírására javasolja a használatát [2] .

A Zipf-törvény magyarázatát az additív Markov-láncok korrelációs tulajdonságaira alapozva (lépés memória funkcióval) 2005-ben adták [3] .

A Zipf-törvényt matematikailag a Pareto-eloszlás írja le . Ez az infometria egyik alaptörvénye .

A törvény alkalmazásai

George Zipf 1949-ben mutatta be először az emberek jövedelmének méret szerinti megoszlását: a leggazdagabb embernek kétszer annyi pénze van, mint a következő leggazdagabbnak, és így tovább. Ez az állítás számos országra (Anglia, Franciaország, Dánia, Hollandia, Finnország, Németország, USA) igaznak bizonyult az 1926 és 1936 közötti időszakban [2] .

Ez a törvény a városrendszer eloszlásával kapcsolatban is működik: bármely országban a legnagyobb lélekszámú város kétszer akkora, mint a következő legnagyobb város, és így tovább [2] . Ha egy adott ország összes városát a listában a népesség csökkenő sorrendjében rendezi, akkor minden városhoz hozzárendelhet egy bizonyos rangot, vagyis azt a számot, amelyet ebben a listában kap. Ugyanakkor a populáció mérete és rangja a [4] képlettel kifejezett egyszerű mintának engedelmeskedik :

,

hol van az n- edik rangú  város lakossága ;  - az ország fővárosának lakossága (1. rang).

Empirikus vizsgálatok alátámasztják ezt az állítást [5] [6] [7] [8] [9] .

1999-ben Xavier Gabet közgazdász a Zipf-törvényt a hatalomtörvény példájaként írta le : ha a városok véletlenszerűen nőnek ugyanazzal a szórással, akkor a határértéken az eloszlás a Zipf-törvényre redukálódik [10] .

A kutatók következtetései szerint az Orosz Föderáció városi településeivel kapcsolatban a Zipf-törvénynek megfelelően [11] :

Kritika

Wentian Li amerikai bioinformatikus a Zipf-törvény statisztikai magyarázatát javasolta, bizonyítva, hogy egy véletlenszerű karaktersorozat is engedelmeskedik ennek a törvénynek [12] . A szerző arra a következtetésre jut, hogy a Zipf-törvény nyilvánvalóan pusztán statisztikai jelenség, amelynek semmi köze a szöveg szemantikájához , és felületes kapcsolatban áll a nyelvészettel.

Általánosságban elmondható, hogy ennek az elméletnek a bizonyítása a következő. Egy n hosszúságú szó véletlenszerű előfordulásának valószínűsége egy véletlenszerű karakterláncban csökken n növekedésével ugyanolyan arányban, ahogyan a szó rangja a gyakorisági listán (sorrendi skálán) nő. Ezért egy szó rangjának és gyakoriságának szorzata egy konstans .

Lásd még

Jegyzetek

  1. Alain Lelu. Jean-Baptiste Estoup és a Zipf-törvény eredete: tudományos gondolkodású gyorsíró (1868-1950)  // Boletín de Estadística e Investigación Operativa. - 2014. - T. 30 , 1. sz . - S. 66-77 .
  2. ↑ 1 2 3 4 Zipf GK Emberi viselkedés és a legkevesebb erőfeszítés elve . - Addison-Wesley Press, 1949. - S.  484-490 . — 573 p.
  3. KE Kechedzhy, OV Usatenko, VA Yampol'skii. Szavak rangsorolása az additív soklépéses Markov-láncokban és a Zipf-törvényben   // Phys . Fordulat. E.. - 2004. - évf. 72 . — P. 046138(1)-046138(6) . — arXiv : physics/0406099 .
  4. Zanadvorov V.S., Zanadvorova A.V. A város gazdaságtana: bevezető tanfolyam . ISBN 5-94628-099-6 . Akadémiai könyv (2003). Letöltve: 2015. augusztus 31. Az eredetiből archiválva : 2015. szeptember 25.
  5. Jiang B., Jia T. Zipf törvénye az Egyesült Államok összes természetes városára: térinformatikai perspektíva . International Journal of Geographical Information Science 25(8), 1269-1281 (2011). Letöltve: 2015. augusztus 31. Az eredetiből archiválva : 2014. szeptember 20..
  6. Kali R. A város mint óriási komponens: Zipf törvényének véletlenszerű gráfos megközelítése. - Applied Economics Letters 10: 717-720(4), 2003.
  7. Axtell, Robert L. Az egyesült államokbeli cégméretek zipf megoszlása ​​(lefelé irányuló kapcsolat) . American Association for the Advanced of Science (2001). Az eredetiből archiválva : 2015. szeptember 23. 
  8. Rozenfeld H., Rybski D., Andrade J.S., Batty M., Stanley. A népességnövekedés törvényei (a link nem érhető el) . Proc. Nat. Acad. sci. 105, 18702-18707 (2008). Archiválva az eredetiből 2015. február 16-án. 
  9. O'Sullivan A. A város gazdaságtana. - M. : Infra-M, 2002. - S. 122. - 706 p. — ISBN 5-16-000673-7 .
  10. Gabaix, Xavier. Zipf városok törvénye: magyarázat . Quarterly Journal of Economics 114(3): 739–67 (1999). Letöltve: 2015. augusztus 31. Az eredetiből archiválva : 2021. február 24.
  11. Fattakhov R.V., Stroev P.V. Oroszország területi fejlődése: A modern kihívások és a gazdasági növekedési pontok kialakulása (elérhetetlen link) . Az Orosz Föderáció kormánya alá tartozó Pénzügyi Egyetem (2015. június 22.). Az eredetiből archiválva : 2015. szeptember 25. 
  12. Wentian Li. A Zipf törvénye véletlenszerű szövegeknél is működik  = Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution. - Santa Fe Institute, 1991. - 8. o . Archiválva az eredetiből 2022. október 24-én.