A Zipf-törvény („rang-gyakoriság”) a szavak gyakoriságának eloszlásának empirikus szabályszerűsége egy természetes nyelvben : ha egy nyelv összes szava (vagy csak egy meglehetősen hosszú szöveg ) csökkenő sorrendbe van rendezve . használata, akkor az n- edik szó gyakorisága egy ilyen listában megközelítőleg fordítottan arányos lesz az n sorszámmal (e szó ún. rangja , lásd sorrendskála ). Például a második leggyakrabban használt szó körülbelül kétszer olyan gyakori, mint az első, a harmadik háromszor olyan ritka, mint az első, és így tovább.
A szabályszerűség felfedezésének szerzője Jean-Baptiste Estoup ( fr. Jean-Baptiste Estoup ) francia gyorsíró, aki 1908-ban írta le "Range of shorthand" [1] című munkájában . A törvényt először Felix Auerbach német fizikus használta a városméretek eloszlásának leírására 1913-ban "A népesedés törvénye" című munkájában [2] , és George Zipf amerikai nyelvészről nevezték el , aki 1949-ben aktívan népszerűsítette ezt a mintát. , először az elosztási gazdasági erők és a társadalmi státusz leírására javasolja a használatát [2] .
A Zipf-törvény magyarázatát az additív Markov-láncok korrelációs tulajdonságaira alapozva (lépés memória funkcióval) 2005-ben adták [3] .
A Zipf-törvényt matematikailag a Pareto-eloszlás írja le . Ez az infometria egyik alaptörvénye .
George Zipf 1949-ben mutatta be először az emberek jövedelmének méret szerinti megoszlását: a leggazdagabb embernek kétszer annyi pénze van, mint a következő leggazdagabbnak, és így tovább. Ez az állítás számos országra (Anglia, Franciaország, Dánia, Hollandia, Finnország, Németország, USA) igaznak bizonyult az 1926 és 1936 közötti időszakban [2] .
Ez a törvény a városrendszer eloszlásával kapcsolatban is működik: bármely országban a legnagyobb lélekszámú város kétszer akkora, mint a következő legnagyobb város, és így tovább [2] . Ha egy adott ország összes városát a listában a népesség csökkenő sorrendjében rendezi, akkor minden városhoz hozzárendelhet egy bizonyos rangot, vagyis azt a számot, amelyet ebben a listában kap. Ugyanakkor a populáció mérete és rangja a [4] képlettel kifejezett egyszerű mintának engedelmeskedik :
,hol van az n- edik rangú város lakossága ; - az ország fővárosának lakossága (1. rang).
Empirikus vizsgálatok alátámasztják ezt az állítást [5] [6] [7] [8] [9] .
1999-ben Xavier Gabet közgazdász a Zipf-törvényt a hatalomtörvény példájaként írta le : ha a városok véletlenszerűen nőnek ugyanazzal a szórással, akkor a határértéken az eloszlás a Zipf-törvényre redukálódik [10] .
A kutatók következtetései szerint az Orosz Föderáció városi településeivel kapcsolatban a Zipf-törvénynek megfelelően [11] :
Wentian Li amerikai bioinformatikus a Zipf-törvény statisztikai magyarázatát javasolta, bizonyítva, hogy egy véletlenszerű karaktersorozat is engedelmeskedik ennek a törvénynek [12] . A szerző arra a következtetésre jut, hogy a Zipf-törvény nyilvánvalóan pusztán statisztikai jelenség, amelynek semmi köze a szöveg szemantikájához , és felületes kapcsolatban áll a nyelvészettel.
Általánosságban elmondható, hogy ennek az elméletnek a bizonyítása a következő. Egy n hosszúságú szó véletlenszerű előfordulásának valószínűsége egy véletlenszerű karakterláncban csökken n növekedésével ugyanolyan arányban, ahogyan a szó rangja a gyakorisági listán (sorrendi skálán) nő. Ezért egy szó rangjának és gyakoriságának szorzata egy konstans .
Szótárak és enciklopédiák | |
---|---|
Bibliográfiai katalógusokban |