Zipfov zakon

Sa Wikipedije, slobodne enciklopedije
Idi na: navigacija, traži
Question book-new.svg Ovaj članak ili neka od njegovih sekcija nije dovoljno potkrijepljena izvorima (literatura, web stranice ili drugi izvori).
Sporne rečenice i navodi bi mogli, ukoliko se pravilno ne označe validnim izvorima, biti obrisani i uklonjeni. Pomozite Wikipediji tako što ćete navesti validne izvore putem referenci, te nakon toga možete ukloniti ovaj šablon.
Preferences-system.svg Ovom članku je potrebna jezička standardizacija, preuređivanje ili reorganizacija.
Pogledajte kako poboljšati članak, kliknite na link uredi i doradite članak vodeći računa o standardima Wikipedije.
George Kingsley Zipf

George Kingsley Zipf je bio je američki lingvist i filolog koji je studirao statističke pojave na različitim jezicima. Zipf je bio predsjednik njemačkog odjela i sveučilišni profesor na Univerzitetu Harvard. Radio je sa kineskim jezikom i demografijom, i većina njegovog rada se odnosi na značajke interneta, distribucije prihoda i mnogim drugim bazama podataka.

Zipfov Zakon[uredi | uredi izvor]

G.K. Zipf je istraživao distribuciju riječi u tekstu, i ustanovio je sličnu pojavu kakva je uočena u Bradfordov-om i Lotkin-ovom zakonu: mali broj riječi pojavljuje se vrlo često. Ako se riječi poredaju po frekvenciji pojavljivanja onda je umnožak redoslijeda pojavljivanja sa frekvencijom pojavljivanja konstantan

Fr = c

Zipfov zakon odnosi se na učestalost distribucije. Grafički se distribucija riječi prema Zipfovu zakonu može prikazati kao hiperbolička krivulja. Zipfov model distribucije riječi u osnovi je jednak modelu Bradfordova zakona , samo je primijenjen u drugom području. Zipfov zakon našao je primjenu u planiranju jezika za indeksiranje administrativnih poslova biblioteka.

Jednostavan opis podataka koji slijedi iz Zipfove distribucije je da oni imaju nekoliko elemenata kojima je rezultat vrlo visok, te velik broj elemenata kojima je rezultat vrlo nizak. Zipfova distribucije karakteriziraju upotrebu riječi u prirodnome jeziku i popularnost knjižnice, tako da naprimjer jezik ima nekoliko riječi ( i , na primjer) koje se često koriste, a biblioteka ima nekoliko knjiga koje svako želi posuditi. Podaci pokazuju da mnoge web stranice koriste slijed Zipfove distribucije.

Matematički gledano, nije moguće izvorni oblik Zipfova zakona u jeziku sa beskonačnim riječima smatrati u potpunosti tačnim. U ovom slučaju svaka pozitivna konstanta C smatra se zbirom negativne frekvencije koja se može izraziti geometrijskim nizom.

Image006.gif

Izvori i literatura[uredi | uredi izvor]

  1. Zipf's Law : http://en.wikipedia.org/wiki/Zipf's_law
  2. Zipfov zakon : http://xlinux.nist.gov/dads/HTML/zipfslaw.html
  3. Miroslav Tuđman, Damir Boras, Zdravko Dovedan :Uvod u informacijske znanosti :http://dzs.ffzg.unizg.hr/text/Uvod%20u%20informacijske%20znanosti/pog1.htm
  4. PlanetMath članak o Zipfovu zakonu :http://planetmath.org/encyclopedia/ZipfsLaw.html
  5. Benford's Law and Zipf's Law :http://www.cut-the-knot.org/do_you_know/zipfLaw.shtml

Također pogledajte[uredi | uredi izvor]

Commons logo
U Wikimedijinom spremniku se nalazi još materijala vezanih uz: