Statistika

S Wikipedije, slobodne enciklopedije

Statistika je matematička disciplina koja proučava načine sakupljanja, sažimanja i prikazivanja zaključaka iz nekih podataka. Primjenjuje se u mnogim strukama, kao i u svakodnevnom životu. Statistika' - je grana primijenjene matematike koja se bavi analizom podataka.

Osnovna podjela statistike je na deskriptivnu i inferencijalnu. Deskriptivna statistika bavi se mjerama centralne tendencije (aritmetička sredina, medijana i mod), mjerama varijabiliteta (raspon, standardna devijacija, varijanca, interkvartilni raspon, semiinterkvartilni raspon i prosječno odstupanje), kao i grafičkim i tabelarnim prikazivanjem osnovnih statističkih vrijednosti. S druge strane, inferencijalna statistika se odnosi na provjeravanje postavljenih hipoteza (nultih i afirmativnih/alternativnih), uz pomoć statističkih testova, koeficijenata i njihove značajnosti (t-test, analiza varijance, hi-kvadrat test, koeficijenti asocijacije i korelacije, diskriminaciona analiza, Mann-Whitney-ev test, Test znaka...). U statističkom žargonu, deskriptivna statistika se naziva statistikom sa malim s, a inferencijalna statistikom sa velikim S, jer je osnovni cilj deskriptivne statistike da ponudi podatke koji se dalje mogu obrađivati uz pomoć tehnika inferencijalne statistike.[1]

Druga podjela se odnosi na tehnike koje se koriste u statistici. Sukladno tome, imamo parametrijsku i neparametrijsku statistiku.[2] U slučaju parametrijske statistike, izračuni se temelje na normalnoj (zvonolikoj, Gaussovoj) distribuciji, dok se u slučaju neparametrijske statistike provode testovi koji ne moraju podrazumijevati normalnost distribucije podataka kojima raspolažemo. Primjeri prve grupe tehnika su: složena analiza varijance, Pearsonov produkt-moment koeficijent korelacije, aritmetička sredina, standardna devijacija... Primjeri za drugu grupu tehnika su: Spearmanov koeficijent korelacije, hi-kvadrat test, Kruskal-Wallisov test, medijana, mod i sl.

Statistika je neodvojiva od teorije vjerovatnoće, koja predstavlja skup matematičkih modela za opisivanje odnosa između ostvarenih događaja (ishoda) i mogućih događaja. Najvažniji koncept teorije vjerovatnoće koji ima široku primjenu u statistici je normalna raspodjela. Standardna normalna raspodjela ima aritmetičku sredinu M = 0 i standardnu devijaciju koja iznosi SD = 1. Udaljenost nekog rezultata (podatka) od aritmetičke sredine, u jedinicama standardne devijacije, predstavlja tzv. z-vrijednost. Ukoliko je z-vrijednost viša od nule, rezultat je pozicioniran iznad aritmetičke sredine. U suprotnom, kažemo da određeni rezultat pada ispod prosjeka.

Kako bi se primijenila neka od statističkih tehnika/procedura, potrebno je prvo postaviti adekvatnu hipotezu/e. Hipoteze mogu biti nulte (gdje se ne pretpostavlja razlika između dvije ili više grupa ispitanika ili se ne pretpostavlja da će korelacija između nekoliko varijabli biti statistički značajna). Također, postoje i afirmativne hipoteze, kojima se pretpostavlja neka statistički značajna razlika ili povezanost.

Primjeri za nulte hipoteze su:

  • Nema statistički značajnih spolnih razlika u stavovima prema eutanaziji.
  • Ne očekuje se statistički značajna korelacija između tjelesne mase i inteligencije.

Primjeri za afirmativne hipoteze su:

  • Postoje statistički značajne dobne razlike u vremenu reakcije na prezentirane stimuluse.
  • Postoji statistički značajna povezanost između alkoholizma i impotencije kod muškaraca.

Statistika kao primijenjena nauka[uredi | uredi izvor]

Neki primjeri korištenja statistike:

  • ispitivanja glasača prije/u toku izbora
  • ispitivanje ljudi uopšteno o bilo kojoj temi
  • vođenje statistike u proizvodnji procesora, utvrđivanje postotka ispravnih procesora (yield)
  • vođenje statistike u proizvodnji, prije i poslije svake kontrole
  • primijenjena statistika na području biomedicinskih znanosti (biostatistika)
  • primijenjena statistika u području geoznanosti, odn. prostorna statistika ili geostatistika
  • biomedicinska statistika (omjeri rizika, omjeri šansi, ROC krive, mjere asocijacije)

Psihološka statistika je matematičko-metodološko ispitivanje i proučavanje individualnih razlika u: ličnosti, motivaciji, inteligenciji, stavovima, vrijednostima, interesovanjima, emocijama. Također, provjeravaju se korelacije između različitih varijabli, te doprinos skupa (seta) varijabli (poznatih pod nazivom prediktori) jednoj kriterijskoj variabli (koja je ishod, posljedica, odnosno neka mjera ponašanja ili mišljenja koja je bitna npr. u poslu, na fakultetu). Primjeri prediktora su: generalna inteligencija, motivacija i radne navike, a primjer kriterija je školski ili akademski uspjeh na kraju godine.

Biomedicinska statistika je oblast koja obuhvata primjenu statistike u kliničkim medicinskim naukama, kao i u biologiji. Najčešća primjena u okviru ove oblasti je u eksperimentalnim istraživanjima, gdje se treba utvrditi djelovanje nekog lijeka ili terapije, na način da se uporede eksperimentalna i kontrolna grupa. Ako je razlika između njih statistički značajna, onda ta razlika zaista i postoji, a nije rezultat slučaja.

Logičke greške pri upotrebi statistike[uredi | uredi izvor]

Najčešća logička greška je nereprezentativan uzorak pri ispitivanju. Samo ispitivanje može biti sociološki izvedeno savršeno (ispitanici popunjavaju uputnik neometani i anonimno), matematička analiza je izvedena bez grešaka (zbroj svih izbora daje 100%, ne manje ili više, što se također može dogoditi), no rezultati ipak nemaju previše veze s realnošću.

Uzorak može biti nereprezentativan iz više razloga:

  • premali broj ispitanika
  • ispitanici samo jednog spola
  • ispitanici samo određene dobi
  • ispitanici samo određenog socijalnog statusa (klase, etničke grupe i sl.

Još neke važne pogreške prilikom korištenja statistike su[3]:

  • pogrešno unošenje podataka u statistički program, tokom pravljenja baze podataka (preskakanje/izostavljanje podataka ili duplo navođenje nekih od prikupljenih podataka usljed brzine kucanja, nesmotrenosti i sl)
  • pogrešna upotreba statističkih tehnika (npr. korištenje neparametrijskih tehnika umjesto parametrijskih)
  • pogrešno prikazivanje podataka (neki grafikoni nisu pogodni za sve vrste prikaza/sumiranja podataka/rezultata)
  • neadekvatna interpretacija podataka (usljed neznanja ili neobraćanja pažnje na metodološka ograničenja određenog istraživanja)
  • pretjerivanje u navođenju statističkih pokazatelja ili izostavljanje bitnih pokazatelja (npr. korelacijske matrice sa prevelikim brojem podataka, koje otežavaju razumijevanje i smanjuju preglednost statističkog prikaza ili izostavljanje indikatora kao što su intervali pouzdanosti, veličina efekta, statistička značajnost i slično).

Rezultati dobiveni valjanom analizom nereprezentativnog uzorka su nevaljani, kao i oni dobiveni nevaljanom analizom reprezentativnog uzorka.

Češći statistički pojmovi[uredi | uredi izvor]

Reference[uredi | uredi izvor]

  1. ^ Devlin, K. & Lorden, G. (2007). The numbers behind NUMB3RS: Solving crime with mathematics. New York: Penguin Group.
  2. ^ Petz, B. (2004). Osnovne statističke metode za nematematičare (peto izdanje). Jastrebarsko: Naklada Slap.
  3. ^ Repišti, S. (2015). Some common mistakes of data analysis, their interpretation, and presentation in biomedical sciences. IMO, 7(12), 37-46.


Nedovršeni članak Statistika koji govori o matematici treba dopuniti. Dopunite ga prema pravilima Wikipedije.