Razlika između verzija stranice "Statistika"

[pregledana izmjena]

Uklonjeni sadržaj Dodani sadržaj

U redovima

Verzija na dan 17 juli 2015 u 11:59

Statistika je matematička disciplina koja proučava načine sakupljanja, sažimanja i prikazivanja zaključaka iz nekih podataka. Primjenjuje se u mnogim strukama, kao i u svakodnevnom životu. Statistika' - je grana primijenjene matematike koja se bavi analizom podataka.

Osnovna podjela statistike je na deskriptivnu i inferencijalnu. Deskriptivna statistika bavi se mjerama centralne tendencije (aritmetička sredina, medijana i mod), mjerama varijabiliteta (raspon, standardna devijacija, varijanca, interkvartilni raspon, semiinterkvartilni raspon i prosječno odstupanje), kao i grafičkim i tabelarnim prikazivanjem osnovnih statističkih vrijednosti. S druge strane, inferencijalna statistika se odnosi na provjeravanje postavljenih hipoteza (nultih i afirmativnih/alternativnih), uz pomoć statističkih testova, koeficijenata i njihove značajnosti (t-test, analiza varijance, hi-kvadrat test, koeficijenti asocijacije i korelacije, diskriminaciona analiza, Mann-Whitney-ev test, Test znaka...). U statističkom žargonu, deskriptivna statistika se naziva statistikom sa malim s, a inferencijalna statistikom sa velikim S, jer je osnovni cilj deskriptivne statistike da ponudi podatke koji se dalje mogu obrađivati uz pomoć tehnika inferencijalne statistike.^[1]

Druga podjela se odnosi na tehnike koje se koriste u statistici. Sukladno tome, imamo parametrijsku i neparametrijsku statistiku.^[2] U slučaju parametrijske statistike, izračuni se temelje na normalnoj (zvonolikoj, Gaussovoj) distribuciji, dok se u slučaju neparametrijske statistike provode testovi koji ne moraju podrazumijevati normalnost distribucije podataka kojima raspolažemo. Primjeri prve grupe tehnika su: složena analiza varijance, Pearsonov produkt-moment koeficijent korelacije, aritmetička sredina, standardna devijacija... Primjeri za drugu grupu tehnika su: Spearmanov koeficijent korelacije, hi-kvadrat test, Kruskal-Wallisov test, medijana, mod i sl.

Statistika je neodvojiva od teorije vjerovatnoće, koja predstavlja skup matematičkih modela za opisivanje odnosa između ostvarenih događaja (ishoda) i mogućih događaja. Najvažniji koncept teorije vjerovatnoće koji ima široku primjenu u statistici je normalna raspodjela. Standardna normalna raspodjela ima aritmetičku sredinu M = 0 i standardnu devijaciju koja iznosi SD = 1. Udaljenost nekog rezultata (podatka) od aritmetičke sredine, u jedinicama standardne devijacije, predstavlja tzv. z-vrijednost. Ukoliko je z-vrijednost viša od nule, rezultat je pozicioniran iznad aritmetičke sredine. U suprotnom, kažemo da određeni rezultat pada ispod prosjeka.

Statistika kao primijenjena nauka

Neki primjeri korištenja statistike:

ispitivanja glasača prije/u toku izbora
ispitivanje ljudi uopšteno o bilo kojoj temi
vođenje statistike u proizvodnji procesora, utvrđivanje postotka ispravnih procesora (yield)
vođenje statistike u proizvodnji, prije i poslije svake kontrole
primijenjena statistika na području biomedicinskih znanosti (biostatistika)
primijenjena statistika u području geoznanosti, odn. prostorna statistika ili geostatistika
biomedicinska statistika (omjeri rizika omjeri šansi, ROC krive, mjere asocijacije)

Logičke greške pri upotrebi statistike

Najčešća logička greška je nereprezentativan uzorak pri ispitivanju. Samo ispitivanje može biti sociološki izvedeno savršeno (ispitanici popunjavaju uputnik neometani i anonimno), matematička analiza je izvedena bez grešaka (zbroj svih izbora daje 100%, ne manje ili više, što se također može dogoditi), no rezultati ipak nemaju previše veze s realnošću.

Uzorak može biti nereprezentativan iz više razloga:

premali broj ispitanika
ispitanici samo jednog spola
ispitanici samo određene dobi
ispitanici samo određenog socijalnog statusa (klase, etničke grupe i sl.

Još neke važne pogreške prilikom korištenja statistike su^[3]:

pogrešno unošenje podataka u statistički program, tokom pravljenja baze podataka (preskakanje/izostavljanje podataka ili duplo navođenje nekih od prikupljenih podataka usljed brzine kucanja, nesmotrenosti i sl)
pogrešna upotreba statističkih tehnika (npr. korištenje neparametrijskih tehnika umjesto parametrijskih)
pogrešno prikazivanje podataka (neki grafikoni nisu pogodni za sve vrste prikaza/sumiranja podataka/rezultata)
neadekvatna interpretacija podataka (usljed neznanja ili neobraćanja pažnje na metodološka ograničenja određenog istraživanja)
pretjerivanje u navođenju statističkih pokazatelja ili izostavljanje bitnih pokazatelja (npr. korelacijske matrice sa prevelikim brojem podataka, koje otežavaju razumijevanje i smanjuju preglednost statističkog prikaza ili izostavljanje indikatora kao što su intervali pouzdanosti, veličina efekta, statistička značajnost i slično).

Rezultati dobiveni valjanom analizom nereprezentativnog uzorka su nevaljani, kao i oni dobiveni nevaljanom analizom reprezentativnog uzorka.

Češći statistički pojmovi

Aritmetička sredina
Geometrijska sredina
Harmonijska sredina
Medijana
Standardna devijacija
Mod (Dominantna vrijednost)
Intervali povjerenja (pouzdanosti)
Normalna kriva
Z-vrijednosti
Testiranje hipoteza
Statistička značajnost
Uzorkovanje
Eksperimentalna istraživanja
Korelacijska istraživanja

Reference

^ Devlin, K. & Lorden, G. (2007). The numbers behind NUMB3RS: Solving crime with mathematics. New York: Penguin Group.
^ Petz, B. (2004). Osnovne statističke metode za nematematičare (peto izdanje). Jastrebarsko: Naklada Slap.
^ Repišti, S. (2015). Some common mistakes of data analysis, their interpretation, and presentation in biomedical sciences. IMO, 7(12), 37-46.

Nedovršeni članak Statistika koji govori o matematici treba dopuniti. Dopunite ga prema pravilima Wikipedije.

Commons logo

Commons ima datoteke na temu: Statistika

[1] Devlin, K. & Lorden, G. (2007). The numbers behind NUMB3RS: Solving crime with mathematics. New York: Penguin Group.

[2] Petz, B. (2004). Osnovne statističke metode za nematematičare (peto izdanje). Jastrebarsko: Naklada Slap.

[3] Repišti, S. (2015). Some common mistakes of data analysis, their interpretation, and presentation in biomedical sciences. IMO, 7(12), 37-46.

[1]

[2]

[3]

@@ Red 5: / Red 5: @@
 Osnovna podjela statistike je na ''deskriptivnu'' i ''inferencijalnu''. Deskriptivna statistika bavi se mjerama centralne tendencije ([[aritmetička sredina]], medijana i mod), mjerama varijabiliteta (raspon, standardna devijacija, varijanca, interkvartilni raspon, semiinterkvartilni raspon i prosječno odstupanje), kao i grafičkim i tabelarnim prikazivanjem osnovnih statističkih vrijednosti. S druge strane, inferencijalna statistika se odnosi na provjeravanje postavljenih hipoteza (nultih i afirmativnih/alternativnih), uz pomoć statističkih testova, koeficijenata i njihove značajnosti (t-test, analiza varijance, hi-kvadrat test, koeficijenti asocijacije i korelacije, diskriminaciona analiza, Mann-Whitney-ev test, Test znaka...). U statističkom žargonu, deskriptivna statistika se naziva statistikom sa malim ''s'', a inferencijalna statistikom sa velikim ''S'', jer je osnovni cilj deskriptivne statistike da ponudi podatke koji se dalje mogu obrađivati uz pomoć tehnika inferencijalne statistike.<ref>[http://www.amazon.com/The-Numbers-Behind-NUMB3RS-Mathematics/dp/0452288576 Devlin], K. & Lorden, G. (2007). ''The numbers behind NUMB3RS: Solving crime with mathematics.'' New York: Penguin Group.</ref>
-<nowiki>  </nowiki>Druga podjela se odnosi na tehnike koje se koriste u statistici. Sukladno tome, imamo ''parametrijsku'' i ''neparametrijsku statistiku''.<ref>Petz, B. (2004). ''Osnovne statističke metode za nematematičare (peto izdanje).'' Jastrebarsko: Naklada Slap.</ref> U slučaju parametrijske statistike, izračuni se temelje na normalnoj (''zvonolikoj'', Gaussovoj) distribuciji, dok se u slučaju neparametrijske statistike provode testovi koji ne moraju podrazumijevati normalnost distribucije podataka kojima raspolažemo. Primjeri prve grupe tehnika su: složena analiza varijance, Pearsonov produkt-moment koeficijent korelacije, aritmetička sredina, standardna devijacija... Primjeri za drugu grupu tehnika su: Spearmanov koeficijent korelacije, hi-kvadrat test, Kruskal-Wallisov test, medijana, mod i sl.
+<nowiki> </nowiki>Druga podjela se odnosi na tehnike koje se koriste u statistici. Sukladno tome, imamo ''parametrijsku'' i ''neparametrijsku statistiku''.<ref>Petz, B. (2004). ''Osnovne statističke metode za nematematičare (peto izdanje).'' Jastrebarsko: Naklada Slap.</ref> U slučaju parametrijske statistike, izračuni se temelje na normalnoj (''zvonolikoj'', Gaussovoj) distribuciji, dok se u slučaju neparametrijske statistike provode testovi koji ne moraju podrazumijevati normalnost distribucije podataka kojima raspolažemo. Primjeri prve grupe tehnika su: složena analiza varijance, Pearsonov produkt-moment koeficijent korelacije, aritmetička sredina, standardna devijacija... Primjeri za drugu grupu tehnika su: Spearmanov koeficijent korelacije, hi-kvadrat test, Kruskal-Wallisov test, medijana, mod i sl.
+Statistika je neodvojiva od teorije vjerovatnoće, koja predstavlja skup matematičkih modela za opisivanje odnosa između ostvarenih događaja (ishoda) i mogućih događaja. Najvažniji koncept teorije vjerovatnoće koji ima široku primjenu u statistici je normalna raspodjela. Standardna normalna raspodjela ima aritmetičku sredinu M = 0 i standardnu devijaciju koja iznosi SD = 1. Udaljenost nekog rezultata (podatka) od aritmetičke sredine, u jedinicama standardne devijacije, predstavlja tzv. z-vrijednost. Ukoliko je z-vrijednost viša od nule, rezultat je pozicioniran iznad aritmetičke sredine. U suprotnom, kažemo da određeni rezultat pada ispod prosjeka.
-== Statistika kao primjenjena nauka ==
+== Statistika kao primijenjena nauka ==
 Neki primjeri korištenja statistike:
@@ Red 15: / Red 17: @@
 * vođenje statistike u proizvodnji procesora, utvrđivanje postotka ispravnih procesora (''yield'')
 * vođenje statistike u proizvodnji, prije i poslije svake kontrole
-* primjenjena statistika na području biomedicinskih znanosti (biostatistika)
+* primijenjena statistika na području biomedicinskih znanosti (biostatistika)
-* primjenjena statistika u području geoznanosti, odn. prostorna statistika ili [[geostatistika]]
+* primijenjena statistika u području geoznanosti, odn. prostorna statistika ili [[geostatistika]]
+* biomedicinska statistika (omjeri rizika omjeri šansi, ROC krive, mjere asocijacije)
 === Logičke greške pri upotrebi statistike ===