Tok podataka
U komunikaciji zasnovanoj na uspostavljanju veze, tok podataka predstavlja prenos sekvence digitalno kodiranih signala radi prenosa informacija.[1] Obično se preneseni simboli grupišu u niz paketa.[2]
Prenos podataka u toku (data streaming) postao je sveprisutan. Sve što se prenosi putem interneta prenosi se kao tok podataka. Korištenje mobilnog telefona za razgovor prenosi zvuk u obliku toka podataka.
Formalna definicija
[uredi | uredi izvor]Na formalan način, tok podataka (data stream) je bilo koji uređeni par gdje:
Sadržaj
[uredi | uredi izvor]Tok podataka sadrži različite skupove podataka, koji zavise od odabranog formata.
- Svaki atribut[3] podataka stream-a predstavlja određeni tip podataka, npr. ID segmenta/podatka, vremenski pečat, geodate.
- Atribut vremenskog pečata pomaže u identifikaciji kada se dogodio neki događaj.
- ID subjekta je ID kodiran algoritmom, koji je izvučen iz kolačića.
- Sirovi podaci uključuju informacije direktno od provajdera podataka, bez obrade od strane algoritma ili čovjeka.
- Obrađeni podaci su podaci koji su pripremljeni[4](neka modifikovana, validirana ili očišćena) da bi se koristili za buduće akcije.
Upotreba
[uredi | uredi izvor]Postoje različite oblasti u kojima se koriste data stream-ovi:
Otkrivanje prevara i ocjenjivanje – sirovi podaci se koriste kao izvor podataka za algoritam protiv prevara (tehnike analize podataka za otkrivanje prevara). Naprimjer, vremenske oznake, učestalost kolačića ili analiza podataka koriste se unutar sistema ocjenjivanja za otkrivanje prevara ili kako bi se osiguralo da primalac poruke nije bot (tzv. Non-Human Traffic[5]).
Umjetnička inteligencija – sirovi podaci se tretiraju kao trening i testni set tokom izgradnje algoritama za AI i mašinsko učenje.
Sirovi podaci se koriste za profiliranje i personalizaciju kako bi se prilagodili korisnički profili[6] i podijelili ih za segmentaciju, npr. prema spolu ili lokaciji (na osnovu podataka).
Poslovna inteligencija – sirovi podaci su izvor informacija za BI sisteme, koriste se za obogaćivanje korisničkih profila detaljnim informacijama o njima, npr. putem puta kupovine ili geodataka. Ove informacije se koriste za poslovnu analizu i prediktivna istraživanja.
Ciljanje – naučnici koji obrađuju podatke poboljšavaju online kampanje i koriste se za dosezanje ciljne publike.[7]
CRM obogaćivanje – sirovi podaci se integriraju sa sistemom za upravljanje odnosima s korisnicima. CRM integracija omogućava popunjavanje praznina u korisničkim profilima demografskim podacima, interesovanjima ili namjerama za kupovinu.
Integracija
[uredi | uredi izvor]Osnovne integracije sa podacima u toku su:
Podaci u toku integriraju se sa sistemima kao što su platforme za upravljanje podacima o korisnicima (CDP), sistemi za upravljanje odnosima sa korisnicima (CRM) ili platforme za upravljanje podacima (DMP) kako bi se obogatili korisnički profili spoljnim podacima.[8] Moguće je proširiti znanje o postojećim korisnicima korišćenjem spoljnih izvora. Podaci u toku se koriste za obogaćivanje sistema za poslovnu inteligenciju i činjenje analiza preciznijim, a zaključaka tačnijim. U slučaju integracije sa sistemima za upravljanje sadržajem (CMS), podaci u toku se koriste za identifikovanje korisnika i personalizaciju njihove posjete, čak i ako je to njihov prvi put. Analizom podataka, stvarni sadržaj veb-sajta se prilagođava korisniku. Podaci u toku se integrišu sa platformama za kupovinu oglasnog prostora sa strane potražnje (DSP) unutar ekosistema programatskog oglašavanja. Strane (npr. oglašivači) mogu razmjenjivati korisničke identifikatore i povezivati ih sa postojećim profilima. Podaci u toku se koriste za odabir odgovarajućih segmenata korisnika (npr. ljudi zainteresovani za automobilsku industriju) i upotrebljavaju ih u online kampanjama. Segmenti se obogaćuju sa više karakteristika korisnika iz podataka u toku i zatim šalju DSP-u.
Vidljivi izvori podataka
[uredi | uredi izvor]U toku podataka vidljivo je koji je uređaj korišćen sa strane korisnika – to je vidljivo u korisničkoj agenti (user agent).
- mobilni – kada korisnik koristi mobilni pregledač za istraživanje, ima usku rezoluciju ekrana i verziju mobilne aplikacije;
- desktop – kada korisnik koristi desktop pregledač ili verziju aplikacije.
Sljedeće informacije se dijele iz korištenog uređaja:
- Stvarni URL na posjećenu web stranicu na kojoj se dogodio događaj
- Korisnički agent
- Geolokacija
- Internet protokol (IP)
Formati
[uredi | uredi izvor]Podatak o tački (data point) je oznaka koja prikuplja informacije o određenoj radnji koju korisnik izvrši na web stranici. Podaci o tačkama postoje u dva tipa, čije se vrijednosti koriste za kreiranje odgovarajućih publika. To su:
- 'event' s informacijama o pojavama specifičnog događaja (npr. klik na link ili prikazivanje oglasa)
- 'atribut' s numeričkim ili alfanumeričkim vrijednostima.
Segment je logička izjava, koja se gradi na specifičnim podacima pomoću AND, OR ili NOT operatora.[9]
Hibridni podaci – sirovi podaci iz oba formata Data Point i Segment podataka.[10]
URL-ovi – skup informacija o određenom URL-u koji je posjećen.
GDPR
[uredi | uredi izvor]Informacije prikupljene sa web stranica temelje se na ponašanju korisnika. Pružatelji podataka isporučuju i osobne i neosobne informacije. Postoje dvije vrste korisničkih podataka dostupnih u podatkovnom toku:
- Osobno prepoznatljive informacije (PII) – informacije koje omogućuju jasno ili kombiniranjem s metodama identifikacije podataka identifikaciju osobe. Primjeri PII su: ID osiguranja, email adresa, broj telefona, IP adresa, geolokacija, biometrijski podaci.[11]
- Neosobno prepoznatljive informacije (ne-PII) su informacije koje se ne mogu koristiti za identifikaciju osobe ili praćenje lokacije. Kolačić ili ID uređaja su primjer ne-PII.
Također pogledati
[uredi | uredi izvor]- Streaming algoritam
Reference
[uredi | uredi izvor]- ^ "Federal Standard 1037C data stream". Arhivirano s originala, 13. 4. 2007. Pristupljeno 4. 4. 2007.
- ^ "Data Stream". techopedia.com. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "Attribute". businessdictionary.com. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "What constitutes data processing?". ec.europa.eu. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "Non-Human Traffic [NHT]". theonlineadvertisingguide.com. 7. 6. 2017. Arhivirano s originala, 13. 8. 2017. Pristupljeno 24. 4. 2019.
- ^ "BEHAVIORAL PROFILING AND PERSONALIZATION: CUSTOMER EXPERIENCE FIRST". selligent.com. 26. 7. 2012. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "What is Targeting – Meaning". selligent.com. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "What is Data Stream and how to use it". OnAudience.com. 17. 4. 2019. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "The 6 types of user segmentation and what they mean for your product". uxdesign.cc. 12. 6. 2018.
- ^ "What is hybrid data management". ibm.com. 2. 1. 2018. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.
- ^ "What is personally identifiable information (PII)? How to protect it under GDPR". csoonline.com. Arhivirano s originala, 24. 4. 2019. Pristupljeno 24. 4. 2019.