Brza statistička detekcija neuobičajenih skokova u izlaznosti tokom dana
Uvod
Praćenje izlaznosti po satu tokom dana izbora može se iskoristiti ne samo za informisanje javnosti, već i kao indikator izborne nepravilnosti u realnom vremenu. Metoda z-poena omogućava kvantifikaciju toga da li je izlaznost u nekom satu neobično visoka u poređenju sa očekivanim obrascem, a sve to uz minimalnu količinu podataka.
Primena ove metode je izuzetno efikasna u danu izbora, jer omogućava da se već nakon nekoliko časova prikupljenih podataka počnu detektovati sumnjivi vremenski intervali, najčešće kasno popodne i pred zatvaranje birališta, kada dolazi do tzv. “poslednjeg talasa” manipulacija.
Intuitivno objašnjenje
Zamislimo da ste posmatrač i da svakog sata dobijate podatke o procentu birača koji su do tada izašli. Na osnovu prethodnih izbora znate da se, u proseku, između 17h i 18h pojavljuje oko 5% birača. Ako sada u istom satu primećujete skok od 15%, jasno je da taj sat odstupa od očekivanog ponašanja.
U statistici z-poen meri koliko je neka vrednost udaljena od proseka, u jedinicama standardne devijacije. Ako je taj rezultat udaljen više od 2 standardne devijacije, on je statistički neuobičajen.
Teorijska osnova
1. Diferencijalna izlaznost po satu
Ako znamo ukupnu kumulativnu izlaznost po satima: \(E = \{e_1, e_2, \ldots, e_T\}\), onda je diferencijalna izlaznost (izlaznost u satu \(t\)): \(d_t = e_t – e_{t-1}\)
2. Z-poeni (standardizovane vrednosti):
\(Z_t = \frac{d_t – \mu_d}{\sigma_d}\)gde su:
- \(d_t\) – izlaznost u satu \(t\),
- \(\mu_d\) – prosečna satna izlaznost,
- \(\sigma_d\) – standardna devijacija satne izlaznosti.
3. Tumačenje:
- \(|Z_t| < 2\) → u granicama normalnog,
- \(|Z_t| > 2\) → moguća anomalija,
- \(|Z_t| > 3\) → verovatna manipulacija (p < 0.003).
Može se dodati i Shewhart-ov pristup: crtanje kontrolnih linija na \(2 \sigma\) i \(3 \sigma\) udaljenosti.
Tipovi manipulacija koje detektuje
Metoda je korisna za otkrivanje:
- Veštačkog povećanja izlaznosti u završnim satima
- Ubacivanja unapred pripremljenih listića (ballot stuffing)
- Masovne mobilizacije iz javnih institucija na kraju dana
- Nepouzdane automatizacije izveštavanja o izlaznosti
Z-poeni pokazuju kada se anomalija dogodila, ali u kombinaciji sa prostornim analizama može pokazati i gde.
Primena u Excel-u i R-u
📊 U Excel-u:
- Napravite kolonu sa kumulativnom izlaznošću po satu.
- Izračunajte razlike između redova da dobijete satnu izlaznost.
- Izračunajte srednju vrednost i standardnu devijaciju.
- Koristite formulu =(x – sredina) / standardna_devijacija za svaki sat.
- Označite ćelije gde je \(|Z| > 2\) kao sumnjive.
📈 U R-u:
Kod iz prethodnog segmenta (grafik generisan ranije):
vreme <- 7:20
izlaznost <- cumsum(c(2, 3, 2.5, 2.5, 3, 3, 4, 3.5, 2, 8, 1, 1, 1, 0.5)) # anomalija u 16h
df <- data.frame(sat = vreme, izlaznost = izlaznost)
df$razlika <- c(df$izlaznost[1], diff(df$izlaznost))
df$z <- scale(df$razlika)
ggplot(df, aes(x = sat, y = razlika)) +
geom_col(fill = "steelblue") +
geom_hline(yintercept = mean(df$razlika) + 2 * sd(df$razlika), linetype = "dashed", color = "red") +
geom_hline(yintercept = mean(df$razlika) - 2 * sd(df$razlika), linetype = "dashed", color = "red") +
labs(
title = "Z-poeni po satima: promene izlaznosti",
x = "Sat u danu",
y = "Promena u izlaznosti (%)"
) +
theme_minimal()
Zatim se koristi ggplot2 za prikaz, sa dodatim linijama \(\pm 2 \sigma\).
Slika 1. na simuliranim podacima ilustruje identifikaciju moguće manipulacije.

Realne primene i reference
🟩 Rusija (2011, 2012):
U velikom broju ruskih regiona izlaznost je bila relativno stabilna tokom dana, ali je u poslednjem satu primećen nagao skok koji je u nekim mestima iznosio 10–15% ukupne izlaznosti.
Klimek et al. (2012) pokazali su da je ovaj fenomen statistički nemoguć pod normalnim uslovima, što je ukazivalo na ubacivanje listića.
Referenca:
Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic election irregularities. PNAS, 109(41), 16469–16473. DOI: https://doi.org/10.1073/pnas.1210722109
Zaključak
Z-poeni i analiza izlaznosti po satima predstavljaju jedan od najbržih i najpraktičnijih načina za otkrivanje sumnjivih obrazaca u toku dana izbora. Mogu se lako primeniti u realnom vremenu i zahtevaju samo osnovne podatke o izlaznosti. Njihova primena je naročito efikasna kada se kombinuju sa drugim indikatorima, poput prostorne analize grupisanja i analize nevažećih listića.