Forenzika izbora u realnom vremenu: Analiza izlaznosti po vremenskim serijama

Reading Time: 2 minutes

Otkrivanje neuobičajenih obrazaca tokom dana glasanja

Uvod

U kontekstu forenzike izbora u realnom vremenu, jedan od ključnih signala potencijalnih manipulacija jeste tok izlaznosti tokom dana. Izbori su vremenski ograničen događaj, najčešće traju 12 do 14 sati, a broj birača koji izlaze na glasanje u svakoj fazi dana obično prati relativno predvidiv obrazac.

Na primer, najveća izlaznost u jutarnjim časovima obično potiče od starijih građana, zaposleni glasaju posle posla, dok se pred kraj dana očekuje usporavanje ritma. Svako značajno odstupanje od ovakvog obrasca, naročito u vidu naglog skoka izlaznosti u poslednjim satima, može biti indikator vanredne mobilizacije, prisilnog izlaženja, ili masovnog ubacivanja listića pred zatvaranje birališta.

Zato je analiza izlaznosti po satima, u formi vremenske serije, jedan od najmoćnijih alata za detekciju sumnjivih obrazaca u realnom vremenu.

Intuitivno objašnjenje

Zamislite da posmatrate grafik koji prikazuje broj birača koji su izašli na glasanje svakog sata od 7h do 20h. Uobičajeno, očekujete postepeni rast tokom dana i blago usporavanje pred kraj. Međutim, na grafiku primećujete da se u poslednja dva sata izlaznost udvostručila, više nego u prethodna četiri sata zajedno.

Ovakav obrazac se teško može objasniti ponašanjem birača, daleko je verovatnije da je reč o organizovanoj mobilizaciji (npr. iz javnih ustanova), ili čak o izbornoj prevari, kao što je ubacivanje fiktivnih listića pred zatvaranje biračkog mesta.

Vremenske serije pomažu da se takvi trenuci odmah uoče, kvantifikuju i ciljano isprate.

Teorijska osnova

Analiza vremenskih serija u ovom kontekstu oslanja se na osnovne metode detekcije:

  1. Kumulativna izlaznost po satu — kako raste ukupni broj izašlih tokom dana.
  2. Diferencijalna izlaznost — koliko birača je izašlo u svakom satu (prvi izvod, tj. prva diferenca vremenske serije).
  3. Z-poeni — poređenje svake satne promene sa celokupnim rasporedom.
  4. Kontrolni pragovi — statističke granice koje označavaju neuobičajene skokove.

Kumulativna izlaznost: \(E_t = \sum_{i=1}^{t} x_i\)

gde je \(x_i\)​ broj birača u satu \(i\), a \(E_t\) ukupna izlaznost do vremena \(t\).

Z-poeni: \(Z_i = \frac{x_i – \mu}{\sigma}​\)

gde su:

  • \(x_i\) – broj birača u satu \(i\),
  • \(\mu\) – srednja vrednost po satu,
  • \(\sigma\) – standardna devijacija.

Ako je \(Z > 2\) ili \(Z < -2\), taj sat se smatra sumnjivim.
Ako je \(Z > 3\), verovatnoća da se tako nešto desi slučajno je manja od 0.3%.

Slika 1 ilustruje vremensku seriju kumulativne izlaznosti na osnovu simuliranih podataka.

Slika 1. Vremenska serija kumulativne izlaznosti po satima

Tipovi manipulacije koje detektuje

Ova metoda je naročito efikasna za otkrivanje:

  • Naglog ubacivanja fiktivnih glasova pred zatvaranje birališta
  • Veštačkog “pumpanja” izlaznosti u režimskim uporištima
  • Kasnog sistematskog dovođenja glasača, naročito pod prinudom
  • Nepodudarnosti između posmatranih i izveštavanih brojki

Takođe, ako se izlaznost po satima značajno razlikuje između različitih regiona, moguće je identifikovati asimetričnu izbornu praksu.

Primena u Excel-u i R-u

📊 U Excel-u:

  1. Zabeležiti broj birača po satu u tabeli.
  2. Napraviti kumulativnu kolonu koristeći =SUM($B$2:B2).
  3. Izračunati prosečnu promenu po satu.
  4. Izračunati standardnu devijaciju.
  5. Izračunati Z-poene: =(B2 – srednja_vrednost) / standardna_devijacija
  6. Obeležiti sate gde je |Z| > 2.

📈 U R-u:

# Simulacija izlaznosti po satu

vreme <- 7:20
izlaznost <- cumsum(c(2, 3, 2.5, 2.5, 3, 3, 4, 3.5, 2, 8, 1, 1, 1, 0.5))  # anomalija u 16h
df <- data.frame(sat = vreme, izlaznost = izlaznost)
df$razlika <- c(df$izlaznost[1], diff(df$izlaznost))
df$z <- scale(df$razlika)
df

Dobija se sledeći rezultat.

df
   sat izlaznost razlika           z
1    7       2.0     2.0 -0.34470558
2    8       5.0     3.0  0.19150310
3    9       7.5     2.5 -0.07660124
4   10      10.0     2.5 -0.07660124
5   11      13.0     3.0  0.19150310
6   12      16.0     3.0  0.19150310
7   13      20.0     4.0  0.72771178
8   14      23.5     3.5  0.45960744
9   15      25.5     2.0 -0.34470558
10  16      33.5     8.0  2.87254649
11  17      34.5     1.0 -0.88091426
12  18      35.5     1.0 -0.88091426
13  19      36.5     1.0 -0.88091426
14  20      37.0     0.5 -1.14901860

Očigledno je z-poen u 16 časova veći od 2, čime se ovaj sat, tj. izlaznost u ovom satu, prema ovoj metodi smatra sumnjivim.

Korišćenjem R paketa ggplot2 moguće je u realnom vremenu pratiti neprirodne skokove i upozoriti posmatrače.

Realni primeri i reference

Ova metoda je korišćena u brojnim analizama post-sovjetskih izbora, uključujući:

  • Rusija (Duma 2011, predsednički izbori 2012): gde je u mnogim regionima izlaznost eksplodirala u poslednjim satima dana, što je ukazivalo na moguće ubacivanje glasova pred zatvaranje.

Referenca:
Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic election irregularities. PNAS, 109(41), 16469–16473. DOI: https://doi.org/10.1073/pnas.1210722109

  • Iran (2009): neusklađenosti između izlaznosti u realnom vremenu i konačnih rezultata pokazale su da su u nekim regionima izborni rezultati dodeljeni, a ne izbrojani.

Referenca:
Mebane, W. R. (2010). Fraud in the 2009 presidential election in Iran? Chance, 23(1), 6–15. DOI: https://doi.org/10.1007/s00144-010-0003-4

Zaključak

Analiza izlaznosti po vremenskim serijama predstavlja jedan od najdostupnijih alata za praćenje regularnosti izbora u realnom vremenu. Njena snaga leži u jednostavnosti primene i jasnoći interpretacije: ako izlaznost naglo „eksplodira“ u neuobičajenom terminu, potrebna je momentalna reakcija. U kombinaciji sa drugim metodama, ovaj alat formira osnovu svakog profesionalnog sistema za monitoring izbora.

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *