Forenzički alati: Izborni otisci prstiju u forenzici izbora – Vodič za posmatrače i analitičare

Reading Time: 4 minutes

1. Uvod

U serijalu „Forenzički alati – Vodič za posmatrače i analitičare“ do sada smo prolazili kroz korelacije, regresije, Benfordov zakon i kumulativne dijagrame. Zajednički imenitelj svih tih alata je isti: ne dokazuju prevaru, ali pomažu da se brzo lociraju biračka mesta (BM) ili delovi teritorije gde obrasci odstupaju od očekivanog i gde vredi pojačati proveru. U tom duhu, „izborni otisci prstiju“ (eng. election fingerprints) su jedna od najintuitivnijih vizuelnih tehnika: jednim pogledom omogućavaju da se sagleda odnos između izlaznosti i udela glasova pobednika po biračkim mestima.

U literaturi su otisci prstiju popularizovani kroz radove koji porede očekivane obrasce u različitim zemljama i ukazuju na tipične tragove sistematskih nepravilnosti, naročito kao „razmazanost“ ka gornjem desnom uglu (visoka izlaznost i visok rezultat pobednika).

2. Teorijska i intuitivna osnova

Šta je „izborni otisak prsta“? U najjednostavnijoj formi, to je 2D histogram (toplotna mapa) gde je:

  • x-osa: izlaznost po BM (turnout_pct, 0–100)
  • y-osa: procenat glasova pobednika u važećim glasovima (winner_pct, 0–100)
  • boja: koliko se biračkih mesta nalazi u toj „ćeliji“ (grupnom intervalu).

Zašto to liči na „otisak“? po (izlaznost, rezultat pobednika) često pravi prepoznatljiv „oblak“ ili „klaster“ čija forma, gustina i repovi mogu da budu informativni.

Kako izgleda očekivan obrazac? U slobodnim i poštenim izborima tipično vidimo:

  • jedan dominantan klaster oko umerenih vrednosti izlaznosti i umerenog/visokog rezultata pobednika (zavisi od političkog konteksta),
  • postepeno „hlađenje“ (manje BM) ka ekstremima,
  • bez izraženog „drugog vrha“ pri 100%/100%. Šta predstavlja sumnjiviji obrazac? Klasičan signal u radovima o otiscima prstiju je razmazanost (eng. smearing) ka gornjem desnom uglu: sve više BM se „nagomilava“ u kombinacijama visoka izlaznost + visok rezultat pobednika, nekad čak uz dodatni vrh blizu 100/100.

👉 Važno: ni „normalan“ otisak nije garancija in „razmazan“ otisak automatski znači prevaru. Otisak je signal za proveru, ne presuda.

3. Primena u forenzici izbora

Otisci prstiju se najčešće koriste u tri režima:

  1. Trijaža (eng. flagging)
    Kada imate rezultate po BM, otisak pomaže da se identifikuju oblasti grafa gde su BM retka ili „neobično grupisana“. To su kandidati za dublju proveru zapisnika, ponovljene unose, ekstremne vrednosti, itd.
  2. Poređenje regiona i izbora kroz vreme
    Upoređivanjem otisaka (npr. izbori 2016 vs 2020 vs 2023; ili region A vs region B) dobija se „vizuelni profil“ promena: da li se oblak pomera, da li raste rep ka ekstremima, da li se pojavljuju dodatni klasteri/grupe.
  • Hipoteze mehanizama (bez optuživanja)
    Otisci su naročito korisni kao okvir za postavljanje pitanja: Ako vidimo rep ka 100/100, da li je u pitanju dodavanje listića (eng. ballot stuffing), mobilizacija/pritisak, proceduralne nepravilnosti, ili legitimna heterogenost (npr. specifične zajednice, institucije, mala mesta)?

U slučaju slobodnih i poštenih izbora očekuje se da 2D histogrami, tj. izborni otisci prstiju za pobednika izbora imaju oblik koji je uočen u stabilnim demokratijama (Slika 1). Ova slika pokazuje dvodimenzionalne histograme broja biračkih mesta za datu izlaznost birača (x osa) i procenat glasova (y osa) za pobedničku stranku (ili kandidata) na nedavnim izborima u različitim zemaljama: Austrija, Kanada, Češka Republika, Finska , Francuska, Poljska, Rumunija, Rusija 2011, Rusija 2012, Španija, Švajcarska i Uganda. Boja predstavlja broj biračkih mesta sa odgovarajućim brojem glasova i izlaznosti. Biračka mesta se obično grupišu oko datog nivoa izlaznosti i procenta glasova. U Ugandi i Rusiji, ovi klasteri su razmazani u gornjem desnom delu grafika, dostižući drugi vrhunac pri 100% izlaznosti i 100% glasova (crveni krugovi). U Kanadi postoje grupe oko dve različite vrednosti glasa, koje odgovaraju Québécois i English Canada. U Finskoj, glavni klaster je podeljen u dva pravca (što ukazuje na mobilizaciju birača zbog kontroverzi oko True Finns).

Slika 1: Izborni otisci prstiju / Izvor: Klimek, Yegorov, Hanel & Thurner (2012)

Da otisak ne bi postao „mašina za sumnju“, treba eksplicitno držati u glavi sledeća ograničenja:

  • Ekološka zabluda (eng. ecological fallacy): radimo sa agregatima po BM. Visok rezultat pobednika i visoka izlaznost ne moraju biti „sumnjivi“ sami po sebi.
  • Legitimna heterogenost: demografija, geografija, etničke/regionalne preferencije, lokalne kampanje ili specifična biračka mesta (mala naselja, udaljena područja) mogu praviti klastere/grupe i repove.
  • Osetljivost na definicije i grupne intervale: važeći vs ukupni glasovi, širina grupnog intervala (1% ili 2%), izbor skale boje, sve to menja izgled.
  • Otisak je alat za trijažu, ne dokaz: najbolja praksa je kombinovanje sa drugim alatima: korelacije, kumulativni dijagrami, Benford/poslednja cifra i sa terenskim nalazima.

5. Praktična komponenta (Excel/R)

A) ✅ Excel (minimalistički)

Pretpostavimo da imate tabelu sa kolonama:

  • turnout_pct (0–100) – %izlaznost
  • winner_pct (0–100) – %glasova pobednika
  • opcionalno precinct_size (broj upisanih birača)

Korak 1: Napravite grupne intervale (sa centrima grupnih intervala i sa granicama grupnih intervala) za 0–100, npr. po 2%: 0, 2, 4, …, 100.

  • Imajte dve liste: jedna za grupne intervale izlaznosti (x) i jedna za grupne intervale pobednika (y).

Korak 2: Matrica učestalosti (COUNTIFS)
U ćeliji matrice (za konkretne grupne intervale po x i y) brojite BM koja upadaju u oba opsega. Primer logike:

  • turnout_pct ∈ [x, x+2) i winner_pct ∈ [y, y+2)

To se radi preko COUNTIFS sa dva uslova (po potrebi četiri, ako eksplicitno pišete donje i gornje granice).

Korak 3: Toplotna mapa
Označite matricu → Conditional Formatting → Color Scales.

  • „Toplije“ ćelije = više biračkih mesta sa tom kombinacijom (izlaznost, rezultat pobednika).

👉 Sugestija: krenite sa širinom grupnog intervala = 2% (stabilnije, manje šuma). Ako želite finiju sliku, pređite na 1%. Izbor širine grupnog intervala zavisi i od broja BM.

B) ✅ R (reproduktivan kod: tidyverse + ggplot2)

#Pretpostavimo df sa kolonama turnout_pct, winner_pct, opcionalno precinct_size.

# Paketi
library(dplyr)
library(ggplot2)

# 1) Osnovna provera i priprema
df2 <- df %>%
  filter(
    !is.na(turnout_pct), !is.na(winner_pct),
    turnout_pct >= 0, turnout_pct <= 100,
    winner_pct  >= 0, winner_pct  <= 100
  )

turnout_mean <- mean(df2$turnout_pct)
winner_mean  <- mean(df2$winner_pct)

# 2) Glavni "election fingerprint" kao 2D binovanje
p_fingerprint <- ggplot(df2, aes(x = turnout_pct, y = winner_pct)) +
  stat_bin2d(binwidth = c(2, 2)) +  # promeni na c(1,1) ako želiš finije binove
  geom_vline(xintercept = turnout_mean, linetype = "dashed", linewidth = 0.8) +
  geom_hline(yintercept = winner_mean,  linetype = "dashed", linewidth = 0.8) +
  labs(
    title = "Izborni otisak prsta: izlaznost vs rezultat pobednika (SNS)",
    x = "Izlaznost po biračkom mestu (%)",
    y = "Udeo glasova pobednika (SNS) u važećim glasovima (%)",
    fill = "Broj biračkih mesta\nu grupnom intervalu"
  ) +
  coord_cartesian(xlim = c(0, 100), ylim = c(0, 100)) +
  theme_minimal(base_size = 12)

print(p_fingerprint)

# 3) Opciono: interna (ne-grafička) provera po veličini BM
# Definicije:
# - BM < 100 upisanih: izdvojeno
# - nakon izbacivanja <100: "mala" = donjih 20%, "velika" = gornjih 20% po precinct_size

if ("precinct_size" %in% names(df2)) {
  df_ge100 <- df2 %>% filter(precinct_size >= 100)
  q20 <- quantile(df_ge100$precinct_size, 0.20, na.rm = TRUE)
  q80 <- quantile(df_ge100$precinct_size, 0.80, na.rm = TRUE)
  df_tag <- df2 %>%
    mutate(
      size_group = case_when(
        precinct_size < 100 ~ "<100 upisanih",
        precinct_size >= 100 & precinct_size <= q20 ~ "Mala BM (donjih 20%)",
        precinct_size >= q80 ~ "Velika BM (gornjih 20%)",
        TRUE ~ "Sredina (20–80%)"
      )
    )
  summary_tbl <- df_tag %>%
    group_by(size_group) %>%
    summarise(
      n_bm = n(),
      turnout_mean = mean(turnout_pct, na.rm = TRUE),
      winner_mean  = mean(winner_pct,  na.rm = TRUE
    ) %>%
    arrange(desc(n_bm))
  print(summary_tbl)
}

Ovaj kod pravi tačno ono što otisak jeste: gustinu biračkih mesta po grupnim intervalima u prostoru (izlaznost, rezultat pobednika), plus prosečne vrednosti kao isprekidane linije, a zatim (opciono) daje sažetak po definiciji veličine BM: <100, mala (donjih 20%), velika (gornjih 20%).

6. Analiza slučaja: Parlamentarni izbori 2023 (Srbija)

U ovoj studiji slučaja posmatramo biračka mesta (BM) i dva pokazatelja:

  • turnout_pct = izlaznost po BM (izašli/upisani)
  • winner_pct = udeo glasova pobedničke liste (SNS) u važećim glasovima po BM.

Kada se nacrta glavni otisak prsta za sva biračka mesta, očekivani „centralni klaster/grupa“ je prisutan: većina BM se grupiše oko dominantnih nivoa izlaznosti i rezultata pobednika, a raspodela na marginama deluje relativno „glatko“. U nacrtu se, međutim, beleži i blaga razmazanost ka gornjem desnom uglu (kombinacije više izlaznosti i višeg udela glasova pobednika), ali bez tvrdnje o uzroku: to je signal za proveru, ne zaključak.

Slika 2: Izborni otisci prstiju prema veličini biračkog mesta: (a) Sva birališta, (b) Manje od 100 birača
Napomena: Bele isprekidane linije označavaju prosečne vrednosti izlaznosti birača i glasova za pobednika.
Slika 3: Izborni otisci prstiju prema veličini biračkog mesta: (c) Mala birališta i (d) Velika birališta

Napomena: Bele isprekidane linije označavaju prosečne vrednosti izlaznosti birača i glasova za pobednika.

Metodološki je korektno da se uradi dodatna interna provera: da li su tragovi izraženiji kod malih biračkih mesta, gde je potencijalno lakše organizovati pritisak/mobilizaciju i gde je manja verovatnoća nezavisnog nadzora. Upravo zbog toga se često koriste definicije poput onih koje smo naveli:

  • posebna kategorija BM sa <100 upisanih (uz oprez zbog malog broja jedinica),
  • zatim, posle izbacivanja tih BM, „mala BM“ = donjih 20%, i „velika BM“ = gornjih 20% po broju upisanih.

Šta proveriti kada otisak „vuče“ ka gornjem desnom uglu?

  • zapisničke kontrole: upisani/izašli/važeći/nevažeći, da li se brojevi „zatvaraju“ bez nelogičnosti;
  • ekstremne vrednosti (npr. vrlo visoka izlaznost, vrlo visok procenat glasova pobednika) i da li su koncentrisane u istim opštinama ili tipovima BM;
  • ponavljajuće „okrugle“ procente (izlaznost ili rezultat pobednika) kao dodatni signal „ljudske preferencije“ ka celim brojevima;
  • kumulativni dijagrami, Benford/poslednja cifra, i naročito terenske informacije posmatrača.

OKVIR 1 — Brza interpretacija otiska prsta

Rep ka 100/100 može da znači: da postoje BM gde su i izlaznost i rezultat pobednika neuobičajeno visoki u odnosu na ostatak distribucije, što je kompatibilno sa određenim tipovima nepravilnosti (npr. dodavanje listića, pritisak/mobilizacija), ali i sa legitimnim lokalnim specifičnostima.

To ne znači automatski: „dokaz prevare“. Otisak ne identifikuje mehanizam; on samo kaže: „ovo vredi proveriti (kada izborni otisak prstiju vuče u gornji desni ugao).

  1. Uzmite listu BM sa ekstremnim (turnout_pct, winner_pct) i proverite zapisnike: da li su svi kontrolni brojevi konzistentni.
  2. Pogledajte nevažeće: da li su neuobičajeno niski/visoki u tim BM.
  3. Proverite da li su ekstremi prostorno grupisani (ista opština/mesna zajednica).
  4. Uradite internu proveru po veličini BM (posebno <100 i donjih/gornjih 20% po upisanima).
  5. Kombinujte sa drugim testovima (npr. „okrugli procenti“, Benford/poslednja cifra, kumulativni dijagrami).
  6. Uparite sa terenskim izveštajima: prisustvo posmatrača, incidenti, neuobičajene procedure, prigovori.

7. Zaključci i preporuke za posmatrače i analitičare

  1. Otisak prsta koristite kao ulazni filter: brzo pokaže gde su „čudne“ kombinacije izlaznosti i rezultata pobednika.
  2. Nikada ne izvodite zaključak o prevari samo iz otiska: tretirajte ga kao signal.
  3. Standardizujte definicije: (i) izlaznost = izašli/upisani, (ii) rezultat pobednika = udeo u važećim glasovima.
  4. Radite bar dve rezolucije grupnih intervala (2% i 1%) i proverite da li zaključci zavise od njihove veličine.
  5. Obavezno uradite internu proveru po veličini BM (posebno <100 upisanih i donjih 20%), čak i ako ne objavljujete dodatne grafike.
  6. Kombinujte sa „okruglim procentima“ (eng. integer percentages), Benford/poslednja cifra, korelacijama i kumulativnim dijagramima.
  7. Najvažnije: povezujte statističke tragove sa „tvrdom“ evidencijom (zapisnici, prigovori, terenski izveštaji).
  8. Za javnu komunikaciju koristite jezik: „indikator“, „zahteva proveru“, „kompatibilno sa…“, ne „dokazuje“.

8. Literatura

  • Jiménez, R., Hidalgo, M., & Klimek, P. (2017). Testing for voter rigging in small polling stations. Science Advances, 3(8), e1602363. DOI: https://doi.org/10.1126/sciadv.1602363.
  • Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic election irregularities. Proceedings of the National Academy of Sciences, 109(41), 16469–16473. DOI: https://doi.org/10.1073/pnas.1210722109.
  • Klimek, P., Aykaç, A., & Thurner, S. (2023). Forensic analysis of the Turkey 2023 presidential election reveals extreme vote swings in remote areas. PLOS ONE, 18(11), e0293239. DOI: https://doi.org/10.1371/journal.pone.0293239.
  • Kobak, D., Shpilkin, S., & Pshenichnikov, M. S. (2016). Statistical fingerprints of electoral fraud? Significance, 13(4), 20–23. DOI: https://doi.org/10.1111/j.1740-9713.2016.00936.x.
  • Kobak, D., Shpilkin, S., & Pshenichnikov, M. S. (2016). Integer percentages as electoral falsification fingerprints. The Annals of Applied Statistics, 10(1). DOI: https://doi.org/10.1214/16-AOAS904.

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *