3. Model konačne mešavine – Mebaneov pristup

Reading Time: 3 minutes

3.1. Ideja i mesto u „drugoj generaciji“ izborne forenzike

Rad Waltera R. Mebanea Jr „A finite mixture model for detecting election fraud“ (circulisan kao radni tekst oko 2010) uvodi operativnu, verovatnostnu specifikaciju kojom se istovremeno modeliraju regularni i različiti tipovi neregularnih izbornih procesa. Za razliku od heuristika (npr. histogrami izlaznosti, Benfordovi testovi), MKM pristup eksplicitno pretpostavlja da su posmatrani parovi \((t_i, v_i)\), izlaznost i udeo glasova za pobednika po biračkom mestu, nastali kao mešavina latentnih komponenti. Time se prelazi sa pitanja „da li ima anomalija?“ na „koliko i koje anomalije doprinose rezultatu?“ (Klimek, Yegorov, Hanel, & Thurner, 2012; Mebane i sar, 2022).

3.2 Latentne klase i interpretacija komponenti

U bazičnoj verziji Mebaneovog modela pretpostavljaju se tri komponente:

Regularne: biračka mesta na kojima \((t_i, v_i)\) slede „uobičajenu“ strukturu varijacije karakterističnu za slobodne i poštene izbore;
Priraštaj prevare (eng. Incremental fraud/ballot stuffing): povišena izlaznost praćena neproporcionalno visokim udelom glasova za pobednika;
Ekstremna prevara (eng. Extreme fraud): rezultati koncentrisani ka \(t_i \approx 1\) i \(v_i \approx 1\).

Na formalnom planu, \((t_i, v_i)\) potiču iz gustine mešavine

\(f(t_i,v_i | \Theta) = \sum_{k=1}^{K} \pi_k f_k (t_i,v_i | \theta_k), \quad \sum_{k=1}^{K} \pi_k=1, \pi_k \ge 0\),

pri čemu se \(\theta_k\) parametrizuju tako da svaka komponenta hvata specifične obrasce (npr. logit–Gauss komponente u transformisanom prostoru radi stabilnije ocene). Empirijski radovi koji su motivisali razliku između „incremental“ i „extreme“ obrasca, npr. karakteristični „šiljci“ na okruglim vrednostima izlaznosti i izuzetno visoki udeli za pobednika, posebno su zabeleženi na ruskim izborima (Klimek i sar, 2012).

3.3 Ocena, posteriorne verovatnoće i udeo prevare

Parametri \(\Theta=\{\pi_k,\theta_k\}\) ocenjuju se maksimizacijom funkcije verodostojnosti

\(L(\Theta) = \prod_{i=1}^{n} \sum_{k=1}^{K} \pi_k f_k (t_i, v_i | \theta_k)\),

standardno preko OM algoritma; O-korak računa posteriorne verovatnoće (odgovornosti) \(\gamma_{ik}\), a M-korak ažurira \(\pi_k,\theta_k\) ponderisano sa \(\gamma_{ik}\). Posteriorne verovatnoće služe za meko dodeljivanje biračkih mesta klasama i za agregiranje veličina po klasama (npr. očekivani broj glasova u „sumnjivim“ komponentama). Ključni pokazatelj je udeo prevare (eng. fraud share), udeo pobednikovih glasova koji potiče iz sumnjivih klasa \(S\subset\{1,\dots,K\}\):

\(\text{Udeo prevare} = \frac{\sum_{i=1}^{n} w_i \sum_{k \subset S}\gamma_{ik}}{\sum_{i=1}^{n} w_i}\)

gde je \(w_i\) broj glasova pobednika na mestu \(i\). Ovaj indikator ukazuje na „težinu“ anomalija i direktno je povezuje sa ishodom.

Napomena o oceni: u praksi su važna višestruka ponavljanja OM postupka ocenjivanja sa različitim početnim vrednostima, izbor broja komponenti prema BIC/ICL kriterijumima, kao i analize osetljivosti (McLachlan & Peel, 2000; Biernacki, Celeux, & Govaert, 2000).

3.4 Zašto je verovatnosni pristup utemeljen i forenzički koristan

Mebaneova inovacija nije samo u tome što identifikuje mesta sa anomalnim obrascima, već što kvantifikuje njihov doprinos ukupnom rezultatu pobednika. Time se razdvaja dijagnostika („gde su anomalije?“) od pitanja o stepenu uticaja („koliko one znače za ishod?“). Ujedno, probabilističko dodeljivanje (\(\gamma_{ik}\)) izbegava grube binarne etikete (bilo je prevara / nije bilo prevara) i olakšava komunikaciju nalaza u politički osetljivim okruženjima.

Dodatna vrednost MKM-a je modularnost: komponente se mogu proširiti (npr. uključiti komponentu nevažećih listića u slučaju da je broj nevažećih lističa značajan) ili ograničiti broj komponenti zavisno od konteksta i kvaliteta podataka; time se postiže ravnoteža između fleksibilnosti i principa jednostavnosti modela (McLachlan & Peel, 2000).

3.5 Ilustrativni primeri i empirijski tragovi

Empirijska literatura svedoči da obrasci koje MKM nastoji da razdvoji zaista postoje u stvarnim podacima. Eksperimentalna studija iz Moskve (slučajna dodela posmatrača na biračka mesta) pokazuje efekat nadzora na smanjenje nepravilnosti i služi kao spoljašnja validacija da su „šiljci“ i disproporcionalno visoki udeli za pobednika povezani sa manipulacijama (Enikolopov et al., 2013). S druge strane, Forensics Toolkit i priručnici pokazuju upotrebljivost modela i vizualizacija u nizu zemalja (uključujući Ugandu 2006), naglašavajući značaj mapiranja „vrućih tačaka“ i izveštavanja sa posteriornim verovatnoćama i ocenama udela prevare (Hicken & Mebane, 2017).

3.6 Ograničenja i napomene i interpretaciji

Mebaneov model ne tvrdi da „dokazuje“ prevaru, već da identifikuje obrasce kompatibilne sa određenim mehanizmima (ballot stuffing, extreme fraud). Interpretacija zavisi od: (i) kvaliteta i granulacije podataka, (ii) adekvatnosti specifikacije komponenti i (iii) dopunske triangulacije nalaza (posmatrački izveštaji, pravni postupci, revizija). Ipak, njegova komparativna prednost je upravo u kvantifikaciji uticaja, što je ključni korak iz heuristike u „drugu generaciju“ forenzike.

Post Views: 68

Forenzika izbora