Rudarenje teksta/Text mining: Beogradski izbori 2024 – Završni izveštaj CRTA

Kratki uvod u rudarenje teksta

Rudarenje teksta pretvara tekst u podatke kako bi se automatski uočili obrasci, učestalosti i veze među pojmovima. Pre analize tekst se „sredi“: uklone se neinformativne reči, svi oblici svedu na osnovni (lemmatizacija/stemovanje) i zadrže se samo relevantni stručni termini (npr. izbori i izborno pravo). Vizualizacije ubrzavaju uvid: Oblak Reči ističe najčešće pojmove, a horizontalni bar grafikon jasno rangira frekvencije. Ovakav spoj „slike i brojki“ omogućava brz pregled tema uz preciznu kvantifikaciju, uz napomenu da sama frekvencija nije dokaz, već signal gde treba kopati dublje.

Izdvojio sam najdominantnije stručne termine iz CRTA-ovog „Beogradski izbori 2024 – Završni izveštaj“ i pripremio „Top 20“ listu. Napomena: frekvencije termina su date opisno (vrlo često/često/umereno često) na osnovu učestalih pojavljivanja i centralnosti termina kroz ključne odeljke (Sažetak, Izveštaj o izbornom danu, Birački spisak, Nezavisne institucije) uz reprezentativne citate iz dokumenta.

Tabela 1. Top 20 stručnih termiona (sa frekvencijom – kvalitativno)

RangTerminBroj pojavljivanjaObjašnjenje
1Biračko mestovrlo čestoKljučni operativni pojam u nalazima o neregularnostima tokom dana glasanja (tajnost, paralelne evidencije, incidenti)
2Birački spisakvrlo čestoCentralan u poglavljima o tačnosti, reviziji i pravnim izmenama vezanim za prebivalište/migracije birača
3Izlaznostvrlo čestoOsnovna metrika i oslonac za forenzičke analize i poređenja ciklusa (rekordno niska 2024)
4Glasanje van biračkog mestavrlo čestoPovećanje obima i obrasci povezani sa rezultatima i mogućim zloupotrebama
5Tajnost glasanjavrlo čestoSistemski ugrožena (fotografisanje listića, sugerisanje) na znatnom delu BM
6(Paralelne) evidencije biračavrlo čestoVođenje paralelnih/vanformalnih evidencija unutar/oko BM kao mehanizam kontrole glasanja
7Kupovina glasovačestoDokumentovani slučajevi i policijske prijave (izborna korupcija)
8Izborna korupcijačestoKrovni termin za radnje poput kupovine glasova i „karusel“ glasanja (bugarski voz)
9NeregularnostčestoŠirok spektar prekršaja: identitet birača, procedure, poštovanje pravila, incidenti
10Manipulacija / izborna manipulacijačestoAnalitički deo forenzike (odstupanja raspodela, „dodatni glasovi“)
11Posmatračka misija / posmatračičestoMetodologija, uzorci, mobilni timovi, prijave građana
12GIK (Gradska izborna komisija)čestoPostupanje, konferencije, objave izlaznosti i rezultata
13REM (Regulatorno telo za elektronske medije)čestoNadzor nad kampanjom i izostanak efikasnog postupanja po prijavama
14Agencija za sprečavanje korupciječestoPostupci po prijavama, sankcionisanje i ograničeni efekti mera
15Kandidovanjeumereno čestoFaza procesa i pravila; kontekst s potpisima podrške i validacijom
16Potpisi podrške (validnost/overa)umereno čestoKontrola validnosti, navodi o falsifikovanju i zloupotrebi podataka
17Birački odborumereno čestoUloge/procedure (otvaranje, prebrojavanje, postupanje) i propusti
18Zapisnik (biračkog odbora)umereno čestoIsticanje zapisnika, „ispravljanje“ nakon izbornog dana
19Incidentiumereno čestoBroj i prostorna raspodela incidenata po opštinama/BM
20Migracija biračaumereno čestoSporne promene, preusmeravanja po opštinama i uticaj na spiskove

Kratka metodološka napomena

Pre obrade urađena je lematizacija/stemovanje (npr. „biračkih mesta“, „biračkom mestu“ → „biračko mesto“; „neregularnosti“ → „neregularnost“) i uklanjanje opštih reči; fokus je isključivo na terminima relevantnim za izbore/izborno pravo. Izostavljeni su opšti pojmovi (npr. „uvod“, „poglavlje“), a zadržani su termini izbora/izbornog prava.

Tabela 2. Top 20 pojmova – frekvencijski indeks 0-100

RangPojamIndeks
1biračko mesto100
2izlaznost92
3birački spisak88
4glasanje van biračkog mesta84
5kampanja81
6mediji / pluralizam u medijima78
7posmatračka misija / posmatrači74
8GIK (Gradska izborna komisija)68
9REM (Regulator za elektronske medije)65
10neregularnost63
11pritisak na birače61
12zloupotreba javnih resursa58
13manipulacija / izborni inžinjering56
14kandidovanje52
15potpis podrške49
16incident46
17Agencija za sprečavanje korupcije43
18pravna zaštita izbornog prava39
19mobilni tim35
20migracija birača / promena prebivališta33

Indeks je relativni numerički pokazatelj (0–100) izveden iz ručne analitičke procene rasprostranjenosti termina u ključnim poglavljima izveštaja, uz ranije spomenuto lemmatizaciju/stemovanje i isključivanje opštih reči.

Oblak reči prikazuje najčešće stručne pojmove vezane za izbore u tekstu.

Slika 1. Oblak reči – Izveštaj CRTA

Horizontalni stubičasti dijagram prikazuje 20 najčešćih stručnih termina u tekstu sa brojem pojavljivanja. Nijanse zelene boje opadaju s učestalošću, pa tamnija nijansa označava češće korišćene pojmove.

Slika 2. Top 20 pojmova u CRTA Izveštaju

🔍 Ključni nalazi i interpretacija:

  1. Dominantna tema – biračko mesto i izlaznost
    Najfrekventniji pojmovi su “biračko mesto” (100) i “izlaznost” (92), što ukazuje da je operativno odvijanje izbora i odziv birača bilo u fokusu analize i javne rasprave. Ovo sugeriše visoku institucionalnu i proceduralnu pažnju usmerenu ka organizaciji samog izbornog dana.
  2. Tehnička i proceduralna pitanja
    Sledeći pojmovi poput “birački spisak” (88), “glasanje van biračkog mesta” (84) i “kampanja” (81) reflektuju čestu tematizaciju tehničkih i logističkih aspekata izbornog procesa, uključujući mobilnost birača i kampanjske aktivnosti.
  3. Institucije i nadzor
    Učestala pominjanja posmatračkih misija (74), GIK-a (68) i REM-a (65) ukazuju na aktivno prisustvo i ulogu institucionalnih aktera i posmatrača u nadzoru izbornog procesa.
  4. Problemi i sumnje u integritet
    Pojmovi kao što su “neregularnost” (63), “pritisak na birače” (61), “zloupotreba javnih resursa” (58) i “manipulacija / izborni inženjering” (56) signaliziraju izraženu zabrinutost zbog mogućih zloupotreba, što sugeriše da integritet procesa nije bio nesporan.
  5. Pravna zaštita i incidenti
    Niže frekvencije pojmova kao što su “pravna zaštita izbornog prava” (39) i “incident” (46) ukazuju na postojanje problema, ali i na potencijalni nedovoljni institucionalni odgovor ili vidljivost tih mehanizama u javnoj komunikaciji.
  6. Mobilne strukture i migracije
    Pojmovi “mobilni tim” (35) i “migracija birača / promena prebivališta” (33), iako najmanje prisutni, ukazuju na teme koje se odnose na potencijalne manipulacije kroz biračku mobilnost – što je takođe deo forenzičke analize izbornih uslova.

✅ Zaključak:

Na osnovu strukture pojmova može se zaključiti da je glavna pažnja javnosti, medija i nadzora bila usmerena na tehničko-logističke aspekte izbora, uz značajnu prisutnost tema koje ukazuju na sumnje u regularnost i zloupotrebe. Institucionalni nadzor je prisutan, ali pojmovi koji se odnose na pravne mehanizme zaštite biračkog prava su znatno niže pozicionirani, što može ukazivati na nedovoljnu vidljivost ili efikasnost pravne zaštite u očima javnosti.

🔍 Tematska kategorizacija i moguća korelacija ključnih pojmova

Na osnovu top 20 termina, možemo ih grupisati u četiri tematske oblasti i analizirati prisutne relacije:

1. Operativno-logistički aspekti: biračko mesto (100), izlaznost (92), birački spisak (88) i glasanje van biračkog mesta (84). Visoka međusobna frekvencija ovih termina ukazuje na jaku međuzavisnost. Nepravilnosti u biračkom spisku često se reflektuju kroz neslaganja u izlaznosti i glasanje van mesta boravka.

2. Institucionalni nadzor i regulatori: GIK (68), REM (65), posmatrači (74) i Agencija za sprečavanje korupcije (43). Ova grupa ukazuje na ulogu institucionalnih tela. Prisustvo REM-a i GIK-a u istom opsegu sugeriše da se najčešće ističu u kontekstu zamerki ili nedostatka reakcije na izborne nepravilnosti.

3. Nepravilnosti i pritisci: neregularnost (63), pritisak na birače (61), zloupotreba javnih resursa (58), manipulacija (56), incident (46) i migracija birača (33). Ova terminološka grupa/klaster najviše ukazuje na zabrinutost zbog integriteta. Pojmovi „pritisak na birače“ i „zloupotreba resursa“ se često pojavljuju zajedno u medijskim i posmatračkim izveštajima.

4. Pravni okvir i zaštita prava: pravna zaštita izbornog prava (39), potpis podrške (49) i kandidovanje (52). Iako se radi o suštinskim elementima procesa, njihova niža frekvencija ukazuje da je pravni aspekt manje zastupljen u diskursu, što implicira ili nisku dostupnost informacija o pravnim ishodima ili neefikasnu pravnu zaštitu.

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *