Rudarenje teksta/Text mining: Forenzička analiza izbora u Srbiji – Predsednički, parlamentarni i lokalni izbori

Uvod u rudarenje teksta (text mining)

Rudarenje teksta je način da „pretvorimo tekst u podatke“ kako bismo iz gomile rečenica brzo videli obrasce, učestalosti i odnose među pojmovima. Umesto da čitamo ceo dokument svaki put od početka do kraja, kompjuterski alat prebrojava reči, uočava teme i ističe šta dominira u sadržaju. Pre toga, tekst se „sređuje“: uklanjaju se uobičajene, neinformativne reči (poput veznika), različiti oblici reči svode se na osnovni (lemmatizacija/stemovanje), a zatim se biraju samo stručni termini koji nas zanimaju, u ovom slučaju pojmovi iz forenzike izbora i izbornog prava.

Vizuelizacije pomažu da te uvide vidimo odmah: klasični Oblak Reči (eng. Word Cloud) naglašava najčešće pojmove veličinom fonta; a horizontalni bar grafikon pokazuje tačan poredak i razlike u učestalosti. Tako istovremeno dobijamo „sliku“ i „brojke“, brz pregled tema i preciznu kvantifikaciju. Važno je imati na umu da učestalost reči sama po sebi nije dokaz, ali jeste dobar trag gde da kopamo dublje i šta da proverimo detaljnijim analizama.

Na kraju je dato kratko objašnjenje pojmova koji se pojavljuju na ovim grafikonima. Tekst koji se analizira je latinična verzija knjige: Kovačić (2024). Forenzička analiza izbora u Srbiji – Predsednički, parlamentarni i lokalni izbori. https://bit.ly/m/Zlatko

Oblak reči prikazuje najčešće stručne pojmove vezane za forenziku izbora u tekstu. Reči su prethodno obrađene postupkom stemovanja i lematizacije, što znači da su svi oblici svedeni na osnovni (npr. ‘izbori’, ‘izbora’, ‘izbornog’ → ‘izbor’). U oblak su uključene samo relevantne reči iz oblasti prava i forenzike, dok su opšti termini poput ‘uvod’, ‘poglavlje’ i sl. izostavljeni.

Slika 1. Word Cloud: Top 20 stručnih termina

Horizontalni stubičasti dijagram prikazuje 20 najčešćih stručnih termina u tekstu sa brojem pojavljivanja. Nijanse zelene boje opadaju s učestalošću, pa tamnija nijansa označava češće korišćene pojmove. Prikaz je zasnovan na stemovanim i filtriranim terminima vezanim za forenziku izbora, dok su opšti izrazi poput ‘uvod’ i ‘poglavlje’ uklonjeni.

Slika 2. Horizontalni stubičasti grafik top 20 termina

Tabela 1. Legenda za top 20 stručnih termina

RangPojamZnačenje u kontekstu forenzike izbora
1🗳️ izborOsnovni demokratski proces odlučivanja kojim građani biraju predstavnike. Ključna jedinica analize u forenzici.
2📊 glasAkt izražavanja volje birača. Forenzika prati pravilnost prebrojavanja i registrovanja glasova.
3👥 biračGrađanin sa pravom glasa; analize obuhvataju regularnost biračkih spiskova i zaštitu biračkog prava.
4⚖️ zakonPravni okvir koji reguliše sprovođenje izbora i omogućava (ili ograničava) forenzičke metode.
5🔍forenzikaSkup statističkih i analitičkih metoda za detekciju izbornih nepravilnosti.
6📢 kampanjaPredizborne aktivnosti stranaka i kandidata; obuhvata i ravnopravnost medijskog tretmana.
7📺 medijiKljučni kanal informisanja birača; neravnopravan tretman stranaka se analizira kao indikator slobodnih izbora.
8🌐 transparentnostStepen u kojem su izborni postupci i rezultati proverljivi i dostupni javnosti.
9📝 revizijaPostizborni postupak provere rezultata (npr. kroz statističko uzorkovanje); u Srbiji zakonski nepostojeći mehanizam.
10🎭 manipulacijaNelegalne ili nelegitimne radnje u procesu izbora, pre ili tokom glasanja, sa ciljem iskrivljavanja rezultata.
11🛡️ kontrolaNadzor nad sprovođenjem izbora; obuhvata rad posmatrača, komisija i nezavisnih tela.
12🕊️ demokratijaŠiri okvir u kojem izbori predstavljaju osnovni mehanizam legitimacije vlasti.
13📜 ustavNajviši pravni akt; garantuje pravo glasa i principe slobodnih izbora.
14🏛️ institucijaOrgani nadležni za sprovođenje izbora (npr. RIK, birački odbori); predmet poverenja i nadzora.
15🤝 poverenjeKljučan indikator percepcije javnosti o legitimnosti izbora; često narušeno manipulacijama.
16⚠️ neregularnostSvaka nepravilnost koja može uticati na validnost izbornog procesa (npr. duplo glasanje, netačni spiskovi).
17📂 birački spisakEvidencija birača; često predmet kontroverzi u Srbiji zbog navodnih „mrtvih duša“ i fiktivnih prijava.
18📈statistikaNaučna disciplina čije metode čine osnovu forenzike izbora (npr. Benfordov zakon, risk-limiting audits).
19🚪 nezavisnostSvojstvo institucija i izbornih tela da deluju bez političkog pritiska.
20🧾odgovornostPravna i politička obaveza aktera da snose posledice za nepravilnosti i zloupotrebe u izbornom procesu.

Na osnovu prikazanog grafikona koji prikazuje 20 najfrekventnijih stručnih termina iz knjige Kovačić (2024). Forenzička analiza izbora u Srbiji, može se sagledati jezički i tematski pejzaž forenzike izbora u domaćem kontekstu. Grafikon je zasnovan na terminološkoj obradi teorijskog uvoda i analize izbornih ciklusa, uključujući predsedničke, parlamentarne i lokalne izbore.


🔍 Ključni nalazi i interpretacija:

1. Opšti izborni koncepti – dominacija osnovnih pojmova

Pojmovi „izbor“ (482), „glas“ (367) i „birač“ (342) očekivano dominiraju frekvencijskom analizom. Ova učestalost ukazuje da autor dosledno usmerava pažnju na subjektivne i proceduralne osnove izbora – glasački čin, učesnike i proces. Ova tematska osovina formira „jezgro“ forenzike izborne u analiziranom korpusu.

2. Pravna i institucionalna osnova forenzike izbora

Visoke frekvencije termina „zakon“ (295), „ustav“ (141), „institucija“ (137) i „odgovornost“ (84) potvrđuju da se analiza oslanja na normativne okvire. Iz toga se zaključuje da je pristup izrazito pravno-tehnički, sa čestim osloncem na zakonodavne definicije nepravilnosti. U ovom okviru se razvija i termin „forenzika“ (244) kao centralni metodološki pojam.

3. Teme integriteta i revizije

Značajne frekvencije pojmova „transparentnost“ (201), „revizija“ (188), „kontrola“ (164) i „poverenje“ (122) upućuju na normativnu dimenziju izbornog poverenja. Pristup autora sugeriše da analiza nepravilnosti ima jasan cilj, obnovu institucionalne odgovornosti i transparentnosti procesa. Ovi termini često se javljaju u korelaciji sa „institucija“ i „demokratija“ (152), naglašavajući vrednosni okvir diskursa.

4. Analitički i statistički alati

U manjoj meri, ali i dalje značajno, zastupljeni su termini „statistika“ (98) i „neregularnost“ (115), što ukazuje na prisustvo kvantitativnih metoda u analizi, ali i na izraženu potrebu da se identifikuju odstupanja kroz objektivne pokazatelje. Ovaj sloj leži u osnovi koncepta forenzike izbora, koja teži merenju, a ne samo deskriptivnosti.

🔗 Poređenje sa grafikom iz objave CRTA, 2025

KategoriјаCRTA grafikonKovačić grafikonKorelacijska veza
Tehničko-operativnobiračko mesto, izlaznost, spisakglas, biračVisoka — fokus na proces i aktere
Nepravilnostipritisak, manipulacija, zloupotrebamanipulacija, neregularnost, revizijaDirektna — tematski slični fokusi
Institucionalni nadzorGIK, REM, posmatračiinstitucija, zakon, odgovornostPosredna — CRTA praktično, Kovačić teorijski
Pravni i normativni okvirpravna zaštitaustav, zakon, transparentnostJaka veza — pravna terminologija
Analitička dimenzijastatistika, kontrola, forenzikaDodatak u Kovačićevom pristupu

✅ Zaključak:

Knjiga Kovačić (2024) strukturira terminološki okvir forenzike izbora u Srbiji sa naglaskom na pravnu, normativnu i kvantitativnu osnovu analize. U poređenju sa CRTA analizom, Kovačićev pristup je više analitički i teorijski, dok je CRTA fokusirana na operativne i posmatračke aspekte izbora. Između dve analize postoji visok stepen tematske komplementarnosti, jedno je opis problema (CRTA), drugo je analitička struktura i normativni odgovor (Kovačić).

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *