Uvod u rudarenje teksta (text mining)
Rudarenje teksta je način da „pretvorimo tekst u podatke“ kako bismo iz gomile rečenica brzo videli obrasce, učestalosti i odnose među pojmovima. Umesto da čitamo ceo dokument svaki put od početka do kraja, kompjuterski alat prebrojava reči, uočava teme i ističe šta dominira u sadržaju. Pre toga, tekst se „sređuje“: uklanjaju se uobičajene, neinformativne reči (poput veznika), različiti oblici reči svode se na osnovni (lemmatizacija/stemovanje), a zatim se biraju samo stručni termini koji nas zanimaju, u ovom slučaju pojmovi iz forenzike izbora i izbornog prava.
Vizuelizacije pomažu da te uvide vidimo odmah: klasični Oblak Reči (eng. Word Cloud) naglašava najčešće pojmove veličinom fonta; a horizontalni bar grafikon pokazuje tačan poredak i razlike u učestalosti. Tako istovremeno dobijamo „sliku“ i „brojke“, brz pregled tema i preciznu kvantifikaciju. Važno je imati na umu da učestalost reči sama po sebi nije dokaz, ali jeste dobar trag gde da kopamo dublje i šta da proverimo detaljnijim analizama.
Na kraju je dato kratko objašnjenje pojmova koji se pojavljuju na ovim grafikonima. Tekst koji se analizira je latinična verzija knjige: Kovačić (2024). Forenzička analiza izbora u Srbiji – Predsednički, parlamentarni i lokalni izbori. https://bit.ly/m/Zlatko
Oblak reči prikazuje najčešće stručne pojmove vezane za forenziku izbora u tekstu. Reči su prethodno obrađene postupkom stemovanja i lematizacije, što znači da su svi oblici svedeni na osnovni (npr. ‘izbori’, ‘izbora’, ‘izbornog’ → ‘izbor’). U oblak su uključene samo relevantne reči iz oblasti prava i forenzike, dok su opšti termini poput ‘uvod’, ‘poglavlje’ i sl. izostavljeni.

Horizontalni stubičasti dijagram prikazuje 20 najčešćih stručnih termina u tekstu sa brojem pojavljivanja. Nijanse zelene boje opadaju s učestalošću, pa tamnija nijansa označava češće korišćene pojmove. Prikaz je zasnovan na stemovanim i filtriranim terminima vezanim za forenziku izbora, dok su opšti izrazi poput ‘uvod’ i ‘poglavlje’ uklonjeni.

Tabela 1. Legenda za top 20 stručnih termina
| Rang | Pojam | Značenje u kontekstu forenzike izbora |
|---|---|---|
| 1 | 🗳️ izbor | Osnovni demokratski proces odlučivanja kojim građani biraju predstavnike. Ključna jedinica analize u forenzici. |
| 2 | 📊 glas | Akt izražavanja volje birača. Forenzika prati pravilnost prebrojavanja i registrovanja glasova. |
| 3 | 👥 birač | Građanin sa pravom glasa; analize obuhvataju regularnost biračkih spiskova i zaštitu biračkog prava. |
| 4 | ⚖️ zakon | Pravni okvir koji reguliše sprovođenje izbora i omogućava (ili ograničava) forenzičke metode. |
| 5 | 🔍forenzika | Skup statističkih i analitičkih metoda za detekciju izbornih nepravilnosti. |
| 6 | 📢 kampanja | Predizborne aktivnosti stranaka i kandidata; obuhvata i ravnopravnost medijskog tretmana. |
| 7 | 📺 mediji | Ključni kanal informisanja birača; neravnopravan tretman stranaka se analizira kao indikator slobodnih izbora. |
| 8 | 🌐 transparentnost | Stepen u kojem su izborni postupci i rezultati proverljivi i dostupni javnosti. |
| 9 | 📝 revizija | Postizborni postupak provere rezultata (npr. kroz statističko uzorkovanje); u Srbiji zakonski nepostojeći mehanizam. |
| 10 | 🎭 manipulacija | Nelegalne ili nelegitimne radnje u procesu izbora, pre ili tokom glasanja, sa ciljem iskrivljavanja rezultata. |
| 11 | 🛡️ kontrola | Nadzor nad sprovođenjem izbora; obuhvata rad posmatrača, komisija i nezavisnih tela. |
| 12 | 🕊️ demokratija | Širi okvir u kojem izbori predstavljaju osnovni mehanizam legitimacije vlasti. |
| 13 | 📜 ustav | Najviši pravni akt; garantuje pravo glasa i principe slobodnih izbora. |
| 14 | 🏛️ institucija | Organi nadležni za sprovođenje izbora (npr. RIK, birački odbori); predmet poverenja i nadzora. |
| 15 | 🤝 poverenje | Ključan indikator percepcije javnosti o legitimnosti izbora; često narušeno manipulacijama. |
| 16 | ⚠️ neregularnost | Svaka nepravilnost koja može uticati na validnost izbornog procesa (npr. duplo glasanje, netačni spiskovi). |
| 17 | 📂 birački spisak | Evidencija birača; često predmet kontroverzi u Srbiji zbog navodnih „mrtvih duša“ i fiktivnih prijava. |
| 18 | 📈statistika | Naučna disciplina čije metode čine osnovu forenzike izbora (npr. Benfordov zakon, risk-limiting audits). |
| 19 | 🚪 nezavisnost | Svojstvo institucija i izbornih tela da deluju bez političkog pritiska. |
| 20 | 🧾odgovornost | Pravna i politička obaveza aktera da snose posledice za nepravilnosti i zloupotrebe u izbornom procesu. |
Na osnovu prikazanog grafikona koji prikazuje 20 najfrekventnijih stručnih termina iz knjige Kovačić (2024). Forenzička analiza izbora u Srbiji, može se sagledati jezički i tematski pejzaž forenzike izbora u domaćem kontekstu. Grafikon je zasnovan na terminološkoj obradi teorijskog uvoda i analize izbornih ciklusa, uključujući predsedničke, parlamentarne i lokalne izbore.
🔍 Ključni nalazi i interpretacija:
1. Opšti izborni koncepti – dominacija osnovnih pojmova
Pojmovi „izbor“ (482), „glas“ (367) i „birač“ (342) očekivano dominiraju frekvencijskom analizom. Ova učestalost ukazuje da autor dosledno usmerava pažnju na subjektivne i proceduralne osnove izbora – glasački čin, učesnike i proces. Ova tematska osovina formira „jezgro“ forenzike izborne u analiziranom korpusu.
2. Pravna i institucionalna osnova forenzike izbora
Visoke frekvencije termina „zakon“ (295), „ustav“ (141), „institucija“ (137) i „odgovornost“ (84) potvrđuju da se analiza oslanja na normativne okvire. Iz toga se zaključuje da je pristup izrazito pravno-tehnički, sa čestim osloncem na zakonodavne definicije nepravilnosti. U ovom okviru se razvija i termin „forenzika“ (244) kao centralni metodološki pojam.
3. Teme integriteta i revizije
Značajne frekvencije pojmova „transparentnost“ (201), „revizija“ (188), „kontrola“ (164) i „poverenje“ (122) upućuju na normativnu dimenziju izbornog poverenja. Pristup autora sugeriše da analiza nepravilnosti ima jasan cilj, obnovu institucionalne odgovornosti i transparentnosti procesa. Ovi termini često se javljaju u korelaciji sa „institucija“ i „demokratija“ (152), naglašavajući vrednosni okvir diskursa.
4. Analitički i statistički alati
U manjoj meri, ali i dalje značajno, zastupljeni su termini „statistika“ (98) i „neregularnost“ (115), što ukazuje na prisustvo kvantitativnih metoda u analizi, ali i na izraženu potrebu da se identifikuju odstupanja kroz objektivne pokazatelje. Ovaj sloj leži u osnovi koncepta forenzike izbora, koja teži merenju, a ne samo deskriptivnosti.
🔗 Poređenje sa grafikom iz objave CRTA, 2025
| Kategoriја | CRTA grafikon | Kovačić grafikon | Korelacijska veza |
|---|---|---|---|
| Tehničko-operativno | biračko mesto, izlaznost, spisak | glas, birač | Visoka — fokus na proces i aktere |
| Nepravilnosti | pritisak, manipulacija, zloupotreba | manipulacija, neregularnost, revizija | Direktna — tematski slični fokusi |
| Institucionalni nadzor | GIK, REM, posmatrači | institucija, zakon, odgovornost | Posredna — CRTA praktično, Kovačić teorijski |
| Pravni i normativni okvir | pravna zaštita | ustav, zakon, transparentnost | Jaka veza — pravna terminologija |
| Analitička dimenzija | – | statistika, kontrola, forenzika | Dodatak u Kovačićevom pristupu |
✅ Zaključak:
Knjiga Kovačić (2024) strukturira terminološki okvir forenzike izbora u Srbiji sa naglaskom na pravnu, normativnu i kvantitativnu osnovu analize. U poređenju sa CRTA analizom, Kovačićev pristup je više analitički i teorijski, dok je CRTA fokusirana na operativne i posmatračke aspekte izbora. Između dve analize postoji visok stepen tematske komplementarnosti, jedno je opis problema (CRTA), drugo je analitička struktura i normativni odgovor (Kovačić).