Stranka Bakalarskej Prace
Info
Meno: Michal Přibil
Názov práce: Bublina na sociálnej sieti Reddit
Meno školitela: Damas Gruska
Kontakt: pribil2@uniba.sk
Zadanie
Anotácia
Práca sa zaoberá štruktúrami bublín na sociálnej sieti Reddit a skúma prepojenie sentimentu a správania používateľov.
Cieľ
Vytvoriť metodiku a nástroje na analýzu sociálnych bublín v sieti Reddit.
Link na prácu na platforme Overleaf:
[odkaz]
Abstrakt
Táto bakalárska práca sa zaoberá analýzou informačných bublín a sentimentu v online
diskusiách na platforme Reddit, konkrétne v rámci slovenského subredditu r/Slovakia.
Cieľom práce je preskúmať, do akej miery sa v tomto prostredí vytvárajú komunity
používateľov a akým spôsobom sa mení sentiment ich príspevkov.
Na analýzu bola vytvorená interakčná sieť používateľov založená na odpovediach
v komentároch.
Pomocou grafových algoritmov Louvain, Leiden a Girvan–Newman
bola identifikovaná komunitná štruktúra a analyzovaná miera súdržnosti jednotlivých
skupín. Súčasťou analýzy je aj vizualizácia väzieb medzi najaktívnejšími používateľmi
a subredditmi.
Druhá časť práce sa venuje analýze sentimentu pomocou jazykového modelu Slo-
vakBERT trénovaného na slovenských textoch.
Zistenia poukazujú na klesajúci trend
sentimentu u používateľov s rastúcou aktivitou, ako aj na negatívny posun v nálade
komunity počas konkrétneho spoločenského diania – atentátu na premiéra SR.
Pou-
žitie všeobecného modelu DeepSeek sa ukázalo ako nevhodné kvôli vysokej variabilite
odpovedí.
Práca kombinuje metódy spracovania prirodzeného jazyka a analýzy sietí s cieľom
lepšie porozumieť dynamike online interakcií a vzniku informačných bublín na sociál-
nych sieťach.
Zoznam zdrojov
Zdroj dát
Subreddit r/Slovakia
SlovakBERT model
Zvyšok zdrojov je uvedený v práci. [odkaz]
Obrazky
Záver práce:
Táto práca sa zameriavala na analýzu sociálnej siete Reddit so zameraním na identifikáciu informačných bublín a vývoj sentimentu v rámci komunity používateľov. Získané dáta z príspevkov a komentárov boli predspracované a analyzované pomocou grafových a jazykových nástrojov.
V prvej časti bola vytvorená interakčná sieť medzi používateľmi subredditu \textit{r/Slovakia} a aplikované algoritmy Louvain, Leiden a Girvan-Newman na detekciu komunitnej štruktúry. Z analýzy vyplynulo, že používateľská sieť má nízku úroveň lokálneho prepojenia (clustering coefficient) a iba slabo definovanú komunitnú modularitu, čo je typické pre diskusné fóra s voľnou štruktúrou a vysokou fluktuáciou používateľov. Hoci algoritmy odhalili isté komunity, ich vnútorná súdržnosť bola minimálna. Z toho vyplýva, že používatelia na Reddite väčšinou interagujú jednorázovo v rámci konkrétnych tém a iba zriedkavo nadväzujú dlhodobejšie väzby s ostatnými používateľmi. To naznačuje, že klasické informačné bubliny sa na Reddite nevytvárajú spôsobom, aký by sme očakávali na centralizovanejších platformách.
V druhej časti bola vykonaná analýza sentimentu príspevkov pomocou špecializovaného jazykového modelu SlovakBERT. Táto analýza odhalila mierne klesajúci trend sentimentu u používateľov s rastúcou aktivitou. Je možné predpokladať, že čím viac je používateľ aktívny, tým viac sa dostáva do konfrontačných alebo negatívne ladených diskusií. Zároveň sme sledovali vývoj sentimentu počas konkrétneho spoločenského incidentu – atentátu na premiéra Slovenskej republiky. Zmena sentimentu pred a po udalosti bola štatisticky významná, čo potvrdzuje schopnosť nástrojov spracovania prirodzeného jazyka zachytiť emocionálne reakcie online komunity na externé udalosti.
Použitie modelu DeepSeek sa ukázalo ako nevhodné, keďže generoval nekonzistentné výstupy a jeho hodnotenia sentimentu sa nedali reprodukovať. Tento model bol v práci nahradený overeným a robustným modelom SlovakBERT, ktorý poskytol stabilné a konzistentné výsledky vhodné pre kvantitatívnu analýzu.
Technickým limitom pri spracovaní dát bol čas potrebný na predspracovanie a vyhodnocovanie veľkého množstva komentárov. Napriek tomu, že analýza bola zúžená iba na jeden subreddit a šesťmesačné obdobie, aj tento objem dát si vyžadoval optimalizácie a filtrovanie, napríklad detekciu botov či skracovanie vstupov modelu.
Medzi hlavné prínosy práce patrí kombinácia grafovej analýzy a spracovania prirodzeného jazyka pre skúmanie správania online komunít. Identifikácia slabých miest (nízka súdržnosť komunít, prítomnosť botov) poskytuje priestor pre ďalší výskum – napríklad sledovanie sentimentu v reálnom čase, identifikáciu irónie či dlhodobé mapovanie polarizácie diskusií.
Do budúcnosti by bolo zaujímavé rozšíriť výskum o viacero subredditov, porovnať jazykové modely s rôznymi úrovňami predtrénovania, alebo sledovať rozdiely v správaní rôznych typov komunít – napríklad tematicky orientovaných vs. ideologicky motivovaných. Rovnako by bolo možné implementovať viacúrovňovú analýzu sentimentu, ktorá by zohľadnila jemnejšie emočné podtóny či dynamiku diskusií v čase.