Stranka Bakalarskej Prace

Info

Meno: Michal Přibil
Názov práce: Bublina na sociálnej sieti Reddit
Meno školitela: Damas Gruska
Kontakt: pribil2@uniba.sk

Zadanie

Anotácia

Práca sa zaoberá štruktúrami bublín na sociálnej sieti Reddit a skúma prepojenie sentimentu a správania používateľov.

Cieľ

Vytvoriť metodiku a nástroje na analýzu sociálnych bublín v sieti Reddit.

Link na prácu na platforme Overleaf: [odkaz]

Abstrakt

Táto bakalárska práca sa zaoberá analýzou informačných bublín a sentimentu v online diskusiách na platforme Reddit, konkrétne v rámci slovenského subredditu r/Slovakia.
Cieľom práce je preskúmať, do akej miery sa v tomto prostredí vytvárajú komunity používateľov a akým spôsobom sa mení sentiment ich príspevkov.
Na analýzu bola vytvorená interakčná sieť používateľov založená na odpovediach v komentároch.
Pomocou grafových algoritmov Louvain, Leiden a Girvan–Newman bola identifikovaná komunitná štruktúra a analyzovaná miera súdržnosti jednotlivých skupín. Súčasťou analýzy je aj vizualizácia väzieb medzi najaktívnejšími používateľmi a subredditmi.
Druhá časť práce sa venuje analýze sentimentu pomocou jazykového modelu Slo- vakBERT trénovaného na slovenských textoch.
Zistenia poukazujú na klesajúci trend sentimentu u používateľov s rastúcou aktivitou, ako aj na negatívny posun v nálade komunity počas konkrétneho spoločenského diania – atentátu na premiéra SR.
Pou- žitie všeobecného modelu DeepSeek sa ukázalo ako nevhodné kvôli vysokej variabilite odpovedí.
Práca kombinuje metódy spracovania prirodzeného jazyka a analýzy sietí s cieľom lepšie porozumieť dynamike online interakcií a vzniku informačných bublín na sociál- nych sieťach.

Zoznam zdrojov

Zdroj dát
Subreddit r/Slovakia
SlovakBERT model
Zvyšok zdrojov je uvedený v práci. [odkaz]

Obrazky

Záver práce:

Táto práca sa zameriavala na analýzu sociálnej siete Reddit so zameraním na identifikáciu informačných bublín a vývoj sentimentu v rámci komunity používateľov. Získané dáta z príspevkov a komentárov boli predspracované a analyzované pomocou grafových a jazykových nástrojov. V prvej časti bola vytvorená interakčná sieť medzi používateľmi subredditu \textit{r/Slovakia} a aplikované algoritmy Louvain, Leiden a Girvan-Newman na detekciu komunitnej štruktúry. Z analýzy vyplynulo, že používateľská sieť má nízku úroveň lokálneho prepojenia (clustering coefficient) a iba slabo definovanú komunitnú modularitu, čo je typické pre diskusné fóra s voľnou štruktúrou a vysokou fluktuáciou používateľov. Hoci algoritmy odhalili isté komunity, ich vnútorná súdržnosť bola minimálna. Z toho vyplýva, že používatelia na Reddite väčšinou interagujú jednorázovo v rámci konkrétnych tém a iba zriedkavo nadväzujú dlhodobejšie väzby s ostatnými používateľmi. To naznačuje, že klasické informačné bubliny sa na Reddite nevytvárajú spôsobom, aký by sme očakávali na centralizovanejších platformách. V druhej časti bola vykonaná analýza sentimentu príspevkov pomocou špecializovaného jazykového modelu SlovakBERT. Táto analýza odhalila mierne klesajúci trend sentimentu u používateľov s rastúcou aktivitou. Je možné predpokladať, že čím viac je používateľ aktívny, tým viac sa dostáva do konfrontačných alebo negatívne ladených diskusií. Zároveň sme sledovali vývoj sentimentu počas konkrétneho spoločenského incidentu – atentátu na premiéra Slovenskej republiky. Zmena sentimentu pred a po udalosti bola štatisticky významná, čo potvrdzuje schopnosť nástrojov spracovania prirodzeného jazyka zachytiť emocionálne reakcie online komunity na externé udalosti. Použitie modelu DeepSeek sa ukázalo ako nevhodné, keďže generoval nekonzistentné výstupy a jeho hodnotenia sentimentu sa nedali reprodukovať. Tento model bol v práci nahradený overeným a robustným modelom SlovakBERT, ktorý poskytol stabilné a konzistentné výsledky vhodné pre kvantitatívnu analýzu. Technickým limitom pri spracovaní dát bol čas potrebný na predspracovanie a vyhodnocovanie veľkého množstva komentárov. Napriek tomu, že analýza bola zúžená iba na jeden subreddit a šesťmesačné obdobie, aj tento objem dát si vyžadoval optimalizácie a filtrovanie, napríklad detekciu botov či skracovanie vstupov modelu. Medzi hlavné prínosy práce patrí kombinácia grafovej analýzy a spracovania prirodzeného jazyka pre skúmanie správania online komunít. Identifikácia slabých miest (nízka súdržnosť komunít, prítomnosť botov) poskytuje priestor pre ďalší výskum – napríklad sledovanie sentimentu v reálnom čase, identifikáciu irónie či dlhodobé mapovanie polarizácie diskusií. Do budúcnosti by bolo zaujímavé rozšíriť výskum o viacero subredditov, porovnať jazykové modely s rôznymi úrovňami predtrénovania, alebo sledovať rozdiely v správaní rôznych typov komunít – napríklad tematicky orientovaných vs. ideologicky motivovaných. Rovnako by bolo možné implementovať viacúrovňovú analýzu sentimentu, ktorá by zohľadnila jemnejšie emočné podtóny či dynamiku diskusií v čase.