Bubliny na sociálnej sieti Instagram

Meno: Richard Macko

Názov práce: Bubliny na sociálnej sieti Instagram

Školiteľ: RNDr. Damas Gruska, PhD.

Kontakt: macko77@uniba.sk

Zadanie práce

Anotácia

Táto bakalárska práca skúma fenomén sociálnych bublin na Instagrame – uzavretých skupín používateľov, ktorí sa spájajú na základe spoločných záujmov, používania hashtagov a interakcií. Práca využíva teóriu malého sveta a metódy network analýzy na získavanie dát z online prostredia a ich následnú vizualizáciu pomocou grafov, ktoré znázorňujú štruktúru týchto komunít a šírenie informácií medzi nimi.

Cieľ práce

Cieľom práce je spracovať a vizualizovať získané dáta zo sociálnej siete Instagram s dôrazom na identifikáciu a analýzu sociálnych bublín. Na základe údajov o spoločných záujmoch, používaní hashtagov a interakciách medzi používateľmi budú vytvorené grafické reprezentácie (grafy), ktoré umožnia posúdiť, do akej miery tieto siete vykazujú charakteristiky malého sveta a ako je vysoká klastrovanosť. Týmto prístupom práca demonštruje štruktúru a dynamiku online komunít a prispieva k lepšiemu pochopeniu šírenia informácií v digitálnom priestore.

Zdroje a odkazy

Napísané texty a materiály

Denník

24.2 - 2.3

  • Vytvorenie webovej stránky

3.3 - 9.3

  • Vytvoril som repozitár na GitHube, kde budem priebežne pridávať kód k bakalárskej práci.
  • Analyzoval som možnosti dostupných Python knižníc na zber dát z Instagramu.

10.3 - 16.3

  • Na základe testovania viacerých nástrojov som definitívne zvolil knižnicu instagrapi pre zber dát z Instagramu.
  • Vytvoril som základný skript, ktorý vytvorí dictionary mojich followings a mapuje ich vzájomné prepojenia. Tento základ slúži ako prvý krok k tvorbe grafovej reprezentácie siete.

17.3 - 23.3

  • Rozšíril som existujúci skript o získavanie interakcií medzi používateľmi z dictionary vytvoreného v predchádzajúcom kroku. Konkrétne som spracoval lajky a komentáre pod príspevkami, čím som získal ďalšie informácie o vzájomnej aktivite medzi používateľmi.
  • Na základe týchto interakcií som doplnil váhy hrán v grafe - čím viac interakcií medzi dvojicou používateľov, tým vyššia váha ich spojenia.
  • Pomocou knižníc networkx a matplotlib som vizualizoval sieť týchto interakcií vo forme grafu. Každý uzol predstavuje používateľa, hrany znázorňujú vzťahy a ich váha zodpovedá intenzite interakcie.

24.3 - 30.3

  • Pokračoval som v zbere dát z Instagramu s využitím skriptov vytvorených v predchádzajúcich týždňoch.
  • Pridal som mechanizmus ukladania zozbieraných dát do JSON formátu, aby som predišiel strate údajov v prípade prerušenia alebo chyby počas zberu. Týmto spôsobom je možné zber kedykoľvek obnoviť bez opakovania celej operácie.
  • Vykonal som menšie úpravy v grafickej reprezentácii siete – úprava veľkosti uzlov, farebnosti a popisov pre zlepšenie čitateľnosti výstupu.

31.3 - 6.4

  • Instagram zablokoval oba použité účty z dôvodu podozrivej aktivity súvisiacej so zberom dát. Obnova prístupu trvala približne 4 dni, počas ktorých nebolo možné pokračovať v zbere dát.
  • Po obnovení prístupu som zatiaľ nezbieral nové dáta, aby som minimalizoval riziko ďalšej blokácie.
  • Začal som využívať Louvainov algoritmus na detekciu komunít v grafe interakcií. Tento algoritmus pomáha efektívne identifikovať skupiny používateľov, ktorí medzi sebou viac interagujú.
  • Pre zlepšenie prehľadnosti grafu som odstránil účty s nízkym stupňom vrchola (málo prepojení), ktoré boli pre analýzu irelevantné a vizuálne rušivé.

7.4 - 13.4

  • Instagram začal blokovať väčšinu požiadaviek (requestov), čo výrazne obmedzilo možnosti zberu dát. V dôsledku týchto obmedzení sa mi podarilo získať len obmedzené množstvo údajov, a preto som sa rozhodol fázu zberu dát ukončiť a ďalej pracovať s tým, čo sa mi doteraz podarilo zhromaždiť.
  • Vykonanie refaktorizácie zdrojového kódu – prehľadne som rozdelil funkcionalitu do samostatných tried (class) pre jednoduchšiu údržbu a čitateľnosť.
  • Testovanie viacero algoritmov na detekciu komunít v grafe a porovnávať ich výsledky s Louvainovým algoritmom.
  • Začiatok písanie práce

14.4 - 20.4

  • Pokračovanie v písaní práce

21.4 - 27.4

  • Napísaná prvá kapitola o histórii sociálnych sietí

28.4 - 4.5

  • Napísaná druhá kapitola o Instagrame a jeho funkcionalitách
  • Začiatok tretej kapitoly