Cieľom práce je navrhnúť a vyhodnotiť pravdepodobnostný generatívny model, ktorý opisuje distribúciu fragmentov mitochondriálneho genómu v zdravých vzorkách a umožní detegovať odchýlky v nových profiloch. Z mapovaných čítaní (BAM) sa zostaví vektor príznakov pre každý fragment (pozícia na cirkulárnom mtDNA, dĺžka fragmentu, počet SNP/indel, pokrytie a súvisiace mapovacie metriky). Model sa trénuje na zdravých dátach a pre nové vzorky poskytne skóre „vysvetliteľnosti“ (anomaly score); vyššie skóre signalizuje potenciálnu onkologickú odchýlku. Ako baseline sa porovná so supervised klasifikátorom zdravý vs. onko. Druhá línia práce preskúma vzťah mitochondriálnych metrik s vekom a faktormi životného štýlu (napr. fajčenie, alkohol) pomocou regresných/klasifikačných modelov. Výstupom bude reprodukovateľná pipeline od BAM po metriky a modely, metriky presnosti (AUROC/PR, kalibrácia, krížová validácia) a interpretácia cez priestorové mapy mtDNA a dôležitosť príznakov. Prínosom je robustná semi-supervised metóda pre skoré odhalenie odchýlok a náhľad na „wellness“ súvislosti mitochondrií.
Email: skornak1@uniba.sk
Email: jaroslav.budis@geneton.sk