Prieskumná analýza onkologických dát

Exploratory data analysis of oncological data

Vitajte na stránke prezentujúcej projekt prieskumnej analýzy onkologických dát v Python Jupyter notebooku.

Tento projekt je súčasťou štúdia exploratívnej analýzy a využíva moderné nástroje na spracovanie a vizualizáciu dát.


Popis projektu:

Projekt sa zameriava na prieskumné analyzovanie dát v oblasti onkológie. Používa dáta v JSON formáte, ktoré boli anotované a predspracované špeciálnym nástrojom na prácu s CNV (Copy Number Variation) dátami.

Analýza je vykonaná v prostredí Python Jupyter notebooku, využívajúc knižnice Pandas a Numpy na efektívne spracovanie dát.

Sumarizácia

Cieľom narábania s datasetom bolo trénovanie a pochopenie rozhodovacích stromov a náhodných lesov, na čo bolo samozreme nutné pochopiť linárnu regresiu. Pôvodný plán bol dostať sa v práci s datasetom až po Support vector machines (SVM), projekt sa však dostal len po ľahké trénovanie náhodných lesov. Pravdepodobne sa nám totiž podarilo natrénovať biasnutý model, alebo sme zvolili nesprávne atribúty pre trénovanie.


Študent: Ján Osadský (osadsky2@uniba.sk)
Školiteľ: Mgr. Jozef Martiš (jozef.martis@uniba.sk)
Repozitár projektu: GitHub
Report - Zima: Report
Report - Leto: Report

        Programované v Python notebooku Jupyter