Vitajte na stránke prezentujúcej projekt prieskumnej analýzy onkologických dát v Python Jupyter notebooku.
Tento projekt je súčasťou štúdia exploratívnej analýzy a využíva moderné nástroje na spracovanie a vizualizáciu dát.
Popis projektu:
Projekt sa zameriava na prieskumné analyzovanie dát v oblasti onkológie. Používa dáta v JSON formáte, ktoré boli anotované a predspracované špeciálnym nástrojom na prácu s CNV (Copy Number Variation) dátami.
Analýza je vykonaná v prostredí Python Jupyter notebooku, využívajúc knižnice Pandas a Numpy na efektívne spracovanie dát.
Sumarizácia
Cieľom narábania s datasetom bolo trénovanie a pochopenie rozhodovacích stromov a náhodných lesov, na čo bolo samozreme nutné pochopiť linárnu regresiu. Pôvodný plán bol dostať sa v práci s datasetom až po Support vector machines (SVM), projekt sa však dostal len po ľahké trénovanie náhodných lesov. Pravdepodobne sa nám totiž podarilo natrénovať biasnutý model, alebo sme zvolili nesprávne atribúty pre trénovanie.
Programované v Python notebooku Jupyter