| Názov projektu: | Nástroj na hodnotenie kvality genomickej atomizácie |
| Študent: | Matej Krivošík |
| Email študenta: | krivosik7@uniba.sk |
| Školiteľ: | doc. Mgr. Tomáš Vinař, PhD. |
| Email školiteľa: | tomas.vinar@fmph.uniba.sk |
| GitHub: | atomization_scorer |
| Detailný popis nástroja: | description |
Tvorba analytického nástroja určeného na hodnotenie kvality genomickej atomizácie, teda rozkladu genómových sekvencií na menšie homogénne úseky – atómové segmenty – na základe lokálnej podobnosti. Atomizácia, realizovaná pomocou algoritmu IMP (implementovaného v nástroji GEESE), umožňuje identifikovať potenciálne homologické regióny medzi sekvenciami. Úlohou nástroja bude overiť, ako presne a konzistentne tento proces prebehol a poskytnúť kvantitatívne aj vizuálne ukazovatele kvality.
report: report_zima
V rámci projektu som sa oboznámil s problematikou genomickej atomizácie a naučil sa pracovať s rôznymi bioinformatickými nástrojmi, ako sú Mash, Minimap2, GEESE, LAST, a s bioinformatickými formátmi FASTA a GEESE. Získal som skúsenosti aj s knižnicou pandas pre spracovanie a analýzu dát.
Naimplementoval som základný python balíček, ktorý poskytuje kostru funkcionality na výpočet základných metrík kvality atomizácie, a základný príkazový riadok pre spustenie nástroja z terminálu.
Pre overenie funkčnosti som napísal základné testy (pytest framework). Testy zatiaľ pokrývajú základné scenáre a v letnom semestri ich plánujem rozšíriť.
-