Predmet: Statistične metode za visokorazsežne podatke
Vrsta predmeta: izbirni
Nosilec predmeta: izr. prof. dr. Rok Blagus
Študijski program in stopnja | Študijska smer | Letnik | Semester |
---|---|---|---|
Uporabna statistika, druga stopnja | Vsi moduli | 1. ali 2. | 1. ali 2. |
Za podrobnejšo časovno razporeditev glej predmetnik.
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti:
- Vpis v letnik študija.
Vsebina:
- Značilnosti raziskav na področju bioinformatike. Statistične posebnosti raziskav z visokorazsežnimi podatki. Načrtovanje raziskav z visokorazsežnimi podatki. Grafično prikazovanje podatkov.
- Identifikacija spremenljivk, ki so statistično značilno povezane z izidom (ponoven nastop bolezni, čas preživetja, itd). Večkratno testiranje: family-wise error rate, false discovery rate; parametrične in neparametrične reštive.
- Ocena multivariatne funkcije razvrščanja za napovedovanje izida. Metode za izbiro spremenljivk, za oceno funkcije razvrščanja in za oceno napovedne natančnosti.
- Interpretacija rezultatov (razlike med statistično in biološko interpretacijo).
- Uporaba statističnega paketa R in Bioconductor.
Cilji in kompetence:
aziskovanje z mikromrežami (za izraženost genov in mikroRNA, prisotnost enonukleotidnih polimorfizmov (SNPs), spremembe v številu kopij DNA zaporedij (copy number analysis), metilacije, itd) je zelo razširjeno na področju medicine in biologije. Posebnost tovrstnih eksperimentov je v tem, da je spremenljivk tipično več tisoč, medtem ko število vključenih statističnih enot redko presega sto. Zato je potrebno uporabljati statistične metode, ki pravilno obravnavajo probleme v zvezi z visokorazsežnimi podatki. Namen predmeta je usposobiti kandidata za samostojno izpeljavo raziskav na tem področju. Poudarek je na načrtovanju in na statistični analizi podatkov v visokorazsežvnih raziskav.
Predvideni študijski rezultati:
Študent zna načrtovati raziskavo z visokorazsežnimi podatki na področju bioinformatike in zna izbrati in uporabljati primerno metodo za analizo podatkov. Študent zna interpretirati rezultate in pripraviti poročilo, ki vsebuje rezultate.