Vícerozměrné statistické metody - detail zprávy #639
Analýza rizikových faktorů ischemické choroby srdeční pomocí logistické regrese
Miriam Jana Šerá, 25. 02. 2026
Data: Framingham Heart Study, https://www.kaggle.com/datasets/noeyislearning/framingham-heart-study
V práci se vyskytuje: Log. regreseROC
Udělená slovní hodnocení
- Zpráva korektně aplikuje logistickou regresi na binární závislou proměnnou z robustního longitudinálního datasetu a autor adekvátně interpretuje význam p-hodnot i Waldovy statistiky. Didakticky oceňuji zejména přehledné vysvětlení poměru šancí (OR) a zahrnutí ROC křivky s hodnotou AUC.
- Práce s daty: Autor pracuje s reálným, prestižním datasetem (Framingham Heart Study), což dodává práci váhu. Kladně hodnotím zařazení ROC křivky a klasifikační matice jako validačních nástrojů – to svědčí o promyšleném přístupu. Mírným nedostatkem je, že model záměrně omezuje počet prediktorů na tři (věk, pohlaví, kouření) a vynechává klinicky klíčové proměnné jako krevní tlak nebo cholesterol, které jsou v původním datasetu dostupné. Didaktická hodnota: Text je napsán srozumitelně a čtivě, terminologie je vysvětlena přístupně, tabulka s výsledky regrese je přehledná. Oceňuji, že autor vysvětluje interpretaci každého parametru – to je skvělé. Mírně schází hlubší komentář ke klasifikační matici a ROC křivce v grafické podobě – graf je přiložen, ale jeho popis mohl být podrobnější.
- Silné stránky: správně zvolená metoda, dobře popsané tabulky, srozumitelná interpretace výsledků, přehledný graf, splněný požadovaný rozsah práce. Slabé stránky: chybí explicitní rozlišení závislé a nezávislých proměnných, chybí popisná statistika, nepřesná definice Waldovy statistiky (Waldova statistika netestuje sílu vlivu proměnné, ale ověřuje, zda je koeficient statisticky významně odlišný od nuly), slabší formální úprava textu (např. zarovnání textu k okrajům).