Vícerozměrné statistické metody - detail zprávy #624
Predikcia vysokej produktivity študentov v kontexte digitálneho rozptýlenia a prístupu k štúdiu
Alžbeta Beňadiková, 18. 02. 2026
Data: Kaggle: Student Productivity & Digital Distraction Dataset, https://www.kaggle.com/datasets/sehaj1104/student-productivity-and-digital-distraction-dataset/data
V práci se vyskytuje: Log. regrese
Udělená slovní hodnocení
- Skvělá práce a zajímavá problematika! Text je srozumitelný, tabulky jsou přehledné. Oceňuji využití grafů, které usnadňují pochopení směru vztahů. Dále se mi líbí kritické zhodnocení limitů modelu.
- Není jasný zdroj a sběr dat. oceňuji to, že je to kompletní logistická regrese včetně OR, R², klasifikační tabulky, senzitivity a specificity. To je fakt plus. Model má vysoké R² a celkovou přesnost, což vypadá skoro až „moc hezky“. Na druhou stranu mi tu chybí jasnější informace o původu dat – odkud přesně dataset je a jak byl sbírán. Působí to spíš jako cvičný nebo generovaný soubor. Taky interpretace Nagelkerke R² jako „vysvětluje 81,8 % rozptylu“ je trochu přehnaná formulace. Taky model má asymetrickou senzitivitu a specificitu, což mohlo být víc rozebráno.
- Super aktuální téma. Velikost fontu v textu a tabulkách bych volila stejnou, trochu to ruší dojem. Zpráva je i dost dlouhá, ale to je dané i množstvím nezávisle proměnných.
- Práce je metodicky pevně ukotvena, obsahuje jasné vymezení závislé a nezávislé proměnné a interpretaci výsledků logistické regrese. Zbývalo by dopracovat vizualizaci vlivu prediktorů na šanci vysoké produktivity a případnou hlubší diskuzi o limitacích modelu (například nižší senzitivitě 55 %). Velkým kladem práce je, že výsledky jsou prezentovány jasně a logicky, což usnadňuje jejich interpretaci.