Vícerozměrné statistické metody - detail zprávy #833
Vliv vybraných faktorů na výskyt zdravotních potíží v souvislosti s užíváním hexahydrokanabinolu
Lucie Drozdová, 11. 04. 2026
Data: Vzorce a kontext užívání HHC u českých adolescentů a dospělých, Lucie Drodzová (bakalářská práce, 2025).
V práci se vyskytuje: Log. regrese
Udělená slovní hodnocení
- Velmi oceňuji kvalitní teoretické vymezení, které je věcné, srozumitelné a čtivé. Pozitivně hodnotím autorovo zdůraznění a při reflexi interpretaci výsledků. A to, že absence statistické významnosti u samotného HHC neznamená nulové riziko, ale spíše jde o komplexní souvislosti dalších faktorů. Autor přiznává že proměnná "frekvence více jak 1x denně" zahrnuje v analýze pouze 2 respondenty, kteří neměli žádné zdravotní potíže. Doporučila bych tak proměnnou sloučit s jinou kategorií nebo vyřadit.
- Téma je aktuální a zajímavé, data z vlastní bakalářky jsou velké plus. Logistická regrese je správně zvolená pro binární outcome, interpretace OR u kombinace s návykovými látkami je věcně správná. Co mi chybí, je jakákoliv diagnostika modelu – žádné pseudo-R², žádný Hosmer-Lemeshow test, žádná klasifikační tabulka. Taky by neuškodilo víc rozebrat, proč frekvence užívání nevyšla signifikantně – jestli je to otázka malých skupin, nebo to opravdu není prediktor.
- Fajn téma a reálná data. Logistická regrese je správná volba pro binární outcome a interpretace OR = 0,35 u kombinace s NL je korektní. Dobře řešíš i ten problém s kategorií „>1× denně" Co mi ale chybí: ukazatele kvality modelu — u logistické regrese se standardně reportuje Nagelkerke R² (nebo Cox-Snell), Hosmer-Lemeshow test a klasifikační tabulka. Bez toho nevím, jak dobře model celkově predikuje. A ještě: řídké kategorie frekvence by šlo sloučit (třeba „denně a častěji" vs. „týdně a méně"), tím by se odhady stabilizovaly.