Vícerozměrné statistické metody - detail zprávy #877
Faktory ovlivňující rozhodnutí pro léčbu duševního zdraví u zaměstnanců v technologickém sektoru
Agáta Zdražilová, 01. 05. 2026
Data: Mental Health in Tech Survey, OSMI (Open Sourcing Mental Illness), www.kaggle.com/datasets/osmi/mental-health-in-tech-survey
V práci se vyskytuje: Lin. regreseROC
Udělená slovní hodnocení
- Precizně popsáno čištění dat, vyřazení možná nereálného věku a ošetření chybějících hodnot. Chválím použití ROC analýzu (AUC = 0,728) k ověření, jak dobře model skutečně předpovídá vyhledání pomoci.
- Oceňuji práci s daty. Popis proměnných v této tabulkové podobě byl za mě lehce nepřehledný.
- Jasná architektura — teorie, hypotézy, čištění, metoda, výsledky po hypotézách. Listwise vyřazení vyhýbavých odpovědí je čisté, ale ti, kdo odpovídají "možná" u stigmatu, nejsou náhodný subset — to by zasloužilo zmínku v limitech. U nulových výsledků H2 a H3 by taky pomohla úvaha o power při této velikosti vzorku, jinak vyznívá silněji než data dovolují. ROC s AUC a kompletní OR s CI ale dělají z reportu jeden z metodicky nejúplnějších v pětici.
- Analýza je vhodně zvolená a práce s daty působí promyšleně, včetně úpravy datového souboru a definice proměnných. Výsledky jsou interpretovány srozumitelně a dávají smysl. Didakticky je práce dobrá, oceňuji přehledné tabulky odpovídající citační normě. Slabší stránkou je však grafické zpracování ROC křivky, která půspbí jako přímý výstup ze statistického programu a mohla by být vizuálně upravena pro lepší přehlednost.
- Tohle je čistě napsaná práce — formulované hypotézy v úvodu, transparentní popis čištění dat (i s tím, jak jsi řešila vyhýbavé odpovědi a extrémy), použití ROC s AUC navíc oproti běžnému Nagelkerke. Interpretace odpovídá hypotézám a kontrolní proměnné jsou dobře oddělené od hlavních prediktorů. Jediné dvě výtky: dataset je z roku 2014, takže by stálo za zmínku, že IT sektor i postoje k duševnímu zdraví se za deset let dost proměnily, a u kategorie "ostatní/nebinární" s velmi nízkým zastoupením bys mohla zvážit, jestli ji do modelu vůbec zahrnovat, nebo ji v transparentní formě analyzovat zvlášť.