Vícerozměrné statistické metody - detail zprávy #396
Predikce odchodu zaměstnance z firmy
Kristina Kačmarská, 23. 02. 2025
Data: https://www.kaggle.com/datasets/mfaisalqureshi/hr-analytics-and-job-prediction
V práci se vyskytuje: Log. regrese
Udělená slovní hodnocení
- Didaktický přínos: Ukázka logistické regrese na predikci chování zaměstnanců. Práce s daty: Velký dataset (15 000 respondentů), vizualizace výsledků (ROC křivka, histogramy, heatmapa). Vytěžení metody/dat: Pečlivá interpretace výsledků, aplikovatelnost v HR psychologii. Celkově: Velmi dobrá práce se skutečnými daty, praktická relevance.
- Práce je za mě trochu nepřehledná, je tam mnoho grafických prezentací, které nejsou ale jasně popsány a jejich interpretace není přímočará. Například korelační heatmapa je pro mě naprosto nepochopitelná. Také některé proměnné (například délka zaměstnání) si myslím, že nejsou úplně správně interpretovány, protože je možná nelineární závislost. Vzhledem k tomu, že vztahy proměnných mohou být také nelineární nevím, zda je logistická regrese nejlépe zvolenou metodou. Více bych komentovala to, že výsledek úrazu vyšel v rozporu s teoretickým ukotvením. Z didaktického pohledu je v práci několik gramatických a stylistických chyb, překlepy, vynechaná písmena, neformální výrazy a například použité zkratky, které nejsou vysvětleny (např. HR).
- Problém je zajímavý a velice komplexní. Za mě bylo zbytečné uvádět první kategorie pro odchod zaměstnanců, protože se s tím nakonec nepracovalo. Taktéž byly využity převážně staré zdroje, které ještě k tomu nebyly seřazeny abecedně v seznamu literatury. Předání výsledků bylo ale srozumitelné a zajímavé. Oceňuji využití několika grafů
- Skvělé představení proměnných i s odkazem na studie Tabulky přehledné, nicméně by bylo lepší zvolit formátování odpovídajícím pravidlům katedry Přehledné vysvětlení, co jednotlivá čísla znamenají Hodně propracovaná práce Velmi se mi líbila praktická interpretace výsledků
- Data jsou velmi dobře vizualizována pomocí různých grafů, tabulek atd. Jde vidět, že je autorka zdatná ve statistických postupech a dokáže prezentovat výsledky srozumitelným a přehledným způsobem.
- Excelentní práce. Výborné grafické zpracování. Velmi dobře strukturované a propracované.
- Použití ROC křivky a confusion matrix je výhodou. Některé závěry (např. o vlivu pracovních úrazů) působí rozporuplně. Výborně strukturovaná práce s vizualizacemi (ROC křivka, heatmapa, histogramy). Interpretace pro manažery dává práci aplikovaný rozměr. práce extrémně dlouhá