Vícerozměrné statistické metody - detail zprávy #776
Shluková analýza fyzické aktivity, BMI, životního stylu a osobnostních rysů
Lenka Grulichová, 22. 03. 2026
Data: HEXACO personality factors as predictors of physical activity, resting heart rate, body mass index, and healthy lifestyle behaviors; https://figshare.com
V práci se vyskytuje: Cluster analýza
Udělená slovní hodnocení
- Oceňuji práci s rozsáhlým datasetem a správné použití standardizace i kombinace hierarchické a nehierarchické shlukové analýzy. Text je srozumitelný a dobře strukturovaný, dendrogam a graf průměrů vhodně doplňují výklad. Výběr shluků je poměrně slabě odůvodněný a interpretace shluků je místy příliš silná (např. hodnotící soudy o osobnosti) - bylo by vhodné je více opřít o data. Celkově jde o dobrou práci s drobnými nedostatky.
- Zpráva má dobře vybranou metodu a postup je srozumitelně popsaný: vhodně používá hierarchickou shlukovou analýzu (Ward + Euklidovská vzdálenost), standardizaci na Z‑skóry a následné zpřesnění pomocí k‑průměrů; výsledky jsou podpořené dendrogramem a grafem průměrů shluků. Pro vyšší hodnocení bych doporučil(a) doplnit validaci a stabilitu shluků (např. silhouette, porovnání řešení pro 2/3/4 shluky, případně split‑sample) a zpřesnit interpretaci: některé závěry jsou formulované příliš „typologicky“ (např. „nečestní“, „tvrdohlaví“) a bylo by lepší držet se neutrálněji u rozdílů v průměrech dimenzí.
- Tady oceňuju hlavně jedno: skutečná data z veřejné databáze. Figshare, citace datasetu, N=1260 – to je přesně to, co by mělo vypadat jako základ dobré analýzy. Oproti zprávám, kde se data prostě „získala výzkumem" bez jakékoli další informace, je tady jasné, odkud čísla pochází. Metodika je ok – Wardova metoda, eukleidovské vzdálenosti, standardizace na Z-skóry. Volba dvou shluků je taky obhájená věcně, ne jen graficky: autor říká, že škola má povinnou fyzickou aktivitu, takže dává smysl rozdělit studenty na „plní" a „neplní". To je chytrá věc. Co mi ale trochu vadí: interpretace shluků je místy dost silná. Věty jako „nečestní a tvrdohlaví" nebo „úzkostliví" – to jsou z-skóry ±0,3 až ±0,6, ne žádné dramatické rozdíly. A chybí mi číslo, které by mi řeklo, jestli jsou ty dva shluky dobře oddělené – žádný siluetový koeficient, žádný Calinski-Harabasz. Bez toho nevím, jak moc jsou ty shluky reálné, a jak moc jsou jen artefakt metody.
- Práce používá adekvátní metody (Wardova metoda, k-průměry, standardizace) a pracuje s reálným datovým souborem. Grafy nejsou podepsány. Celkově je zdůvodnění volby počtu shluků nedostatečné a informace o velikosti shluků zcela chybí.
- Po metodologické stránce super práce, byl jsem ale trošku zmatený z druhého grafu (průměry). Možná by příště stálo za to otočit kódování položek, případně se detailněji věnovat interpretaci toho grafu když mají proměnné opačnou polaritu.
- Práce je sice věcně správná, ale její přínos brzdí hodně specifický vzorek studentů, který nejde moc zobecnit. Postupy jsou popsané jen stručně a v porovnání s ostatními zprávami text postrádá větší eleganci nebo potenciál k dalšímu učení.
- Metodologicky čistý postup. Volba počtu shluků je podložená. Interpretace je srozumitelná. Celkově přehledná práce.