Vícerozměrné statistické metody - detail zprávy #632

Vztah mezi množstvím pohybové aktivity a depresivní symptomatikou měřenou Beckovou škálou deprese

Michaela Pěronková, 24. 02. 2026

Data: Simulovaná data (BDI a pohybová aktivita), generováno pomocí ChatGPT (OpenAI).

V práci se vyskytuje: Lin. regrese

Udělená slovní hodnocení

Pěkná práce. Škoda, že to nejsou reálná data. Jediná věc mi tam chybí: kdyby zde byl test podmodelu srovnávají oba prezentované modely, věděli bychom zda má smysl rozlišovat pohyb vevnitř a pohyb venku, nebo zda jsou zaměnitelné.
Velmi kvalitně zpracovaná práce s vysokou didaktickou hodnotou. Oceňuji přehledný popis modelů, důkladné ověření předpokladů a jasnou interpretaci výsledků. Velkou předností je také kritická diskuse limitů simulovaných dat. Práce je dobře strukturovaná a může sloužit jako dobrý příklad regresní analýzy.
Velmi hezká práce práce s daty, je vidět, že si autorstvo práce dalo skutečně záležet na daném projektu, oceňuji i samostatné zhodnocení limitů dané práce. Možná pro příště doporučuji se jen zamyslet zda by některé segmenty práce nešli zkráti jelikož dosahuje dvojnásobné délky než která byla doporučována.
Práce s daty: Oceňuji, že autor/ka ověřil/a předpoklady regrese (normalita reziduí, homoskedasticita, VIF) a otevřeně přiznal/a jejich mírné porušení. Zásadní slabinou je však použití simulovaných dat generovaných umělou inteligencí, což výrazně omezuje analytickou hodnotu práce, protože výsledky (R² = 49–54 %) jsou de facto nastaveny předem a netestují nic reálného. Graf 2 je označen jako interakční, přestože model žádný interakční člen neobsahuje? Zřejmě jde jen o věcnou nepřesnost v pojmenování? Celkově jde tedy spíše o metodickou demonstraci než o skutečnou analýzu. Didaktická hodnota: Po didaktické stránce je však práce poměrně silná. Text sice vykazuje četné znaky využití AI (což je ostatně přiznáno hned v úvodu práce), avšak je srozumitelný, tabulky jsou přehledné a dobře okomentované, schéma analýzy (Obrázek 1) je vizuálně dobře uchopeno pro pochopení struktury modelů. Limity jsou přiznány poctivě a opakovaně, včetně simulované povahy dat.
Pro použitá data jsou dobře zvolené modely a je skvěle uvedeno, že se nejedná o kauzalitu. Jen je zde pár menších nedostatků. Značně rušivé při čtení práce je neustálé upozorňování na fakt, že data byla vygenerována pomocí AI - autor to velmi často zmiňuje, jelikož často odkazuje na to, že to vychází tak, jak by se dalo předpokládat a další závěry podobného rázu. Podobné závěry jsou vzhledem k původu dat nevhodné a bez nich by stačilo uvést v záhlaví, že jsou generována pomocí AI. Mezi předpoklady lineární regrese linearita nepatří (možná myšlena kolinearita?). Není tím úplně jasné, jak přesně bylo toto vizuálně kontrolováno. Dále je zmínka, že vadí linearita, pak bude možná namístě proměnnou modelovat jako nelineární vztah. Graf 2: nevhodně použit na dané proměnné s tím, že jsou z něj vyčteny ne zcela správné závěry. Je zde zmíněno, že chybí interakce - je možné ji do modelu přidat i pro jen vygenerování grafu (jen to zmínit v popisku).
Práce má přehlednou strukturu a oceňuji také hezky zpracovanou diskusi a část věnovanou limitům. Pozitivně hodnotím také interpretaci výsledků regresní analýzy a jejich zasazení do širšího kontextu zkoumaného problému. Výsledky jsou prezentovány pomocí grafů, které ale působí jako přímé výstupy ze statistického programu a mohly by být graficky upraveny pro větší přehlednost. V textu se místy objevují také drobné stylistické chyby.
+ líbí se mi použití aktuálních zdrojů (rok 2025, 2024, atd.) + líbí se mi dostatečně rozpracovaná kapitola „limity“ jako mínus vnímám fiktivně vytvořená data