Vícerozměrné statistické metody - detail zprávy #845
Co ovlivňuje adherenci k léčbě?
Andrea Slavotínková, 12. 04. 2026
Data: https://www.kaggle.com/datasets/sergionefedov/patient-records-100k-patients-15-conditions/code/data
V práci se vyskytuje: Lin. regreseLog. regrese
Udělená slovní hodnocení
- Vyšší hodnocení za srovnání dvou různých statistických přístupů. Práce velmi dobře vysvětluje rozdíly v interpretaci obou použitých metod, což má vysokou diaktickou hodnotu. Text je přehledný, prezentace výsledků spíše standardní.
- Přehledně zpracovaná zpráva. Osobně bych nezarovnávala nadpisy na střed a trochu mi vadilo rozdělení tabulky na 2 strany. Oceňuji, že autorka ve zprávě popisuje i teoretické ukotvení a limity.
- Statistiky mi práce přijde v pořádku, ale možná by bylo vhodné data otestovat trochu hlouběji.
- Chybí deskriptivní statistika. Autor kóduje kategoriální proměnnou medication jako ordinální, což způsobuje, že model implicitně interpretuje pořadí a lineární trend mezi jednotlivými léky, který ve skutečnosti neexistuje. Tento postup může vést ke zkreslení regresních koeficientů. Hranice 80 % pro definici adherence je arbitrární a není zdůvodněna ani klinicky, ani na základě literatury. Výstupy z logistické regrese nejsou v práci uvedeny, což znemožňuje plnou interpretaci výsledků. Použití obou modelů (lineární a logistické regrese) je do určité míry redundantní, protože analyzují stejné prediktory na stejném datasetu a žádný z modelů neprokázal statisticky významné vztahy. Logistická regrese nepřináší v tomto případě zásadně novou informační hodnotu, pouze alternativní operacionalizaci závislé proměnné. Formulace typu „žádná proměnná není statisticky významná“ a závěr, že proměnné nejsou vhodnými prediktory adherence, je příliš silná. Možnými alternativními vysvětleními jsou nízká statistická síla, nevhodná specifikace modelu, měřicí chyba nebo nelineární vztahy mezi proměnnými. Nízká hodnota R² sama o sobě neznamená, že proměnné nejsou relevantní. Může indikovat spíše nevhodnou specifikaci modelu nebo potřebu jiného typu analytického přístupu. Interpretace interakčního efektu není dostatečně přesná. V práci není testována multikolinearita mezi prediktory. Shoda výsledků dvou různých modelů sama o sobě neznamená vyšší robustnost závěrů. Tabulky by byly přehlednější, pokud by byly formátovány dle stylu APA a jazykově sjednoceny. Celková formální úprava textu je slabší.