Vícerozměrné statistické metody - detail zprávy #880
Faktory ovlivňující spokojenost se životem v evropských zemích
Ela Trejbalová, 02. 05. 2026
Data: European Social Survey European Research Infrastructure (ESS ERIC). (2023). ESS Round 11: Data and documentation. https://www.europeansocialsurvey.org/
V práci se vyskytuje: Lin. regrese
Udělená slovní hodnocení
- ESS je skvělý zdroj a velikost vzorku přes 49 tisíc dává hodně možností. Problém je, že R² = 0,005 znamená, že model fakticky nic nevysvětluje – statistická signifikance je tu artefaktem velikosti vzorku, ne reálné velikosti efektů. To bys mohla v interpretaci přiznat ostřeji než jen poznámkou „efekt je velmi slabý". Druhá zásadní věc: v textu pracuješ s teorií U-tvaru a graf to dokonce naznačuje, ale tvůj model je čistě lineární – takový vztah z principu nezachytí. Stálo za to přidat kvadratický člen věku, jinak je nesoulad mezi grafem a modelem matoucí. Také mi tu chybí jakákoli kontrola zemí jako klastrů – ESS data mají hierarchickou strukturu.
- Dobře propracovaná teorie. Ocenila bych ještě bližší popis metody lineární regrese, která je v práci použita. Jinak je práce hezky a srozumitelně napsaná.
- Oceňuji více zdrojů. Hezká práce. Trochu bych vylepšil/a formální vzhled práce (někde chybí tečka, odsazení, zarovnání do bloku).
- Datový soubor nesedí se zprávou, resp. ve zprávě není uvedeno, že došlo k čištění dat, nebo že datová matice obsahuje data před čištěním. Na to, že koeficient determinace vyšel 0,005 je závěr poněkud ambiciózní... a vůbec je ten závěr nějaký nesmyslný i vzhledem ke grafu.
- Lineární regrese je pro daný problém vhodná. Největší slabinou je zjevný nesoulad mezi teorií a modelem. Úvod zmiňuje předpoklad U-křivky ve vztahu věku a spokojenosti, avšak model testuje pouze lineární efekt věku. Vhodné by tak bylo zařadit u věku také kvadratický člen. Dále chybí v tabulce standardizované koeficienty sloužící k porovnání velikosti efektů. Text je relativně čtivý. V tabulkách jsou názvy proměnných ponechány v původní podobě (např. rlgdgr), což snižuje čitelnost.
- ESS je výborný zdroj, ale takhle je v podstatě nevyužitý. R² blízko nuly při velikosti vzorku v desítkách tisíc znamená, že každá nenulová hodnota vyjde signifikantně, aniž by to věcně cokoli znamenalo — a to je v textu jen zlehka odbyté. Druhý nesoulad: úvod pracuje s teorií U-tvaru, graf to dokonce naznačuje, ale model je lineární a tenhle tvar z principu nezachytí. Stačil by kvadratický člen věku, abys naladila model na to, co teorie slibuje. Třetí věc: ESS data mají hierarchickou strukturu (země), což běžná lineární regrese ignoruje. Pokud chceš ze stejných dat vytáhnout víc, vícev úrovňový model nebo aspoň fixní efekty zemí by pomohly.