Vícerozměrné statistické metody - detail zprávy #402
Galton: Řekni mi výšku rodičů a já ti povím, kolik bude měřit dítě
Lucie Juklíčková, 25. 02. 2025
Data: Galton's Height Data: Multiple linear regression, Kaggle, https://www.kaggle.com/datasets/fundal/galtons-height-data-multiple-linear-regression/data
V práci se vyskytuje: Lin. regrese
Udělená slovní hodnocení
- Vynikající práce! Jeto přehledné, srozumitelné a použité metody jsou správně a vhodně použity. Kdybych byl opravdu velký hnidopich, snad jedinou formulaci bych upravil - pokud přidáme do modelu regresor v druhé mocnině, pak ten původní regresor v první mocnině změní význam (říká cosi o umístění vrcholu paraboly vpravo nebo vlevo od nuly). Takže uvažovat o tom, že ztratil významnost není zajímavé, protože to je najednou úplně jiný regresor.
- Autorka testovala přidání druhých mocnin výšky rodičů, ale ty se ukázaly jako nevýznamné. Přesto bylo uvedeno, že původní lineární koeficienty „ztratily významnost“. Pokud jsou kvadratické členy nevýznamné, znamená to spíše, že model byl nadbytečně rozšířen, než že by základní vztahy přestaly platit. Jinak je za mě práce přehledná a v pořádku.
- Moc zajímavé téma, přehledně zpracováno, srozumitelně popsaný postup i výsledky, hezké grafy a tabulky. I když by možná bylo lepší, kdyby byla zpráva o něco kratší.
- Po obsahové stránce má práce velmi precizní teoretické ukotvení, což ji činí hodnotnou a dobře podloženou. Možný nedostatek může představovat nefunkční odkaz na zmiňovaný dataset. Text je velmi přehledný a srozumitelný.
- Silné stránky: Skvělá analýza regresního modelu, elegantní řešení, podrobné testování variant modelu, výborné vizualizace (scatterploty, regresní linie). Slabé stránky: Mohl by být více zdůrazněn význam omezení modelu.
- Zpráva je motodologicky precizní, analyticky podložená a výsledky jsou prezentovány srozumitelně. Všechny statistické metody a interpretace jsou v souladu s očekávanými postupy v analýze dědičnost výšky.