Vícerozměrné statistické metody - detail zprávy #876
Smrt krásných jezdců aneb Vztah závažnosti následků dopravní nehody s věkem a pohlavím
Mira Schejbalová, 30. 04. 2026
Data: Policie ČR: Statistické údaje o nehodovosti na území ČR za rok 2025. zdroj: https://policie.gov.cz/clanek/statistika-nehodovosti.aspx?q=Y2hudW09Mg%3d%3d
V práci se vyskytuje: Ordinal. regrese
Udělená slovní hodnocení
- Líbí se mi použití nových zdrojů z roku 2021-2026. Srozumitelně, čtivě popsáno. Oceňuji volbu logistické regrese s ordinální proměnnou, která respektuje pořadí kategorií (usmrcení > těžké zranění atd.), což je elegantnější a přesnější než brát tuto proměnnou jen jako čísla. Práce pracuje s největším datovým souborem (N>100 000). Tabulky výsledků jsou mírně syrové (přímo z výstupu softwaru) a hůře se v nich orientuje. Interpretace interakce v závěru je sice věcně správná, ale textu by prospěla lepší vizualizace než jen tabulka koeficientů. Práce je velmi zajímavá díky analýze reálných dat z českých silnic, ale didakticky mírně pokulhává v prezentaci výsledků. Chválím detailní analýzu interakce mezi věkem a pohlavím. Nadpis mě sice dojal (fakt), ale proč jsou ti jezdci krásní? Kdo je ten krásný a kdo škaredý?
- Volba ordinální logistické regrese je tu dobře zdůvodněná a interakce věk × pohlaví je smysluplná výzkumná otázka. Datasetu věřím – jde o reálnou policejní statistiku. Co v reportu chybí, je test předpokladu proporcionality šancí (proportional odds assumption), který je pro tuhle metodu klíčový – bez něj nevíš, jestli je model vůbec adekvátní. Taky bych ocenila zmínku o tom, že v "bez zranění" jsou tisíce případů, zatímco v "usmrcení" jen stovky – to by mohlo ovlivňovat odhady. Závěrečná interpretace je čtenářsky příjemná, jen pozor na kauzální slovník typu „ženy jezdí bezpečněji" – data ukazují korelaci.
- Pěkný design celé práce dodává na přehlednosti, aktuální problematika, dobrá práce
- Zajímavé téma a věcně správná aplikace zvolené statistické analýzy.
- Jedna z mála prací se skutečnými českými administrativními daty v plné velikosti — to samo dává jiný kalibr, než dává Kaggle. Volba ordinální regrese je dobře obhájená a interakce věk × pohlaví je smysluplná otázka. Chybí mi ale ověření předpokladu proporcionálních šancí, který je u téhle metody klíčový. A závažnost nehody závisí i na faktorech mimo řidiče (protistrana, pásy, typ srážky), takže rozdíl mezi pohlavími může víc odrážet profil nehod než styl řízení. Závěr by zasloužil opatrnější jazyk — formulace o tom, kdo "jezdí bezpečněji", se s korelačními daty neudrží.
- Téma je zpracované na reálných datech z PČR, což práci dodává praktický přesah. Interakce věku a pohlaví je zajímavým analytickým krokem. Výsledky by ale mohly být lépe vizualizovány. Například graf by pomohl lépe pochopit zjištěnou interakci.
- Práce je přehledná, dobře vysvětlená a hlavní pointa je snadno pochopitelná. Díky jednoduchému shrnutí v závěru působí text velmi čtivě. Tabulky působí více technicky, takže chvíli trvá se v nich zorientovat, ale výsledky jsou následně v textu dobře vysvětlené.