Research Academy for Exercise Sciences e.V.
Schwimmleistung · Individuelles Profiling
1 / 5
Wissenschaft
Individualisierung der
Schwimmleistungsdiagnostik
Vom Populationsmodell zum dynamischen State-Space-Ansatz
260
Athleten (Population)
6
Pilotathleten
50
Messzeitpunkte
10k
MC-Samples
Methode 1
Populationsregression (OLS) → Koeffizienten als Bayes-Prior
Methode 2
Konjugiertes Bayes-Update → Posterior pro Athlet
Methode 3
State-Space / Kalman-Filter → zeitvariable β_t
Pilotstudie mit synthetischen Daten · Implementierung: Python (numpy, statsmodels, ruptures)
Research Academy for Exercise Sciences e.V.
Das N=1 Problem
2 / 5
Wissenschaft
Warum versagt klassische Regression
bei individuellem Profiling?
Problem 1: Unterbestimmtheit
Ein Athlet: 4 Streckenzeiten als Zielvariablen, 6 Dimensionen als Praediktoren. Das System ist massiv unterbestimmt — OLS nicht identifizierbar.
Problem 2: Multikollinearitaet
Aerob ↔ Oekonomie: r=0.70. Anaerob ↔ Kraft: r=0.65. Klassische Regression wird numerisch instabil. VIF >> 10.
Problem 3: Stationaritaet
ADF-Test zeigt: 40% der Dimensionszeitreihen sind nicht-stationaer (φ > 0.7). Einfache Querschnittsregression ignoriert Zeitstruktur.
Loesung: Hierarchisches Bayes + State-Space
Prior: β | σ² ~ N(μ₀, σ² V₀) aus Populationsregression n=260 Posterior: μ_n = V_n(V₀⁻¹μ₀ + Xᵀy/σ²) konjugiert, analytisch State-Space: β_t = β_(t-1) + η_t zeitvariabel, Kalman-Filter
Kernidee: Der Populationsprior regularisiert das N=1-Problem. Mit mehr individuellen Daten loest sich der Posterior vom Prior (Shrinkage). Der State-Space-Ansatz erlaubt zeitvariable Koeffizienten.
Befund Pilotstudie: Shrinkage bei n=50 ~0.1% — Prior aus n=260 ist sehr stark. Echte Individualisierung braucht schwächeren Prior ODER mehr individuelle Daten.
Multikollinearitaet geprueft via Korrelationsmatrix (6x6). AR(1)-Koeffizienten: φ zwischen 0.58 und 0.82 je Athlet und Dimension.
Research Academy for Exercise Sciences e.V.
Das Modell-Oekosystem
3 / 5
Wissenschaft
Drei Modelle — ein Workflow
Schritt 1: Populationsregression
T_ev = β₀ + ∑ β_d * score_d + ε
OLS auf n=260. R² ≥ 0.98 fuer alle 4 Strecken. Liefert β₀ und Kovarianzmatrix Σ als Prior-Basis. Separates Modell pro Strecke.
R² 50m0.985
R² 200m0.982
σ 200m2.23 s
Schritt 2: Konjugiertes Bayes-Update
V_n = (V₀⁻¹ + XᵀX/σ²)⁻¹
μ_n = V_n(V₀⁻¹μ₀ + Xᵀy/σ²)
Normal-Normal-konjugiert. Analytisch loesbar. n=50 individuelle Punkte. Posterior-Evolution von n=1 bis n=50 verfolgt. Monte Carlo: N=10k Samples.
Shrinkage n=50~0.1%
MC-Samples10.000
Intervention+5 Score-Pkt.
Schritt 3: State-Space / Kalman-Filter
y_t = x_tᵀ β_t + ε_t
β_t = β_(t-1) + η_t
Random-Walk-Prior fuer β_t. Kalman-Filter vorwaerts, RTS-Smoother rueckwaerts. P0 = 25·P0_pop (vager Prior). Q = 0.05·P0.
P0-Skalierung25x pop.
Q-Frakton5% von P0
Anomalie-Scorev_t / √S_t
!
Naechster Schritt: Q via EM-Algorithmus schaetzen (datengetrieben). State-Space mit zeitvariablen Messgewichten (streckenspezifische β_t separat). GLS statt OLS fuer AR(1)-Fehlerstruktur.
Alle drei Modelle implementiert in Python <200 Zeilen (numpy). Kein MCMC benoetigt dank konjugiertem Prior.
Research Academy for Exercise Sciences e.V.
Ergebnisse: β_t-Verlauf + Anomalie-Detection
4 / 5
Wissenschaft
State-Space live — NAC_0002 vs. NAC_0102
Athlet auswaehlen: Strecke:
β_t Verlauf — Smoothed (RTS) + 1SE Band
Anomalie-Score (standardisierte Innovation)
Drift β₀ → β₅₀ (Oekonomie, aktuell)
Lesehinweis: Negative Koeffizienten (Oekonomie, Anaerob) bedeuten: groesserer Score = kuerzere Zeit. Drift nach oben = Einfluss wird schwaecher.
Research Academy for Exercise Sciences e.V.
Limitierungen & Naechste Schritte
5 / 5
Wissenschaft
Was das Modell kann — und was noch nicht
Limitierungen (synthetische Daten)
1
Circularity: Zeiten aus demselben Modell generiert das den Prior speist → R² zu hoch, Shrinkage zu klein.
2
Q manuell: EM-Algorithmus wuerde Q datengetrieben schaetzen. Hier: konservative manuelle Wahl.
3
AR(1)-Fehler: Messrauschen ist autokorreliert (φ 0.58-0.82). GLS waere robuster als OLS im Populationsmodell.
4
Normalverteilung: Konjugierter Prior setzt Normalverteilung voraus. Bei echten Daten pruefen.
Naechste methodische Schritte
1
Echte Daten: Shrinkage, Q-Wahl und Beta-Drift werden mit realen Laengsschnittdaten validiert.
2
EM fuer Q: Expectation-Maximization schaetzt optimales Prozessrauschen automatisch aus den Daten.
3
Streckenspezifische β_t: Separate State-Space-Modelle pro Strecke mit geteiltem Zustandsraum.
4
Schicht 2: Wissenschaftliches Methodendokument mit vollstaendigen Herleitungen und Literatur.
Kernbefund: Das dreistufige Modell (OLS → Bayes → State-Space) ist methodisch konsistent und auf echte Daten uebertragbar. Shrinkage-Befund ist wissenschaftlich wichtig und transparent.
Implementierung: Python numpy <300 Zeilen. Kein externes Framework. Bereit fuer Erweiterung auf Stan/PyMC fuer komplexe Prior-Strukturen.
← Startseite