RAES – Wissenschaftliche Praesentation

Research Academy for Exercise Sciences e.V.

Schwimmleistung · Individuelles Profiling

1 / 5

Wissenschaft

Individualisierung der
Schwimmleistungsdiagnostik

Vom Populationsmodell zum dynamischen State-Space-Ansatz

260

Athleten (Population)

6

Pilotathleten

50

Messzeitpunkte

10k

MC-Samples

Methode 1

Populationsregression (OLS) → Koeffizienten als Bayes-Prior

Methode 2

Konjugiertes Bayes-Update → Posterior pro Athlet

Methode 3

State-Space / Kalman-Filter → zeitvariable β_t

Pilotstudie mit synthetischen Daten · Implementierung: Python (numpy, statsmodels, ruptures)

Research Academy for Exercise Sciences e.V.

Das N=1 Problem

2 / 5

Wissenschaft

Warum versagt klassische Regression
bei individuellem Profiling?

Problem 1: Unterbestimmtheit

Ein Athlet: 4 Streckenzeiten als Zielvariablen, 6 Dimensionen als Praediktoren. Das System ist massiv unterbestimmt — OLS nicht identifizierbar.

Problem 2: Multikollinearitaet

Aerob ↔ Oekonomie: r=0.70. Anaerob ↔ Kraft: r=0.65. Klassische Regression wird numerisch instabil. VIF >> 10.

Problem 3: Stationaritaet

ADF-Test zeigt: 40% der Dimensionszeitreihen sind nicht-stationaer (φ > 0.7). Einfache Querschnittsregression ignoriert Zeitstruktur.

Loesung: Hierarchisches Bayes + State-Space

Prior: β | σ² ~ N(μ₀, σ² V₀) aus Populationsregression n=260 Posterior: μ_n = V_n(V₀⁻¹μ₀ + Xᵀy/σ²) konjugiert, analytisch State-Space: β_t = β_(t-1) + η_t zeitvariabel, Kalman-Filter

Kernidee: Der Populationsprior regularisiert das N=1-Problem. Mit mehr individuellen Daten loest sich der Posterior vom Prior (Shrinkage). Der State-Space-Ansatz erlaubt zeitvariable Koeffizienten.

Befund Pilotstudie: Shrinkage bei n=50 ~0.1% — Prior aus n=260 ist sehr stark. Echte Individualisierung braucht schwächeren Prior ODER mehr individuelle Daten.

Multikollinearitaet geprueft via Korrelationsmatrix (6x6). AR(1)-Koeffizienten: φ zwischen 0.58 und 0.82 je Athlet und Dimension.

Research Academy for Exercise Sciences e.V.

Das Modell-Oekosystem

3 / 5

Wissenschaft

Drei Modelle — ein Workflow

Schritt 1: Populationsregression

T_ev = β₀ + ∑ β_d * score_d + ε

OLS auf n=260. R² ≥ 0.98 fuer alle 4 Strecken. Liefert β₀ und Kovarianzmatrix Σ als Prior-Basis. Separates Modell pro Strecke.

R² 50m0.985

R² 200m0.982

σ 200m2.23 s

Schritt 2: Konjugiertes Bayes-Update

V_n = (V₀⁻¹ + XᵀX/σ²)⁻¹
μ_n = V_n(V₀⁻¹μ₀ + Xᵀy/σ²)

Normal-Normal-konjugiert. Analytisch loesbar. n=50 individuelle Punkte. Posterior-Evolution von n=1 bis n=50 verfolgt. Monte Carlo: N=10k Samples.

Shrinkage n=50~0.1%

MC-Samples10.000

Intervention+5 Score-Pkt.

Schritt 3: State-Space / Kalman-Filter

y_t = x_tᵀ β_t + ε_t
β_t = β_(t-1) + η_t

Random-Walk-Prior fuer β_t. Kalman-Filter vorwaerts, RTS-Smoother rueckwaerts. P0 = 25·P0_pop (vager Prior). Q = 0.05·P0.

P0-Skalierung25x pop.

Q-Frakton5% von P0

Anomalie-Scorev_t / √S_t

!

Naechster Schritt: Q via EM-Algorithmus schaetzen (datengetrieben). State-Space mit zeitvariablen Messgewichten (streckenspezifische β_t separat). GLS statt OLS fuer AR(1)-Fehlerstruktur.

Alle drei Modelle implementiert in Python <200 Zeilen (numpy). Kein MCMC benoetigt dank konjugiertem Prior.

Research Academy for Exercise Sciences e.V.

Ergebnisse: β_t-Verlauf + Anomalie-Detection

4 / 5

Wissenschaft

State-Space live — NAC_0002 vs. NAC_0102

Athlet auswaehlen: Strecke:

β_t Verlauf — Smoothed (RTS) + 1SE Band

Anomalie-Score (standardisierte Innovation)

Drift β₀ → β₅₀ (Oekonomie, aktuell)

Lesehinweis: Negative Koeffizienten (Oekonomie, Anaerob) bedeuten: groesserer Score = kuerzere Zeit. Drift nach oben = Einfluss wird schwaecher.

Research Academy for Exercise Sciences e.V.

Limitierungen & Naechste Schritte

5 / 5

Wissenschaft

Was das Modell kann — und was noch nicht

Limitierungen (synthetische Daten)

1

Circularity: Zeiten aus demselben Modell generiert das den Prior speist → R² zu hoch, Shrinkage zu klein.

2

Q manuell: EM-Algorithmus wuerde Q datengetrieben schaetzen. Hier: konservative manuelle Wahl.

3

AR(1)-Fehler: Messrauschen ist autokorreliert (φ 0.58-0.82). GLS waere robuster als OLS im Populationsmodell.

4

Normalverteilung: Konjugierter Prior setzt Normalverteilung voraus. Bei echten Daten pruefen.

Naechste methodische Schritte

1

Echte Daten: Shrinkage, Q-Wahl und Beta-Drift werden mit realen Laengsschnittdaten validiert.

2

EM fuer Q: Expectation-Maximization schaetzt optimales Prozessrauschen automatisch aus den Daten.

3

Streckenspezifische β_t: Separate State-Space-Modelle pro Strecke mit geteiltem Zustandsraum.

4

Schicht 2: Wissenschaftliches Methodendokument mit vollstaendigen Herleitungen und Literatur.

Kernbefund: Das dreistufige Modell (OLS → Bayes → State-Space) ist methodisch konsistent und auf echte Daten uebertragbar. Shrinkage-Befund ist wissenschaftlich wichtig und transparent.

Implementierung: Python numpy <300 Zeilen. Kein externes Framework. Bereit fuer Erweiterung auf Stan/PyMC fuer komplexe Prior-Strukturen.