KI-gestützte axSpA-Früherkennung

Deep Learning zur Detektion von Sakroiliitis im MRT: Externe Validierung mit RAPID-axSpA und C-OPTIMISE

Ein Deep-Learning-Algorithmus erreicht eine akzeptable Übereinstimmung mit Experten-Readern bei der Detektion von Sakroiliitis im MRT – mit 70% Sensitivität und 81% Spezifität.

💡 Key Finding

Der Algorithmus zeigt 74% absolute Übereinstimmung mit Expertenlesern und könnte Nicht-Spezialisten bei der axSpA-Diagnostik unterstützen.

Studientyp
Expert Recommendation Validierungsstudie
MRT-Scans
N = 731
Journal
Ann Rheum Dis 2025

Hintergrund

Die Diagnose der axialen Spondyloarthritis (axSpA) erfordert die Beurteilung von Sakroiliakalgelenk-MRTs nach den ASAS-Kriterien von 2009. Dies setzt erhebliche Expertise voraus, was zu Verzögerungen in der Diagnostik führen kann. Künstliche Intelligenz könnte helfen, diese diagnostische Lücke zu schließen und die Früherkennung zu verbessern.

PICO

  • Population: 731 Patienten mit nr-axSpA und r-axSpA aus den RCTs RAPID-axSpA und C-OPTIMISE
  • Intervention: Deep-Learning-Algorithmus zur automatisierten Beurteilung von SI-Gelenk-MRTs
  • Comparison: Zentrale Experten-Beurteilung nach ASAS-MRT-Definition 2009
  • Outcome: Sensitivität, Spezifität, PPV, NPV, Cohen's kappa

Ergebnisse

Diagnostische Genauigkeit vs. Experten-Konsensus

Metrik Wert 95% CI
Sensitivität 70% 66% – 73%
Spezifität 81% 78% – 84%
PPV 84% 82% – 87%
NPV 64% 61% – 68%
Cohen's kappa 0.49 0.43 – 0.55
Absolute Übereinstimmung 74% 72% – 77%

Detektionsergebnisse

  • Der Algorithmus identifizierte Inflammation bei 360/731 Patienten
  • Experten-Reading fand Inflammation bei 436/731 Patienten
  • Der Algorithmus tendierte zu konservativerer (unter-)Berichterstattung

Fazit für die Praxis

Der Deep-Learning-Algorithmus erreicht eine akzeptable Detektion von Sakroiliitis gemäß ASAS-Definition 2009 in einer großen externen Validierungskohorte. Er könnte als Screening-Tool für Nicht-Experten (Radiologen ohne Rheuma-Spezialisierung, Rheumatologen ohne MRT-Expertise) dienen, ersetzt aber nicht die Expertenbeurteilung bei unklaren Fällen.

⚠️ Limitationen

Mit einem Cohen's kappa von 0.49 (moderate Übereinstimmung) und 70% Sensitivität werden ca. 30% der positiven Fälle übersehen. Der Algorithmus eignet sich als Screening-, nicht als alleiniges Diagnosetool.