Entwicklung und Validierung eines Radiomik-Modells unter Einbeziehung von maschinellem Lernen zur Identifizierung von Leberfibrose und früher Leberzirrhose
Leberfibrose (LF) und frühe Leberzirrhose (ESC) sind kritische Zustände in der Hepatologie, da sie potenziell reversible Stadien einer Lebererkrankung darstellen. Fortgeschrittene Zirrhosen sind hingegen oft irreversibel und mit schlechten klinischen Ergebnissen verbunden. Der Goldstandard zur Diagnose von LF und ESC war traditionell die Leberbiopsie, ein invasives Verfahren mit inhärenten Risiken und Limitationen. Fortschritte in quantitativen Bildgebungstechniken, insbesondere der Radiomik, ermöglichen nun nicht-invasive Diagnosemethoden. Diese Studie entwickelt und validiert ein Radiomik-Modell auf Basis diffusionsgewichteter Bildgebung (DWI) zur präzisen Identifizierung von LF und ESC.
Einführung
Leberzirrhose ist ein globales Gesundheitsproblem, insbesondere in China, wo sie signifikant zu Morbidität und Mortalität beiträgt. Zirrhose entsteht häufig durch die Progression von LF, klassifiziert nach dem METAVIR-System in Stadien F1 bis F3. ESC (F4) repräsentiert das frühe Zirrhosestadium mit erhaltener Leberfunktion. Eine frühzeitige Identifizierung ist entscheidend, da rechtzeitige Interventionen das Fortschreiten aufhalten können. Trotz ihrer Rolle als Goldstandard weist die Leberbiopsie Nachteile wie Invasivität und Probenvariabilität auf, weshalb nicht-invasive Alternativen gesucht werden.
Die Magnetresonanztomographie (MRT), insbesondere DWI, hat Potenzial zur Bewertung von Lebererkrankungen gezeigt. Radiomik extrahiert quantitative Merkmale aus Bilddaten, um Biomarker für Diagnose und Prognose zu entwickeln. Diese Studie kombiniert Radiomik und maschinelles Lernen, um ein robustes Modell zur Unterscheidung von LF und ESC mittels DWI-Daten zu erstellen.
Methoden
Studiendesign und ethische Genehmigung
Diese retrospektive Studie wurde am Shandong Cancer Hospital and Institute durchgeführt und erhielt ethische Genehmigung. Eingeschlossen wurden 369 Fälle: 108 LF-Patienten, 116 ESC-Patienten und 145 gesunde Kontrollen. Einschlusskriterien umfassten normale Lebermorphologie, pathologische Bestätigung von LF/ESC und klare Stadieneinteilung. Fälle mit pathologischer Morphologie, signifikanter Aszites oder unzureichender Bildqualität wurden ausgeschlossen.
Bildakquisition und Vorverarbeitung
Die MRT-Untersuchungen erfolgten mit einem Philips-3,0-Tesla-Scanner und einer achtkanaligen Bauch-Phased-Array-Spule. DWI-Bilder wurden mit b-Werten von 0, 400 und 800 s/mm² aufgenommen, basierend auf Vorstudien zur Informationsredundanzvermeidung. Hochaufgelöste T1-gewichtete Bilder unterstützten die Volumen-of-Interest (VOI)-Definition.
Volumen-of-Interest (VOI)-Definition
Zwei erfahrene Radiologen legten manuell VOIs im Leberparenchym mittels MIM-Maestro-Software fest. VOIs wurden in drei Segmenten (II/III, V/VI, VII) auf b = 0 s/mm²-Bildern definiert und auf andere b-Werte übertragen, um Reproduzierbarkeit zu gewährleisten.
Radiomik-Merkmalsextraktion
Mit der SlicerRadomics-Erweiterung in 3D Slicer wurden 93 Merkmale pro VOI extrahiert, kategorisiert in sechs Gruppen: Erstordnungs-Histogramme, Graustufen-Kookkurrenzmatrizen (GLCM), Graustufen-Längenlaufmatrizen (GLRLM), Graustufen-Zonenmatrizen (GLSZM), Nachbarschaftsdifferenzmatrizen (NGTDM) und Graustufen-Abhängigkeitsmatrizen (GLDM). Zur Reproduzierbarkeit wurden Intensitätswerte in 100 feste Bins diskretisiert.
Modellkonstruktion und Merkmalsauswahl
Zwei Strategien wurden verfolgt: Plan 1 umfasste ein zweistufiges Modell (Model 1: gesund vs. pathologisch; Model 2: LF vs. ESC). Plan 2 bestand aus parallelen Modellen (Model 1: gesund vs. LF; Model 2: gesund vs. ESC). Die Merkmalsauswahl erfolgte durch univariate Analyse (p < 0,1) und RELIEFF-Algorithmus (Top-3-Merkmale pro Kategorie). Ein Support-Vektor-Maschinen-Modell (SVM) mit radialer Basisfunktion wurde unter 1000-facher 10-fach-Kreuzvalidierung trainiert.
Leistungsbewertung
Die Modelle wurden anhand der Fläche unter der ROC-Kurve (AUC) und Genauigkeit evaluert. Trainings- und Validierungskohorten wurden randomisiert aufgeteilt.
Ergebnisse
Univariate Analyse und Merkmalsauswahl
Univariate Analysen identifizierten 75 bzw. 63 Merkmale für Plan 1 (Model 1/2) und 62 bzw. 59 für Plan 2. RELIEFF wählte jeweils 18 Merkmale für das Training aus.
Modellleistung
Plan 1 erreichte in der Validierungskohorte für Model 1 eine AUC von 0,948 (95%-KI: 0,903–0,993) und 89,1% Genauigkeit. Model 2 zeigte eine AUC von 0,968 (95%-KI: 0,940–0,996) und 92,6% Genauigkeit.
Plan 2 erzielte für Model 1 eine AUC von 0,857 (95%-KI: 0,808–0,906) und Model 2 0,863 (95%-KI: 0,804–0,922). Falschklassifikationen in Plan 2 führten zu niedrigeren AUC-Werten (0,774 für LF; 0,698 für ESC), was dessen klinische Eignung minderte.
Optimaler Ansatz
Plan 1 erwies sich als überlegen, da er robuste Validierungsergebnisse lieferte. Plan 2 war aufgrund von Kreuzprädiktionsfehlern weniger zuverlässig.
Diskussion
Die Studie demonstriert das Potenzial der DWI-basierten Radiomik zur nicht-invasiven Differenzierung von LF und ESC. Das Plan-1-Modell übertraf frühere gadoxetat-basierte Modelle (AUC ~0,910), vermutlich durch optimierte b-Werte und Merkmalsselektion. Die Kombination aus DWI, Radiomik und maschinellem Lernen bietet eine präzise Alternative zur Biopsie.
Limitationen und Ausblick
Retrospektives Design und fehlende ADC-Karten limitieren die Aussagekraft. Zukünftige prospektive Studien mit größeren Kohorten und klinischen Parametern (z. B. Leberenzyme) könnten die Genauigkeit weiter steigern.
Fazit
Das entwickelte Radiomik-Modell ermöglicht eine zuverlässige, nicht-invasive Diagnostik von LF und ESC mit hoher AUC und Genauigkeit. Die Integration radiomischer und maschineller Lernverfahren verspricht erhebliche Fortschritte im Management hepatologischer Erkrankungen.
doi.org/10.1097/CM9.0000000000001113