Diagnostische Leistungsfähigkeit künstlicher Intelligenz zur Entscheidungsunterstützung bei Hauttumoren in klinischen Alltagssituationen
Einleitung
In den letzten Jahren hat künstliche Intelligenz (KI) beispiellose Aufmerksamkeit erfahren und wird in vielen medizinischen Disziplinen erforscht und angewendet. Die Dermatologie, als eine visuell-morphologisch geprägte Wissenschaft, eignet sich besonders für KI-gestützte Diagnosen. KI bietet großes Potenzial für das Screening und die Diagnose von Hautkrebs. Aktuelle Studien zeigen, dass dermatologische KI-Systeme auf Basis von Deep-Learning-Algorithmen Hauttumoren auf dem Niveau von Dermatologen klassifizieren können, teilweise sogar besser als zertifizierte Fachärzte. Dies könnte die medizinische Versorgung verbessern und Ressourcenengpässe ausgleichen.
Hauttumoren, insbesondere maligne, stellen ein globales Gesundheitsproblem dar. Die Inzidenz steigt jährlich, was die Diagnosefähigkeit von Ärzten herausfordert. Obwohl die Dermoskopie die Sensitivität und Spezifität der Diagnostik erhöht, zeigt eine aktuelle Studie, dass chinesische Dermatologen in der bildgestützten Diagnostik von Hauttumoren heterogene Fähigkeiten aufweisen. Die Einführung von KI-Systemen wie der Youzhi AI-Software, die auf der chinesischen Hautbilddatenbank (CSID) trainiert wurde, könnte hier Abhilfe schaffen. Das System nutzt die GoogLeNet Inception v4-Architektur und erreichte in Laborstudien eine diagnostische Genauigkeit von 91,2 % für Benignität/Malignität und 81,4 % für spezifische Entitätstypen. Die Leistung in realen klinischen Settings blieb jedoch ungeklärt.
Methoden
Ethische Genehmigung
Die Studie wurde von der Ethikkommission des China-Japan Friendship Hospital genehmigt; alle Patienten unterzeichneten eine Einverständniserklärung.
Studienpopulation
Retrospektiv wurden 2023 Patienten der Dermatologie des China-Japan Friendship Hospital (09/2017–06/2019) eingeschlossen. Ausschlusskriterien umfassten mehrdeutige Histopathologie, Nicht-Hauttumoren, unzureichende Bildqualität und Vorbehandlungen. Letztlich wurden 106 Patienten per Zufallsstichprobe aus 1438 qualifizierten Fällen ausgewählt.
Bilderfassung
Klinische und dermoskopische Bilder wurden mit dem FotoFinder medicam 1000 unter Standardbeleuchtung aufgenommen. Die Bildqualität wurde durch zertifizierte Dermatologen sichergestellt.
Studiendesign
Die Youzhi AI-Software (Version 2.2.5) analysierte klinische und dermoskopische Bilder der 106 Patienten. Die KI klassifizierte Läsionen primär als benign/malign und sekundär in 14 Subtypen. Fünf unabhängige Untersucher wiederholten die Analysen, um die Softwarestabilität zu prüfen. Parallel diagnostizierten 11 Dermatologen (4 Anfänger, 4 Fortgeschrittene, 3 Experten) die Bilder in zwei Modi: randomisierte Einzelbilder (DR-Modus) und gekoppelte klinisch-dermoskopische Bildpaare (DM-Modus). Die Ergebnisse wurden mit histopathologischen Befunden verglichen.
Statistische Analyse
Normalverteilung wurde mittels D’Agostino-Pearson-Test geprüft. Gruppenvergleiche erfolgten via t-Test, Mann-Whitney-U-Test und ANOVA. Signifikanzniveau: p < 0,05. Analysen wurden mit SPSS 20.0 und GraphPad Prism 7.0 durchgeführt.
Ergebnisse
Pathologische Typen
Unter 106 Fällen fanden sich 36 maligne/prämaligne Läsionen (4 Melanome, 5 Plattenepithelkarzinome, 24 Basalzellkarzinome, 3 aktinische Keratosen) und 70 benigne Läsionen (19 Nävi, 35 seborrhoische Keratosen, 4 Hämangiome, 6 Dermatofibrome, 6 Epidermoidzysten).
Diagnostische Genauigkeit
- KI vs. Dermatologen: Keine signifikanten Unterschiede in der Benignität/Malignität-Diagnostik (p > 0,05). Bei der Subtypklassifikation übertraf die KI-Dermoskopie (AID-DTA: 76,4 % [95 %-KI 0,7132–0,8000]) die Dermatologen im DR-Modus (63,4 % [95 %-KI 0,5513–0,7163]; p = 0,010).
- Klinische Bilder: Die KI zeigte vergleichbare Genauigkeit wie Ärzte (p > 0,05).
- Modusvergleich: Die DM-Modus-Diagnostik (73,6 % DTA) übertraf signifikant den DR-Modus (61,4 %; p = 0,022) und rein klinische Bilder (p = 0,021).
KI-Performance
Die diagnostische Genauigkeit der KI lag in realen Settings unter Laborwerten (p < 0,001), blieb jedoch stabil über fünf Messungen (ANOVA: p > 0,05). Dermoskopische Bilder wurden präziser analysiert als klinische (AID-BMA vs. AIC-BMA: p = 0,008; AID-DTA vs. AIC-DTA: p = 0,016).
Diskussion
Die Studie zeigt, dass die Youzhi AI-Software in realen klinischen Umgebungen eine vergleichbare diagnostische Genauigkeit wie Dermatologen erreicht, insbesondere bei der Subtypklassifikation via Dermoskopie. Die Kombination klinischer und dermoskopischer Bilder verbesserte die Ärzteleistung signifikant, was die Bedeutung multimodaler Diagnostik unterstreicht. Trotz reduzierter Performance gegenüber Laborbedingungen (u.a. durch weniger typische Bildmerkmale und Gerätevarianz) bietet die KI wertvolle Unterstützung, besonders für Hausärzte und Kliniken mit limitierter dermoskopischer Expertise.
Einschränkungen
Retrospektives Design, Single-Center-Daten und begrenzte Teilnehmerzahl limitieren die Generalisierbarkeit. Zukünftige multizentrische Studien mit Cloud-basierten Plattformen sollen die KI-Performance weiter validieren und optimieren.
Fazit
Die Youzhi AI-Software ist ein vielversprechendes Werkzeug zur Hauttumordiagnostik, das insbesondere in ressourcenlimitieren Settings die Diagnosegenauigkeit verbessern kann. Weitere Optimierungen der Bildverarbeitung und klinischen Integration sind erforderlich, um das Potenzial voll auszuschöpfen.
Interessenkonflikt
Die Autoren erklären keine Interessenkonflikte.
Referenzen
doi.org/10.1097/CM9.0000000000001002