Maschinelles Lernen identifiziert genetische Merkmale von HIV-Sequenzen in Monozyten
Humane Immundefizienzvirus (HIV)-DNA wurde in zirkulierenden Monozyten von HIV-infizierten Personen mit oder ohne antiretrovirale Therapie (ART) nachgewiesen. Obwohl HIV-DNA in zirkulierenden Monozyten selten und in geringen Konzentrationen vorkommt, beherbergen diese Zellen replikationskompetentes, nicht-latentes HIV-1 bei ART-behandelten Patienten. Frühere Studien an zirkulierenden Monozyten zeigten unterschiedliche Viruspopulationen und genetische Merkmale im Vergleich zu T-Zellen. Bislang existiert jedoch keine einfache Methode, um Viruspopulationen in Monozyten klar von denen in T-Zellen zu unterscheiden.
Monozyten verbleiben nur wenige Tage im Blut, bevor sie absterben oder in Gewebe migrieren und sich zu Makrophagen differenzieren. HIV-infizierte Monozyten könnten ein wichtiger Mechanismus sein, um das Virus in Kompartimente wie das Zentralnervensystem (ZNS) oder das männliche Genitalsystem zu transportieren, wo Hinweise auf eine Kompartimentierung der Viruspopulationen vorliegen. Eine Möglichkeit ist, dass Monozyten durch makrophagentrope Viren infiziert werden, die in Gewebsmakrophagen replizieren. Die Identifizierung genetischer Determinanten von Viren in Monozyten könnte das Verständnis makrophagentroper Viren in verschiedenen anatomischen Regionen verbessern und Implikationen für die Entwicklung kurativer HIV-Strategien haben.
In Studien zu makrophagentropen Viren wurde häufig die env-Sequenz in Pseudoviren kloniert, wobei die Tropismusdefinition auf Eintritt und Replikation basierte. Diese Arbeiten zeigten, dass die Fähigkeit von Viren, unter niedriger CD4- und Corezeptor-Dichte in Makrophagen einzudringen, ein Schlüsselmerkmal ist. Mutationen im und um die CD4-Bindungsstelle des Hüllproteins (Env) wurden als entscheidend für Makrophagentropismus identifiziert, darunter die N283-Substitution in der C2-Region, die die Bindungsaffinität von gp120 an CD4 erhöht, sowie der Verlust der N-glykosylierten Stelle N386 in V4. Eine weitere wichtige Region ist die V3-Schleife, die mit der Corezeptor-Bindung assoziiert ist. Spezifisch wurden die V3-Schleifen-Substitutionen S306R und I326 mit Makrophagentropismus in Verbindung gebracht.
Maschinelles Lernen (ML) könnte ein effektives Werkzeug zur Vorhersage von HIV-Proviren im Makrophagenreservoir sein. ML-Methoden wurden bereits genutzt, um Muster in biologischen Daten zu identifizieren, darunter Corezeptorverwendung, immune Epitope und arzneimittelresistente Mutationen. In dieser Studie wurden ML-Methoden angewendet, um anhand von env-Sequenzen Viren in Monozyten von denen in T-Zellen zu unterscheiden.
Alle verfügbaren Subtyp-B-env-C2V3C3-Segmente von Patienten mit gepaarten Monozyten- und T-Zell-Proben wurden aus der Los-Alamos-HIV-Datenbank (Stand: 21. Mai 2022) bezogen. CD4+-T-Zellen und CD14+-Monozyten wurden mittels Säulenreinigung und magnetischen Antikörperperlen aus PBMCs isoliert (Reinheit: ~99%). Phylogenetische Bäume der env-Segmente wurden in MEGA X unter Verwendung des GTR+Γ+I-Substitutionsmodells erstellt. Die genetische Kompartimentierung zwischen Monozyten und T-Zellen wurde in HyPhy mittels Slatkin–Maddison-Test (SM-Test) und Hudson-Test (Snn-Test) analysiert (Signifikanzkriterium: P ≤0,01).
Die Datenanalyse erfolgte in R 4.0.2 mit dem Paket HANDPrediction. Sequenzen wurden im Verhältnis 4:1 in Trainings- und Testgruppen aufgeteilt. Jede Aminosäure wurde anhand biophysikalisch-chemischer Eigenschaften (Hydrophobie, Ladung, Polarität, Verteilung, Flexibilität) mittels AAIndex-Metriken quantifiziert. Nach Filterung verblieben 4880 Merkmale. Klassifikatoren wie Support Vector Machine (SVM), Random Forest (RF), Gradient Boosting Machine (GBM) und Extreme Gradient Boosting (XGBL/XGBT) wurden verglichen. Die Modellvalidierung erfolgte mittels zehnfacher Kreuzvalidierung.
Die Analyse umfasste 504 env-C2V3C3-Sequenzen von acht Patienten (266 aus T-Zellen, 238 aus Monozyten). Beide Tests (SM und Snn) bestätigten eine signifikante Kompartimentierung der Viruspopulationen zwischen T-Zellen und Monozyten (P <0,01). Der XGBL-Klassifikator erreichte eine mittlere Genauigkeit von 79,0 % (beste: 86,5 %) und eine Spezifität von 0,94. Für das gesamte Dataset lag die Genauigkeit bei 88,3 % (95 %-KI: 0,86–0,91).
Fünf env-C2V3C3-Merkmale (Positionen 297, 326, 335, 355, 395) waren signifikant mit Monozyten assoziiert. Die hydrophoben Eigenschaften an Position 297 (297I), 326 (326D) und 335 (335N) sowie die beta-Faltblatt-Hydrophobie an Position 355 (355G) und die Aminosäurenverteilung an Position 395 (395W/T) unterschieden sich zwischen den Gruppen (P <0,05). Ein reduziertes Modell mit diesen Merkmalen erreichte eine Genauigkeit von 73,4 % (95 %-KI: 0,69–0,77).
Frühere Studien identifizierten die V3-Schleife als kritisch für die Corezeptorvermittlung. Position 326 (I326) interagiert mit dem CXCR4-N-Terminus und ist für den Eintritt in monozytenabgeleitete Makrophagen (MDM) entscheidend. Positionen 335 und 355 (C3-Region) wurden bisher nicht im Kontext des Zelltropismus beschrieben. Die Anreicherung von 335N und 355G in Monozyten deutet auf strukturelle Anpassungen hin, die die Interaktion mit Wirtsfaktoren beeinflussen könnten.
HIV-infizierte Monozyten tragen zur Verbreitung des Virus in anatomische Sanctuary-Sites bei, wo sie sich zu Makrophagen differenzieren und als Gewebereservoire dienen. Die Identifizierung monozytenassoziierter Virusmerkmale verbessert das Verständnis der myeloischen Reservoircharakteristik und könnte neue Ansätze zur Eradikation lenken.
DOI: 10.1097/CM9.0000000000002932