banner
Nachrichtenzentrum
Unsere Mission ist die Bereitstellung außergewöhnlicher Waren, pünktlicher Lieferungen und hervorragender Kundenbetreuung.

Erklärbare ML-Modelle für einen tieferen Einblick in die Behandlungsentscheidung für lokalisierten Prostatakrebs

May 28, 2023

Scientific Reports Band 13, Artikelnummer: 11532 (2023) Diesen Artikel zitieren

390 Zugriffe

1 Altmetrisch

Details zu den Metriken

Obwohl es mehrere Entscheidungshilfen für die Behandlung von lokalisiertem Prostatakrebs (PCa) gibt, gibt es Einschränkungen in der Konsistenz und Sicherheit der bereitgestellten Informationen. Unser Ziel war es, den Behandlungsentscheidungsprozess besser zu verstehen und ein Entscheidungsvorhersagemodell zu entwickeln, das onkologische, demografische, sozioökonomische und geografische Faktoren berücksichtigt. Eingeschlossen wurden Männer, bei denen zwischen 2010 und 2015 aus der Datenbank „Surveillance, Epidemiology, and End Results Prostate with Watchful Waiting“ neu ein lokalisiertes PCa diagnostiziert wurde (n = 255.837). Wir haben zwei Vorhersagemodelle entworfen: (1) Entscheidungsvorhersage für aktive Überwachung/wachsames Abwarten (AS/WW), radikale Prostatektomie (RP) und Strahlentherapie (RT) in der gesamten Kohorte. (2) Vorhersage von AS/WW-Entscheidungen in der Kohorte mit geringem Risiko. Die Diskriminierung des Modells wurde anhand der Mehrklassenfläche unter der Kurve (AUC) bewertet. Zur Erklärung der Vorhersageergebnisse des Modells wurde ein plausibler additiver Shapley-Erklärungswert verwendet. Onkologische Variablen beeinflussten die RP-Entscheidungen am stärksten, während RT stark von geografischen Faktoren beeinflusst wurde. Das Abhängigkeitsdiagramm stellte die Merkmalsinteraktionen beim Erreichen einer Behandlungsentscheidung dar. Das Entscheidungsvorhersagemodell erreichte eine Gesamt-Multiklassen-AUC von 0,77, wohingegen 0,74 für das Modell mit geringem Risiko bestätigt wurde. Mithilfe einer großen bevölkerungsbasierten Datenbank aus der realen Welt haben wir den komplexen Entscheidungsprozess entschlüsselt und nichtlineare Merkmalsinteraktionen in lokalisierten PCa visualisiert.

Lokalisierter PCa macht mehr als 75 % der neu diagnostizierten Männer mit Prostatakrebs (PCa)1 aus und weist eine bemerkenswerte Heterogenität zwischen Tumoren und Risikogruppenvielfalt auf2; Daher werden mittlerweile verschiedene Behandlungsoptionen ohne solide Entscheidungskriterien vorgeschlagen.

Tatsächlich hat sich keine der möglichen Behandlungen – wie Beobachtung (aktive Überwachung (AS)/wachsames Abwarten (WW)), radikale Prostatektomie (RP) oder Strahlentherapie (RT) – im Hinblick auf die Krebskontrolle bei lokalisierten Tumoren als überlegen erwiesen Krankheit3, Daher basiert eine anfängliche Behandlungsentscheidung oft auf der PCa-Risikostratifizierung des Patienten und der Behandlungspräferenz von Patient und Arzt4,5. In der realen Welt ist die Entscheidungsfindung jedoch ein komplexer Prozess, der nicht nur von Krebsmerkmalen, sondern auch von verschiedenen Faktoren auf Patientenebene, auf Landes-/Kreisebene, regionaler Ebene und sozioökonomischen Faktoren beeinflusst wird6. Daher ist ein umfassender Ansatz für Patienten und Ärzte dringend erforderlich. Um dieses Problem anzugehen, gibt es mehrere Entscheidungshilfen (DAs) für lokalisierte PCa-Patienten7. Es besteht jedoch ein Mangel an Einheitlichkeit zwischen diesen Entscheidungshilfen und ihren Leistungen8.

Ein erklärbares Modell für maschinelles Lernen bietet Vorteile, indem es ein tieferes Verständnis der internen Prozesse erhält, während das Modell selbst trainiert oder Entscheidungen trifft und Ursache-Wirkungs-Beziehungen innerhalb der Eingaben und Ausgaben des Systems identifiziert9. In dieser Studie beleuchten wir den komplexen Behandlungsentscheidungsprozess bei lokalisiertem PCa mithilfe des SEER-Datensatzes (Surveillance, Epidemiology, and End Results) der Prostata mit wachsamem Warten (SEER/WW) durch ein erklärbares Modell des maschinellen Lernens. Mithilfe von Interaktionsdiagrammen mit zwei Variablen bestand unser Hauptziel darin, einen tieferen Einblick in die wichtigen Merkmale zu gewinnen, die mit jeder Behandlungsmodalität verbunden sind. Unser sekundäres Ziel war die Entwicklung eines Modells zur Vorhersage von Behandlungsentscheidungen unter Berücksichtigung allgemeiner Merkmale, einschließlich onkologischer, geografischer (Daten auf Kreisebene), demografischer und sozioökonomischer Faktoren, die in eine webbasierte Plattform zur Verwendung im klinischen Alltag integriert wurden.

Wir identifizierten 255.837 Männer mit neu diagnostiziertem lokalisiertem PCa, die die Einschluss- und Ausschlusskriterien erfüllten (ergänzende Abbildung 1). Davon unterzogen sich 26.389 (10,3 %) einer AS/WW, 86.714 (33,9 %) einer RP, 76.919 (30,8 %) einer RT und 63.815 (24,9 %) einer kombinierten anderen/unbekannten Behandlung, einschließlich Androgendeprivationstherapie (ADT). ADT und RT usw. Im Niedrigrisiko-Kohortenmodell (Patienten mit klinischem T-Stadium T1c und T2a, Gleason-Gradgruppe 1 und PSA ≤ 10 ng/ml, Alter < 80) wurden 79.633 Patienten eingeschlossen. Davon unterzogen sich 17.553 (22 %) einer AS/WW und 62.080 (78 %) anderen Behandlungen wie einer Androgenentzugstherapie oder einer fokalen Therapie.

Regionale Faktoren wie das SEER-Register, Bundesstaat/Bezirk, durchschnittliches Bildungsniveau, durchschnittliche Anzahl von Gesundheitsdienstleistern (Urologen, Radioonkologen, Hausärzte) und Gesundheitseinrichtungen zeigten korrelative Zusammenhänge (Abb. 1A). Das entscheidungsvorhersagende maschinelle Lernmodell erreichte im Testsatz eine faire Diskriminierung mit einer Gesamt-Multiklassen-AUC von 0,77 (Abb. 1B). Die am einfachsten zu unterscheidende Behandlung war AS/WW (AUC von 0,84), wohingegen die RT (AUC von 0,72) am schwierigsten zu unterscheiden war. Die RP-Behandlung zeigte eine mittlere Diskriminierungsleistung (AUC von 0,78).

(A) Korrelation zwischen kategorialen Merkmalen nach der Kendall-Methode in der gesamten Kohorte mit lokalisiertem Prostatakrebs. (B) Ein Entscheidungsvorhersagemodell, das die operative Charakteristikkurve des Empfängers und die Mehrklassenfläche unter der Kurve (AUC) der gesamten Kohorte verwendet.

Der Beitrag und die Auswirkung jedes Merkmals (gemessen anhand der SHAP-Scores) auf das gewählte Ergebnis sind in Abb. 2 dargestellt. Die Entscheidung, AS/WW durchzuführen, wurde hauptsächlich von der ISUP-Klassengruppe (GG) beeinflusst, gefolgt vom positiven Kernprozentsatz (PPC), klinisches T-Stadium, Bundesstaat/Bezirk und Jahr der Diagnose. Die Werte für RP waren Alter, ISUP GG, PSA und PPC. Für RT, ISUP GG waren Alter, Bundesland/Bezirk und Jahr der Diagnose die wichtigen Merkmale.

Diagramm der globalen Merkmalsbedeutung und Beeswarm-Diagramm unter Verwendung des SHAP-Werts für jede Behandlungsentscheidung (A) AS/WW (B) RP (C) RT in der gesamten lokalisierten Prostatakrebs-Kohorte.

Innerhalb der AS/WW-Gruppe wählten Patienten im T1c-Stadium mit niedrigem PPC AS/WW, während Patienten im T2-Stadium bei hohem PPC eher AS/WW wählten. In ähnlicher Weise zeigten Gruppen mit einem unterschiedlichen PSA-Wert (niedrig vs. hoch) für dasselbe ISUP GG unterschiedliche Entscheidungsfindungen (ergänzende Abbildung 2). In der RP-Gruppe entschieden sich die kürzlich diagnostizierten Patienten für RP, wenn der ISUP GG hoch war, wohingegen bei zuvor diagnostizierten Patienten der gegenteilige Trend auftrat (die Gruppe mit niedrigem ISUP GG entschied sich für RP). Darüber hinaus gab es einen Rassen-/ethnischen Unterschied bei den RP-Behandlungsentscheidungen, wobei weiße Männer dazu neigten, RP zu wählen, wenn der PPC hoch war, während Männer mit anderen Rassen RP mieden (ergänzende Abbildung 3). Für die RT-Gruppe zog es ISUP GG1 vor, RT nicht zu wählen, während ISUP GG2-5 RT bevorzugte. PSA war ein ausgeprägtes onkologisches Merkmal, das verschiedene Entscheidungen bezüglich der RT-Behandlung beeinflusste. Die ältere Gruppe vermied eine RT, wenn der PSA hoch war, und entschied sich stattdessen für AS/WW, während die jüngere Gruppe eine RT bevorzugte, wenn der PSA hoch war. Darüber hinaus zeigten Patienten im T1- und T2-Stadium den entgegengesetzten Trend der RT-Entscheidung für ähnliche begleitende onkologische Merkmale. Typischerweise hatte ein hoher PPC einen positiven Einfluss auf die RT-Entscheidungsfindung im T2-Stadium, jedoch einen negativen Einfluss bei Patienten im T1-Stadium (ergänzende Abbildung 4).

In der Kohorte mit geringem Risiko wurde die gleiche Korrelation beobachtet wie in der gesamten Kohorte, was eine positive Korrelation zwischen regionalen Faktoren zeigt (Abb. 3A). Das entscheidungsvorhersagende maschinelle Lernmodell erreichte eine faire Diskriminierung mit einer Gesamt-AUC der Binärklasse von 0,74 (Abb. 3B). Der wichtigste Faktor bei der AS/WW-Entscheidung war das Jahr der Diagnose, gefolgt von PPC, Bundesstaat/Bezirk, Alter, SEER-Register und Bildung (Abb. 4).

(A) Korrelation zwischen kategorialen Merkmalen nach der Kendall-Methode in einer Kohorte mit geringem Risiko. (B) Betriebscharakteristikkurve des Empfängers und Messung der Mehrklassenfläche unter der Kurve (AUC) in einem Entscheidungsvorhersagemodell mit einer Kohorte mit geringem Risiko.

Diagramm der globalen Merkmalsbedeutung und Beeswarm-Diagramm für die AS/WW-Entscheidung in einer Kohorte mit geringem Risiko unter Verwendung des SHAP-Werts.

Es gab unterschiedliche Merkmale zwischen Rassen und Ethnien. Weiße Patienten tendierten dazu, AS/WW zu wählen, wenn das Alter hoch oder die PPC niedrig war, während Patienten anderer Rasse oder ethnischer Zugehörigkeit (schwarze, hispanische, asiatische und andere) den gegenteiligen Trend zeigten. Im T1c-Stadium entschieden sich kürzlich diagnostizierte Patienten oder Patienten mit höheren PSA-Werten für AS/WW, wohingegen Patienten im T2a-Stadium aktive Behandlungen bevorzugten, wenn sie kürzlich diagnostiziert wurden oder einen niedrigeren PSA-Wert aufwiesen (ergänzende Abbildung 5).

Das Modell ist für den Patientenzugriff unter http://210.117.211.210:8501/ geöffnet (ergänzende Abbildung 6). Modellinformationen und -details sind in der Ergänzungstabelle 2 aufgeführt.

Die Faktoren, die den komplexen Entscheidungsprozess bei der Behandlung von lokalisiertem PCa beeinflussen, bleiben umstritten10, was darauf hindeutet, dass es uns immer noch an Verständnis für diese komplexen Prozesse mangelt. Auf diese Weise helfen Kliniker den Patienten gemeinsam, durch einen gemeinsamen Entscheidungsprozess die richtigen Entscheidungen zu treffen, indem sie beispielsweise Belege für die Sicherheit und den Wert jeder Behandlungsmethode liefern8 oder die Behandlungsarten informieren, die ähnlichen Männern mit ähnlichen Krebsmerkmalen angeboten werden, um eine größere Konsistenz in ihren Behandlungen zu erreichen Entscheidungen. In diesem Zusammenhang hat die Michigan Urological Surgery Improvement Collaborative (MUSIC) kürzlich ein neues Modell für maschinelles Lernen entwickelt, um Männern dabei zu helfen, vorhergesagte Behandlungsentscheidungen ähnlicher Patienten anhand eines prospektiven Registers von 7543 Männern, bei denen Prostatakrebs diagnostiziert wurde, anzuzeigen11. Allerdings war dieses Zufallswaldmodell nicht in der Lage, eindeutig zu verstehen, wie eine einzelne Entscheidung zustande kam, und es berücksichtigte keine geografischen und sozioökonomischen Unterschiede bei der Behandlungsentscheidung12.

Um diese Mängel auszugleichen, haben wir ein erklärbares maschinelles Lernmodell unter Verwendung des kürzlich veröffentlichten SEER-WW-Datensatzes (2010–2016) eingeführt, der eine neu erstellte Variable enthält, die eindeutig als „AS/WW“ definiert ist. Ein präzises Modelltraining wurde durch eine genauere Klassifizierung der Behandlungsgruppen im Vergleich zu den vorhandenen SEER-Datenbanken ermöglicht. Wir trainierten Modelle für maschinelles Lernen unter Verwendung einer breiten Palette realer Merkmale als Eingabe, darunter klinisch-pathologische Merkmale sowie Demografie, sozioökonomische Informationen und landesweite geografische Daten auf Kreisebene, einschließlich regionaler Gesundheitsressourcen, die die MUSIC Group (Michigan State-) begrenzte Kohorte) konnte nicht angesprochen werden. Normalerweise gibt es für jedes maschinelle Lernmodell einen Kompromiss zwischen Interpretierbarkeit und Genauigkeit13; Unser Modell zeigte jedoch eine Interpretierbarkeit bei vergleichbarer Modellleistung mit der MUSIC-Gruppe (AUC 0,77 vs. 0,81).

Zu den Gesamtmerkmalen des in dieser Studie entwickelten Modells für maschinelles Lernen gehörten geografische Merkmale (Bundesstaat/Bezirk und SEER-Register), die sich am stärksten auf RT-Behandlungsentscheidungen auswirkten, gefolgt von AS/WW. Dieses Ergebnis stimmt mit einer früheren Studie von Wang et al. überein. die zeigten, dass die Verfügbarkeit von RT der wichtigste Faktor für die regionale Variation ist4. Inzwischen wurde in einem früheren Artikel von Washington et al. Der Nachweis, dass der geografische Standort mit der Variation der AS/WW-Praxis6 zusammenhängt, erklärt besser die regionalen Faktoren, die AS/WW-Entscheidungen beeinflussen. Entgegen unseren Erwartungen hatten sozioökonomische Merkmale (Familienstand, Bildungsstatus, Haushaltseinkommen, Versicherung usw.) im Allgemeinen keinen Einfluss auf die Behandlungsentscheidung, mit der Ausnahme, dass bei RP-Patienten verheiratete Männer im Vergleich zu unverheirateten Männern tendenziell zu Operationen tendierten /alleinstehende Männer. Diese Wahrscheinlichkeit wird häufig bei mehreren anderen Krebsarten (Lungenkrebs, Brustkrebs usw.) beobachtet6,12,14 und Schymura et al. zeigten, dass unverheiratete Männer eher eine konservative Behandlung oder RT als RP15 wählen, was mit unseren Ergebnissen übereinstimmt.

Krebsmerkmale (ISUP GG, PPC, klinisches T-Stadium, PSA usw.) trugen im Gegensatz zu RT-Behandlungsentscheidungen erheblich zu AS/WW- oder RP-Behandlungsentscheidungen bei. Das Alter war das wichtigste Merkmal bei der aktiven Behandlungsentscheidung (an erster Stelle bei RP und an zweiter Stelle bei RT), wahrscheinlich aufgrund seiner Korrelation mit begleitenden Komorbiditäten und der Lebenserwartung16. In Übereinstimmung mit früheren Daten, die den Einfluss der ethnischen Zugehörigkeit auf PCa-Behandlungsentscheidungen mithilfe logistischer Regressionsmodelle12 belegen, beobachteten wir bei der Erstbehandlung einen Unterschied zwischen Rasse und ethnischer Zugehörigkeit. Der Einfluss auf die Gesamtleistung des Modells war jedoch relativ gering und reichte vom siebten bis zum zehnten Platz. Schließlich war das Jahr der Diagnose das wichtigste Merkmal bei der Entscheidung über AS/WW im Niedrigrisikomodell, was den aktuellen Zeittrend eines steigenden Anteils von AS/WW-Patienten zeigt17. Mit anderen Worten: Der zeitliche Trend spiegelt sich entwickelnde Beweise für AS/WW wider.

Mehrere bemerkenswerte und solide Beziehungsvisualisierungen verleihen dieser Studie weitere Tiefe. Im AS/WW-Behandlungsergebnismodell zeigten die älteren (≥ 70 Jahre) und jüngeren Altersgruppen unterschiedliche Entscheidungsprozesse. Die ältere Gruppe mit höherem onkologischen Risiko (hohes PSA oder PPC oder ISUP GG) entschied sich für AS/WW, während die jüngere Gruppe sich bei derselben Erkrankung nicht für AS/WW entschied und sich einer endgültigen Behandlung unterzog (ergänzende Abbildung 2). Dieses Ergebnis steht im Einklang mit dem Gesamtergebnis des Merkmalsbeitrags, dass das Alter das wichtigste Merkmal bei der Entscheidung über aktive Behandlungen (RP und RT) war. Darüber hinaus wurden in der älteren Altersgruppe rassische/ethnische Unterschiede beobachtet. Während ältere weiße Männer dazu neigten, AS/WW zu verfolgen, mieden andere Rassen dies weitgehend, was im Kohortenmodell mit geringem Risiko deutlicher zu erkennen war (ergänzende Abbildung 5). Dies könnte darauf hindeuten, dass weiße Männer tendenziell den Schwerpunkt auf die Behandlungsbelastung legen, während andere Rassen die Wirksamkeit/Heilung der Behandlung betonen18, insbesondere in der Gruppe mit geringem Risiko. Es war unwahrscheinlich, dass diese Patientenkohorte Fortschritte machte und möglicherweise keine radikale Behandlung erforderlich war19. Wir beobachteten auch, dass Patienten, bei denen eine hohe Tumorlast (PPC ≥ 50 %) vermutet wird, sowohl die RP- als auch die RT-Monotherapie meiden und sich für eine Androgenentzugstherapie oder eine Kombinationsbehandlung entscheiden, wenn sie von anderen onkologischen Merkmalen mit schlechter Prognose, wie z. B. einem hohen ISUP, begleitet werden GG oder hoher PSA.

Mit Hilfe der Variablenanmerkung „Jahr der Diagnose“ haben wir den zeitlichen Trend der zugehörigen Variablen visuell untersucht. Obwohl es einen Trend zu zunehmender AS/WW-Entscheidungsfindung gab, entschieden sich kürzlich diagnostizierte Patienten dafür, sich keiner AS zu unterziehen, wenn hohe ISUP- oder PPC-Werte vorlagen, was im Gegensatz zum vorherigen Zeitraum stand (ergänzende Abbildung 2), möglicherweise aufgrund der jüngsten Veröffentlichung der AS-Kriterien20. Was die aktiven Behandlungsgruppen betrifft, so tendierten Patienten mit höherem onkologischen Risiko (hoher ISUP GG, hoher PPC oder hoher PSA) aktiver dazu, sich für eine aktive Behandlung zu entscheiden, obwohl beide in letzter Zeit zurückgegangen sind, was mit früheren Daten übereinstimmt, die einen zunehmenden Trend zeigen RP in der mittleren bis hohen Risikogruppe17.

Diese Studie weist mehrere Einschränkungen auf. Erstens deckt die SEER-Datenbank nur 30 % der Krebspatienten in den USA ab, was Bedenken hinsichtlich ihrer Generalisierbarkeit aufkommen lässt. Darüber hinaus umfassen der SEER- und der Area Health Resource File (AHRF)-Datensatz nicht dieselben Patientengruppen, was zu potenziellen Problemen bei der Datenintegration führen kann. Allerdings ist die SEER-Datenbank immer noch die am besten etablierte bevölkerungsbasierte epidemiologische Kohorte, und die AHRF-Daten wurden mit den Daten auf Kreisebene, in denen die Patienten im SEER/WW-Datensatz leben, verknüpft, wobei ein Abgleichsprozess auf der Grundlage der kombinierten Bundesinformationen verwendet wurde FIPS-Codes (Processing System) für Bundesstaaten und Landkreise. Um die Genauigkeit des regionalen Abgleichs zu verbessern, wurde auch ein Jahresabgleich implementiert. Zweitens stellt das Ergebnis dieses Vorhersagemodells das Ergebnis einer komplizierten Behandlungsentscheidung dar; Daher kann es von der Entscheidungsvorhersage abweichen. Drittens blieb die potenzielle klinische Verzerrung bestehen, obwohl eine Datenvorverarbeitung durchgeführt wurde, um das Problem der Merkmalsunausgewogenheit zu verringern. Da diese Kohorte beispielsweise in der Ära des aktiven PSA-Screenings entwickelt wurde, war die Kohortenverteilung stark auf frühere Krankheitsstadien ausgerichtet. Viertens fehlte die externe Validierung. Fünftens kann es bei der Analyse des Interaktionsabhängigkeitsdiagramms nicht identifizierte Störfaktoren geben, die die Fähigkeit, zu eindeutigen Schlussfolgerungen zu gelangen, behindern. Sechstens konnten mehrere wichtige Faktoren wie Lebenserwartung, bereits bestehende Harnsymptome, genomische Daten (somatisch und/oder Keimbahn), Familiengeschichte und Arten der Krankenversicherung nicht berücksichtigt werden, da der SEER/WW-Datensatz nicht verfügbar war. Siebtens konnte bei Patienten, die in die Beobachtungsgruppe eingeordnet wurden, nicht zwischen WW und AS unterschieden werden, obwohl es sich um völlig unterschiedliche Behandlungsansätze handelt. Um dieses Problem anzugehen, verwendeten wir erklärbare Interaktionsdiagramme, um die Unterscheidung zwischen den beiden Gruppen anzunähern. Und achtens wurde die Patientenpopulation zwischen 2010 und 2016 aufgenommen, was möglicherweise die Berücksichtigung der neuesten Trends verhindert. Es kann auch einen Nachteil geben, dass bei diesen Patienten nicht die neuesten AS-Einschlusskriterien angewendet wurden. Es ist jedoch erwähnenswert, dass im ersten Jahrzehnt des Jahres 2000 ein erheblicher Konsens über die Festlegung von AS-Kriterien erzielt und als Richtlinie vorgeschlagen wurde, die nahezu den aktuellen Standards entspricht21.

Trotz dieser Einschränkungen zeigt diese Studie wichtige klinische Implikationen. Zunächst extrahierten wir mit Hilfe der erklärbaren SHAP-Methode und weiteren deskriptiven Interaktionsdiagrammen eine plausible Beschreibung jeder Behandlungsentscheidung auf orthogonale Weise, was zu einem umfassenden Verständnis und tieferen Einblicken führte. Zweitens wurde unser auf maschinellem Lernen basierendes Modell an einer großen, zeitgenössischen, ethnisch heterogenen Bevölkerung mithilfe realer Daten aus einer hochwertigen Datenbank trainiert22. Drittens wurde die potenzielle Wirksamkeit dieses Ansatzes (Entscheidungen anzubieten, die von ähnlichen Männern getroffen wurden) in einer früheren, von Patienten geleiteten Online-Community-Studie nachgewiesen, indem er Patienten dabei half, den Entscheidungsprozess zu verstehen23. Viertens wurde das Vorhersagemodell in dieser Studie im Vergleich zu einer ähnlichen Studie der MUSIC-Gruppe mit zusätzlichen nicht-onkologischen Merkmalen wie sozioökonomischen und geografischen regionalen Faktoren ausgestattet. Geografische Merkmale beeinflussten die RT-Behandlungsentscheidungen am stärksten.

Mithilfe einer großen bevölkerungsbasierten Datenbank aus der realen Welt könnten wir einen tieferen Einblick in den komplexen Entscheidungsprozess gewinnen und nichtlineare Merkmalsinteraktionen in lokalisierten PCa visualisieren.

Ergänzende Abbildung 7 bietet eine Zusammenfassung der Analyse. Der in dieser Studie verwendete experimentelle Datensatz besteht aus dem klinischen SEER/WW-Datensatz und dem regionalen County AHRF-Datensatz. Um die Klassifizierungsleistung zu verbessern, wurden Vorverarbeitungstechniken eingesetzt, um Klassenungleichgewichte zu beheben und das Vorhandensein von Ausreißern oder verrauschten Daten zu verringern. Der vorverarbeitete Datensatz wurde dann in Trainings-, Validierungs- und Testsätze unterteilt. Das Klassifizierungsmodell wurde mithilfe des Trainingssatzes iterativ trainiert, mit dem Ziel, den optimalen Algorithmus für maschinelles Lernen und die entsprechenden Hyperparameter zu identifizieren. Die Optimalität des Modells wurde mithilfe des Validierungssatzes bewertet. Schließlich wurden Modellerklärungstechniken angewendet, um Einblicke in die Bedeutung und Interaktionen von Merkmalen zu gewinnen. Der Rest dieses Abschnitts enthält detailliertere Informationen.

Für die experimentelle Analyse haben wir die folgenden zwei Datensätze verwendet: (1) den SEER/WW-Datensatz (2010–2016), der wegen fehlender Datenverarbeitung mehrfach unterstellt wurde24, und (2) den AHRF, der Daten zu variablen Gesundheitsversorgungsdaten enthält. verwandte Merkmale, wie z. B. Gesundheitsdienstleister nach Fachgebiet, Gesundheitseinrichtungen, demografische Merkmale der Bevölkerung, Einkommen und Krankenhausnutzung6. Wir haben diese beiden Datensätze zu einem endgültigen experimentellen Datensatz zusammengeführt (n = 255.837). Ergänzende Tabelle 1 zeigt die Beschriftungen, die die Entsprechung zwischen kategorialen Variablen, einschließlich nominaler Variablen, kodieren. Die anfängliche Behandlungsvariable wurde in vier Gruppen eingeteilt: AS/WW, RT, RP und andere/unbekannte Behandlungen. Wir schlossen Männer mit gleichzeitiger RP- und RT-Behandlung in die andere Behandlungsgruppe ein, da eine kleine Anzahl von RP + RT-Klassen die Verteilung der gesamten Klasse verzerren könnte. Die Niedrigrisikokohorte wurde verfeinert, um Patienten mit den klinischen T-Stadien T1c und T2a, Gleason-Gradgruppe 1 und PSA ≤ 10 ng/ml einzuschließen. Männer im Alter von > 80 Jahren wurden von der Studie ausgeschlossen, was mit einer geeigneten Patientenpopulation für AS6 übereinstimmt . Die anfänglichen Behandlungsmerkmale in der Niedrigrisikogruppe wurden in zwei Klassen umgegliedert: AS/WW (AS ​​+ WW) und andere Behandlungen (ergänzende Abbildung 1).

Der institutionelle Prüfungsausschuss des Seoul National University Hospital erachtete diese Studie als von der Prüfung und Einverständniserklärung ausgenommen, da die Patienteninformationen in diesen Datenbanken vollständig anonymisiert und öffentlich zugänglich waren.

Um das Problem der Klassenungleichheit zu umgehen, wurden Oversampling- und Undersampling-Techniken eingesetzt. MSMOTE (Modified SMOTE)25 wurde als Oversampling-Methode hauptsächlich verwendet, um die Verteilung von Minderheitsklasseninstanzen zu berücksichtigen und verrauschte Instanzen zu entfernen. Für die Unterabtastungsmethode haben wir den bearbeiteten nächsten Nachbarn (ENN)26 verwendet, der auf einem Algorithmus für den nächsten Nachbarn basiert, um Stichproben zu entfernen, deren Klasse sich im weitesten Sinne von der Mehrheitsklasse ihrer Nachbarschaft unterscheidet.

Wir teilen den Datensatz in Trainingssätze (70 %), Validierungssätze (15 %) und Testsätze (15 %) auf. Der Validierungssatz wurde für die Suche nach geeigneten Hyperparametern des Modells zugewiesen. Wir haben drei verschiedene Ensemble-Methodenmodelle auf Basis von Gradient Boosting-Entscheidungsbaumalgorithmen trainiert: eXtreme Gradient Boosting (XGBoost)27, LightGBM28 und CatBoost29, und festgestellt, dass das XGBoost-Modell in unserer experimentellen Umgebung die höchste Erklärungskraft hatte.

Nach der Anpassung des XGBoost-Modells mithilfe des Trainingssatzes wurde die Diskriminierung des Modells im Testsatz mithilfe einer Mehrklassen-Area-under-the-Curve-Messung (AUC) bewertet. Die Modellkalibrierung wurde mithilfe eines Kalibrierungsdiagramms bewertet, das die vorhergesagten Klassen für jedes Ergebnis mit den beobachteten Klassen verglich.

SHapley Additive ExPlanations (SHAP)30 erfüllt zwei Funktionen. (1) Um den Beitrag jedes Features zu den gesamten Vorhersageergebnissen des Modells zu demonstrieren, visualisieren Sie es mit der globalen Feature-Bedeutung und Beeswarm-Plots. (2) Die nichtlineare komplizierte Beziehung zwischen zwei Hauptmerkmalen mithilfe eines Streudiagramms mit bidirektionaler Abhängigkeit zu entschlüsseln und einen tieferen Einblick in den komplexen Entscheidungsprozess zu ermöglichen.

Wir haben die Proca-Webplattform (Prostate Cancer Treatment Advisor; Slogan: Freundliche Beratung von Patienten wie Ihnen) basierend auf Streamlit entwickelt, einer Open-Source-Python-Bibliothek zum Erstellen von Daten-Apps. Die Webplattform zeigt anhand der gegebenen Eingaben die anfängliche Behandlungsvorhersage für einen Patienten. Die Eingaben bestanden aus demografischen und klinischen Informationen, die während des Experiments auftauchten. Darüber hinaus stellt die Webplattform mehrere wichtige Faktoren dar, die die Vorhersage beeinflussen. Dieses Tool ermöglicht eine Vorhersage der Wahl des Patienten in einem bestimmten Szenario und schlägt daher vor, was andere Menschen gewählt haben. Hier geht es nicht darum, was jeder Patient für seinen lokalisierten PCa tun sollte.

R Version 3.6 zur Durchführung mehrerer Imputationen und statistischer Analysen zur Vervollständigung des experimentellen Datensatzes. Für den Modellalgorithmus wurden Python 3.8.10 und XGBoost 1.4.2 verwendet. Train/Test-Split, Shuffle und andere Datenvorverarbeitungsverfahren wurden mit Scikit-learn 0.24.2 durchgeführt. Smote-Varianten 0.4.0 wurden verwendet, um das Problem des Klassenungleichgewichts zu lösen. Schließlich wurde die Bibliothek shap 0.39.0 zur Modellinterpretation eingesetzt.

Die während der aktuellen Studie generierten und/oder analysierten Datensätze sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Siegel, DA, O'Neil, ME, Richards, TB, Dowling, NF & Weir, HK Inzidenz und Überleben von Prostatakrebs, nach Stadium und Rasse/ethnischer Zugehörigkeit – USA, 2001–2017. MMWR Morb. Sterblich. Wkly. Rep. 69, 1473–1480. https://doi.org/10.15585/mmwr.mm6941a1 (2020).

Artikel PubMed PubMed Central Google Scholar

Fraser, M. et al. Genomische Merkmale von lokalisiertem, nicht indolentem Prostatakrebs. Natur 541, 359–364. https://doi.org/10.1038/nature20788 (2017).

Artikel ADS CAS PubMed Google Scholar

El-Haouly, A., Dragomir, A., El-Rami, H., Liandier, F. & Lacasse, A. Behandlungsentscheidungen bei Männern mit lokalisiertem Prostatakrebs, die in einer abgelegenen Gegend leben: Ein Querschnitt, beobachtend Studie. Dürfen. Urol. Assoc. J. 15, E160–E168. https://doi.org/10.5489/cuaj.6521 (2021).

Artikel PubMed Google Scholar

Wang, EH et al. Gemeinsame Entscheidungsfindung und Einsatz von Entscheidungshilfsmitteln bei lokalisiertem Prostatakrebs: Ansichten von Radioonkologen und Urologen. JAMA-Praktikant. Med. 175, 792–799. https://doi.org/10.1001/jamainternmed.2015.63 (2015).

Artikel PubMed Google Scholar

Hoffman, KE et al. Ärztevariation bei der Behandlung von Prostatakrebs mit geringem Risiko: Eine bevölkerungsbasierte Kohortenstudie. JAMA-Praktikant. Med. 174, 1450–1459. https://doi.org/10.1001/jamainternmed.2014.3021 (2014).

Artikel PubMed PubMed Central Google Scholar

Washington, SL 3. et al. Regionale Unterschiede in der aktiven Überwachung von Prostatakrebs mit geringem Risiko in den USA. JAMA Netw. Öffnen Sie 3, e2031349. https://doi.org/10.1001/jamanetworkopen.2020.31349 (2020).

Artikel PubMed PubMed Central Google Scholar

Vromans, RD et al. Kommunikative Aspekte von Entscheidungshilfen für die Behandlung von lokalisiertem Prostatakrebs – Eine systematische Übersicht. Urol. Onkol. 37, 409–429. https://doi.org/10.1016/j.urolonc.2019.04.005 (2019).

Artikel PubMed Google Scholar

Riikonen, JM et al. Entscheidungshilfen für die Wahl des Prostatakrebs-Screenings: Eine systematische Überprüfung und Metaanalyse. JAMA-Praktikant. Med. 179, 1072–1082. https://doi.org/10.1001/jamainternmed.2019.0763 (2019).

Artikel PubMed PubMed Central Google Scholar

Linardatos, P., Papastefanopoulos, V. & Kotsiantis, S. Erklärbare KI: Ein Überblick über Methoden zur Interpretierbarkeit maschinellen Lernens. Entropie 23, 200. https://doi.org/10.3390/e23010018 (2020).

Artikel Google Scholar

Cox, J. & Amling, CL Aktuelle Entscheidungsfindung in der Prostatakrebstherapie. Curr. Meinung. Urol. 18, 275–278. https://doi.org/10.1097/MOU.0b013e3282fba5f2 (2008).

Artikel PubMed Google Scholar

Auffenberg, GB et al. askMUSIC: Nutzung eines klinischen Registers zur Entwicklung eines neuen Modells für maschinelles Lernen, um Patienten über Prostatakrebsbehandlungen zu informieren, die von ähnlichen Männern gewählt wurden. EUR. Urol. 75, 901–907. https://doi.org/10.1016/j.eururo.2018.09.050 (2019).

Artikel PubMed Google Scholar

Krupski, TL, Kwan, L., Afifi, AA & Litwin, MS Geografische und sozioökonomische Unterschiede bei der Behandlung von Prostatakrebs. J. Clin. Onkol. Rev. 23, 7881–7888. https://doi.org/10.1200/JCO.2005.08.755 (2005).

Artikel PubMed Google Scholar

Johansson, U., Sonstrod, C., Norinder, U. & Bostrom, H. Kompromiss zwischen Genauigkeit und Interpretierbarkeit für prädiktive In-Silico-Modellierung. Zukünftiges Med. Chem. 3, 647–663. https://doi.org/10.4155/fmc.11.23 (2011).

Artikel CAS PubMed Google Scholar

Harlan, LC et al. Faktoren im Zusammenhang mit der Ersttherapie bei klinisch lokalisiertem Prostatakrebs: Studie zu den Ergebnissen von Prostatakrebs. J. Natl. Krebsinst. 93, 1864–1871. https://doi.org/10.1093/jnci/93.24.1864 (2001).

Artikel CAS PubMed Google Scholar

Schymura, MJ et al. Faktoren im Zusammenhang mit der Erstbehandlung und dem Überleben bei klinisch lokalisiertem Prostatakrebs: Ergebnisse der CDC-NPCR Patterns of Care Study (PoC1). BMC Cancer 10, 152. https://doi.org/10.1186/1471-2407-10-152 (2010).

Artikel PubMed PubMed Central Google Scholar

Jeldres, C. et al. Überleben nach radikaler Prostatektomie und Strahlentherapie bei Prostatakrebs: Eine bevölkerungsbasierte Studie. Dürfen. Urol. Assoc. J. 3, 13–21 (2009).

PubMed PubMed Central Google Scholar

Gray, PJ, Lin, CC, Cooperberg, MR, Jemal, A. & Efstathiou, JA Zeitliche Trends und die Auswirkungen von Rasse, Versicherung und sozioökonomischem Status auf die Behandlung von lokalisiertem Prostatakrebs. EUR. Urol. 71, 729–737. https://doi.org/10.1016/j.eururo.2016.08.047 (2017).

Artikel PubMed Google Scholar

Xu, J., Janisse, J., Ruterbusch, J., Ager, J. & Schwartz, KL Rassenunterschiede bei der Behandlungsentscheidung für Männer mit klinisch lokalisiertem Prostatakrebs: Eine bevölkerungsbasierte Studie. J. Rassenethn. Gesundheitliche Ungleichheiten 3, 35–45. https://doi.org/10.1007/s40615-015-0109-8 (2016).

Artikel PubMed Google Scholar

Bryant, RJ et al. Die ProtecT-Studie: Analyse der Patientenkohorte, Basisrisikostratifizierung und Krankheitsverlauf. BJU Int. 125, 506–514. https://doi.org/10.1111/bju.14987 (2020).

Artikel PubMed PubMed Central Google Scholar

Liu, JL, Patel, HD, Haney, NM, Epstein, JI & Partin, AW Fortschritte bei der Auswahl von Patienten mit Prostatakrebs für die aktive Überwachung. Nat. Rev. Urol. 18, 197–208. https://doi.org/10.1038/s41585-021-00432-w (2021).

Artikel PubMed Google Scholar

Han, CS, Parihar, JS & Kim, IY Aktive Überwachung bei Männern mit Prostatakrebs mit geringem Risiko: Aktuelle und zukünftige Herausforderungen. Bin. J. Clin. Exp. Urol. 1, 72–82 (2013).

PubMed PubMed Central Google Scholar

Lee, C. et al. Anwendung eines neuartigen Frameworks für maschinelles Lernen zur Vorhersage der spezifischen Mortalität durch nicht-metastasierten Prostatakrebs bei Männern unter Verwendung der SEER-Datenbank (Surveillance, Epidemiology, and End Results). Lanzettenziffer. Gesundheit 3, e158–e165. https://doi.org/10.1016/S2589-7500(20)30314-9 (2021).

Artikel CAS PubMed Google Scholar

Wicks, P. et al. Teilen Sie Gesundheitsdaten für bessere Ergebnisse auf PatientsLikeMe. J. Med. Internet Res. 12, e19. https://doi.org/10.2196/jmir.1549 (2010).

Artikel PubMed PubMed Central Google Scholar

Jeong, CW et al. Die neue Datenbank für Überwachung, Epidemiologie und Endergebnisse der Prostata mit wachsamem Warten: Chancen und Grenzen. EUR. Urol. 78, 335–344. https://doi.org/10.1016/j.eururo.2020.01.009 (2020).

Artikel PubMed Google Scholar

Hu, S., Liang, Y., Ma, L. & He, Y. Im Jahr 2009 Zweiter internationaler Workshop zu Informatik und Ingenieurwesen 13–17 (2009).

Wilson, DL Asymptotische Eigenschaften von Regeln für den nächsten Nachbarn unter Verwendung bearbeiteter Daten. IEEE Trans. Syst. Mann Cybern. 3, 408–421 (1972).

Artikel MathSciNet MATH Google Scholar

Friedman, JH Greedy-Funktionsnäherung: Eine Gradientenverstärkungsmaschine. Ann. Stat. 29, 1189–1232 (2001).

Artikel MathSciNet MATH Google Scholar

Ke, G. et al. Lightgbm: Ein hocheffizienter Entscheidungsbaum zur Gradientenverstärkung. Adv. Neuronale Inf. Verfahren. Syst. 30, 3146–3154 (2017).

Google Scholar

Dorogush, AV, Ershov, V. & Gulin, A. CatBoost: Gradientenverstärkung mit Unterstützung kategorialer Funktionen. arXiv-Vorabdruck arXiv:1810.11363 (2018).

Lundberg, SM & Lee, S.-I. In Proceedings of the 31st International Conference on Neural Information Processing Systems 4768–4777.

Referenzen herunterladen

Diese Studie wurde durch einen Zuschuss des Nationalen Forschungs- und Entwicklungsprogramms zur Krebsbekämpfung des Ministeriums für Gesundheit und Soziales der Republik Korea (HA17C0039) und des vom Ministerium für Gesundheit und Soziales der Republik Korea finanzierten Koordinierungszentrums für patientenzentrierte klinische Forschung unterstützt ( HI19C0481, HC19C0164), ein Zuschuss des Electronics and Telecommunications Research Institute (ETRI), finanziert von der koreanischen Regierung (22ZS1100, Core Technology Research for Self-Improving Integrated Artificial Intelligence System, und dem New Faculty Startup Fund der Seoul National University (800-20200267)) . Keiner der Sponsoren hatte Zugang zu den Daten oder Einfluss auf den Analyseplan, die Ergebnisse oder das Manuskript.

Diese Autoren trugen gleichermaßen bei: Jang Hee Han, Sungyup Lee und Chang Wook Jeong.

Abteilung für Urologie, Seoul National University Hospital, Seoul, Republik Korea

Jang Hee Han & Chang Wook Jeong

Forschungsinstitut für Elektronik und Telekommunikation (ETRI), Daejeon, Republik Korea

Sungyup Lee, Byounghwa Lee und Ock-kee Baek

Abteilung für Urologie, Helen Diller Family Comprehensive Cancer Center, University of California, San Francisco, CA, USA

Samuel L. Washington III, Annika Herlemann, Peter E. Lonergan, Peter R. Carroll, Chang Wook Jeong und Matthew R. Cooperberg

Abteilung für Epidemiologie und Biostatistik, University of California, San Francisco, CA, USA

Samuel L. Washington III und Matthew R. Cooperberg

Klinik für Urologie, Ludwig-Maximilians-Universität München, München, Deutschland

Annika Herlemann

Abteilung für Urologie, St. James's Hospital, Dublin, Irland

Peter E. Lonergan

Abteilung für Chirurgie, Trinity College, Dublin, Irland

Peter E. Lonergan

Abteilung für Urologie, Seoul National University College of Medicine, Seoul, Republik Korea

Chang Wook Jeong

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

CWJ hatte vollen Zugriff auf alle Daten der Studie und übernimmt die Verantwortung für die Integrität der Daten und die Genauigkeit der Datenanalyse. Konzept und Design: CWJ, MRC Datenerfassung, Analyse und Interpretation von Daten: Alle Autoren Erster Entwurf des Manuskripts: JHH, SL, BL, O.-kB, CWJ Kritische Überarbeitung des Manuskripts hinsichtlich wichtiger intellektueller Inhalte: Alle Autoren. Statistische Analyse: CWJ, SLW, MRC Erhaltene Finanzierung: CWJ Administrative, technische und materielle Unterstützung: PRC, MRC Aufsicht: CWJ, PRC, MRC

Korrespondenz mit Chang Wook Jeong.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Han, JH, Lee, S., Lee, B. et al. Erklärbare ML-Modelle für einen tieferen Einblick in die Behandlungsentscheidung für lokalisierten Prostatakrebs. Sci Rep 13, 11532 (2023). https://doi.org/10.1038/s41598-023-38162-1

Zitat herunterladen

Eingegangen: 21. Dezember 2022

Angenommen: 04. Juli 2023

Veröffentlicht: 17. Juli 2023

DOI: https://doi.org/10.1038/s41598-023-38162-1

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.