Logo

Arbeitsgemeinschaft Deutscher Tumorzentren e.V.

Netzwerk für Versorgung, Qualität und Forschung in der Onkologie

Kontakt
LinkIn Profil

Bild

Krebsforschungsdatenzentrum - KI-gestützte Evidenzgenerierung aus versorgungsnahen Daten Klinischer Krebsregister, GKV-Routinedaten, Klinikdaten und deren Linkage (onkoFDZ)

Bild

 

Projekt-Motivation und Ziele

Randomisierte kontrollierte Studien (RCTs) gelten als Goldstandard der medizinischen Forschung.
Allerdings sind RCTs entweder nur begrenzt oder sogar gänzlich ungeeignet, um bestimmte Fragestellungen
zu untersuchen. Dies bedeutet, dass wichtige Erkenntnisse zur Wirksamkeit neuer Operationstechniken und
Vergleiche zwischen verschiedenen Behandlungsmethoden fehlen.

Dementsprechend sind die Leitlinienprogramme bei spezifischen Fragestellungen lediglich limitiert fähig,
evidenzbasierte Empfehlungen zur Behandlung von Patientinnen und Patienten zu formulieren.
Dabei stellen ebendiese Leitlinien eine bedeutende Entscheidungshilfe für Ärztinnen und Ärzte bereit, um eine Behandlung, die auf aktuellen wissenschaftlichen Erkenntnissen basiert, zu ermöglichen.
Die Datensammlungen der Klinischen Krebsregister (KKR), der zertifizierten Zentren der Deutschen Krebsgesellschaft, der onkologischen Spitzenzentren und der gesetzlichen Krankenkassen haben das Potenzial, zu hochwertigen Erkenntnissen bei spezifischen therapierelevanten Fragestellungen beizutragen und somit die Studienlage zu erweitern.

In diesem Projekt soll geprüft werden, wie solche Evidenzlücken unter Nutzung versorgungsnaher Daten (VeDa) geschlossen werden können. Der Fokus liegt dabei auf der Weiterentwicklung und Pilotierung von Verfahren zum datenschutzkonformen Linkage sowie der Nutzung und Auswertung von verlinkten Daten mit statistischen und KI-gestützten Methoden.

 

Methodik

Um anlassbezogen die für dieses Projekt vorgesehenen, verschiedenen dezentral vorliegenden Daten
(Daten Klinischer Krebsregister, Abrechnungsdaten Gesetzlicher Krankenkassen, Daten der DKTK-Standorte, OncoBox-Daten) zu verknüpfen, bedarf es eines Verfahrens, das auch in geschützten Umgebungen, wie klinischen Krebsregistern, anwendbar ist. Gemeinsam mit den datenhaltenden Projektpartnern wurde das Secure Multi-Party Computation – Privacy-Preserving Record Linkage (SMPC-PPRL) als die sicherste und am besten geeignete Methode für den vorliegenden Anwendungskontext bewertet.

Für die Auswertung soll neben klassischen statistischen Verfahren auch maschinelles Lernen genutzt werden, um den Einsatz und die Wirksamkeit von verschiedenen Behandlungen zu erfassen und die Ergebnisse der durchgeführten Analysen für Leitliniengruppen, Behandelnde und die Öffentlichkeit nutzbar zu machen.
Vorrangig sollen solche Fragestellungen bearbeitet werden, für die die S3-Leitlinie „Kolorektales Karzinom“ derzeit keine oder keine evidenzbasierten Empfehlungen geben kann. Dafür wurden in engem Austausch mit Expertinnen und Experten sechs Use Cases formuliert.

 

Perspektiven für die Praxis

Die im Projekt gewonnenen Erfahrungen sowie die entwickelten Werkzeuge bieten perspektivisch einen bedeutenden Mehrwert für die zukünftige Versorgungsstruktur von Krebspatienten und Krebspatientinnen Die Ergebnisse leisten einen wichtigen Beitrag zur Bereitstellung der im Vorhaben konzipierten Verfahren zur Datenharmonisierung und -integration für künftige Anwendungen. Darüber hinaus können sie als methodisches Fundament für den Aufbau zukünftiger Forschungsinfrastrukturen in der deutschen Krebsforschung dienen.
Die eingesetzten KI-gestützten Analysen haben Pilotcharakter für vergleichbare Fragestellungen und sollen zur vertieften Erkenntnis über die Wirksamkeit verschiedener Therapieansätze beitragen.
Evidenzbasierte Empfehlungen sind eine wesentliche Voraussetzung für eine zukünftig noch bessere medizinische Versorgung von an Krebs erkrankten Patientinnen und Patienten.

 

Projektlaufzeit

01.09.2022 bis 31.08.2025

 

Förderung

Das Projekt Krebsforschungsdatenzentrum wird vom Bundesministerium für Gesundheit im Handlungsfeld „Digitalisierung“, Forschungsschwerpunkt „Krebsregisterdaten zusammenführen und intelligent nutzen“ gefördert 

(Förderkennzeichen: ZMI5-2522DAT14A-O).

 

Universitätsklinikum und Medizinische Fakultät Carl Gustav Carus an der TU Dresden, Zentrum für Evidenzbasierte Gesundheitsversorgung (ZEGV) 

Arbeitsgemeinschaft Deutscher Tumorzentren e.V. 

  • Zentrum für Evidenzbasierte Gesundheitsversorgung (ZEGV) der Medizinischen Fakultät der TU Dresden und des Universitätsklinikums Carl Gustav Carus Dresden
  • Arbeitsgemeinschaft Deutscher Tumorzentren e.V. (ADT)
  • Johann Wolfgang-Goethe-Universität Frankfurt
  • Deutsches Krebsforschungszentrum (DKfZ)
  • Tumorzentrum Regensburg der Universität Regensburg
  • Arbeitsgemeinschaft Deutscher Darmkrebszentren (addz e.V.)
  • Klinisches Krebsregister Dresden
  • Klinisches Krebsregister Leipzig
  • Klinisches Krebsregister Zwickau
  • Klinisches Krebsregister Chemnitz
  • Klinisches Krebsregister für Brandenburg und Berlin gGmbH
  • Hessisches Krebsregister
  • Deutsche Krebsgesellschaft e.V. (DKG e.V.)
  • OnkoZert
  • Universitätsklinikum Freiburg, Institut für Medizinische Bioinformation und Systemmedizin 
  • AOK PLUS – Die Gesundheitskasse für Sachsen und Thüringen
  • AOK Bayern
  • Nationale Centrum für Tumorerkrankungen Dresden (NCT/UCC)
  • Robert Koch-Institut
  • Deutsche ILCO e.V.

Das Verbundprojekt Krebsforschungsdatenzentrum (onkoFDZ) ist im September 2022 gestartet und wird vom Bundesministerium für Gesundheit (BMG) im Bereich "Ressortforschung im Handlungsfeld ‚Digitalisierung‘, Forschungsschwerpunkt ‚Krebsregisterdaten zusammenführen und intelligent nutzen‘" gefördert.

 

Unter der Leitung der Arbeitsgemeinschaft Deutscher Tumorzentren e.V. (ADT) und des Zentrums für Evidenzbasierte Gesundheitsversorgung (ZEGV) der Hochschulmedizin Dresden arbeiten 15 Partner zusammen, um mit Hilfe integrierter Daten aus klinischen Krebsregistern und anderen versorgungsnahen Daten hochwertige klinische Evidenz in der Onkologie zu generieren.

 

Es gibt medizinische Fragestellungen, die nicht oder nur schwer mithilfe randomisierter kontrollierter Studien (RCT) beantwortet werden können. Damit bestehen häufig Evidenzlücken bezüglich besonderer Gruppen von zu behandelnden Personen (z.B. Hochbetagte) oder auch für einige komplexe Interventionen, da diese häufig nicht in RCTs adressiert werden bzw. werden können. Diese Evidenzlücken bedingen letztlich auch höhere Unsicherheiten in Leitlinienempfehlungen.

 

In diesem Projekt soll geprüft werden, wie solche Evidenzlücken unter Nutzung versorgungsnaher Daten (VeDa) geschlossen werden können. Dafür sollen dezentral vorliegende Versorgungsdaten aus vier verschiedenen Datenquellen miteinander verknüpft werden (Daten Klinischer Krebsregister, Abrechnungsdaten Gesetzlicher Krankenkassen, Daten der DKTK-Standorte, OncoBox-Daten).

 

Um anlassbezogen verschiedene dezentral vorliegende Daten zu verknüpfen, bedarf es eines Verfahrens, das auch in hochsicheren Umgebungen, wie klinischen Krebsregistern, anwendbar ist. . Im Projekt wurde gemeinsam mit den Projektpartnern das Secure Multi-Party Computation – Privacy-Preserving Record Linkage (SMPC-PPRL) als die sicherste und am besten geeignete Methode für den vorliegenden Anwendungskontext bewertet.

 

Beim SMPC-PPRL wird eine Person (Patientin/Patient) durch mehrere "geheime Anteile" repräsentiert. Diese geheimen Anteile werden auf verschiedene Parteien (z. B. Institutionen), verteilt, sodass keine Partei allein über vollständige Informationen verfügt. Wenn ein geheimer Anteil bei der ursprünglichen Partei verbleibt, können die sensiblen Daten selbst dann nicht aufgedeckt werden, wenn alle anderen Parteien böswillig zusammenarbeiten würden. Wenn zwei Parteien prüfen möchten, ob dieselbe Person in ihren Daten vorliegt, können sie dies tun, ohne Daten preiszugeben. Die geheimen Anteile werden in einem Kryptografischen Protokoll ohne zwischenzeitliche Offenlegung verarbeitet um einen „Ähnlichkeitswert“ aller Personen miteinander zu berechnen. Ist dieser hinreichend hochwissen beide Parteien, dass es sich um dieselbe Person handelt, ohne deren Identität offenlegen zu müssen.

 

Der Argumentation des CORD-MI-Rechtsgutachtens[1] folgend, findet bei der korrekten Einbettung des SMPC-Verfahrens in das Projekt beim SMPC-PPRL keine Datenübermittlung im Sinne der DSGVO statt, da personenbezogene Daten die datenspeichernde Einrichtung nicht verlassen. An die Linkagestelle (ADT-Vertrauensstelle) wird statt identifizierender Angaben lediglich das aus dem SMPC-Linkage ermittelte Pseudonym zusammen mit den angeforderten medizinischen Daten übermittelt. Nach der Verknüpfung in der ADT-Vertrauensstelle wird die Linkage-Information entfernt, sodass die Analysestellen nur einen für den Datenumfang bestmöglich anonymisierten Datensatz (faktisch anonym) erhalten.

 

In einem Proof of Concept mit künstlich erzeugten Daten konnte bereits gezeigt werden, dass es möglich ist, die technischen Voraussetzungen für ein sicheres SMPC-PPRL nach der früheren Pilotierung in Kliniknetzwerken[2] auch in hochsicheren Umgebungen wie Krebsregistern mit speziellen Schutzmaßnahmen und Firewalls anwendungsbereit zu implementieren.

 

Am 9. Dezember 2024 wurde erfolgreich ein SMPC-PPRL zwischen dem Tumorzentrum Regensburg und dem Deutschen Krebsforschungszentrum (DKFZ) durchgeführt. Diese Pilotierung auf Basis künstlicher Daten erfolgte somit erstmals in der hochsicheren Umgebung einer datenhaltenden Einrichtung. Dabei wurden bestehende Übereinstimmungen zwischen den beteiligten Parteien erfasst, ohne jedoch im Anschluss eine Linkage-ID zu generieren. Ein weiterer erfolgreicher Testlauf fand am 19. Dezember 2024 statt, diesmal zwischen dem Tumorzentrum Regensburg und dem Krebsregister Berlin/Brandenburg – ebenfalls mit künstlichen Daten.

 

Durch die gezielten Anpassungen der Software, die aus den beiden Testläufen resultierten, wird es in den weiteren Tests nun auch möglich sein, eine Linkage-ID zu generieren. Aktuell sind weitere Pilotierungen in einem zusätzlichen Krebsregister sowie in einem zertifizierten Zentrum geplant, ebenfalls mit künstlichen Daten. Die bisherigen Tests haben aber bereits eindrucksvoll demonstriert, dass einer sicheren und datenschutzkonformen Nutzung von SMPC-PPRL für den Abgleich realer Daten von Patientinnen und Patienten in hochsicheren Umgebungen nichts mehr im Wege steht. Das Verfahren bietet eine innovative Lösung, um sensible Gesundheitsdaten über verschiedene Institutionen hinweg sicher und datenschutzfreundlich zu verknüpfen, ohne dass vertrauliche Informationen offengelegt werden.

 

[1] K. Schneider (Vogel und Partner), „Secure Multi-Party Computation – Grundlegende datenschutzrechtliche Einordnung“, Gutachten, unveröffentlicht. 2021.

 

[1]K. Schneider und N. Wiedemann (Vogel und Partner), „Secure Multi-Party Computation – Datenschutzrechtliche Einordnung von Verfahren zu sicheren Summen- und Schnittmengenberechnung“, Gutachten, unveröffentlicht. 2022.

 

[2]Kussel, T., Brenner, T., Tremper, G. et al. Record linkage based patient intersection cardinality for rare disease studies using Mainzelliste and secure multi-party computation. J Transl Med 20, 458 (2022). https://doi.org/10.1186/s12967-022-03671-6

 

Bild

Förderkennzeichen: ZMI5-2522DAT14A-O