Verbundinformationssysteme
- Bildgebung und Radioonkologie
- DKFZ-Hector Krebsinstitut
Prof. Dr. Martin Lablans
Head of Department
Um Brücken für die biomedizinische Forschung zu bauen, leisten wir Pionierarbeit bei der Entwicklung neuer Methoden zur Lösung technischer und medizinisch-rechtlicher Probleme beim Datenaustausch. Wir schaffen Netzwerke für die gemeinsame Nutzung von Daten und Bioproben in Europa und darüber hinaus.
Unsere Forschung
Die Erschließung verteilter Daten- und Probenquellen ist daher Voraussetzung für die meisten datengetriebenen Forschungsansätze im Gesundheitswesen. Zudem bildet sie ein vielschichtiges Forschungsfeld zur Entwicklung von Infrastrukturen, die effiziente Forschung in vernetzten Verbünden auf technischer und inhaltlicher Ebene überhaupt erst möglich machen. Auch müssen regulatorische Anforderungen, die sich in der Verarbeitung sensibler Patientendaten naturgemäß ergeben, berücksichtigt werden.
In unserer Abteilung Verbundinformationssysteme untersuchen wir Probleme, die in der vernetzten medizinischen Forschung regelmäßig auftreten:
- Semantik
- Multizentrische Datenintegration aus heterogenen Quellsystemen
- Datenschutz, Einwilligungsmanagement, Record Linkage und Pseudonymisierung
- Verteilte Prozesse zur Auswertung von Daten
- Standortübergreifend vergleichbare Messung der Datenqualität
Hierfür entwickeln wir interoperable und nachnutzbare Werkzeuge. Außerdem bringen wir unsere Kenntnisse in nationalen und internationalen Forschungs- und Behandlungsverbünden zum Einsatz. Durch unsere „Brückenköpfe“ erschließen wir ein Netzwerk aus exzellenten Partnern (vgl. Abbildung).
Projekte und Netzwerke
Wir bauen Brücken zwischen Institutionen mit GDPR-konformen föderierten Datenmanagementlösungen, darunter die "Mainzelliste" für Pseudonymisierung und Datensatzverknüpfung, mehrere föderierte Suchlösungen und der "Brückenkopf" für kontrollierten Datenaustausch. Diese bilden das Rückgrat des Deutschen Krebskonsortiums (DKTK), der Datensammlung für Lungenkrebspatienten im Nationalen Netzwerk Genomische Medizin (nNGM) und des "Sample Locator", der eine föderierte Suche in 16 europäischen Biobanken (BBMRI-ERIC) ermöglicht. Als Brückenabteilung zur Universitätsmedizin Mannheim fördern wir datengetriebene Kooperationen im Rahmen des neuartigen Ansatzes des DKFZ Hector Cancer Institute zur gemeinsamen Nutzung von Daten mit der Initiative Medizinische Informatik.
Das Deutsche Konsortium für Translationale Krebsforschung (DKTK) ist eines von sechs durch das BMBF geförderten Deutschen Zentren der Gesundheitsforschung (DZG). Die standortübergreifende Vernetzung des Konsortiums wird durch die IT der Clinical Communication Platform (CCP-IT) ermöglicht, die in einer eigenen Arbeitsgruppe, bestehend aus mindestens einem Mitglied pro Partnerstandort, entwickelt wird. Daten aus Tumordokumentationen und Biomaterialbanken können unter Wahrung des Datenschutzes und der Datenhoheit für das Konsortium dank der föderierten Netzwerkarchitektur auch von Patienten vor Gründung des DKTK eingebracht werden. So werden Machbarkeitsstudien und die Rekrutierung von Studien nicht nur während, sondern auch vor ihrer Beantragung beim DKTK unterstützt.
Webseite: Clinical Communication Platform
Ziel des DKFZ -Hector Krebsinstitut an der Universitätsmedizin Mannheim ist es, durch die Bündelung von Kompetenzen im Bereich der Krebsforschung und der Krebsmedizin, den Transfer von Ergebnissen aus der onkologischen Spitzenforschung in die Patientenversorgung (Translation) und die Nutzung von Erkenntnissen aus dem klinischen Praxisalltag für die Krebsforschung (Reverse Translation) zu beschleunigen. Ein Konzept zur Übertragung von klinischen Routinendaten von Patienten an der UMM wurde in Abstimmung mit dem Data Integration Center der UMM entwickelt, automatisiert, datenschutzkonform in eine Studiendatenbank am DKFZ zu übertragen. Eine grafische Benutzeroberfläche löst die Generierung von Patientenpseudonymen am DKFZ aus und ermöglicht deren Offenlegung an einen vertrauenswürdigen Dritten (TTP) im UMM-Krankenhausnetzwerk (Hospital TTP). Diese „Verknüpfung“ zwischen dem DKFZ und der UMM dient als rechtliche Grundlage und Nachweis für eine nachträgliche Übermittlung medizinischer Patientendaten.
Das Helmholtz-Institut für Translationale Onkologie Mainz (HI-TRON Mainz) soll am Wissenschaftsstandort Mainz als weltweit führendes Zentrum für personalisierte Krebsmedizin mit Schwerpunkt Immuntherapie etabliert werden.
Als zentraler Punkt der Einrichtung und zur Unterstützung eines nachhaltigen Datenmanagements wird das HI-TRON Mainz Data Portal entwickelt, ein Datenkatalog mit Metadaten, der Wissenschaftlern einen Überblick über potenziell verfügbare Daten und Bioproben geben soll.
Das Portal ermöglicht es Wissenschaftlern, beispielsweise nach Expressionsprofilen oder molekularen Signaturen in anderen Studien- und Tumorentitäten zu suchen. Es ermöglicht auch Cross-OMIC-Integrationen, multidimensionale Klassifikatoren mithilfe von maschinellem Lernen zu entwickeln.
Das Konsortium HiGHmed arbeitet an neuartigen, interoperablen Lösungen in der Medizininformatik mit dem Ziel, medizinische Patientendaten für klinische Forschung und Lehre zugänglich zu machen. Das Projekt bündelt und integriert die Kompetenzen von 12 führenden Universitätskliniken in Deutschland sowie weiteren Partnern aus Wissenschaft und Industrie. Der Onkologie-Anwendungsfall stellt sich der Herausforderung, enorme Datenmengen aus der Genomsequenzierung und Radiologie in die klinische Praxis zu integrieren. Ein virtuelles Onkologie-Zentrum soll den Behandlungsverlauf von Krebspatienten veranschaulichen und als Austauschplattform für Kliniken, Forschungseinrichtungen, Ärzte und Patienten dienen. Auf diese Weise können ähnliche Krebsfälle besser erkannt und eine individuelle patientenorientierte Behandlung ermöglicht werden.
Künftig sollen alle Patienten in Deutschland mit fortgeschrittenem Lungenkrebs über ein nationales Netzwerk Zugang zu molekularer Diagnostik und innovativen Therapien erhalten. Um dies umzusetzen, bündeln 15 Universitätskrebszentren ihre Kräfte im nationalen Netzwerk für Genomische Medizin (nNGM) - darunter alle Zentren des Deutschen Konsortiums für Translationale Krebsforschung (DKTK) und alle onkologischen Exzellenzzentren, die derzeit vom DKH gefördert werden. Grundlage für alle verteilten Prozesse ist eine sichere Vernetzung der Brückenköpfe der Clinical Communication Platform (CCP-IT). Diese Plattform umfasst dank ihrer Erweiterung über die Initiative Connecting Comprehensive Cancer Centers (C4) auch alle nNGM-Zentren.
Im Rahmen der German Biobanking Alliance erstellt ein verteiltes Team von 20 Informatikern eine IT-Plattform für den Austausch von Bioproben, um große, multizentrische Probensammlungen für Forschungsprojekte zusammenzustellen. Hier sind die Biobanken sowohl innerhalb des deutschen Konsortiums als auch mit internationalen Biobank-Infrastrukturen wie dem BBMRI-ERIC vernetzt.
Die Deutschen Zentren der Gesundheitsforschung (DZG) suchen nach neuen Therapien für Diabetes, Infektionen, Lungenkrankheiten, Krebs, Herz-Kreislauf- sowie neurodegenerative und psychische Krankheiten. Unsere Abteilung vertritt das Deutsche Konsortium für Translationale Krebsforschung (DKTK) in der DZG übergreifenden Arbeitsgruppe Forschungs-IT.
Die Pan-European Biobank and Biomolecular Research Infrastructure (BBMRI-ERIC) ist eine verteilte biomedizinische und biowissenschaftliche Struktur für die nachhaltige Lagerung und Verbreitung von Biobankproben und verwandten Daten in Europa. Das BBMRI-Eric bietet Zugang zu den Biobank- und biomolekularen Ressourcen und deren Expertise und Dienstleistungen.
Cancer Core Europe ist ein Zusammenschluss von sieben führenden Krebszentren aus Europa. Es wurde 2014 gegründet, um die Entwicklung innovativer Krebstherapien durch enge Zusammenarbeit in der translationalen und klinischen Forschung zu beschleunigen. Eine der vier Hauptsäulen ist das VDC (Virtual Data Centre), das diese Vision durch Datenaustausch ermöglicht. Der in unserer Abteilung entwickelte Brückenkopf ermöglicht den Datenaustausch zwischen den teilnehmenden Standorten. Gestartet wurde mit 4 Piloten ( Gustave Roussy (Frankreich), Karolinska Institutet (Schweden), Vall d'Hebron Institute of Oncology (Spanien) und Netherlands Cancer Institute (Niederlande). Ein umfassendes Datenschutzkopnzept, das zusammen mit den Datenschutzbeauftragten der beteiligten Einrichtungen entwickelt wird, bildet die Grundlage für die Nutzung von Patientendaten.
Die European Cancer Imaging Initiative (EUCAIM) verbindet Forschungseinrichtungen, Gesundheitsdienstleister und kommerzielle Innovatoren aus derzeit 12 Ländern in ganz Europa. EUCAIM bietet eine interoperable, datenschutzkonforme und sichere Infrastruktur für die Durchführung einer föderierten, verteilten Analyse von annotierten, anonymisierten Krebsbilddaten. Wir entwickeln das föderierte Erkundungssystem von EUCAIM auf der Grundlage von Samply.Lens und Samply.Beam.
Ziel dieses Projekts im Rahmen der ITCC pediatric cancer data portal Initiative ist es, eine nachhaltige Lösung für die systematische Priorisierung neuer Krebstherapien für Kinder in Europa und weltweit durch bessere Nutzung vorhandener molekularer und klinischer Daten zu etablieren und damit Kindern mit bisher unheilbaren Krebserkrankungen eine neue Chance zu bieten. Metadatenharmonisierung und Datenverknüpfung sind hierfür unerlässlich. Die Hopp-ITCC International Data Integration Platform wird dazu beitragen, die Entwicklung von Krebsmedikamenten für Kinder und Jugendliche mit Krebs im neuen regulatorischen Umfeld zu priorisieren.
Technische Teams werden zusammen mit Klinikern im gesamten Konsortium ein gemeinsames Datenmodell (CDM) auf zwei Ebenen definieren: Erstens dient ein kleinerer Satz gemeinsamer Datenelemente (CDE), der von den meisten oder sogar allen Datenquellen gemeinsam genutzt wird, dem Suchen, Visualisieren und Abfragen von Daten über alle verbundenen Partnerstandorte hinweg. Zweitens wird dieser Datensatz für die Datenintegration, die spezifische Forschungsfragen adressieren, durch projektspezifische größere Datensätze ergänzt. Für diesen zweiten Schritt werden gemeinsame Trajektorien wissenschaftlicher Fragestellungen zwischen den Hauptbereichen der biologischen Grundlagenforschung, der klinisch-biologischen translationalen Forschung und klinischen Studien definiert.
Am Beispiel des Darmkrebses zielt das onkoFDZ-Projekt darauf ab, Daten aus sieben Krebsregistern mit anderen gesundheitsbezogenen medizinischen Daten wie Begleiterkrankungen, Therapien oder Links zu Studiendaten zu kombinieren. Anschließend sollen KI-Methoden wie maschinelles Lernen eingesetzt werden, um den Einsatz und die Wirksamkeit verschiedener Therapien zu erfassen und die Ergebnisse der durchgeführten Analysen für Zielgruppen, Behandlungsanbieter und die Öffentlichkeit nutzbar zu machen.
Unsere Software-Tools
Über Konzepte und Prototypen hinaus entwickeln wir unsere Methoden routinemäßig zu produktionsreifen Software-Tools weiter, die wir – als starke Befürworter von freier Open-Source-Software (FOSS) – unter FOSS-Lizenzen auf GitHub u.a. veröffentlichen.
Seit 2013 werden Brückenköpfe als Betriebssystem eingesetzt, um eine sichere Datenarbeit zu gewährleisten, die gleichzeitig heterogen und verteilt ist.
Open Source: https://github.com/samply/bridgehead
Diese Technologie ermöglicht:
- Die Erforschung und Analyse von über 600.000 Patienten und über 280.000 Bioproben
- Verknüpfung von Forschungsdaten mit Daten aus der klinischen Routineversorgung in der Universitätsmedizin
- Verbesserung der Verfügbarkeit von molekularen Therapien
- Auffindung ähnlicher Patienten auf der Grundlage molekularer Marker
- Multinationale Zusammenarbeit zwischen Studiennetzwerken
- Verbesserte Zugänglichkeit von Bioproben und zugehörigen klinischen Daten
- Verknüpfung von Patientenakten über Institutionen hinweg ohne Weitergabe sensibler Daten
- Harmonisierung der Datenschutzbestimmungen und Forschungsbedürfnisse
- Semantisch interoperabler Datenaustausch in der Onkologie
Die Mainzelliste ist ein webbasierter Pseudonymisierungsdienst und wurde als Nachfolger des PID-Generators der TMF e.V. entwickelt.
Open Source: https://bitbucket.org/medicalinformatics/mainzelliste
Sie erlaubt die Erzeugung von Personenidentifikatoren (PID) aus identifizierenden Attributen (IDAT), dank Record-Linkage-Funktionalität auch bei wechselnder Qualität identifizierender Daten. Ihre Funktionen werden über eine REST-Schnittstelle bereitgestellt, die besonders flexible Integration durch andere Software ermöglicht.
Samply.Lens ist eine leistungsstarke Webanwendung, die speziell für die effiziente und flexible Exploration föderierter Daten entwickelt wurde.
Open Source: https://github.com/samply/lens
Mit einem Fokus auf Performance, Interoperabilität und Benutzerfreundlichkeit bietet Samply.Lens innovative Funktionen, die die Datenauffindbarkeit für Forschende verbessern und leichtgewichtige Analysen sowie oberflächliche Datenerkundungen ermöglichen.
Samply.Lens wird bereits in verschiedenen Projekten erfolgreich eingesetzt:
- DKTK
- DKTK Joint Funding EXLIQUID
- HiGHMED Use-Case Oncology
- BBMRI
- EUCAIM
TransFAIR dient der Datenintegration in medizinischen Einrichtungen und erleichtert den ETL-Prozess : die Extraktion aus Quellsystemen, die Transformation in Zielschemata und das Laden in das Zielsystem.
Open Source: https://github.com/samply/transFAIR
TransFAIR ist darauf ausgelegt besonders den Aufwand der Datenintegration für die Standorte zu minimieren, die an mehrere Netzwerke angeschlossen sind. Durch die Unterstützung von neuen Datensatz-/Mapping-Definitionen lassen diese sich leicht erweitern und somit wird die Einführung neuer Funktionen und Datensatzerweiterungen beschleunigt. Die Datenqualität wird verbessert, da Fehler in den TransFAIR-Zuordnungen zentral behoben werden können.
Samply.Beam ist für eine effiziente und sichere Netzwerkkommunikation in sehr restriktiven Netzwerkumgebungen konzipiert. Als verteiltes Task-Broker-System ermöglicht sie die am häufigsten verwendeten Kommunikationsmuster in praktisch allen Netzwerken, insbesondere in solchen, die restriktive Firewall-Regeln und exotische Proxy-Server verwenden.
Open Source: https://github.com/samply/beam
Geschrieben in Rust, verfolgt es Leistung, Robustheit und Sicherheit als primäre Designziele, bietet Ende-zu-Ende-Verschlüsselung und Signaturen sowie eine optimierte Zertifikatsverwaltung auf der Grundlage einer einfach zu verwendenden REST-API. Im Gegensatz zu früheren Middlewares ist Beam besser für restriktive Netzwerkeinstellungen geeignet und kann die von vielen SMPC-Frameworks geforderte Kommunikation mit hoher Bandbreite und niedriger Latenz bewältigen.
Blaze ist ein spezialisierter Datenbankserver für die Verwaltung und Analyse medizinischer Daten. Er implementiert die HL7 FHIR-Spezifikation, einen international anerkannten und weit verbreiteten Standard für den Austausch und die Speicherung von medizinischen Daten.
Open Source: https://github.com/samply/blaze
Blaze „spricht“ die HL7-FHIR-Sprache, so dass er Daten speichern und abfragen kann, die nach diesem Standard strukturiert sind. Zusätzlich zur FHIR-Suche unterstützt Blaze auch Abfragen mit der Clinical Quality Language (CQL). CQL ist eine von HL7 standardisierte, domänenspezifische Sprache, die dazu dient, klinische Entscheidungslogik und Qualitätsmessungen in einer für Menschen lesbaren, computergestützten Weise auszudrücken.
Ein besonderes Merkmal des Blaze Servers ist seine spezielle Ausrichtung auf medizinische Anwendungen. Es ist erwähnenswert, dass Blaze keine Benutzeroberfläche hat, sondern als Hintergrundprogramm arbeitet.
oBDS2FHIR ist eine spezialisierte ETL-Lösung (Extract, Transform, Load) zur automatisierten Umwandlung des Onkologischen Basisdatensatzes (oBDS) in das FHIR-Format. Das Tool ermöglicht es deutschen Universitätskliniken, ihre onkologischen Registerdaten effizient in Forschungsnetzwerke einzubringen, ohne eigene ETL-Prozesse entwickeln zu müssen.
Open Source: https://github.com/samply/obds2fhir
Die Forschungsdatenintegration geht über eine rein technische Konvertierung hinaus (vgl. Samply.TransFair). Einerseits wird ein forschungsorientiertes Modell aus der Tumordokumentation abgeleitet. Andererseits werden die Daten harmonisiert und inhaltlich abgestimmt, da der oBDS zwar als Standard definiert ist, in der Praxis jedoch uneinheitlich angewendet und unterschiedlich interpretiert wird. Dies geschieht unter Berücksichtigung der realen Unterschiede in den Tumordokumentationen deutscher Universitätskliniken, um eine vergleichbare Datenbasis zu schaffen.
Der EpiSelector ist eine webbasierte Anwendung, die die Auswahl von Vergleichsgruppen durch Matching unterstützt. Der EpiSelector wurde für medizinische Forscher konzipiert, die über unterschiedliche Vorkenntnisse im Bereich Matching verfügen. Er ermöglicht eine transparente und reproduzierbare Selektion der Vergleichsgruppen und stellt während des gesamten Matching-Prozesses schrittweise Anleitungen und Empfehlungen bereit.
Der EpiSelector ist in Kombination mit anderen (data preprocessing) Komponenten anwendbar und wird in naher Zukunft als Prototyp in einem Docker-Container verfügbar sein:
OpenSource: https://github.com/samply/EpiSelector
Team
In unserem Team entwickeln und betreiben wir nationale IT-Infrastrukturen für den sicheren Austausch von Patientendaten etwa zwischen den Universitätskliniken im Deutschen Konsortium für Translationale Krebsforschung, Biomaterialbanken der German Biobank Alliance oder im nationalen Netzwerk Genomische Medizin. Als Brückenabteilung zwischen dem DKFZ und der Universitätsmedizin Mannheim unterstützen wir exzellentes ärztliches und wissenschaftliches Personal bei der Übertragung neuartiger Krebstherapien in die praktische Anwendung.
-
Prof. Dr. Martin Lablans
Head of Department
-
Nabe Al Hasnawi
-
Moanes Ben Amor
-
Torben Brenner
-
Dr. David Croft
-
Pierre Delpy
-
Leandro Ariel Doctors Lopez
-
Adrian Estevez
-
Claudia Funke
Scientific Project Coordination/Assistance
-
Dennis Grimm
-
Lena Grimm
Assistance
-
Defne Halici
-
Mats Johansen
-
David Juarez Guajardo-Fajardo
-
Martin Jurk
-
Jori Kern
-
Paola Klein
-
Enola Knezevic
-
Thomas Köhler
-
Denis Köther
-
Dr. Eva Krieghoff-Henning
-
Dr. Tobias Kussel
-
Mohamed Lambarki
-
Thewind Mom
-
Valerie Sauer
-
Dr. Esther Schmidt
Deputy Head of Department
-
Tim Schumacher
-
Emil Daniel Simes
-
Jan Skiba
-
Patrick Skowronek
-
Dr. Monique Stenzel
-
Galina Tremper
-
Manoj Waikar
Publikationen
Wir danken unseren Förderern: