Mit Data Science und Machine Learning Covid-19 bremsen

Corona mit künstlicher Intelligenz bekämpfen

Die Bedrohungen durch Sars-CoV-2, besser bekannt als „Corona-Virus“ – und die damit verbundenen Einschränkungen und Ausgangsbeschränkungen halten uns alle in Atem. Und ich frage mich: Tun wir wirklich genug, um unser Gesundheitswesen in Zeiten von drohender Überforderung – gerade der Intensiv-Kapazitäten – so effizient wie möglich zu nutzen und zu gestalten? Angesichts der sensationellen Erfolge von Künstlicher Intelligenz und Machine Learning in der Medizin erscheint mir diese Frage sehr berechtigt.  

Die meist auf künstlichen neuronalen Netzen beruhenden Algorithmen sind längst in der Lage, etwa Lungenentzündungen (1,2,3,4), aber auch Hautkrebs (5), Malaria und viele andere Krankheiten mit einer höheren, oder zumindest der gleichen Genauigkeit zu erkennen, wie die besten Spezialisten des jeweiligen Fachs. Die würden durch den Einsatz dieser Algorithmen keineswegs überflüssig – im Gegenteil: Die Ärzte hätten mehr Zeit, sich um andere Dinge zu kümmern, beispielsweise um eine bessere Aufklärung und Information der Patienten. Außerdem nähmen sie den Ärzten die Diagnose nicht ab, könnten die Mediziner jedoch sinnvoll unterstützen. Auch und gerade bei Corona-Infektionen. 

Vielleicht wundern Sie sich, warum der letzte Absatz so viele Konjunktive enthält. Tatsächlich ist die Situation paradox, zumindest in Deutschland und vielen Teilen Europas: Während Forschungseinrichtungen immer neue Rekorde bei der computergesteuerten Erkennung von Krankheiten vermelden, werden diese Modelle und Systeme in der Praxis noch viel zu wenig eingesetzt. Jedenfalls in Europa (6). Zu den Gründen dafür zählen auch unterschiedliche Anforderungen an den Datenschutz für Forschungszwecke einerseits und für den tatsächlichen Einsatz im klinischen Umfeld andererseits.  

Ganz konkret heißt das: Wer einen Algorithmus zur Erkennung von Krankheitsbildern trainieren und im Klinikbetrieb einsetzen will, braucht dazu Daten vieler hundert oder besser noch tausender Patienten. Vor allem aber braucht er laut Datenschutzgrundverordnung die eindeutige Einwilligung jedes Einzelnen dieser Patienten, dessen Daten zu nutzen. Und zwar zweckgebunden, also in diesem Fall: Zum Training eines KI- oder ML-Algorithmus und dessen Einsatz im klinischen Umfeld. Und zwar auch wenn die Daten anonymisiert werden. Allerdings sieht die DSGVO eine Ausnahme vor – nämlich, wenn ein „öffentliches Interesse“ an den Daten besteht, was in der Corona-Krise wohl außer Zweifel steht (7, 8). 

Vielleicht wundern Sie sich jetzt weiter, wieso ihr Telekommunikationsanbieter Verbindungsdaten anonymisiert verkaufen darf (9, 10). Schließlich handelt es sich dabei auch um personenbezogene, also Ihre ganz persönlichen Daten. Der Schlüssel dazu liegt in der Definition des Wortes „anonymisiert“.  

Laut der gängigen Rechtsprechung und -auslegung sind Daten nämlich nur dann tatsächlich anonymisiert, wenn diese Anonymisierung oder Verschlüsselung nicht rückgängig zu machen bzw. wieder zu entschlüsseln ist. Jedenfalls nicht durch den Anwender. Bei den Telefonanbietern ist die Sache ganz einfach: Die Unternehmen MÜSSEN die Daten nach einem halben Jahr vernichten. Und wenn es die Daten nicht mehr gibt, ist die Verschlüsselung auch nicht mehr rückgängig zu machen.  

Bei Medizindaten verbietet sich ein solches Vorgehen selbstverständlich. Und auch für das Training von neuronalen Netzen ist es notwendig, die Daten in seltenen Fällen zurückverfolgen zu können. Etwa wenn in der Fehleranalyse Zweifel aufkommen, ob etwa eine bestimmte Krankheit auf einem Blutabstrich oder einem Röntgenbild tatsächlich richtig gelabelt (also diagnostiziert) ist.  

Natürlich ist der Datenschutz wichtig – gerade und vor allem in Zeiten der Digitalisierung. Gesundheitsdaten aber können Leben retten und deshalb müssen wir einerseits den Schutz der Daten sicherstellen – andererseits aber auch ihre Möglichkeiten nutzen. Verschiedene, auch internationale Organisationen, darunter die US-Gesundheitsbehörde National Institutes of Health (NIH) (11,12), aber auch viele internationale Initiativen, wie etwa „AI for Good“ (13) oder der „Roundtable on Global Initiative and Data Commons“(14) die Auffassung, dass unsere Daten –  anonymisiert und nach strengen Standards und Sicherheitsanforderungen – ein Gemeingut sind 

Und warum auch nicht?  

Immerhin vertritt unser Gesundheitsminister die Auffassung, dass wir im Fall eines Hirntodes kein Recht an unseren Organen haben sollten, es sei denn, wir haben einer Transplantation zuvor ausdrücklich widersprochen. Soweit ist es im Bundestag nicht gekommen, stattdessen sollen die Bürger nun öfter gefragt werden, ob Sie Ihre Organe nach ihrem Tod spenden wollen.  

Wie wichtig eine ähnliche Lösung bei Daten gerade jetzt und heute wäre, zeigen die Möglichkeiten des Machine Learning. Ein Algorithmus etwa, der Corona-Infektionen auf Lungenröntgenbildern, oder auch den Aufnahmen eines Computertomographen erkennt, hätte in der Krise folgende Auswirkungen:  

  • Ärzte warten derzeit laut Medienberichten bis zu 3 Tage oder noch länger auf das Ergebnis eines Corona-Tests – jedenfalls dann, wenn Sie kein eigenes Labor zur Verfügung haben. Mit dem Algorithmus hätten sie die Möglichkeit, gerade bei Patienten mit schweren Verläufen, eine viel schnellere Diagnose zu bekommen.  
  • Im Falle überlasteter Intensiv-Kapazitäten könnten sie Patienten, die mit Covid-19 infiziert sind, gezielter isolieren – was einerseits eine Entlastung wäre und zudem die Ansteckungsgefahr in den Kliniken reduzieren würde.   
  • Der Algorithmus könnte zudem Ärzten helfen, die bislang noch nicht oder kaum mit Corona infizierten Patienten in Berührung gekommen sind – und das insbesondere beim Ausschluss von Corona-Infektionen. 
  • In einer späteren Phase könnte der Algorithmus möglicherweise auch dazu genutzt werden, Patienten zu erkennen und zu identifizieren, bei denen ein schwerer Verlauf der Infektions-Krankheit droht, was eine möglichst frühe, zielgerichtete Behandlung ermöglicht. 

Erste Forschungen auf dem Gebiet laufen auf Hochtouren. So setzen Krankenhäuser in Wuhan einen ähnlichen Algorithmus bereits ein, allerdings sind die Daten nicht öffentlich zugänglich (15, 16) – des Weiteren wäre ein Datensatz mit ausschließlich chinesischen Patienten auf Grund einer möglichen Verzerrung („Bias“) höchst problematisch. In den USA baut ein Wissenschaftler der Uni Stanford (17) zusammen mit Ärzten gerade einen öffentlich verfügbaren Datensatz auf, jedoch ist die Zahl der bislang hochgeladenen Bilder mit derzeit 105 Röntgenaufnahmen von 65 Patienten (Stand: Sonntag, 22. März 2020) viel zu klein, um einen zuverlässigen Algorithmus zu trainieren.   

In Europa gibt es derzeit meines Wissens nach noch keine vergleichbare Initiative. Die Alexander Thamm GmbH könnte so einen Algorithmus binnen kürzester Zeit programmieren, trainieren und allen interessierten Ärzten und Kliniken kostenfrei zur Verfügung stellen. Wir haben neben Hunderten industriellen Projekten im Maschinellen Lernen auch im medizinischen Bereich Erfahrungen, etwa bei   

  • der Erkennung von Lungenentzündungen auf Röntgenbildern  
  • der Identifikation von Malaria-Infektionen in Bildern von Blutabstrichen  
  • der Klassifizierung von Proteinen in Mikroskop-Aufnahmen  
  • der Erkennung der Schwere von diabetischer Retinopathie anhand von Aufnahmen des Augapfels

Um dieses Vorhaben zu verwirklichen und den Algorithmus in der angespannten Corona-Lage tatsächlich schnell zur Verfügung zu stellen, suchen wir einerseits Kontakte zu Kliniken, die uns anonymisiert Daten – also Lungenröntgenbilder oder CT-Aufnahmen zur Verfügung stellen können – und andererseits Sponsoren, die dieses Vorhaben unterstützen. Als sozial verantwortliches Unternehmen würden wir einen Teil der Kosten selbst tragen.  

Ernsthaft interessierten Sponsoren und/oder Kooperationspartnern aus der Medizinbranche stellen wir gerne eine Projektskizze zur Verfügung. Bitte wenden Sie sich dazu an:

Andreas Gillhuber (Co-CEO)
andreas.gillhuber@alexanderthamm.com

Wir würden uns sehr freuen, wenn wir in dieser Situation helfen könnten. Herzlichen Dank für Ihr Interesse und Ihre Aufmerksamkeit,
 
Alexander Thamm 
Gründer & CEO – Alexander Thamm GmbH

Quellen

  1. https://arxiv.org/pdf/1711.05225.pdf 
  2. https://www.nature.com/articles/s41746-019-0189-7 
  3. https://www.researchgate.net/publication/332049903_An_Efficient_Deep_Learning_Approach_to_Pneumonia_Classification_in_Healthcare  
  4. https://ieeexplore.ieee.org/document/8869364 
  5. https://cs.stanford.edu/people/esteva/nature/ 
  6. https://www.digitale-technologien.de/DT/Redaktion/DE/Downloads/Publikation/SSW_Policy_Paper_KI_Medizin.pdf?__blob=publicationFile&v=4 
  7. https://dejure.org/gesetze/DSGVO/6.html 
  8. https://staufer.de/blog/2019/06/dsgvo-schriftliche-einwilligung-patienten/
  9. https://www.mdr.de/datenspuren/datenbroker-daten-handel-100.html 
  10. https://netzpolitik.org/2016/mobilfunkbetreiber-telefonica-macht-jetzt-daten-seiner-kunden-zu-geld/ 
  11. https://www.ncbi.nlm.nih.gov/books/NBK54304/ 
  12. https://commonfund.nih.gov/commons/awardees 
  13. https://medium.com/berkman-klein-center/data-commons-version-1-0-a-framework-to-build-toward-ai-for-good-73414d7e72be 
  14. https://www.itu.int/en/ITU-T/extcoop/ai-data-commons/Pages/default.aspx 
  15. https://jamanetwork.com/journals/jama/fullarticle/2762997 
  16. https://www.alizila.com/how-damo-academys-ai-system-detects-coronavirus-cases/ 
  17. https://github.com/ieee8023/covid-chestxray-dataset 
top