Las amenazas del Sars-CoV-2, más conocido como "virus Corona", y las restricciones y limitaciones de producción asociadas nos mantienen a todos en vilo. Y yo me pregunto: ¿estamos haciendo realmente lo suficiente para utilizar y diseñar nuestro sistema sanitario de la forma más eficiente posible en tiempos de sobrecarga inminente -especialmente de las capacidades de cuidados intensivos-? En vista de los sensacionales éxitos de la inteligencia artificial y el aprendizaje automático en medicina, esta pregunta me parece muy justificada.
Los algoritmos, que en su mayoría se basan en redes neuronales artificiales, hace tiempo que son capaces de detectar la neumonía (1,2,3,4), por ejemplo, pero también el cáncer de piel (5), la malaria y muchas otras enfermedades con una precisión superior, o al menos igual, a la de los mejores especialistas en el campo respectivo. El uso de estos algoritmos no les haría en absoluto superfluos, al contrario: los médicos tendrían más tiempo para ocuparse de otras cosas, como educar e informar mejor a los pacientes. Además, no quitarían el diagnóstico a los médicos, pero podrían apoyarlos de forma significativa. También y sobre todo en el caso de las infecciones coronarias.
Se preguntarán por qué el último párrafo contiene tantos subjuntivos. De hecho, la situación es paradójica, al menos en Alemania y en muchas partes de Europa: mientras que las instituciones de investigación siguen informando de nuevos récords en la detección informatizada de enfermedades, estos modelos y sistemas siguen utilizándose demasiado poco en la práctica. Al menos en Europa (6). Entre las razones de ello se encuentran también los diferentes requisitos de protección de datos para fines de investigación, por un lado, y para el uso real en un entorno clínico, por otro.
En concreto, esto significa que quien quiera entrenar un algoritmo para reconocer patrones de enfermedad y utilizarlo en operaciones hospitalarias necesita datos de muchos cientos o, mejor aún, miles de pacientes. Pero sobre todo, según el Reglamento General de Protección de Datos, necesita el consentimiento inequívoco de cada uno de estos pacientes para utilizar sus datos. Y esto debe ser para un propósito específico, en este caso: entrenar un algoritmo de IA o ML y utilizarlo en el entorno clínico. Y esto es así aunque los datos estén anonimizados. Sin embargo, el GDPR prevé una excepción, a saber, si existe un "interés público" en los datos, lo que probablemente está fuera de toda duda en la crisis de Corona (7, 8).
Quizá ahora se pregunte por qué su proveedor de telecomunicaciones está autorizado a vender datos de conexión anonimizados (9, 10). Al fin y al cabo, también se trata de datos personales, es decir, de sus propios datos personales. La clave está en la definición de la palabra "anonimizados".
Según la jurisprudencia y la interpretación actuales, los datos sólo son realmente anónimos si esta anonimización o cifrado no puede revertirse o descifrarse de nuevo. Al menos no por el usuario. Con los proveedores de telefonía, el asunto es bastante sencillo: las compañías DEBEN destruir los datos al cabo de medio año. Y si los datos ya no existen, el cifrado ya no puede deshacerse.
En el caso de los datos médicos, este procedimiento es, por supuesto, imposible. E incluso para el entrenamiento de redes neuronales es necesario poder rastrear los datos en casos excepcionales. Por ejemplo, si en el análisis de errores surgen dudas sobre si una determinada enfermedad está realmente etiquetada correctamente (es decir, diagnosticada) en un frotis de sangre o en una radiografía.
Por supuesto, la protección de datos es importante, especialmente en tiempos de digitalización. Sin embargo, los datos sanitarios pueden salvar vidas y, por lo tanto, por un lado, debemos garantizar la protección de los datos, pero, por otro, también debemos aprovechar sus posibilidades. Diversas organizaciones, también internacionales, entre ellas los Institutos Nacionales de Salud (NIH) de EE.UU. (11,12), pero también muchas iniciativas internacionales, como "AI for Good" (13) o la "Roundtable on Global Initiative and Data Commons"(14) la opinión de que nuestros datos -anonimizados y de acuerdo con normas y requisitos de seguridad estrictos- son un bien común.
¿Y por qué no?
Después de todo, nuestro ministro de Sanidad opina que no deberíamos tener derecho a nuestros órganos en caso de muerte cerebral, a menos que nos hayamos opuesto expresamente a un trasplante de antemano. El Bundestag no fue tan lejos; en su lugar, ahora se preguntará más a menudo a los ciudadanos si quieren donar sus órganos tras su muerte.
Lo importante que sería una solución similar para los datos ahora mismo y en la actualidad lo demuestran las posibilidades del aprendizaje automático. Por ejemplo, un algoritmo que detecte infecciones coronarias en radiografías pulmonares o incluso en tomografías computerizadas tendría los siguientes efectos en una crisis:
- Según los medios de comunicación, en la actualidad los médicos esperan hasta tres días o incluso más por los resultados de una prueba de corona, al menos si no disponen de laboratorio propio. Con el algoritmo, tendrían la posibilidad de obtener un diagnóstico mucho más rápido, especialmente para pacientes con cursos graves de la enfermedad.
- En el caso de las capacidades de cuidados intensivos sobrecargadas, podrían aislar a los pacientes infectados con Covid-19 de forma más selectiva, lo que aliviaría la carga por un lado y también reduciría el riesgo de infección en las clínicas.
- El algoritmo también podría ayudar a los médicos que aún no han entrado en contacto con pacientes infectados por el virus de la corona, o que apenas lo han hecho, especialmente a la hora de descartar infecciones coronarias.
- En una fase posterior, el algoritmo podría utilizarse también para reconocer e identificar a los pacientes que corren el riesgo de sufrir una evolución grave de la enfermedad infecciosa, lo que permitiría un tratamiento específico lo antes posible.
La investigación inicial en este campo está en pleno desarrollo. Los hospitales de Wuhan, por ejemplo, ya están utilizando un algoritmo similar, pero los datos no están a disposición del público (15, 16) - además, un conjunto de datos con sólo pacientes chinos sería muy problemático debido a un posible sesgo. En EE.UU., un científico de la Universidad de Stanford (17) está creando un conjunto de datos de acceso público junto con médicos, pero el número de imágenes cargadas hasta la fecha, actualmente 105 radiografías de 65 pacientes (a fecha del domingo 22 de marzo de 2020), es demasiado pequeño para entrenar un algoritmo fiable.
Que yo sepa, actualmente no existe ninguna iniciativa comparable en Europa. Alexander Thamm GmbH podría programar y entrenar un algoritmo de este tipo en muy poco tiempo y ponerlo gratuitamente a disposición de todos los médicos y clínicas interesados. Además de cientos de proyectos industriales en aprendizaje automático, también tenemos experiencia en el ámbito médico, por ejemplo con
- detección de neumonía en radiografías
- la identificación de infecciones palúdicas en imágenes de frotis sanguíneos
- clasificación de proteínas en imágenes de microscopio
- Detección de la gravedad de la retinopatía diabética a partir de imágenes del globo ocular.
Para llevar a cabo este proyecto y poder disponer rápidamente del algoritmo en la tensa situación de Corona, estamos buscando, por un lado, contactos con clínicas que puedan facilitarnos datos anonimizados -por ejemplo, radiografías de pulmón o tomografías computarizadas- y, por otro, patrocinadores que apoyen este proyecto. Como empresa socialmente responsable, asumiríamos parte de los costes.
Estaremos encantados de facilitar un esbozo del proyecto a patrocinadores y/o socios colaboradores del sector médico seriamente interesados. Para ello, póngase en contacto con nosotros:
Andreas Gillhuber (Codirector General)
andreas.gillhuber@alexanderthamm.com
Estaríamos muy contentos si pudiéramos ayudar en esta situación. Muchas gracias por su interés y atención,
Alexander Thamm
Fundador y CEO - Alexander Thamm GmbH
Fuentes
- https://arxiv.org/pdf/1711.05225.pdf
- https://www.nature.com/articles/s41746-019-0189-7
- https://www.researchgate.net/publication/332049903_An_Efficient_Deep_Learning_Approach_to_Pneumonia_Classification_in_Healthcare
- https://ieeexplore.ieee.org/document/8869364
- https://cs.stanford.edu/people/esteva/nature/
- https://www.digitale-technologien.de/DT/Redaktion/DE/Downloads/Publikation/SSW_Policy_Paper_KI_Medizin.pdf?__blob=publicationFile&v=4
- https://dejure.org/gesetze/DSGVO/6.html
- https://staufer.de/blog/2019/06/dsgvo-schriftliche-einwilligung-patienten/
- https://www.mdr.de/datenspuren/datenbroker-daten-handel-100.html
- https://netzpolitik.org/2016/mobilfunkbetreiber-telefonica-macht-jetzt-daten-seiner-kunden-zu-geld/
- https://www.ncbi.nlm.nih.gov/books/NBK54304/
- https://commonfund.nih.gov/commons/awardees
- https://medium.com/berkman-klein-center/data-commons-version-1-0-a-framework-to-build-toward-ai-for-good-73414d7e72be
- https://www.itu.int/en/ITU-T/extcoop/ai-data-commons/Pages/default.aspx
- https://jamanetwork.com/journals/jama/fullarticle/2762997
- https://www.alizila.com/how-damo-academys-ai-system-detects-coronavirus-cases/
- https://github.com/ieee8023/covid-chestxray-dataset
0 comentarios