[go: up one dir, main page]

ES1277194U - Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer - Google Patents

Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer Download PDF

Info

Publication number
ES1277194U
ES1277194U ES202130615U ES202130615U ES1277194U ES 1277194 U ES1277194 U ES 1277194U ES 202130615 U ES202130615 U ES 202130615U ES 202130615 U ES202130615 U ES 202130615U ES 1277194 U ES1277194 U ES 1277194U
Authority
ES
Spain
Prior art keywords
cancer
treatment
treatments
biomarkers
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
ES202130615U
Other languages
English (en)
Other versions
ES1277194Y (es
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keyzell Holding Sl
Original Assignee
Keyzell Holding Sl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keyzell Holding Sl filed Critical Keyzell Holding Sl
Priority to ES202130615U priority Critical patent/ES1277194Y/es
Publication of ES1277194U publication Critical patent/ES1277194U/es
Application granted granted Critical
Publication of ES1277194Y publication Critical patent/ES1277194Y/es
Priority to EP22174859.3A priority patent/EP4064294A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Sistema basado en inteligencia artificial para el análisis de biomarcadores genéticos y epigenéticos, diagnóstico y recomendación de tratamientos personalizados contra el cáncer, proceso conocido como medicina de precisión, caracterizado por estar dividido en los siguientes módulos: a) Módulo de tratamiento y análisis de datos almacenados. b) Plataforma digital para la visualización de resultados.

Description

DESCRIPCIÓN
Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer
Sector de la técnica
La presente invención se enmarca en el sector oncológico y, en particular, en un método asistido por redes neuronales (inteligencia artificial), entrenadas para analizar biomarcadores genéticos y producir un valor diagnostico o un valor pronóstico para personalizar un tratamiento o una combinación de fármacos personalizados contra el cáncer.
El sistema almacena miles de datos en forma de datasets (líneas celulares, tratamientos y resultados), utilizados con el fin de generar predicciones sobre tratamientos a medida (sinergia de varios fármacos) con mayor índice de éxito para la línea tumoral y biomarcadores genéticos y epigenéticos de cada paciente.
Estado de la técnica
El cáncer sigue constituyendo una de las principales causas de morbi mortalidad del mundo. La international Agency for Research ha estimado que en el año 2020 se diagnosticaron unos 19,2 millones de cánceres en el mundo y unos 10 millones de muertes. La misma agencia que en el año 2040 se diagnosticarán aproximadamente 30,2 millones de nuevos casos en el mundo y 16,3 millones de muertes. Los cánceres que causan un mayor número de muertes son los de pulmón, hígado, estómago, colon y mama.
En este contexto un informe elaborado por IQVIA Institute, calcula que el mercado global de medicamentos terapéuticos oncológicos alcanzara los 200 mil millones de dólares en 2022, con un crecimiento promedio de 13% en los próximos cinco años.
La primera fase fundamental en el tratamiento del cáncer es establecer un diagnóstico basado en un examen patológico. Para determinar la extensión del tumor hay que realizar una serie de pruebas. La estatificación suele requerir recursos cuantiosos que pueden resultar prohibitivos en entornos de escasos recursos, donde, debido a un diagnóstico tardío, que a su vez es consecuencia del acceso deficiente a la atención, en la mayor parte de los pacientes la enfermedad se encuentra ya en fase avanzada.
Una vez establecidos en la medida de lo posible el diagnóstico y el grado de extensión del tumor, hay que tomar una decisión sobre el tratamiento más eficaz en un determinado entorno socioeconómico.
Para ello hay que seleccionar cuidadosamente una o varias modalidades de tratamiento principales; cirugía, radioterapia y tratamiento sistémico, elección que debe basarse en pruebas científicas sobre el mejor tratamiento existente teniendo presentes los recursos disponibles. Cuando el tumor está localizado y es de pequeño tamaño, es probable que la cirugía, y a veces la radioterapia, alcancen muy buenos resultados por sí solas. La quimioterapia por sí sola puede ser eficaz para un pequeño número de tipos de cáncer, como las neoplasias hematológicas (leucemias y linfomas), que por lo general puede considerarse que están extendidas desde el principio.
Actualmente los avances en tecnología e innovación permiten cada vez más la detección precoz de ciertas enfermedades, incluso antes de que se desarrollen los primeros síntomas, lo que posibilita activar los protocolos de actuación necesarios para evitar la aparición final de la patología.
El documento ES2436667 hace referencia a biomarcadores para diagnosticar el cáncer colorrectal.
Esto es posible gracias a los biomarcadores, una característica o cambio fisiológico medible y evaluable a nivel molecular, bioquímico o celular que actúa como indicador de un proceso biológico normal o patológico, o como respuesta a una intervención terapéutica.
De hecho, estos indicadores se han convertido en una pieza clave en los tratamientos oncológicos ya que permiten definir la naturaleza celular de cada uno de los tumores para conocer su posible evolución y aplicar, en cada caso, una terapia individualizada o personalizada.
El documento ES2537403 y ES 2611000 hacen referencia al uso de perfiles de expresión genética para determinar pronósticos para pacientes con cáncer.
De esta manera, identificar de una forma correcta qué pacientes son los adecuados para cada tratamiento y desarrollar técnicas que ofrezcan información valiosa sobre la evolución de un proceso tumoral o sobre el pronóstico del mismo son fundamentales para mejorar la salud de los pacientes.
Si bien los protocolos seguidos en terapias de combinación de medicamentos son un concepto bien establecido en el tratamiento del cáncer, identificar cuál es la combinación más idónea para un paciente con un perfil genético determinado resulta ser todo un desafío debido al tamaño del espacio combinatorio. Normalmente, esta elección de pautas y normas (plan de tratamiento) se establecen de forma generalizada en todos los hospitales basándose en la experiencia científica y clínica, revisión bibliográfica y conocimiento de protocolos precedentes. Además, se recogen indicaciones y limitaciones en función de varios factores relacionados con el tumor (tipo, localización y tamaño, afección de ganglios u otros órganos) y relacionados con el paciente (edad, estado general de salud, comorbilidades, predisposición del paciente); pero sin llegar a tener en cuenta la genética propia del tumor y del paciente para ofrecer tratamientos más personalizados.
Es sabido que las células cancerosas suelen presentar "alteraciones" en sus genes, sus proteínas o su entorno titular específico que las distinguen de las células normales, por lo que una de las vías principales de tratamiento consiste en utilizar medicamentos diseñados específicamente para atacar a las células cancerosas, bloqueando su crecimiento y diseminación, sin afectar a las normales, Es lo que se conoce como terapia dirigida. Este tipo de terapia permite disponer de una medicina personalizada o de precisión pues está diseñada para atacar específicamente a algunos cambios o sustancias de las células cancerosas. Este blanco al que atacar puede ser diferente incluso entre sujetos con el mismo tipo de cáncer. De ahí la gran variabilidad y combinatoria existente que obliga a disponer de herramientas que faciliten el análisis conjunto de toda la casuística presente en el cáncer para encontrar el tratamiento más eficaz. Encontrar esa molécula blanco específico (identificación de genes, proteínas u otros factores del tumor) hace que la identificación de los pacientes con el tratamiento sea más precisa o personalizada siempre que sea posible.
Un equipo científico de la Universidad de Granda y del Centro Genómica en Investigación Oncológica ha desarrollado una técnica con la que se pueden identificar las células causantes de la metástasis mediante un análisis de sangre. Con los nuevos biomarcadores se puede identificar, por primera vez, todas las subpoblaciones existentes de células tumorales circulantes.
La sociedad Americana de Genetistas y Biólogos Moleculares (ASCO) ha publicado nuevas guías de práctica clínica sobre el uso de biomarcadores para guiar las decisiones sobre las terapias en la primera etapa del cáncer de mama.
En la publicación "Biomarkers in cáncer, contribution of epigenetics in personalised medicine”, se exponen el papel fundamental de la genética y la epigenética para la búsqueda de terapias personalizadas en el tratamiento del cáncer, así como marcadores pronósticos de fenotipos en cáncer.
La cantidad de biomarcadores identificados hace un sinfín de variables que dificultan o imposibilitan la relación de estas variables para lograr que los equipos médicos logren una predicción predictiva deseada y efectiva. En consecuencia, lo que se necesita es un enfoque para diagnosticar y proporcionar tratamientos personalizados que incorpore un sistema capaz de acomodar un gran número de factores, por ejemplo, factores genéticos y epigenéticos, y para ello existen las redes neuronales capaces de trabajar con altos volúmenes de datos de los pacientes y de los tumores, para procesar rápidamente los datos y obtener un diagnóstico y una previsión.
Actualmente ya se ha comenzado a utilizar las Redes Neuronales o los sistemas de Inteligencia Artificial en el sector oncológico, investigadores de la Universidad Estatal de Tomsk han desarrollado un nuevo método para el diagnóstico de adenocarcinoma, un tumor maligno de la glándula prostática, que utiliza inteligencia artificial para identificar si hay tumor y determinar la etapa de la enfermedad. Según uno de los investigadores, la inteligencia artificial no solo detecta la presencia de células cancerosas, con una precisión del cien por cien, en palabras de los investigadores, sino que también evalúa el tumor según la escala de Gleason, que marca la gravedad y el avance del cáncer y que es importante en términos de predecir el curso de la enfermedad.
La revista Nature publicó un estudio donde revelaba que Google ha desarrollado un algoritmo que permite reducir en un 3,5% los falsos positivos, son aquellas personas que son diagnosticadas de cáncer cuando en realidad no lo tienen, y en un 8,1% los falsos negativos, aquellos casos en los que no se detecta cáncer, pero en realidad sí que está.
Natasa Przulj, investigadora del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) ha liderado la creación de un nuevo método computacional basado en inteligencia artificial que acelera la identificación de nuevos genes relacionados con el cáncer. El método y sus resultados se han publicado en Nature Communications.
Los enfoques computacionales en búsqueda de tratamientos como modelos de aprendizaje para luchar contra el cáncer han sido una de las vías más eficientes en tiempo y coste de los últimos años, pues permiten encontrar patrones ocultos y llevar a cabo tareas complejas que suelen llevar meses en cuestión de segundos. Estas aproximaciones se basan especialmente en el análisis eficiente de una gran cantidad de datos (alta dimensionalidad), con el fin de intentar explicar la variabilidad existente en una enfermedad tan heterogénea como lo es el cáncer. En este aspecto, el Deep Learning ha demostrado tener un gran impacto sobre este tipo de tareas complejas de búsqueda de patrones (representaciones abstractas), dado que se adapta perfectamente a este tipo de desafíos gracias al gran rendimiento de sus modelos para extraer características importantes y su capacidad de predicción a partir de grandes conjuntos de datos.
Explicación de la invención
Es un objetivo de la presente invención dar a conocer un novedoso procedimiento basado en un aprendizaje profundo a partir de los datos, teniendo en cuenta aspectos relevantes como: Las características peculiares del cáncer de cada paciente. Existe una enorme variabilidad en el cáncer. Esta variabilidad se manifiesta a cuatro niveles: 1.- dentro del mismo cáncer hay zonas que son diferentes entre sí; 2.- entre cada tipo de cáncer; 3.- en el mismo tipo de cáncer entre una persona y otra; y 4.- en el mismo cáncer y en la misma persona se produce un cambio en sus características a lo largo de la evolución del mismo.
Las características peculiares de la persona que tiene el cáncer (Huésped). Cada persona es diferente, esta diferencia viene determinada por la información genética que porta, que es la que condiciona y dirige el funcionamiento de su organismo. Estas diferencias, obviamente, condicionan también elementos clave en la progresión del cáncer como es la respuesta del organismo a la enfermedad, la absorción y distribución de los fármacos y la aparición de toxicidad (daño en las células no cancerosas) que se traducen en efectos indeseables (manifestación en los órganos del daño producido por los fármacos en las células no cancerosas).
El efecto conocido de los fármacos contra el cáncer. Cada fármaco tiene un previsible efecto diferente sobre cada tipo de cáncer. Este efecto viene determinado por los aspectos siguientes: las características peculiares del fármaco, las características peculiares del cáncer concreto y las características peculiares del huésped en el que reside este cáncer. Es conocido que en algunos tipos de cáncer es efectivo el tratamiento con un solo fármaco, pero la experiencia clínica ha demostrado que en la mayoría de los casos de cáncer es más efectivo el uso combinado de dos o tres fármacos. Esto se basa en la variabilidad del cáncer, de forma que en un mismo cáncer y en una misma persona puede haber áreas con diferentes características que condicionan la sensibilidad a un fármaco, por lo que al utilizar varios se aumentan las posibilidades de “cubrir” todas las áreas con diferentes peculiaridades de un mismo cáncer.
La presente invención utiliza información genómica, la historia natural y clínica de cada paciente con cáncer como información de entrada. Al incorporar información genómica, aprende a distinguir diferentes líneas de células cancerosas y encontrar cuáles son las combinaciones de medicamentos específicas utilizadas en la práctica clínica que tengan la máxima eficacia en una línea celular determinada. A nivel interno, emplea una estrategia de normalización para minimizar la heterogeneidad de los datos de entrada y combina información sobre la línea celular del cáncer y el conjunto de fármacos en sus capas de redes neuronales ocultas para formar una representación compuesta del modelo que eventualmente conduce a predicciones precisas de posibles tratamientos adecuados para las características del sujeto con cáncer de entrada, con sus correspondientes dosis. Se constituye así un Clinical Decision Support System, capaz de interpretar la información de grandes cantidades de datos (genómica funcional).
Estos tratamientos proporcionados consisten en combinaciones de fármacos, pues se ha demostrado que este tipo de terapias suelen presentar una mayor eficacia, menor toxicidad y reducción de resistencia a los fármacos en comparación a la monoterapia. Para ello, la invención es capaz de analizar las peculiaridades particulares del cáncer de una determinada persona, en el contexto particular de esa persona como huésped que interacciona con ese cáncer con un sistema de carácter dinámico, teniendo en cuenta la variabilidad del sistema biológico. Precisamente, el principal problema que hace que el cáncer siga siendo una enfermedad mortal es su carácter variable y dinámico que le proporciona la capacidad de adaptarse al medio (presión de la interacción con el huésped) y al ataque de los fármacos disponibles y, por lo tanto, un mecanismo eficaz de "escape” y progresión. La única forma de combatirlo es controlando esa variabilidad y prediciendo ese dinamismo (lo que le otorga capacidad de resistencia y progresión). Resulta importante entonces encontrar la combinación de fármacos que mejor se adapta a un determinado sujeto aumentando su supervivencia libre de la progresión del cáncer.
En este sentido, se explora la variabilidad del cáncer y sus formas de evolución, de manera que en cada caso podrá adelantarse a los mecanismos de adaptación y evolución (escape) de cada caso de cáncer diseñando el tratamiento óptimo efectivo en el momento "0” y en cualquier escenario de evolución (escape) del mismo. Es decir, el cáncer no es únicamente tratado en base a las características presentes en el momento del diagnóstico, sino también a las características previsibles que tendría en cada uno de los posibles escenarios de escape de ese cáncer en concreto.
El desarrollo de la invención consiste en la construcción de un modelo según reivindicaciones en la que se distinguen dos fases principales: por una parte, la búsqueda de patrones y aprendizaje, y por otra la predicción del tratamiento de un sujeto.
Para una primera aproximación de entrenamiento del modelo, se ha empleado un conjunto de datos con 18.458 muestras de líneas celulares, donde cada muestra consta de características propias del tumor (localización, tipo, especie) y perfil genético e inmunohistoquímico de las líneas celulares. El conjunto de datos cubre 527 combinaciones distintas de fármacos (tratamientos), cada uno probada sobre 46 líneas celulares cancerosas.
A pesar de la importancia de las líneas de células cancerosas en la investigación biomédica, a menudo se cuestiona su capacidad para representar con precisión el estado in vivo. La razón es que incluso si existe una alta correlación genómica entre el tumor original y la línea celular cancerosa derivada, todavía está lejos de ser perfecta. Sin embargo, el hecho de utilizar líneas celulares en las primeras fases de entrenamiento permite adquirir una primera estructura muy próxima a la esperada in vitro, pues las primeras capas empiezan a aprender las características más básicas y comunes compartidas entre ambas experimentaciones, de manera que se aprovecha y utiliza la gran cantidad de información y conocimiento adquirido relacionados en la resolución del problema en términos estadísticos. Técnica muy utilizada en Deep Learning, denominada Transfer Learning, muy útil en este caso pues se requiere abordar el mismo problema.
Evidentemente, se requiere de información in vivo para así poder validar y evaluar el desempeño de los modelos pre-entrenados precisos en in vitro, pero así se podrán utilizar estos modelos ya entrenados y validados para reconocer las características buscadas con la modificación de patrones o modificación y adición de capas posteriores, sin tener que recurrir a un entrenamiento desde cero, hasta llegar a un rendimiento aceptable. Son estas últimas capas las que se especializan en la resolución del problema concreto in vivo, mientras que las primeras capas profundas son las que explican aquellos aspectos más generales tanto para in vitro como in vivo.
De esta manera, las predicciones fiables proporcionan una guía válida para la investigación in vitro e in vivo. Además, los métodos desarrollados para utilizar información genómica para sus predicciones ofrecen la oportunidad de aplicarlos también en un entorno in vivo. Por tanto, estos modelos predictivos son un gran paso hacia la medicina de precisión. El cáncer es una enfermedad difícil de tratar, por lo que disponer de la mayor cantidad de conocimiento en todos los niveles y desde distintas perspectivas, permite tener mayor capacidad de inferencia a la hora de combatirla.
Con la disposición de la información necesaria, se realiza un entrenamiento supervisado ya que se conoce a priori la respuesta de estas líneas celulares consideradas ante las diversas combinaciones de fármacos, recorriendo los miles de posibilidades. La finalidad del entrenamiento es justamente el algoritmo de decisión médica: mejor entendimiento de los mecanismos de la enfermedad e identificación de potenciales tratamientos candidatos.
Breve descripción de los dibujos
Para su mejor comprensión se adjunta, a título de ejemplo explicativo, pero no limitativo, una serie de figuras para resumir el funcionamiento de la presente invención.
La figura 1 representa el modelo de entrenamiento de acuerdo con las características de la invención.
La figura 2 representa el modelo de análisis de datos de acuerdo con las características de la invención.
La figura 3 representa el modelo de resultados de acuerdo con las características de la invención.
Exposición detallada de un modo de realización de la invención
Una de las mejores maneras de abordar el problema, teniendo en cuenta la tipología de datos y características, es generando un modelo capaz de mapear los vectores de entrada que representan las muestras a 3 valores de salida: corto, medio y largo plazo, "Short, Médium, Long Term Result".
El modelo se caracteriza por el empleo de redes neuronales profundas. En este caso concretamente consiste en una Feed Forward Neural Network. Dichas redes están formadas por una superposición de capas conformando lo que se conoce como un perceptrón multicapa capaz de resolver el problema en cuestión. Así, en este tipo de arquitecturas se distinguen 3 clases de capas: capa de entrada, capas ocultas y capa de salida. El principal objetivo de utilizar esta perspectiva es la obtención de un modelo preciso de predicción configurando los patrones de asignación de una entrada A (conjunto de sujetos con sus respectivas características individuales) a una salida determinada B (respuesta de un sujeto a una determinada combinación de fármacos). En este caso, se trata de un aprendizaje supervisado pues se parte de un conjunto establecido de datos, conociéndose la respuesta de los mismos, es decir, se saben las salidas (B) que los definen. El modelo en última instancia ajustará los atributos de los datos modelados a las etiquetas que poseen, extrayendo la información de correlación entre las variables. De ahí la importancia de que los datos de los que se dispone para el entrenamiento, sean expuestos de la mejor manera posible, sin fallos en el etiquetado e intentando que el modelo pueda disponer de todas las características de entrada.
Durante la etapa de entrenamiento, se hace uso de los datos disponibles en el repositorio de datos. En las primeras fases estos datos serán únicamente los recolectados durante los estudios realizados previamente, pero se irán complementando con los propios que vaya prediciendo la herramienta. De esta manera, cada una de los sujetos será representado por un vector de N entradas construido a partir de las características individuales propias del sujeto y su cáncer. Dentro de estas propiedades individuales de entrada se distinguen: características propias (tales como la edad, el sexo, localización del tumor), valores de expresión génica (DNA, RNA, inmunohistoquímico) y tratamiento utilizado en el sujeto. Este vector constituye la entrada individual del modelo (capa de entrada), por lo que su longitud se corresponde con el número de neuronas presentes en esta capa.
En cuanto a su capa de salida está conformada por 3 neuronas que se corresponden con "Short, Medium, Long Term Result". Este tipo de resultado cuantifica tanto de la efectividad como la toxicidad del tratamiento utilizado, siendo un valor entre 0 y 150 que indica el grado de supervivencia celular. Siempre se busca que el sistema proporcione el resultado óptimo. Entendiendo por óptimo aquel que permite una mayor eficacia (un valor medio más bajo) cuando es una de las líneas celulares tumorales y una menor toxicidad (un valor medio más alto) cuando se trata de una línea celular normal.
Por último, con respecto a las capas ocultas, se optará por una metodología conservadora, evitando caer tanto en el underfitting como en el overfitting, es decir que no sea capaz de aprender o que pierda capacidad de generalización, respectivamente. Se parte de una estructura sencilla a la que se irán añadiendo mayor número de neuronas e incluso puede que alguna capa, a medida que se quieran obtener mejores resultados y mayor precisión, y con el paso de datos in vitro a in vivo. La estructura primara utilizada con el entrenamiento dadas las dimensiones del problema es disponer de dos capas ocultas con 8192 y 4096 neuronas, respectivamente. La estructura de la red es de tipo piramidal, en la que la información de entrada se propaga a través de las diferentes capas de la red hasta llegar a proporcionar la calidad deseada.
Algunos aspectos técnicos necesarios para el correcto funcionamiento y desempeño del modelo: la normalización de los datos cuantitativos que se estandarizan todas las entradas con media 0 y varianza 1, y se aplica la tangente hiperbólica. Las variables cualitativas, y por tanto categóricas son binarizadas mediante técnicas de One Hot Encodering. Las capas ocultas aplican activaciones lineales rectificadas, y la capa de salida utiliza una activación lineal. La función objetivo que se minimiza durante el entrenamiento es el error cuadrático medio.
Una de las consideraciones más importantes a tener en cuenta es el hecho de que el modelo, solo debería proporcionar aquellos tratamientos cuyas combinaciones de fármacos ya han sido probadas, es decir, ya han sido utilizadas en los algunos de los sujetos con los que se entrenan y que se disponen en la base de datos. Este hecho reduce enormemente la cantidad de combinaciones que se pueden conseguir con los fármacos estudiados, y determina la forma en que se construye el modelo. En principio el modelo no debería proporcionar una combinación de fármacos que no haya sido probada, puesto que no se dispone de estudios del comportamiento de los sujetos ante dicha "nueva combinación". De manera que solo se tendrán en consideración los tratamientos sobre las que ya hayan sido utilizados en estudios.
Con el modelo entrenado al introducir un paciente junto con un tratamiento concreto éste proporciona resultados a corto, medio y largo término, utilizando los patrones aprendidos durante la fase de entrenamiento. Se distingue ahora la etapa de predicción.
En esta etapa, la entrada de datos incluye dos aspectos: el tipo de tumor del paciente (que puede ser uno de los recogidos en la base de datos u otro aún no recogido) y el perfil genético del tumor que tiene dos tipos de perfil DNA (DNA Hotspot genes) y RNA (RNA Fusión Drivers). El tipo de tumor del sujeto “problema” será conocido. Y a todos los casos de paciente “problema” se le hará un estudio DNA / RNA similar al realizado a las líneas celulares / casos incluidos en la base de datos en los que el tratamiento aplicado y el posible resultado obtenido fue conocido durante la fase de entrenamiento. Así, se realiza una predicción en base a la similitud del perfil DNA / RNA del paciente al perfil DNA / RNA de los casos recogidos en la base de datos, de las diferentes opciones de tratamiento y potencial efecto de cada una de ellas.
Esta etapa a su vez está constituida por un algoritmo en dos fases. La primera de ellas es la determinación de posibles tratamientos y la segunda la evaluación de los tratamientos considerados.
Centrándonos en la primera fase del algoritmo, esta se encargará de determinar cuáles son las opciones de tratamiento farmacológico que mejor podrían adaptarse al sujeto. Para ello, se emplea un sistema de recomendación de tratamiento. Este algoritmo emplea una medida de similitud (distancia del coseno) entre el sujeto de entrada y los sujetos ya presentes en la base de datos, los cuales tienen un tratamiento ya asignado. Con esta medida el sistema sabe la distancia espacial entre dos sujetos y por tanto cuantifica lo próximos que están y por ende cómo de semejantes son. Partiendo de aquellos que presenten una similitud mayor (k vecinos), se les extrae el tratamiento utilizado (k tratamientos), y se añade esto a la información del nuevo sujeto.
Toda la información conjunta tanto características propias del nuevo sujeto (edad, sexo, perfiles genéticos e inmunohistoquímico) como un posible tratamiento, se concatenan y constituyen la entrada del modelo de red neuronal. Todo este flujo de trabajo se realiza para cada uno de los k-vecinos considerados.
En la segunda fase, el modelo evaluará las características del sujeto con el tratamiento proporcionando las posibilidades de eficacia de dicha combinación de fármacos sobre el sujeto, que está representada por la salida del modelo.
Los tratamientos ideales son aquellos que consiguen la máxima eficacia con la mínima (a ser posible "cero”) toxicidad.
Finalmente, se obtiene un listado de todas las opciones de tratamiento posibles clasificadas desde la opción de tratamiento óptima a la menos óptima para un el sujeto "problema".
Con herramienta se pretende aumentar la eficiencia, productividad y la confianza clínica de los operadores del sistema, reduciendo la gran variabilidad existente y carga su carga de trabajo. Se consigue, así, un flujo de trabajo inteligente y automatizado que proporciona un procesamiento hábil e interpretación de la información; permitiendo convertir los datos en información procesable, para extraer conocimiento médico oncológico necesario para ofrecer el tratamiento más adecuado para el cáncer, en el orden adecuado y en el momento más adecuado.

Claims (5)

REIVINDICACIONES
1. Sistema basado en inteligencia artificial para el análisis de biomarcadores genéticos y epigenéticos, diagnóstico y recomendación de tratamientos personalizados contra el cáncer, proceso conocido como medicina de precisión, CARACTERIZADO por estar dividido en los siguientes módulos:
a) Módulo de tratamiento y análisis de datos almacenados.
b) Plataforma digital para la visualización de resultados.
2. Módulo, según reivindicación 1, CARACTERIZADO por almacenar miles de datos en forma de datasets (líneas celulares, biomarcadores genéticos y epigenéticos, tratamientos y resultados), utilizados con el fin de generar predicciones en tiempo real sobre tratamientos a medida (sinergia de varios fármacos) con mayor índice de éxito para la línea tumoral y biomarcadores característicos de un paciente.
3. Sistema, según reivindicación 1 y 2, CARACTERIZADO por un subsistema de redes neuronales (machine learning, inteligencia artificial) relativo al tratamiento y análisis de toda la información de biomarcadores genéticos y epigenéticos, registrados en forma de datasets.
4. Sistema, según reivindicación 1, CARACERIZADO, por el empleo de un algoritmo para predecir tratamientos personalizados contra líneas tumorales.
5. Sistema, según reivindicación 1, 3 y 4, CARACTERIZADO, porque el usuario puede acceder a una interfaz con información estadística, informe diagnóstico y recomendaciones de tratamiento.
ES202130615U 2021-03-25 2021-03-25 Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer Active ES1277194Y (es)

Priority Applications (2)

Application Number Priority Date Filing Date Title
ES202130615U ES1277194Y (es) 2021-03-25 2021-03-25 Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer
EP22174859.3A EP4064294A1 (en) 2021-03-25 2022-05-23 Artificial intelligence-based system for analysing biomarkers and personalising cancer treatments

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES202130615U ES1277194Y (es) 2021-03-25 2021-03-25 Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer

Publications (2)

Publication Number Publication Date
ES1277194U true ES1277194U (es) 2021-09-03
ES1277194Y ES1277194Y (es) 2021-11-26

Family

ID=77515541

Family Applications (1)

Application Number Title Priority Date Filing Date
ES202130615U Active ES1277194Y (es) 2021-03-25 2021-03-25 Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer

Country Status (2)

Country Link
EP (1) EP4064294A1 (es)
ES (1) ES1277194Y (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115691813A (zh) * 2022-12-30 2023-02-03 神州医疗科技股份有限公司 基于基因组学和微生物组学的遗传性胃癌评估方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009151967A1 (en) * 2008-05-28 2009-12-17 Georgia Tech Research Corporation Metabolic biomarkers for ovarian cancer and methods of use thereof
ES2925983T3 (es) 2010-07-27 2022-10-20 Genomic Health Inc Método para usar la expresión génica para determinar el pronóstico del cáncer de próstata
EP2680003A1 (en) 2012-06-28 2014-01-01 Fundació Institut d'Investigació Biomèdica de Bellvitge Serum biomarker for diagnosing colorectal cancer
AU2018284077B2 (en) * 2017-06-13 2021-09-23 Bostongene Corporation Systems and methods for identifying responders and non-responders to immune checkpoint blockade therapy
JP7681817B2 (ja) * 2018-10-12 2025-05-23 ヒューマン ロンジェヴィティ インコーポレイテッド 癌の遺伝子および臨床データの統合分析のためのマルチオミクス検索エンジン
JP7747524B2 (ja) * 2019-05-14 2025-10-01 テンパス エーアイ,インコーポレイテッド マルチラベルがん分類のためのシステムおよび方法

Also Published As

Publication number Publication date
EP4064294A1 (en) 2022-09-28
ES1277194Y (es) 2021-11-26

Similar Documents

Publication Publication Date Title
Sethi et al. Long short-term memory-deep belief network-based gene expression data analysis for prostate cancer detection and classification
Kibriya et al. A novel and effective brain tumor classification model using deep feature fusion and famous machine learning classifiers
Biancalani et al. Deep learning and alignment of spatially resolved single-cell transcriptomes with Tangram
Wang et al. Herb target prediction based on representation learning of symptom related heterogeneous network
US20150006445A1 (en) Pathway analysis for identification of diagnostic tests
Liu et al. A subcomponent-guided deep learning method for interpretable cancer drug response prediction
Manik et al. Integrating genomic data and machine learning to advance precision oncology and targeted cancer therapies
Shafik Revolutionizing Skin Cancer Diagnosis With Artificial Intelligence: Insights Into Machine Learning Techniques
Zhu et al. Multi-atlas label fusion with random local binary pattern features: Application to hippocampus segmentation
Chang et al. Machine-learning based investigation of prognostic indicators for oncological outcome of pancreatic ductal adenocarcinoma
Kumar et al. The utility of artificial intelligence in the diagnosis and management of pancreatic cancer
ES1277194U (es) Sistema basado en inteligencia artificial para analizar biomarcadores y personalizar tratamientos para cáncer
Mahmoud et al. Breast Cancer Survival Prediction Modelling Based on Genomic Data: An Improved Prognosis-Driven Deep Learning Approach
Gago et al. Machine Learning System for the Effective Diagnosis and Survival Prediction of Breast Cancer Patients.
Kabir et al. Identification of lung cancer using particle swarm optimization and machine learning technique
Liu et al. Detecting spatial susceptibility to cardiac toxicity of radiation therapy for lung cancer
CN120092302A (zh) 用于对患者结果的多模态预测的系统和方法
Wang Mining causal relationships among clinical variables for cancer diagnosis based on Bayesian analysis
Simon Class probability estimation for medical studies
Bote-Curiel et al. A resampling univariate analysis approach to ovarian cancer from clinical and genetic data
Cottrell et al. Multiscale Cell-Cell Interactive Spatial Transcriptomics Analysis
Soares et al. Predicting xerostomia after IMRT treatments: a data mining approach
Sree 3D Convolutional Neural Networks for Predicting Protein Structure for Improved Drug Recommendation.
Dawar et al. Usage of Machine Learning and Deep Learning for Lung Cancer Detection: Current Scenario, Challenges and Futuristic Direction
Gad et al. COVID-19 drug repurposing model based on pigeon-inspired optimizer and rough sets theory

Legal Events

Date Code Title Description
CA1K Utility model application published

Ref document number: 1277194

Country of ref document: ES

Kind code of ref document: U

Effective date: 20210903

FG1K Utility model granted

Ref document number: 1277194

Country of ref document: ES

Kind code of ref document: Y

Effective date: 20211122