MX2012006031A - Firma transcripcional sanguinea de infeccion de mycobacterium tuberculosis activa versus latente. - Google Patents
Firma transcripcional sanguinea de infeccion de mycobacterium tuberculosis activa versus latente.Info
- Publication number
- MX2012006031A MX2012006031A MX2012006031A MX2012006031A MX2012006031A MX 2012006031 A MX2012006031 A MX 2012006031A MX 2012006031 A MX2012006031 A MX 2012006031A MX 2012006031 A MX2012006031 A MX 2012006031A MX 2012006031 A MX2012006031 A MX 2012006031A
- Authority
- MX
- Mexico
- Prior art keywords
- patient
- modules
- genetic
- genes
- active
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
La presente invención incluye métodos, sistemas y kits para distinguir entre infección de mycobacterium tuberculosis activa y latente en un paciente que se sospecha de estar infectado con Mycobacterium tuberculosis, el método incluye las etapas de obtenr un conjunto de datos de expresión genética del paciente sospechoso de estar infectado con Mycobacterium tuberculosis; surtir el conjunto de datos de expresión genética a uno o más módulos genéticos asociados con infección de Mycobacterium tuberculosis y comparar el conjunto de datos de expresión genética para cada uno o más de módulos genéticos con un conjunto de datos de expresión de un sujeto que no es paciente; en donde el incremento o disminución en la totalidad de expresión genética en el conjunto de datos de expresión genética del paciente para el uno o más módulos es indicador de infección de Mycobacterium tuberculosis activa.
Description
FIRMA TRA SCRIPCIONAL SANGUINEA DE INFECCION DE MYCOBACTERIUM TUBERCULOSIS ACTIVA VERSUS LATENTE CAMPO TÉCNICO DE LA INVENCIÓN
La presente invención es concerniente en general con el campo de infección de Mycobacterium tuberculosis y más en particular con un método, kit y sistema para la diagnosis, prognosis y monitoreo de infección de Mycobacterium tuberculosis activa y avance de la enfermedad antes, durante y después del tratamiento que aparece latente o asintomática.
ANTECEDENTES DE LA INVENCIÓN
Sin limitar el alcance de la invención, sus antecedentes son descritos en relación con la identificación y tratamiento de infección de Mycobacterium tuberculosis .
La tuberculosis pulmonar (PTB) es una causa mayor e incrementada de morbidez y mortalidad mundialmente provocada por Mycobacterium tuberculosis (M. tuberculosis) . Sin embargo, la mayoría de individuos infectados con M. tuberculosis permanecen asintomáticos , reteniendo la infección en forma latente y se piensa que este estado latente es mantenido por una respuesta inmune activa (WHO; Kaufmann, SH & McMichael, AJ. , Nat ed, 2005). Esto es soportado por reportes que muestran que el tratamiento de pacientes con enfermedad de Crohn o artritis reumatoide con anticuerpos anti-TNF, da como resultado mejora de síntomas autoinmunes, pero por otra parte provocan la reactivación en TB en pacientes previamente en contacto con M. tuberculosis (Keane) . La respuesta inmune a M. tuberculosis es multifactorial e incluye factores de huésped determinados genéticamente, tales como TNF e IFN-? e IL-12, del eje de Thl (revisado en Casanova, Ann Rev; Newport) . Sin embargo, las células inmunes de pacientes con TB pulmonar adultos pueden producir IFN-?, IL-12 y TNF y la terapia con IFN-? no ayuda a mejorar la enfermedad (revisado en Reljic, 2007, J Interferon & Cyt Res., 27, 353-63), sugiriendo que un número más amplio de factores inmunes del huésped están involucrados en protección contra tuberculosis M. y el mantenimiento de latencia. Asi, el conocimiento de los factores de huésped inducidos en TB latente versus activa puede proveer información con respecto a la respuesta inmune, que puede controlar la infección con M. tuberculosis.
La diagnosis de PTB puede ser difícil y problemática por un número de razones. En primer lugar, la demostración de la presencia de bacilos de M. tuberculosis típicos en el esputo mediante examen microscópico (frotis positivo) tiene una sensibilidad de solamente 50 - 70% y la diagnosis positiva requiere el aislamiento de M. tuberculosis mediante cultivo, que puede tomar hasta 8 semanas. Además, algunos pacientes son de frotis negativo en el esputo o no son aptos de producir esputo y así se requiere de toma de muestras adicional mediante broncoscopia, un procedimiento invasivo. Debido a estas limitaciones en la diagnosis de PTB, los pacientes de frotis negativo son algunas veces probados en cuanto a reactividad de la piel de tuberculin (PPD) ( antoux) . Sin embargo, la reactividad a la piel a tuberculina (PPD) no puede distinguir entre la vacunación de BCG, TB latente o activa. En respuesta a este problema, se han desarrollado análisis que demuestran inmunoreactividad a antigenos de M. tuberculosis específicos, que están ausentes en BCG. La reactividad a estos antígenos de M. .tuberculosis, tal como es medida por la producción de IFN-? por las células de sangre en análisis de liberación de interferón . gamma (IGRA), sin embargo, no diferencia la enfermedad latente de la enfermedad activa. La TB latente es definida en la clínica por una reacción de hipersensibilidad tipo retardada cuando el paciente es atacado intradérmicamente con PPD, junto con un resultado positivo de IGRA, en ausencia de síntomas o signos clínicos o radiología sugerente de enfermedad activa. La reactivación de tuberculosis latente/aletargada (TB) presenta un peligro de salud · mayor con el riesgo de transmisión a otros individuos y así biomarcadores que reflejan diferencias en pacientes con TB latente y activa serían de uso en el manejo de la enfermedad, particularmente puesto que el tratamiento con fármaco anti-micobacteriano es arduo y puede dar como resultado efectos secundarios serios.
La mayoría de los individuos infectados ' con M. tuberculosis permanecen asintomáticos, con una tercera parte de la población mundial estimada estar infectada latentemente con la bacteria, proporcionando así un depósito enorme para el esparcimiento de la enfermedad. De estas personas descritas como infectadas latentemente, 5 - 15% desarrollarán enfermedad de TB activa en su vida 7'8. Así, los pacientes TB latente representan una clasificación clínicamente heterogénea, que varía de la mayoría que permanecerá asintomática en toda su vida, a aquellos que avanzarán a reactivación de la enfermedad 9. La diagnosis de TB latente está basada solamente en la evidencia de sensibilización inmune, clásicamente por la reacción de la piel a antígenos de M. tuberculosis, una prueba cuya especificidad es comprometida por reacciones positivas a micobacterias no patógenas incluyendo la vacuna BCG. Análisis más recientes que determinan la secreción de IFN-? por células sanguíneas a antígenos de M. tuberculosis específicos (IGRA) sufren de este problema menos pero, como la prueba de la piel, no pueden diferenciar la enfermedad latente de la enfermedad activa ni identificar claramente aquellos pacientes que pueden avanzar a la enfermedad activa 10. La identificación de aquellos más en riesgo de reactivación ayudaría con la terapia preventiva apuntada de importancia puesto que el tratamiento con fármaco anti-micobacteriano es prolongado y puede dar como resultado efectos secundarios serios. Asi, nuevas herramientas para diagnosis, tratamiento y vacunación son necesarios urgentemente, pero los esfuerzos para desarrollar estos han estado limitados por un entendimiento incompleto de la patogénesis fundamental o subyacente compleja de TB.
BREVE DESCRIPCIÓN DE LA INVENCIÓN
La presente invención incluye métodos y kits para la identificación de pacientes con tuberculosis · latente versus activa (TB) , en comparación con testigos saludables. En una modalidad, análisis de microarreglo de sangre de una firma inmune distinta y reciproca es usado para determinar, diagnosticar, rastrear y tratar pacientes con tuberculosis latente versus activa (TB) . La presente invención provee por primera vez la habilidad para distinguir entre la heterogeneidad de infecciones TB que puede ser usada para determinar cuales individuos con TB latente se les debe dar quimioterapia anti-micobacteriana debido a una infección de TB activa y no latente/asintomática .
En una modalidad, la presente invención incluye un método para predecir una infección de MycoJacteriwn tuberculosis activa que aparece latente/asintomática que comprende: obtener un conjunto de datos de expresión genética del paciente del paciente que se sospecha de estar infectado con Mycobacterium tuberculosis; clasificar el conjunto de datos de expresión genética del paciente a uno o más módulos genéticos asociados con infección de Mycobacterium tuberculosis; y comparar el conjunto de datos de expresión genética del paciente para cada uno del uno o más módulos genéticos con un conjunto de datos de expresión genética de un no paciente también clasificado a los mismos módulos genéticos; en donde un incremento o disminución en la totalidad de expresión genética en el conjunto de datos de expresión genética del paciente por el uno o más módulos genéticos es indicador de una infección de Mycobacterium tuberculosis activa en lugar de una infección con Mycobacterium tuberculosis latente/asintomática . En un aspecto, el método comprende además la etapa de usar la información de producto genético comparativa determinada para formular por lo menos uno de diagnosis, una prognosis o un plan de tratamiento. En otro aspecto, el método puede también incluir la etapa de distinguir pacientes con TB latente de pacientes con TB activa. En un aspecto, el conjunto de datos de expresión genética del paciente es de células en por lo menos uno de sangre entera, células mononucleares de sangre periférica o esputo. En otro aspecto, el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 ó 393 genes seleccionados de los genes de la Tabla 2. En otro aspecto, el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, Módulos MI.3, M2.8, MI.5, M2.6, M2.2 y 3.1. En otro aspecto, los módulos genéticos asociados con infección de Mycohacterium tuberculosis son seleccionados del grupo que consiste de Módulo MI.3, Módulo M2.8, Módulos MI.5, Módulos M2.6, Módulo M2.2 y Módulo 3.1. En otro aspecto, los módulos genéticos asociados con infección de Mycohacterium tuberculosis son seleccionados con cambios en una disminución en genes relacionados con* célula B, una disminución en genes relacionados con célula T, un incremento en genes mieloide relacionados, un incremento en transcriptos neutrófilo relacionados y genes interferón inducibles (IFN) . En otro aspecto, el estado de enfermedad del paciente es determinado además mediante análisis . radiológico de los pulmones del paciente. En otro aspecto, el ' método también incluye la etapa de determinar un conjunto de datos de expresión genética del paciente tratado después que el paciente ha sido tratado y determinar si el conjunto de datos de expresión genética del paciente tratado ha regresado a un conjunto de datos de expresión genética normal, determinando mediante esto si el paciente ha sido tratado.
En otra modalidad, la presente invención es un método para distinguir entre infección de Mycohacterium tuberculosis activa y latente en un paciente sospechoso de estar infectado con Mycohacterium tuberculosis, el método comprende: obtener un primer conjunto de datos de expresión genética obtenido de un primer grupo clínico con infección de Mycojacteriuffl tuberculosis activa, un segundo conjunto de datos de expresión genética obtenido de un segundo grupo clínico con infección de Mycohacterium tuberculosis latente y un tercer conjunto de datos de expresión genética obtenido de un grupo clínico de individuos no infectados; generar un conjunto de datos de grupos de genes que comprenden la expresión diferencial de genes entre cualquiera de dos de los primeros, segundos y terceros conjuntos de datos; y determinar un patrón único de expresión/representación que es indicador de infección latente, infección activa o de ser saludable, en donde él conjunto de datos de expresión genética del paciente comprende por lo menos 6, 10, 20, 40, 50, 70, 80, 90, 100, 125, 150 ó 200 genes obtenidos de los genes en por lo 'menos uno de los Módulos Mi.3, M2.8, MI.5, M2.6, M2.2 y 3.1.
En todavía otra modalidad, la presente invención es un kit para diagnosticar la infección en un paciente que se sospecha de estar infectado con Mycohacterium tuberculosis, el kit comprende: un detector de expresión genética para obtener un conjunto de datos de expresión genética del paciente del .paciente, en donde los genes expresados son obtenidos de sangre entera del paciente; y un procesador apto de comparar el conjunto de datos de expresión genética con un conjunto de datos de módulos de genes pre-definidos asociado con infección de Mycobacterium tuberculosis y que distinguen entre pacientes infectados y pacientes no infectados, en donde la sangre entera demuestra un cambio de agregado en los niveles de polinucleótidos en uno o más módulos de expresión genética transcripcionales en comparación con pacientes no infectados coincidentes, distinguiendo mediante esto entre infección de Mycobacterium tuberculosis activa y latente. En un aspecto, el conjunto de datos de expresión genética del paciente es obtenido de células mononucleares de sangre periférica. En otro aspecto, el conjunto de datos de expresión genética del paciente comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 ó 393 genes seleccionados de los genes de la Tabla 2. En otro aspecto, el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, Módulos MI.3, M2.8, MI.5, M2.6, M2.2 y 3.1. En otro aspecto, los módulos genéticos asociados con la infección de Myco£>a cteri u/n tuberculosis son seleccionados del grupo que consiste de Módulo MI.3, Módulo M2.8, Módulos Mi.5, Módulos M2.6, Módulo M2.2 y Módulo 3.1. En otro aspecto, · los módulos genéticos asociados con la infección de Mycobacterium tuberculosis son seleccionados con cambios en una disminución en genes relacionados con célula B, una disminución en genes relacionados con célula T, un incremento en genes mieloide relacionados, un incremento en transcriptos neutrófilo relacionados y genes interferón inducibles (IFN). En otro aspecto, los genes son seleccionados de PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 y C5.
Otra modalidad de la presente invención es un sistema para diagnosticar un paciente con infección de Mycobacterium tuberculosis activa y latente que comprende: un detector de expresión genética para obtener un conjunto de datos de expresión genética del paciente, en donde los genes expresados son obtenidos de la sangre entera del paciente; y un procesador apto de comparar el conjunto de datos de expresión genética con un conjunto de datos de módulo genético pre-definido asociado con infección de Mycobacterium tuberculosis y que distingue entre pacientes infectados y pacientes no infectados, en donde la sangre entera demuestra un cambio de agregado en los niveles de polinucleótidos en el uno o más módulos de expresión genética transcripcionales, en comparación con pacientes no infectados coincidentes, distinguiendo mediante esto entre infección de Mycobacterium tuberculosis activa y latente, en donde el conjunto de datos de módulo genético comprende por lo menos uno de los Módulos MI.3, M2.8, MI.5, M2.6, M2.2 y 3.1. En un aspecto, el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 ó 393 genes seleccionados de los genes de la Tabla 2. En otro aspecto, el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, Módulos Mi.3, M2.8, MI.5, M2.6, M2.2 y 3.1. En otro aspecto, los módulos genéticos asociados con la infección de Mycobacterium tuberculosis son seleccionados del grupo que consiste de Módulo MI.3, Módulo M2.8 , Módulos MI.5, Módulos M2.6, Módulo M2.2 y Módulo 3.1. En otro aspecto, los módulos genéticos asociado con la infección de Mycobacterium tuberculosis son seleccionados con cambios en una disminución en genes relacionados con célula B, una disminución en genes relacionados con célula T, un incremento en genes mieloide relacionados, un incremento en transcriptos neutrófilo relacionados y genes interferón inducibles (IFN) . En otro aspecto, los genes son seleccionados de PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 y C5.
BREVE DESCRIPCIÓN DE LAS FIGURAS
Para un entendimiento más completo de los elementos y ventajas de la presente invención, se hace referencia ahora a la descripción detallada de la invención junto con las figuras adjuntas y en las cuales:
Las Figuras la a le. Una firma transcripcional de sangre entera distinta de TB activa. Cada hilera del mapa de calor representa un gen individual y cada columna un participante individual. La abundancia relativa de transcriptos en todo el documento es indicado por una escala de colores en la base de la figura (rojo, alto; amarillo, mediano; azul, bajo). (la) Los 393 genes expresados diferencialmente más significativos en el conjunto de entrenamiento organizado por agrupación jerárquica. (Ib) La misma lista de 393 transcriptos, ordenados en el mismo árbol genético, fue usada para analizar los datos del conjunto de pruebas independiente, con agrupamiento jerárquico mediante correlación de Spearman con enlace promedio que crea un árbol de condición (a lo largo del borde horizontal superior del mapa de calor) y el agrupamiento de estudio (esto es, el fenotipo clínico) presentado como bloques coloreados en la base de cada perfil. (le) El Conjunto de Validación independiente reclutado en Sudáfrica fue analizado como above .
Figuras 2a a 2c: La firma transcripcional de TB activa se correlaciona con la extensión radiográfica de la enfermedad. Radiografías del pecho para cada paciente en los conjuntos de prueba de entrenamiento e independientes fueron determinadas por tres clínicos independientes (Figura 9a) cegados a otros datos. (2a) Los 393 perfiles de transcripto son mostrados para cada paciente con TB activa en el Conjunto de Pruebas independiente. Se ilustran ejemplos radiográficos representativos de enfermedad avanzada, enfermedad moderada, enfermedad mínima y sin enfermedad. (2b, 2c) Los perfiles fueron agrupados de acuerdo con la extensión radiográfica de la enfermedad y la "Distancia Molecular a Salud" media (Métodos Adicionales) para cada grupo comparado utilizando ANOVA de Kruskal-Wallis , con pruebas post-hoc de comparación múltiple de Dunn para comparar entre grupos (*** = p <0.0001) .
Figuras 3a a 3d. La firma transcripcional de TB activa es disminuida durante el tratamiento exitoso. (3a) se volvieron a tomar muestras de 7 pacientes con TB activa (Activa) a 2 y 12 meses enseguida del inicio del tratamiento anti-micobacteriano y se compararon con testigos saludables del Conjunto de Pruebas independientes (Testigo, n = 12) . (3b) Radiografías de pecho al tiempo de diagnosis y 2 y 12 meses enseguida del inicio del tratamiento anti-micobacteriano, son mostrados para 2 de los 7 pacientes (marcados "4" o "7") . Los perfiles para estos individuos son mostrados arriba marcados por el mismo indicador numérico. (3c) "Distancia Molecular a la Salud" para cada paciente fue calculada en cada punto en el tiempo y comparada con el postinicio en el tiempo de tratamiento utilizando correlación de Spearman. (3d) La "Distancia Molecular a la Salud" media para cada punto en el tiempo fue comparada utilizando la prueba de Friedman, con pruebas post-hoc de comparación múltiple de Dunn para comparar entre puntos en el tiempo. Las barras horizontales indican la mediana, 5-ésimo y 95-ésimo percentiles.
Figuras 4a a 4e. La firma transcripcional de sangre entera de TB activa refleja tanto cambios distintos en composición¦ celular y cambios en los niveles absolutos de expresión genética. (4a) Expresión genética de TB activa en comparación con testigos saludables son mapeadas dentro de una estructura modular pre-definida . La intensidad de la mancha representa la proporción de transcriptos expresados diferencial de manera significativa para cada módulo (rojo = incrementado, azul = disminuido, abundancia de transcripto) . Interpretaciones funcionales determinadas previamente mediante perfilado de la literatura sin procesar son indicadas por la rejilla codificada por colores debajo (4b) Sangre entera de testigos saludables del conjunto de pruebas (Testigo) y pacientes de TB activos (Activo) analizados mediante citometria de flujo en cuanto a células T CD3+CD4+ y CD3+CD8+ y células B CD19+CD20+. Barras de error = mediana. (4c) Sangre entera de testigos saludables del conjunto de pruebas (Testigo) y pacientes de TB activa (Activa) analizados mediante citometria de flujo en cuanto a monocitos de CD14+, monocitos inflamatorios CD14+CD16+ y neutrófilos CD16+. Barras de error = mediana. (4d) Las rutas canónicas del análisis de rutas de ingenuidad . para la señalización de interferón es mostrada aquí con cada producto genético identificado con un símbolo correspondiente con su función (leyenda en la derecha) y transcriptos sobre-representados en los pacientes con TB activa del conjunto de entrenamiento son sombreados en rojo. (4e) Niveles en el suero de CXCL10 (IP10) de testigos saludables (Testigo) y pacientes con TB pulmonar activa (Activa) . Se llevó a cabo la comparación estadística utilizando la prueba de Mann-Whitney de dos colas. La barra horizontal indica la media para cada grupo, mientras los bigotes indican el intervalo de confianza del 95%.
Figuras 4f y 4g. Una . firma transcripción de 86 genes de sangre entera distinta de TB activa es distinta de otras enfermedades. (4f) Comparación de la firma de 86 genes en pacientes con TB y otras enfermedades normalizados con sus propios testigos; TB (entrenamiento, n=13; testigo, n=12), TB (SA, n=20; testigo = 12), grupo A Streptococcus (Strep; n=23; testigo=12), Staphylococcus (Staph; n=40; testigo=12), enfermedad de Still (Still; n=31; testigo=22), SLE adulta (SLE; n=29; testigo=16) y SLE pediátrica (pSLE; n=49; testigo=ll) pacientes. (4g) Niveles de expresión de firmas de 86 genes después de 2 y 12 meses de tratamiento de pacientes con TB.
Figura 4h. Expresión genética (enfermedad versus testigos saludables) de TB (conjunto de prueba) y diferentes enfermedades mapeadas dentro de una estructura modular predefinida. La intensidad de mancha (.rojo, incrementado; azul, disminuido) indica la abundancia del transcripto.
Figuras 5a y 5b. Expresión genética interferón-inducible en TB activa. La abundancia del transcripto del gen interferón-inducible (5a) en muestras de sangre entera de poblaciones de TB activa (conjuntos de entrenamiento, prueba, y validación) ; y (5b) expresión en poblaciones de leucocitos de sangre separadas de la sangre del conjunto de pruebas. La abundancia/expresión genética es mostrada en comparación con la mediana de los testigos saludables (marcados como en la Figura 1) . Los números mostrados en el conjunto de prueba y las poblaciones separadas corresponden a pacientes individuales.
Figuras 6a a 6d. PDLl (CD274) es sobreabundante en sangre entera de pacientes con TB activa, predominantemente debido a su sobreexpresión por neutrófilos. (6a) Abundancia de PDLl (normalizada a la mediana de todas las muestras) en sangre entera de pacientes con TB activa (Activa) y testigos saludables (Testigo) (o Sudáfrica latente) . También se muestra la intensidad de fluorescencia media geométrica (MFI) de PDLl en leucocitos de sangre entera de un paciente representativo y testigo. Los niveles de MFI están enlazados a perfiles de expresión para PDLl por las flechas. La gráfica muestra los datos de MFI acumulados de 11 pacientes con de TB activos y 11 testigos saludables (barras de error= media ± 95% de intervalo de confianza) . (6b) La MFI de PDL1 en diferentes sub-poblaciones de células (azul) , en comparación con PDL1 en leucocitos totales (rojo) y testigo de isotipo de las células totales (verde) . Se muestra un testigo y un paciente. Las gráficas muestran los datos de MFI acumulados del mismo número de pacientes de TB activos y testigos saludables (barras de error= media ± 95% de intervalo de confianza) . (6c) La expresión para PDL1, normalizada a la mediana de todas las muestras, es mostrada para 4 testigos y 7 pacientes con TB activa en sub-poblaciones celulares enriquecidas. (6d) La abundancia de PDL1 en la sangre entera de 7 pacientes con TB activa (Activa) es mostrada a 0, 2 y 12 meses post-tratamiento anti-micobacteriano, en comparación con 12 testigos saludables del conjunto de prueba (Testigo) .
Figuras 7a a 7c. Formación de los conjuntos de entrenamiento, prueba y validación. Cada cohorte no fue solamente reclutado independientemente, sino que todas las etapas del procesamiento de ARN y análisis de microarreglo fueron también efectuadas completamente de manera independiente. (7a) El reclutamiento del cohorte del conjunto de entrenamiento en Londres, Reino Unido de la Gran Bretaña; (7b) El reclutamiento del cohorte del conjunto de pruebas independientes en Londres, Reino Unido de la Gran Bretaña. (7c) El reclutamiento del cohorte del conjunto de validación independiente en Ciudad del Cabo, Sudáfrica.
Figuras 8a a 8e. Agrupamiento jerárquico de perfiles del paciente. (8a) Los 1836 perfiles de expresión del transcripto para el conjunto de entrenamiento fueron sometidos a agrupamiento jerárquico sin supervisar mediante correlación de Spearman con enlace promedio para crear un árbol de condición (a lo largo del borde superior del mapa de color) . Estos grupos de pacientes pueden luego ser comparados con los parámetros clínicos y demográficos mostrados en bloques debajo de cada perfil a lo largo del borde inferior del mapa de color. Se provee una clave en el fondo de la figura. Los grupos fueron divididos igualmente de acuerdo con distancia. (8b) Los 393 perfiles de expresión de transcripto para el conjunto de pruebas agrupado mediante correlación de Pearson con enlace promedio. (8c) Los 393 perfiles de expresión de transcripto para el conjunto de validación agrupado mediante correlación de Pearson con enlace promedio. (8d y 8e) Los 393 perfiles de expresión del paciente de transcripto para solamente aquellos de edad de 22 a 34 años de edad en el conjunto de validación.
Figuras 9a a 9c. Una comparación de la firma transcripcional de TB activa con la extensión radiográfica de la enfermedad. (9a) El esquema de clasificación usado para graduar radiografías de pecho de acuerdo con la extensión de enfermedad. (9b) Los 393 perfiles de expresión de transcripto para todos los 13 pacientes con TB activa en el conjunto de entrenamiento, junto con su radiografía de pecho correspondiente tomada al tiempo de la diagnosis, cuando ambos se agruparon de acuerdo con el grado de rayos X según el esquema de clasificación. Se da al perfil de expresión y radiografía de un paciente dado el mismo indicador numérico. (9c) Los 393 perfiles de expresión del transcripto y radiografías de pecho para los 21 pacientes con TB activa en el Conjunto de Prueba.
Figuras 10a a lOd. La firma transcripcional de sangre entera de TB activa refleja tanto cambios distintos en composición celular como cambios en los niveles absolutos de expresión genética. La expresión genética de TB activa en comparación con testigos saludables es mapeada dentro de una estructura modular pre-definida . La intensidad de la mancha representa la proporción de transcriptos expresados diferencialmente de manera significativa para cada módulo (rojo = incrementado, azul = disminuido, abundancia de transcriptos) . Interpretaciones funcionales previamente determinadas mediante perfilado de la literatura sin polarizar son indicadas por la rejilla codificada por colores en la Figura 4 principal. Aquí, se demuestra que el porcentaje de genes en cada módulo que está sobre-representado (rojo) o sub-representado (azul) en el Conjunto de Entrenamiento (10a); (10b) Conjunto de Pruebas; (10c) Conjunto de Validación (SA) . (lOd) La distancia molecular ponderada a la salud fue calculada para cada paciente en el pre-tratamiento de referencia (0 meses) y a 2 y 12 meses enseguida del inicio de la terapia anti-micobacteriana . Los números de paciente individuales, corresponden a aquellos mostrados en las Figuras 3a a 3d.
¦ Figuras lia a 11c. Análisis de linfocitos en sangre de pacientes con TB activa y testigos, (lia) Se muestran estrategias de recorte citométricas de flujo para analizar sangre entera de testigos saludables del conjunto de pruebas y pacientes con TB activa en cuanto a células T y células B. La hilera superior de paneles muestra la estrategia de recorte usada para determinar la compuerta de FSC/SSC de linfocito en el recorte subsecuente. Un recorte de FSC/SSC grande fue ajustado inicialmente (panel izquierdo) y luego analizado en cuanto a CD45 vs CD3. Las células de CD45CD3 fueron recortadas (panel medio) y su perfil de FSC/SSC determinado (panel derecho) . Este perfil fue luego usado para determinar un recorte de FSC/SSC de linfocito apropiado (véase segunda hilera, panel izquierdo) . Este procedimiento de recorte de compuerta también se llevó a cabo en el recorte de CD45+CD19+ (células B) para asegurar que estas células estuvieran incluidas en la . compuerta linfocitica (no mostrada ) .
La segunda hilera de paneles muestra la estrategia de recorte usada para identificar las poblaciones de células T. un recorte de FSC/SCC de linfocito fue establecido y estas células fueron determinadas en cuanto a CD45 vs CD3 (2do. Panel de la izquierda) . Luego, las células CD45+ fueron recortadas y determinadas en' cuanto a CD3 vs CD8. Las células T CD3+ fueron recortadas y determinadas en cuanto a expresión de CD4 y CD8. Luego, los subconjuntos de CD4+ y CD8+ fueron recortados. Las hilera 3-6 muestran la estrategia de recorte usada para definir subconjuntos de memoria de célula T. las células T CD4 y CD8 recortadas como en la hilera 2 fueron determinadas en cuanto a expresión de CD45 RA vs CCR7 y un cuadrante establecido en base a testigos de isotipo (hilera 5 y 6) para definir memoria naive (CD45RA+CCR7+) , memoria central (CD45RA-CCR7+) , memoria efectora (CD45RA-CCR7-) y en el caso de células T CD8+, células T efectoras diferenciadas terminalmente (CD45RA+CCR7-) . Estos subconjuntos fueron también determinados en cuanto a expresión de CD62L. La hilera interior de los paneles muestran la estrategia usada para recortar células B. Un recorte de FSC/SSC de linfocito fue establecido y las células determinadas en cuanto a CD45 vs CD19. Las células CD45+ fueron recortadas y determinadas en cuanto a CD19 y CD20. Las células B fueron definidas como CD19+CD20+. (11b) Sangre entera de 11 testigos saludables de conjunto de prueba (testigo) y 9 pacientes de TB activos del conjunto de prueba (activo) fue analizada mediante citometria de flujo de multiparámetros en cuanto a poblaciones de memoria de células T. la estrategia de recorte mediante citometria de flujo plena es mostrada en la Figura 11a. Las gráficas muestran los datos acumulados de todos los individuos en cuanto porcentajes de subconjuntos de células efectores naive, de memoria central (TCM) , memoria efectora (TEM) y diferenciadas terminalmente (TD, células T CD8+ solamente) (hilera superior, cada grupo) y números de células (xloVml) para cada subconjunto de células (hilera inferior, cada grupo). Cada símbolo representa un paciente individual. La línea horizontal representa la mediana. (11c) La abundancia del transcripto de célula T de gen (i) en muestras de sangre entera de TB activo (conjuntos de entrenamiento, prueba y validación) y (ii) expresión en poblaciones de leucocito sanguíneo separados de la sangre del conjunto de prueba. La abundancia/expresión genética es mostrada en comparación con la mediana de los testigos saludables (marcados con la Figura 1) . Los números mostrados en el conjunto de pruebas y las poblaciones separadas corresponden a pacientes individuales.
Figuras 12a a 12c. Análisis de células mieloides en sangre de pacientes de TB activos y testigos. (12a) Se muestran las estrategias de recorte citométricas de flujo usadas para analizar sangre entera de testigos saludables del conjunto de pruebas y pacientes con TB activo en cuanto a monocitos y neutrofilos. Un recorte de FCS/SCC grande fue establecido (hilera superior, panel izquierdo) y fue analizado en cuanto a CD45 vs CD1 . Las células CD45+ fueron recortadas (panel medio) y determinadas en cuanto a CD14 vs CD16. Los monocitos fueron definidos como CD14+, monocitos inflamatorios como CD14+CD16+ y neutrofilos como CD16+. También se muestra en esta figura la estrategia de recorte usada para determinar la súper posición o traslape posible entre neutrofilos de CD16+ y células NK que expresan CD16. Un recorte de FSC/CSS grande fue establecido para abarcar tanto neutrofilos como células NK. (12b) las células CD45+ fueron luego determinadas en cuanto CD16 vs CD56 (marcador de células NK) los neutrofilos de CD16+ expresaron altos niveles de CD16 y no de CD56 (como se muestra por la gráfica de control de isotipo, para panel inferior) . Las células NK de CD56+ expresaron niveles intermedios de CD16 y no se traslaparon con células CD16hi. Las células CD56+CD16 y las células CD16hi tuvieron diferentes propiedades de FSC/CSS. (12c) Abundancia de transcripto de gen mieloide (i) en muestras de sangre entera de TB activa (conjuntos de entrenamiento, prueba y validación) y (ii) expresión en población de leucocitos sanguíneos separados de la sangre del conjunto de prueba. La abundancia/expresión genética es mostrada en comparación con la mediana de los testigo saludables (marcado como en la Figura 1) . Los números mostrados en el conjunto de prueba y las poblaciones separadas corresponden a pacientes individuales.
Las Figuras 13a y 13b. Análisis de rutas de ingenuidad de la firma del transcripto 393. (13 a) La probabilidad (como un -logaritmo del valor p calculado por la Prueba Exacta de Fischer, con corrección de prueba múltiple de Benjamini-Hochberg) de que cada ruta biológica canónica sea sobre representada significativamente es indicada por los cuadrados anaranjados. Las barras de colores continuos representan el porcentaje del número total de genes que comprenden aquella ruta (dada en en negritas en el borde derecho de cada barra) presente en la lista genética analizada. El color de la barra indica la abundancia de aquellos transcriptos en la sangre entera de pacientes con TB activa en comparación con testigos saludables en el conjunto de entrenamiento. (13b) Niveles en el suero de interferon-alfa 2a ( IFN-alfa-2a) e interferon-gama (IFN-gama) son mostrados en la presente para, los 12 testigos saludables y 13 pacientes con TB activa usados para los análisis de micro arreglo del conjunto de entrenamiento. No se observo ninguna diferencia significativa entre grupos ya sea para citoquina utilizando la prueba de Mann- hitney de dos colas. La linea horizontal indica la media para cada grupo y los bigotes indican el intervalo de confianza de 95 %.
La Figura 13c muestra los niveles de suero en el interferón-alfa 2a (IFN-alfa 2a), y el interferón-gama (IFN-gama) se muestra aquí para los controles de salud 12 y pacientes 13 con TB activo usado para el análisis de microarreglo del juego de entrenamiento. No se observó diferencia significante entre los grupos para alguna citosina que usara la prueba de Mann-Whitney de dos colas. La linea horizontal indica el significado para cada grupo y los pelos indicaron el 95% de intervalo de conflabilidad .
Figuras 14a a 14f. Expresión de PDL1 (CD274) en sangre entera y sub poblaciones celulares de testigos saludables individuales y pacientes con TB activa. (14a) Sangre entera de 11 testigos saludables del conjunto de prueba (testigo) y 11 pacientes con TB activa del conjunto de prueba (activa) fue analizada mediante citometria de flujos en cuanto a la expresión de PDL1. Un recorte de FSC/CSS grande fue establecido para abarcar glóbulos blancos sanguíneos totales y la intensidad de fluorescencia mediación métrica ( FI) de PDL1 (en rojo) en comparación con el testigo de isotipo (verde) determinado. Cada paciente de TB activo fue analizado en un día diferente, los testigos saludables fueron analizados de pequeños grupos (desde la izquierda, las muestras l y 2, 3 y 4, 6 y 8 y 9-11 se pusieron en operación conjuntamente, el 5 se puso en operación individualmente) y las muestras dentro de cada grupo comparten un control de isotipo. (14b) Subpoblaciones celulares de la sangre de los mismos 11 testigos saludables del conjunto de prueba (testigo) y 11 pacientes con TB activa del conjunto de prueba (activo) como en la parte a fueron también anal-izadas mediante citometria de flujo en cuanto a expresión de PDL1. Las subpoblaciones celulares fueron definidas como en la Figura 6b y la MFI DE PDLU1 (en rojo) en comparación con el control de isotipo (verde) graficadas.
Figuras 15a y 15b. Los perfiles del transcripto de 393 del conjunto de. entrenamiento ordenados de acuerdo con el grupo de estudio son mostrados amplificados con símbolos de gen son enlistados en la derecha de la Figura. Los transcriptos claves son presentados por un texto más grande. A a la izquierda de "cada figura, se muestra todo el árbol genético y mapa de calor, con el área ampliada marcada por un rectángulo negro. La abundancia relativa de transcriptos es indicada por una escala de colores en la base de la figura (como en la figura 1) .
Las Figuras 16a a 16f son mapas de calor que comparan el testigo, latente y activo para los varios genes, como se enlista en el lado derecho de los mapas de calor.
Las Figuras 17a a 17c son tablas con estadísticas para los varios conjuntos de entrenamiento, conjuntos de prueba y conjuntos de validación como se enlista en las tablas, es decir, genero, país de origen y etnicidad con varios rompimientos.
Las Figuras 18a a 18c son tablas con estadísticas para los varios conjuntos de entrenamiento, conjuntos de prueba y conjuntos de validación como se indica en las tablas, es decir, resultados de prueba para TST, BCG vacunación y estatus de frotis.
La Figura 19 es una tabla que resume los resultados en cuanto a especificidad y sensibilidad de los conjuntos de entrenamiento conjuntos de prueba y conjuntos de validación entre las varias fuentes para los ejemplos.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
En tanto que la elaboración y uso de varias modalidades de la presente invención son discutidas en detalle a continuación, se debe apreciar que la presente invención provee muchos conceptos inventivos aplicables que pueden ser implementados en una amplia variedad de contextos específicos. Las modalidades específicas discutidas en la presente son solamente ilustrativas de maneras específicas para elaborar y usar la invención y no delimitan e'l alcance de la invención.
Para facilitar el entendimiento de esta invención, el número de términos son definidos posteriormente en la presente. Los términos definidos de la presente tienen significados como se entiende comúnmente por la persona de habilidad ordinaria en las aéreas relevantes a la presente invención. Términos tales como "uno", "un" y "el" no pretenden referirse solo a una entidad singular, sino que incluyen la clase en general de la cual un ejemplo especifico puede ser usado por ilustración. La terminología en la presente es usada para describir modalidades específicas de la invención, pero su uso no delimita la invención, excepto como se resume en las reivindicaciones. A no ser que se definan de otra manera, todos los términos técnicos y científicos usados en la presente tienen el significado entendido comúnmente por la persona experimentada en el arte con la cual esta invención es concerniente. Las siguientes referencias proveen a aquel de habilidad en el arte una definición general de muchos de los términos usados en esta invención: Singleton et al., Dictionary of Microbiology and Molecular Biology (2d ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5TH ED., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991) .
Varios métodos bioquímicos y métodos de biología molecular son bien conocidos en el arte. Por ejemplo, métodos de aislamiento y purificación de acido nucleicos son descritos en detalle en O 97/10365; WO 97/27317; capítulo 3 de Laboratory Techniques in Biochemistry y Molecular Biology: Hybridization with Nucleic Acid Probes, Part I. Theory and Nucleic Acid Preparation, (P. Tijssen, ed.) Elsevier, N.Y. (1993); Sambrook, et al . , Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, N.Y., (1989); and Current Protocols in Molecular Biology, (Ausubel, F. M. et al., eds . ) John Wiley & Sons, Inc., New York (1987-1999), incluyen complementos
Definiciones de bioinformatica
Como se usa en la presente, un "objeto" se refiere a cualquier ítem o información de interés (en general textual, incluyendo nombre, verbo, adjetivo, adverbio, frase, oración, símbolo, caracteres médicos, etc.). Por consiguiente, un objeto es cualquier cosa que puede formar una relación y algo que puede ser obtenido, identificado y/o buscado de una fuente. "Objetos" incluye pero no están limitados a una entidad de interés tal como gen, proteína, enfermedad, genotipo, mecanismo, fármaco, etc. En algunos aspectos, un objeto puede consistir de datos como se describe posteriormente en la presente.
Como se usa en la presente, una "relación" se refiere a la co-presencia de objetos en la misma unidad (por ejemplo, una frase, oración, dos · o mas líneas de texto, un párrafo, una sección de una pagina web, una pagina, una revista, documento, libro, etc.). Puede ser texto, símbolos, números y combinaciones de los mismos.
Como se usa en la presente "contenido de meta dato" se refiere a información en cuanto a la organización de texto en una fuente de datos. Meta datos pueden comprender meta datos estándar tales como meta datos de Dublin Core o pueden ser específicas de colección.
Ejemplos de formatos de meta datos incluyen pero no están limitados a, registros de Catálogo que se puede Leer por la Máquina (MARC) usados para Catálogos de Bibliotecas, Formato de Descripción de Recursos (RDF) y el Lenguaje de Marcación Extensible (XML) . Los meta objetos pueden ser generados manualmente o por medio de algoritmos de extracción de información automatizados.
Como se usa en la presente, un "motor" se refiere a un programa que efectúa una función central o esencial para otros programas. Por ejemplo, un motor puede ser un programa central en un sistema operativo o programa de aplicación que coordina la operación global de otros programas. El término "motor" también se puede referir a un programa que contiene un algoritmo que puede ser cambiado. Por ejemplo, un motor de descubrimiento de conocimiento puede ser diseñado de tal manera que su procedimiento para identificar relaciones puede ser cambiado para reflejar nuevas reglas de identificar y clasificar relaciones.
Como se usa en la presente "análisis semántico" se refiere a la identificación de relaciones entre palabras que representan conceptos similares, por ejemplo, por medio de remoción de sufijos o derivación o al usar un libro de referencia de sinónimos. "Análisis estadístico" se refiere a una técnica basada en contar el número de presencias de cada termino (palabra, raíz de palabra, derivación de palabra, n-grama, frase, etc.)- En correcciones no restringidas en cuanto al sujeto, la misma frase usada en diferentes contextos puede representar contextos diferentes. El análisis estadístico de la co-presencia de frases puede ayudar a resolver la ambigüedad del sentido de la palabra. "Análisis sintáctico" puede ser usado para disminuir adicionalmente la ambigüedad mediante el análisis de la parte de habla. Como se usa en la presente, uno o más de tales análisis son denominados mas en general como "análisis léxicos". "Inteligencia Artificial (AI)" se refiere a métodos mediante los cuales un dispositivo no humano, tal como una computadora, efectúa tareas que los humanos considerarían valiosas o "inteligentes". Ejemplos incluyen identificar imágenes, entender palabras habladas o texto escrito y resolver problemas.
Términos tales como "datos", "conjunto de datos" y "información" son frecuentemente usados de manera intercambiable como lo son "información" y "conocimiento". Como se usa en la presente, "dato" es la unidad mas fundamental que es una medición empírica o conjunto de mediciones. Los datos son compilados para contribuir a información, pero son fundamentalmente independientes de la misma y pueden ser combinados en un conjunto de datos, esto es, un conjunto de datos. La información, en contraste, es derivada de intereses, por ejemplo, datos (la unidad) pueden ser reunidos en cuanto a etnicidad, genero, altura, peso y dieta por el propósito de encontrar variables correlacionadas con riesgo de enfermedad cardiovascular. Sin embargo, los mismos datos podrían ser usados para desarrollar una formula o para crear "información" acerca de preferencias dietéticas, esto es, probabilidad de que ciertos en un supermercado tengan una probabilidad mas alta de ventas.
Como se usa en la presente, el termino "base de datos" se refiere a depósitos para datos sin procesar o datos compilados, aun si se pueden encontrar facetas informacionales en los campos de datos. Una base de datos puede incluir uno más conjuntos de datos. Una base de datos esta organizada comúnmente de tal manera que su contenido pueda ser accedido, manipulado y actualizado (por ejemplo, la base de datos es dinámica) . El termino "base de datos" y "fuente" son también usados intercambiablemente en la presente invención, debido a que las fuentes primarias de datos e información son bases de datos. Sin embargo, una "base de datos fuente" o "datos fuente" se refieren en general a datos, por ejemplo, datos de texto sin estructurar y/o datos estructurados que son introducidos al sistema para identificar objetos y determinar relaciones. Una base de datos fuente puede o puede no ser una base de datos relacional. Sin embargo, una base de datos de sistema usualmente incluye una base de datos relacional o algún tipo equivalente de base de datos que almacena valores relacionados con relaciones entre objetos.
Como se usa en la presente, una "base de datos de sistema" y "base de datos relacionada" son usados intercambiablemente y se refieren a una o mas conexiones de datos organizados como un conjunto de tablas que contienen datos ajustados en categorías predefinidas. Por ejemplo, una tabla de base de datos puede comprender una o mas categorías definidas por columnas (por ejemplo, atributos) , mientras que las hileras de la base de datos pueden contener un objeto único para las categorías definidas por las columnas. Así, un objeto tal como la identidad de un gen podría tener columnas en cuanto a su presencia, ausencia y/o nivel de expresión del gen. Una hilera de base de datos relacional puede también ser denominada como un "conjunto" y es en general definida por los valores de sus columnas. Un "dominio" en el contexto de una base de datos relacional es un intervalo de valores validos de un campo, tal como una. columna puede incluir.
Como se usa en la presente, un "dominio de conocimiento" se refiere a una área de estudio en la cual el sistema es operativo, por ejemplo, todos los datos biomédicos. Se debe indicar que hay ventaja de combinar datos de varios dominios, por ejemplo datos biomédicos y datos de ingeniería, ya que estos datos diversos pueden algunas véces enlazar cosas que no pueden ser puestas conjuntamente para una persona normal que esta solamente familiarizada con un área de investigación /estudio (un dominio) . Una "base de datos distribuida" se refiere a una base de datos que puede ser disfrazada o replicada entre diferentes puntos en una red.
Como se usa en la presente "información" se refiere a un conjunto de datos que puede incluir números, letras, conjuntos de números, conjuntos de letras o conclusiones resultantes o derivadas de conjunto de datos. "Datos" es entonces una medición o estadística y la unidad fundamental de- información. "Información" puede también incluir otros tipos de datos, tales como palabras, símbolos, texto, tales como texto libre sin estructurar, códigos, etc. "Conocimiento" es definido holgadamente como un conjunto de información que da suficiente entendimiento de un sistema para modelar causa y efecto. Para extender el ejemplo previo, la información en cuanto demografía, genero y compras previas pueden ser usadas para desarrollar una estrategia de comercialización regional para ventas de alimentos mientras que la información en cuanto la nacionalidad podría ser usada por compradores como directrices para importación de productos. Es importante notar que no hay fronteras estrictas entre datos, información y conocimiento; los tres términos son algunas veces considerados equivalentes. En general, los datos vienen del examen, la información viene de la correlación y el conocimiento viene del modelado.
Como se usa en la presente, un "programa" o "programa de computadoras" se refiere en general a una unidad sin táctica que se conforma a las reglas de un lenguaje de programación particular y que esta compuesta de declaraciones y afirmaciones o instrucciones, divisibles en "segmentos de códigos" necesarios para resolver o ejecutar una cierta función, tarea o problema. Un lenguaje de programación es en general un lenguaje artificial para expresar programas.
Como se usa en la presente, un "sistema" o un
"sistema de computadora" se refieren en general a una o más computadoras, equipo periférico y elementos de programación que efectúan el procesamiento de datos. Un "usuario" o un "operador de sistema" incluyen en general una persona que usa una red de computadoras accedida por medio de un "dispositivo de usuario" (por ejemplo, una computadora, un dispositivo inalámbrico, etc.) por el propósito de procesamiento de datos e intercambio de información. Una "computadora" es en general una unidad funcional que puede efectuar cálculos sustanciales, incluyendo numerosas operaciones aritméticas y operaciones lógicas sin intervención humana.
Como se usa en la presente, "elementos de programación de aplicación" o "programas de aplicación" se refiere en general a elementos de programación o un programa que es especifico a la solución de un problema de aplicación. Un "problema de aplicación" es en general un problema presentado por un usuario final y que requiere procesamiento de información para su solución.
Como se usa en la presente, "lenguaje natural" se refiere a un lenguaje cuyas reglas están basadas en el uso actual sin ser prescritas específicamente, por ejemplo Ingles, Español o Chino. Como se usa en la presente, un "lenguaje artificial" se refiere a un lenguaje cuyas reglas son establecidas explícitamente antes de su uso, por ejemplo, lenguajes de programación de computadora tales como C, C++, Java, BASIC, FORTRAN o COBOL.
Como se usa en la presente, "relevancia estadística" se refiere a uno o mas de los esquemas de clasificación (proporción de O/E, fuerza, etc.), en donde se determina que una relación es estadísticamente relevante si . se presenta de manera significativa mas frecuentemente de lo que se esperaría por una probabilidad aleatoria.
Como se usa en la presente, los términos "genes regulados coordinadamente" o "módulos transcipcionales" son usados intercambiablemente para referirse a perfiles de expresión genética agrupados (por ejemplo, valores de señal asociados con una secuencia genética especifica) de genes específicos. Cada módulo transcripcional correlaciona dos piezas clave de datos, una porción de búsqueda de literatura y datos del valor de expresión genética empírica reales obtenidos de un micro arreglo genético. El conjunto de genes que es seleccionado a módulos transcripcionales esta basada en el análisis de datos de expresión genética (algoritmo de extracción de módulo descrito anteriormente) . Etapas adicionales son enseñadas por Chaussabel, D. & Sher, A. Mining microarray expression data by literature profiling. Genome Biol 3, RESEARCH0055 (2002),
(http: //qenomebioloqy . com/2002/3/10/research/0055) porciones relevantes incorporadas en la presente por referencia y datos de expresión obtenidos de una enfermedad o condición de interés, por ejemplo, Lupus eritematoso Sostemico, artritis, linfoma, carcinoma, melanoma, infección aguda, alteraciones autoinmunes, alteraciones autoinflamatorias , etc.).
La tabla a continuación enlista ejemplos de palabras claves que fueron usadas para desarrollar la porción de búsqueda en la literatura o contribución a los módulos de transcripción. El experimentado en el arte reconocerá que otros términos pueden fácilmente ser seleccionados para otras condiciones, por ejemplo canceres específicos, enfermedad infecciosa especifica, trasplante, etc. Por ejemplo, genes y señales para aquellos genes asociados con activación de célula T son descritos posteriormente en la presente como módulo ID "M 2.8" en el cual ciertas palabras claves (por ejemplo, Linfoma, células T, CD4,CD8,TCR, Timo, Linfoide, IL2); fueron usadas para identificar genes asociados a células T claves, Por ejemplo, marcadores de superficie de célula T (CD5, CD6, CD26, CD28, CD96) ; moléculas expresadas por células de linaje linfoide (linfotoxina beta, cinasa de célula T IL2-inducible, TCF7 y proteina de diferenciación de mal, GATA 3, STAT5B) . Enseguida, el módulo completo es desarrollado al correlacionar datos de una población de pacientes por estos genes (sin consideración de plataforma, presencia /ausencia y/o regulación ascendente o descendente) para generar el módulo transcripcional . En algunos casos, el perfil genético no coincide (en ese tiempo) con cualquiera agrupamiento particular de genes para estas condiciones de enfermedad y dato, sin embargo, ciertas rutas fisiológicas (por ejemplo, señalización de cAMP, proteínas de zinc-dedo, marcadores de superficie celular, etc.) son encontradas en los módulos "subdeterminados" . En efecto, el conjunto de datos de expresión genética puede ser usado para extraer genes que han coordenado la expresión antes de coincidir con la búsqueda de palabras clave, esto es, ya sea en uno u otro conjunto de datos puede ser correlacionado antes de la referencia cruzada con el segundo conjunto de datos.
Tabla 1. Módulos transcripcionales .
I.D. de
Módulo de Selección de palabra clave
Ejemplo ejemplar Determinación de perfil genético
Células de plasma: Inlcuye genes que codifican por cadenas de inmonoglobulina (p.e, 1GHM, IGJ, IGLL1 ,
Ig, Inmunoglobulina, hueso, IGKC, IGHD) y el marcador de célula de plasma es de
M 1.1 osea, PreB, IgM, Mu. CD38.
Plaqueta, adhesión, agregación, endotelial, vascular, plaquetas : incluyen genes que codifican por microproteínas de plaquetas(ITGA2B, ITGB3, GP6, GP1 A/B), y mediadores inmunes derivados de plaquetas tales como PPB (proteína básica de plaquetas) y PF4
M 1.2 (factor 4 de plaquetas).
Sin determinar: Este módulo incluye genes que codifican inmune-relacionados (CD40, CD80, CXCL12, IFNA5, IL4R) también como moléculas citoesqueleto-relacionadas
Adenoma, Intersticial, (Miosina, Dedicador de Citoquenesis, Syndecan 2, Plexina
M 2.5 Mesénquima, Dendrita, Motriz Cl , Distrobrevina).
Linaje Mieloide: Relacionado con M.5. Incluye genes expresados en células de linaje mieloide (IGTB2/CD18, receptor beta de Linfotoxina, Receptor 1 de péptido de
Granulocitos, Monocitos, formilo de proteínas 8/14 mieloides relacionadas tales
M 2.6 Mieloide, ERK, Necrosis como monocitos y neutrofilos),
Sin determinar: Este módulo esta compuesto extensamente de transcritos sin una función conocida, solamente de intergenes asociados con literatura incluyendo un miembro de las familias del factor semejante a quiniosina
M 2.7 Sin palabras clave extraídas (CKLFSF8).
Células T : Incluyen marcadores de superficie de célula T (CD5, CD6, CD7, CD26, CD28, CD96) y moléculas expresadas por células de linaje linfoide (linfotoxina beta,
Linfoma, células T, CD4, CD8, cinasa de célula T IL2-inducible, TCF7, proteína de
M 2.8 TCR, Timo, Linfoide, IL2 diferenciación de células T mal, GATA3, STAT5B).
Sin determinar: Incluye genes que codifican moléculas que se asocian al citoesqueleto (Proteína 2/3 actina relacionada, MAPK1 , MAP3K1 , RAB5A). También presentes están
ERK, Transactivación, genes expresados por células T (FAS, ITGA4/CD49D,
M 2.9 Citoesqueletal, MAPK, JNK ZNF1A1).
Sin determinar: Incluyen genes que codifican por
moléculas de superficie celular inmune-relacionadas
Mieloide, Macrófago, (CD36, CD86, LILRB), citoquinas (IL15) y moléculas Dendrítica, Inflamatoria, involucradas en rutas de señalización (FYB, ruta del
M 2.10 Interleucina receptor semejante a toll TICAM2).
Sin determinar: Incluye cinasa(UHMKl, CSN 1G1 , CDK6, WNK1 , TAOK1, CALM2, PRKCI, ITPKB, SRPK2, STK17B, DYRK2, PIK3R1, STK4, CLK4, P N2)
Replicación, Represión, RAS, y miembros de la familia de RAS (G3BP, RAB 14, RASA2,
M 2. l l Autofosforilación, Oncogénica RAP2A, RAS).
Interferon-inducibles: Este conjunto incluye genes interferon-inducibles: Moléculas Antivirales (OAS 1/2/3/L, GBP 1 , G1P2, EIF2AK2/PKR, MX1 , PML), quimiosinas
ISRE, Influenza, AntiViral, IFN- (CXCL10/IP-10), moléculas de señalización (ST ATI ,
M 3.1 gama, IFN-alfa, Interferon STAt2, IRF7, ISGF3G).
Inflamación I: Incluye genes que codifican moléculas involucradas én procesos inflamatorios (p.e., IL8, ICAM1 , C5R1 , CD44, PLAUR, IL1A, CXCL16), y reguladores de apoptosis (MCL1 , FOX03A, RARA, BCL3/6/2A1 ,
TGF-beta, TNF, Inflamatoria, GADD45B).
M 3.2 Apoptotica, Lipopolisacárido
Inflamación II: Incluyen moléculas que inducen o son inducibles de CSF Granulocito-Macrofago (SPI1 , IL18, ALOX5, ANPEP), también como enzimas lisosomales
Granulocito, Inflamatorio,
(PPT1 , CTSB/S, CES1 , NEU1 , ASAH1 , LAMP2, CAST).
M 3.3 Defensa, Oxidar, Lisosomal
Sin determinar: Incluye fosfato d e proteínas (PPP 1R12A, PTPRC, PPPICB. PPMIB) y miembros de la familia de fosfonoisitide 3-cinasa(PI3K) (PI 3CA, PIK32A,
M 3.4 Sin palabras clave extraídas PIP5K3).
Sin determinar. Compuestos solamente de un número pequeño de transcriptos. Incluyendo genes de
hemoglobina.(HBAl , HBA2, HBB).
M 3.5 Sin palabras clave extraídas
Sin determinar: Conjunto grande que incluye marcadores de superficie de Células T (CD101 , CD102, CD103)
Complemento, Conductor, también como moléculas expresadas ubicuamente entre Oxidante, Citosqueletal, Células leucocitos de sangre (CXRCR1 : receptor fractalquina,
M 3.6 T CD47, ligando de P-selectina).
Sin determinar : Incluye genes que codifican sub unidades de proteasoma(PSMA2/5, PSMB5/8); ligasas de proteína de ubiquitina HIP2, STUB1 , también como componentes
Rebanosoma, Metilación,
de complejos de ubiquitina ligasa (SUGT1).
M 3.7 Ubiquitina, Beta-catenina
Sin determinar: Incluye genes que codifican para varias enzimas: aminometiltransferasa, arginiltransferasa, asparaginas sintetasa, diacilglicerol cinasa, inositol fofatasas, metiltransferasas, helicasas...
M 3.8 CDC, TCR, CREB, Glicosilasa
Sin determinar: Incluyen genes que codfican por cinasa de proteína (PRKPIR, PR DC, PRKCI) y fosfatases (p.e.,
Cromatina, Punto de PTPLB, PPP1 R8/2CB). También incluye miembros de la verificación, Replicación, familia del oncogéno RAS y el receptor de células NK
M 3.9 Transactivación 2B4 (CD244).
Definiciones biológicas
Como se usa en la presente, el término "arreglo" se refiere a un soporte sólido o sustrato con uno o 'más péptidos o sondas de ácido nucleico anexados al soporte. Los arreglos tienen comúnmente uno o más diferentes ácidos nucleicos o sondas de péptido que son acoplados a una superficie dé un sustrato en diferentes sitios conocidos. Estos arreglos, también descritos como "micro arreglos" o "sitios genéticos" pueden tener 10,000; 20,000, 30,000 o 40,000 diferentes genes identificables en base al genoma conocido, por ejemplo el genoma humano. Estos pan-arreglos son usados para detectar todo el "transcriptoma" o fondo de transcripción de genes que son expresados o encontrados en una muestra, por ejemplo, ácidos nucleicos que son expresados como ARN, mARN y los semejantes y pueden ser sometidos a RT y/o RT-PCR para elaborar un conjunto complementario de replicones de ADN. Los arreglos pueden, ser producidos utilizando métodos de síntesis mecánicos, métodos de síntesis dirigidos por luz y los semejantes que incorporan una combinación de métodos no litográficos y/o fotolitográficos y métodos de síntesis en fase solida.
Varias técnicas para la síntesis de estos arreglos de ácido nucleico han sido descritas, por ejemplo fabricados sobre una superficie de virtualmente cualquier forma o aun una multiplicidad de superficies. Los arreglos pueden ser péptidos o ácidos nucleicos sobre perlas, geles, superficies poliméricas, fibras tales como fibra óptica, vidrio o cualquier otro sustrato apropiado. Los arreglos pueden ser empatados de tal manera para permitir la diagnosis u otra manipulación de inclusive todo el dispositivo, véase, por ejemplo Patente Estadounidense 6,955,788, porciones relevantes incorporadas en la presente por referencia.
Como se usa en la presente, el término "enfermedad" se refiere a un estado fisiológico de un organismo con cualquier estado biológico anormal de una célula. Enfermedad incluye pero no esta limitada a una interrupción, cese o alteración de células, tejidos, funciones corporales, sistemas u órganos que pueden ser inherentes, heredados, provocados por una infección, provocados por función de célula anormal, división de célula normal y los semejantes. Una enfermedad que conduce a un "estado de enfermedad" es en general perjudicial al sistema biológico, esto es, el huésped de la enfermedad. Con respecto a la presente invención, cualquier estado biológico, tal como una infección (por ejemplo, viral, bacteriana, fungal, helmíntica, etc.), inflamación, auto inflamación, autoinmunidad, anafilaxis, alergias, pre malignidad, malignidad, quirúrgica, trasplante, fisiológica y los semejantes que este asociadad con una enfermedad o alteración es considerada ser un estado de enfermedad. Un estado patológico es en general equivalente de un estado de enfermedad.
Los estados de enfermedad pueden también ser clasificados en diferentes niveles de estado de enfermedad. Como se usa en la presente, el nivel de una enfermedad o estado de enfermedad es una medida arbitraria que refleja el avance de una enfermedad o estado de enfermedad también como la respuesta fisiológica en, durante y después del tratamiento. En general, una enfermedad o estado de enfermedad avanzara a través de niveles o etapas, en donde los efectos de la enfermedad se vuelven incrementadamente severos. El nivel de un estado de enfermedad puede ser impactado por el estado fisiológico de las células en la muestra.
Como se usan en la presente, los términos "terapia" o "régimen terapéutico" se refieren a aquellas etapas medicas tomadas para aliviar o alterar un estado de enfermedad, por ejemplo, un curso de tratamiento que pretende reducir o eliminar los efectos o síntomas de una enfermedad utilizando técnicas farmacológicas, quirúrgicas, dietéticas y/u otras técnicas. El régimen terapéutico puede incluir una dosificación prescrita' de uno o más fármacos o cirugía. Las terapias mas frecuentemente serán benéficas y reducirán el estado de enfermedad, pero de muchas instancias el efecto de una terapia tendrá efectos indeseables o efectos secundarios. El efecto de la terapia también será impactado por el estado fisiológico del huésped, por ejemplo edad, genero, genética, peso u otras condiciones de enfermedad, etc.
Como se usa en la presente, el término "estado farmacológico" o "estatus farmacológico" se refieren a aquellas muestras que estarán, son y/o fueron tratados con uno o mas fármacos, cirugía y los semejantes que pueden aceptar el estado farmacológico de uno o mas ácidos nucleicos en una muestra, por ejemplo, recién transcrita, estabilizada y/o estabilizada como resultado de la intervención farmacológica. El estado farmacológico de una muestra es concerniente con cambios en el estatus biológico, antes, durante y/o después de tratamiento con el fármaco y puede servir como una función de diagnostico o pronostico, como se enseña en la presente. Algunos cambios enseguida de tratamiento con fármaco o cirugía pueden ser relevantes al estado de enfermedad y/o pueden ser efectos secundarios no relacionados de la terapia. Los cambios en el estado farmacológico son los resultados probables de la relación de terapia, tipos y dosis de fármacos "prescritos, grado de apego con un curso de terapia dado y/o fármacos no prescritos y digeridos .
Como se usa en la presente, el término "estado biológico" se refiere al estado del transcriptoma (esto es, toda la colección de transcripto de ARN) de la muestra celular aislada y purificada para el análisis de cambio en expresión. El estado biológico refleja el estado fisiológico de las células en la muestra la medir la abundancia y/o actividad de constituyentes celulares, caracterizado de acuerdo con el genotipo morfológico o una combinación de los métodos para la detección de transcriptos.
Como se usa en la presente, el término "perfil de expresión" se refiere a la abundancia relativa de ARN, ADN o abundancias de proteínas o niveles de actividad. El perfil de expresión puede ser una medida por ejemplo del estado transcripcional o el estado de traducción mediante cualquier número de métodos y utilizando un número cualquiera de chips genéticos, arreglos genéticos, perlas, PCR multiplex, PCR cuantitativa, análisis en operación, análisis de Northern blot, análisis de Western blot, expresión de proteína, clasificación de células activada por fluorescencia (FACS), análisis inmunoabsorbentes enlazados a enzimas (ELISA) , estudios de quimioluminiscencia, análisis enzimáticos, estudios de proliferación o cualquier otro método, aparato y sistema para la determinación y/o análisis de expresión genética que están altamente disponibles comercialmente .
Como se usa en la presente, el término "estado transcripcional de una muestra" incluye las entidades y abundancias relativas de la especie de ARN, especialmente mARN presentes en la muestra. Todo estado transcripcional de una , muestra, esto es, la combinación de identidad y abundancia de ARN, es también denominado en la presente como el transcriptoma . En general, una fracción sustancial de todos los constituyentes relativos de todo el conjunto de especie de ARN en la muestra son medidos.
Como se usa en la presente, el término "vectores transcripcionales modulares" se refiere a datos de expresión transcripcionales que reflejan la "proporción de genes expresados diferencialmente" . Por ejemplo, para cada módulo, la producción de transcriptos expresados y principalmente entre por lo menos dos grupos (por ejemplo, sujetos · saludables contra pacientes). Este vector es derivado de la comparación de dos grupos de la muestra. La primera etapa analítica es usada para la selección de conjuntos enfermedad- específicos de transcriptos dentro de cada módulo. Enseguida, esta el "nivel de expresión". La comparación de grupo para una enfermedad dada provee la lista de transcriptos expresados diferencialmente para cada módulo. Se encontró que diferentes enfermedades producen diferentes subconjuntos de transcriptos modulares. Con este nivel de expresión, es entonces posible calcular vectores para cada módulo para una sola muestra al promediar valores de expresión de subconjuntos enfermedad-especifico de genes identificados como siendo expresados diferencialmente . Este procedimiento permite la generación de mapas de vectores de expresión modulares para una sola muestra, por ejemplo, aquellos descritos en los mapas del módulo relevados en la presente. Estos mapas de módulo de vector representan un nivel de expresión promediado para cada módulo (en lugar de una proporción de genes expresados diferencialmente ) que pueden ser derivados para cada muestra.
Utilizando la presente invención, es posible identificar y distinguir enfermedades no solamente al nivel de módulo, sino también al nivel genético, esto es, dos enfermedades pueden tener el mismo vector (proporción idéntica de transcriptos expresados diferencialmente, "polaridad idéntica") pero la composición genética del vector puede todavía ser enfermedad-específica. La expresión a nivel de gen provee la ventaja distintiva de incrementar extensamente la resolución del análisis. Además, la presente invención toma ventaja de los marcadores transcripcionales combinados. Como se usa en la presente, el término "marcadores transcripcionales combinados" se refiere a los valores de expresión promedio de múltiples genes (sub conjuntos de módulo) en comparación con usar genes individuales como marcadores (y la composición de estos marcadores puede ser enfermedad-específica) . El procedimiento de marcadores transcripcionales combinados es único debido a que el usuario puede desarrollar puntuaciones de micro arreglo multivariadas para determinar la severidad en general de pacientes, por ejemplo, con SLE o para derivar vectores de expresión revelados en la presente. Más importantemente, se ha encontrado que utilizando los marcadores transcripcionales modulares compuestos de la presente invención, los resultados encontrados en la presente son reproducibles a través de la plataforma de micro arreglo, proporcionando mediante esto mayor conflabilidad para la aprobación regulatoria.
Los sistemas de monitoreo de expresión genético para uso con la presente invención pueden incluir arreglos genéticos adaptados con un número limitado y/o básico de genes que son específicos y/o adaptados para la uno o más enfermedades objetivo. A diferencia de los arreglos de pan-genoma en general que están en uso acostumbrado, la presente invención provee no solamente el uso de estos pan-arreglos generales para el análisis genética y análisis de genoma retrospectiva sin la necesidad de usar una plataforma específica, sino que mas importantemente, provee el desarrollo de arreglos sobre pedido que proveen un conjunto de genes óptimos para análisis sin la necesidad de miles de otros genes no relevantes. Una ventaja distintiva de los arreglos y módulos optimizados de la presente invención con respecto al arte existente es una reducción en los costos financieros (por ejemplo, costo por análisis, materiales, equipo, tiempo, personal, entrenamiento, etc.) y más importantemente, el costo ambiental de manufactura de pan-arreglos en donde la vasta mayoría de los datos es irrelevante. Los módulos de la presente invención permiten por primera vez el diseño de arreglos sobre pedido simples que proveen datos óptimos con el número mínimo de sondas en tanto que maximizan la proporción de señal a ruido. Al eliminar el número total de genes para el análisis es posible por ejemplo eliminar la necesidad de la manufactura de miles de mascaras de platino caras para fotolitografías durante la manufactura de chips pan-genéticos que proveen vastas cantidades de datos irrelevantes. Utilizando la presente invención es posible evitar completamente la necesidad de micro arreglos si el (los) conjunto (s) sonda limitados de la presente invención son usados con, por ejemplo arreglos de química óptica digital, arreglos de perla- de bola, perlas (por ejemplo, Luminex) , PCR multiplex, PCR cuantitativa, análisis de corrida, análisis de Northern blot o aun para análisis de proteína, por ejemplo, análisis de Western blot, expresión de proteína en gel 2-D y 3-D, MALDI, MALDI-TOF, clasificación de células activadas por fluorescencia (FACS) (superficie celular o intracelular) , análisis inmunoabsorbentes enlazados a enzimas (ELISA) , estudio de quimioluminiscencia, análisis enzimáticos, estudios de proliferación o cualquier otro método, aparato y sistema para la determinación y/o análisis de expresión genética que están disponibles comercialmente .
El "sistema de huella digital molecular" de la presente invención puede ser usado para facilitar y llevar a cabo un análisis comparativo de expresión en diferentes células o tejidos, diferentes subpoblaciones de las mismas células o tejidos, diferentes estados fisiológicos de las mismas células o tejidos, diferentes etapas de desarrollo de las mismas células o tejido o diferentes poblaciones celulares del mismo tejido contra otras enfermedades y/o testigos de célula normal. En algunos casos, los datos de expresión normales o tipos silvestre pueden ser de muestras analizadas en o aproximadamente al mismo tiempo o pueden ser datos de expresión obtenidos o recopilados de bases de datos de expresión de arreglo genético existente, por ejemplo base de datos publicas, tales como la base de datos NCBI Gen Expression Omnibus.
Como se usa en la presente, el término "expresado diferencialmente" se refiere a la medición de un constituyente celular (por ejemplo, ácido nucleico, proteina, actividad enzimática y los semejantes) que varia en dos o más muestras, por ejemplo entre una muestra enferma y una muestra normal. El constituyente celular puede estar encendido o apagado (presente o ausente) , regulado ascendentemente en relación con una referencia o regulado descendentemente en relación con la referencia. Para uso con chips genéticos o arreglos genéticos, se puede usar expresión genética diferencial de ácidos nucleicos, por ejemplo mARN u otros ARN (miARN, siARN, hnARN, rARN, Tarn, etc.) para distinguir entre tipos de células o ácidos nucleicos. Mas comúnmente, la medición del estado transcripcional de una célula que lleva a cabo mediante transcriptasa inversa cuantitativa (RT) y/o en cadena de transcriptasa-polimerasa inversa cuantitativa (RT-PCR) , análisis de expresión genómica, análisis posttraducción, modificaciones a ADN genómico, translocaciones, hibridización in situ y los semejantes.
Para algunos estados de enfermedad, es posible identificar diferencias celulares o morfológicas, especialmente a niveles prematuros del estado de enfermedad. La presente invención evita la necesidad de identificar aquellas mutaciones especificas o uno o mas genes al mirar en los módulos de genes de las células mismas o mas importantemente, de la expresión de ARN celular de genes de células efectoras inmunes que están actuando dentro de su contexto fisiológico regular, esto es, durante la activación inmune, tolerancia inmune o aun alergia inmune. En tanto que una mutación genética puede dar como resultado un cambio dramático en los niveles de expresión de un grupo de genes, los sistemas biológicos frecuentemente compensan los cambios al alterar la expresión de otros genes. Como resultado de estas respuestas de compensación internas, muchas perturbaciones pueden tener efectos mínimos sobre genotipos observables del sistema pero efectos profundos a la composición de constituyentes celulares. · Así mismo, las copias reales de un transcripto genético pueden no incrementarse o disminuir, sin embargo, la longevidad o vida media del transcripto puede ser afectada conduciendo a incrementos extensos en reducción de proteína. La presente invención elimina la necesidad de detectar el mensaje real al, en una modalidad, mirar las células efectoras (por ejemplo, leucocitos, linfocitos y/o sub poblaciones de los mismos) en lugar de mensajes y/o mutaciones individuales.
El experimentado en el arte apreciara fácilmente que se pueden obtener muestras de una variedad de fuentes, incluyendo, por ejemplo células individuales, una conexión de células, cultivo celular y los semejantes. En ciertos casos, puede aun ser posible aislar suficiente ARN de células encontradas en, por ejemplo muestras de orina, sangre, saliva, tejido o biopsia y los semejantes. En ciertas circunstancias, suficientes células y/o ARN pueden ser obtenidos de: secreción mucosal, heces, lágrimas, plasma sanguíneo, fluido peritoneal, fluido intersticial, intradural, fluido cerebroespinal, sudor u otros fluidos corporales. La fuente de ácido nucleico, por ejemplo de tejido o fuente de células, puede incluir una muestra de biopsia de tejido, una o más poblaciones de células clasificadas, cultivo celular, clones de células, células transformadas, biopsias o una sola célula. La fuente de tejido puede incluir, por ejemplo cerebro, hígado, corazón, riñon, pulmón, vaso, retina, hueso, neural, nodulo linfático, glándula endocrina, órgano reductor, sangre, nervio, tejido vascular y epitelio olfativo.
La presente invención incluye los siguientes componentes básicos que pueden ser usados solos o en combinación, es decir, uno o más algoritmos de minería de datos; uno o más procesos analíticos a nivel de módulos; la caracterización de módulos transcripcionales de leucocitos sanguíneos; el uso de datos modulares agregados en análisis multivariados para el diagnóstico/prognóstico molecular de enfermedades humanas y/o visualización de datos y resultados a nivel de módulo. Utilizando la presente invención, también es posible desarrollar y analizar marcadores transcripcionales compuestos, que pueden ser agregados adicionalmente a una sola puntuación multivariada .
Una explosión en velocidades de adquisición de datos ha espoleado el desarrollo de herramientas y algoritmos de minería para el aprovechamiento de datos de microarreglo y conocimiento biomédico. Los procedimientos apuntados a descubrir la organización modular y función de sistemas transcripcionales constituyen métodos promisorios para la identificación de firmas moleculares robustas de enfermedad. Por supuesto, tales análisis pueden transformar la percepción de estudios transcripcionales a gran escala al tomar la conceptualización de datos de microarreglos más allá del nivel de genes individuales o listas de genes.
Los presentes inventores han reconocido que la investigación a base de microarreglo actual está de frente a retos significativos con el análisis de datos que son notoriamente "ruidosos", esto es, datos que son difíciles de interpretar y no comparan bien a través de laboratorios y plataformas. Un procedimiento ampliamente aceptado para el análisis de datos de microarreglo comienza con la identificación de subconjuntos de genes expresados diferencialmente entre grupos, de estudio. Enseguida, los usuarios tratan subsecuentemente de "hacer sentido" de los listados de genes resultantes utilizando algoritmos de descubrimiento de patrón y conocimiento científico existente.
En lugar de tratar con la gran variabilidad a través de plataformas, los presentes inventores han desarrollado una estrategia que enfatiza la selección de genes biológicamente relevantes a una etapa prematura del análisis. Brevemente, el método incluye la identificación de los componentes transcripcionales que caracterizan un sistema biológico dado para el cual un algoritmo de minería de datos mejorado fue desarrollado para analizar y extraer grupos de genes expresados coordinadamente o módulos transcripcionales a partir de colecciones grandes de datos.
Tuberculosis pulmonar (PTB) es una causa mayor e incrementada de incrementar morbidez y mortalidad en todo el mundo provocada por Mycobacterium- tuberculosis ( . tuberculosis) . Sin embargo, la mayoría de individuos infectados con M. tuberculosis permanecen asintomáticos , reteniendo la infección en forma latente y se piensa que este estado latente es mantenido por una respuesta inmune activa. La sangre es la tubería del sistema inmune y como tal es el material biológico ideal del cual se puede establecer el estatus de salud y estatus inmune de un individuo. Aquí, utilizando tecnología de microarreglos para determinar la actividad de todo el genoma en células sanguíneas, se identificaron firmas de biomarcador transcripcionales de sangre distintas y recíprocas en pacientes con tuberculosis pulmonar activa y tuberculosis latente. Estas firmas fueron también distintas de aquellas en individuos testigo. La firma de tuberculosis latente, que mostró una sobre-representación de expresión de gen citotóxico inmune en sangre entera, puede ayudar a determinar factores inmune protectores contra infección de M. tuberculosis, puesto que estos pacientes son infectados pero a lo más no desarrollan la enfermedad. Esta firma de biomarcador transcripcional distinta de pacientes con TB activa y latente puede ser también usada para diagnosticar la infección y para monitorear la respuesta al tratamiento con fármacos anti-micobacterianos . Además, la firma en pacientes con tuberculosis activa ayudará a determinar factores involucrados en inmunopatogénesis y posiblemente conducir a estrategias para intervención terapéutica inmune. Esta invención es concerniente con una solicitud previa gue reivindicaba el uso de biomarcadores transcripcionales de sangre para la diagnosis de infecciones. Sin embargo, esta solicitud previa no revela la existencia de biomarcadores para tuberculosis activa y latente y se enfocó más bien en niños con otras infecciones agudas (Ramillo, Blood, 2007) .
La presente identificación de una firma transcripcional en sangre de pacientes con TB latente versus activa puede ser usada para probar pacientes con infección de Mycobacterium tuberculosis sospechada, también como para la selección de salud/detección temprana de la enfermedad. La invención también permite la evaluación de la respuesta al tratamiento con fármacos anti-micobacterianos. En este contexto, una prueba también seria particularmente valiosa en el contexto de pruebas de fármacos y particularmente para determinar tratamientos de fármaco en pacientes resistentes a multi-Fármacos . Además, la presente invención puede ser usada para obtener datos inmediatos, intermedios y a largo plazo de la firma inmune de tuberculosis latente para definir mejor una respuesta inmune protectora durante pruebas de vacunación. También, la firma en pacientes con tuberculosis activa ayudará a determinar factores involucrados en inmunopatogénesis y posiblemente conducir a estrategias para intervención terapéutica inmune.
La respuesta inmune a M. tuberculosis es compleja y multifactorial . Aunque es conocido que las células T y citocinas, tales como TNF, IFN-gamma e IL-12, son importantes para el control inmune de M. tuberculosis 14"17, todavía hay un entendimiento incompleto de los factores huésped que determinan protección o patogénesis' 16. El perfilado transcripcional de sangre ha sido aplicado exitosamente a enfermedades inflamatorias para mejorar la diagnosis y el entendimiento de patogénesis de enfermedad 18'19. sin embargo, el tamaño y complejidad de los datos generados hace la interpretación difícil, frecuentemente forzando a los científicos a enfocarse en un puñado de genes candidatos para estudio adicional 20, que puede no ser suficiente como biomarcadores específicos para diagnosis y proveen poca información con respecto a patogénesis de la enfermedad. Utilizando técnicas de bioinformática independientes y complementarias se ha definido una firma transcripcional para pacientes con TB activa, que ha impulsado el análisis inmunológico adicional. El estudio no polarizado extenso provee discernimientos importantes a la inmunopatogénesis de esta enfermedad compleja y entendimiento mejorado de la cual ayudará en avances en el control de TB.
Una firma transcripcional de sangre entera distinta de tuberculosis activa .
Para obtener un estudio extenso no polarizado de respuestas de huésped a infección de M. tuberculosis, perfiles transcripcionales de genoma amplio de la sangre de pacientes con TB activa, pacientes con TB latente y testigos saludables fueron generados utilizando arreglos de perla HT12 de Illumina. Se tomaron muestras de todos los pacientes antes del tratamiento. La diagnosis de TB activa fue confirmada mediante cultivo positivo por M. tuberculosis . Los pacientes con TB latente fueron contactos domésticos asintomáticos de pacientes de TB activa o nuevos entrantes de países endémicos, definidos por una prueba de tuberculina-piel positiva (TST) (Londres) y una IGRA positiva (Londres y Sudáfrica) . Testigos saludables fueron reclutados en Londres y fueron negativos para todos los criterios anteriores. Tres cohortes fueron reclutados y muestreados independientemente: un conjunto de entrenamiento (reclutado en Londres, enero -septiembre, 2007; 13 pacientes con TB pulmonar activa; 17 pacientes con TUBO latente; y 12 testigos saludables); un conjunto de prueba (reclutado en Londres, octubre 2007 -febrero 2009; 21 pacientes con' TB activa; 21 pacientes con TB latente; 12 testigos saludables) ; y un Conjunto de Validación (reclutado en una región endémica de alta carga, pueblo de Khayelitsha cerca de Ciudad del Cabo, Sudáfrica, (SA) , mayo 2008 - febrero 2009; 20 pacientes con TB activa; 31 pacientes con TB latente) (Figuras 16 y 17; Figura 7). Similarmente, todo el procesamiento y análisis de muestras de los tres cohortes fueron efectuados independientemente. El conjunto de entrenamiento fue usado para el descubrimiento de conocimiento y la determinación de la conveniencia del tamaño de muestra. El ARN fue extraído de muestras de sangre entera y procesado como se describe en Métodos. Los datos resultantes fueron filtrados para remover transcriptos que no fueron detectados (OÍ=0.01) y tuvieron menos de desviación de dos veces en expresión normalizada de la mediana de todas las muestras en más del 10% de las muestras que constituyen el conjunto de datos. Esta filtración sin supervisar produjo una lista de 1836 transcriptos, que revelaron una firma distinta dentro del grupo de TB activo, (Figura 8a).. Esta lista de 1836 transcriptos fue luego usada para identificar genes de firma que fueron expresados diferencialmente de manera significativa en entre los grupos (ANOVA de Kruskal-Wallis, con la proporción de descubrimiento falso igual a 0.01 utilizando la corrección de pruebas múltiples de Benjamini-Hochberg) . Esto produjo una lista de 393 transcriptos, que fueron sometidos a agrupamiento jerárquico mediante correlación de Pearson con enlace promedio en cuanto a la medida de distancia entre dos grupos, creando un árbol genético de transcriptos con abundancia relativa similar. Esto es mostrado como un dendrograma, a la izquierda del mapa de color, organizando los datos de cada individuo a un perfil transcripcional único, mostrado agrupado en base a diagnosis clínica (Figura la). Esto reveló una firma distinta para TB activa, que estuvo ausente en la mayoría de las muestras de pacientes con TB latente o testigos saludables.
Habiendo identificado una firma transcripcional supuesta para TB activa, . fue importante confirmar estos hallazgos en un cohorte independiente de pacientes. Los análisis de microarreglo son vulnerables a variabilidad metodológica, técnica y estadística 21~23. Adicionalmente, es probable que TB represente un intervalo diverso de respuestas inmunes a infección de M. tuberculosis, más probablemente influenciada por la etnicidad, área geográfica, coinfección, edad y estatus socioeconómico 1:1'13. Así, para asegurar que nuestros hallazgos serían ampliamente aplicables, se confirmaron en dos cohortes independientes adicionales, reclutados a un tiempo más tarde. Las muestras de estas dos cohortes independientes, el conjunto de prueba (Londres) y el conjunto de validación (Sudáfrica) fueron procesados y los datos fueron normalizados como para el conjunto de entrenamiento. Ya que el objetivo de estas validaciones adicionales era confirmar independientemente la firma definida en el conjunto de entrenamiento, ninguna filtración o selección de transcriptos fue efectuada. Más bien, la lista de 393 transcriptos pre-seleccionados y árbol genético definido por el análisis de los datos del conjunto de entrenamiento fueron aplicados, a los datos obtenidos del Conjunto de Pruebas independientes y Conjunto de Validación (SA) . Algoritmos de agrupamiento jerárquicos fueron aplicados a los perfiles del transcripto 393 del Conjunto de Prueba y Conjunto de Validación (SA) , utilizando correlación de Spearman y enlace promedio como una medida de la distancia entre grupos, a un grupo junto con perfiles de expresión genética ' individuales de acuerdo con su similaridad, creando un "árbol de condiciones", mostrado a lo largo del borde superior del mapa de color (Figuras Ib y le) . Este agrupamiento jerárquico sin supervisar tanto de los perfiles transcripcionales del paciente del Conjunto de Prueba y Conjunto de Validación (SA) muestran claramente que el grupo de pacientes con TB activa independientemente de los grupos de TB latente y testigos saludables (Figura Ib, Londres) o de TB latente (Figura le; Sudáfrica) , con una asociación significativa entre el grupo y grupo de estudio (Prueba Chi-Cuadrada de Pearson p<0.0005) (Figuras Ib y le), pero no con etnicidad, edad y género (Figuras 8b, 8c y 8d) . Sin embargo, el perfil transcripcional de un número pequeño de pacientes con TB latente (aproximadamente 10% - Conjunto de Pruebas 2/21, Londres; 3/31 Conjunto de Validación (SA) ) , agrupados conjuntamente con aquellos de los pacientes con TB activa (Marcado † y A en el Conjunto de Prueba, Figura Ib; y marcado ?, O y 5 en el Conjunto de Validación de Sudáfrica, Figura le) . Luego se probó la habilidad de la lista de 393 transcriptos para clasificar correctamente las muestras del Conjunto de Prueba y el Conjunto de Validación como TB activa o no (saludable o latente), sin conocimiento de la diagnosis clínica, utilizando una herramienta de predicción de clase basada en el método de predicción de clase de vecino de -más cercano. El modelo de predicción hizo 44 predicciones correctas, 9 predicciones incorrectas y no hizo predicción para 1 muestra en el Conjunto de Prueba. Esto se igualó a una sensibilidad de 61.67%, una especificidad de 93.75% y una proporción indeterminada de 1.9%. Las predicciones incorrectas en el Conjunto de Pruebas, que comprenden 5 pacientes con TB latente clasificados como TB activos indicado en análisis de agrupamiento anterior; y 4 pacientes con TB activa predichos como TB no activos. En el Conjunto de Validación de Sudáfrica hubieron 45 predicciones correctas, 2 incorrectas (1 activa, 1 latente) y ninguna predicción para 4 muestras. Esto dio una sensibilidad de 94.12% y una especificidad de 96.67%, pero una proporción indeterminada de 7.8% (Figura 19) .
Tabla 2. Lista de 393 Genes.
Una firma transcripcional en la sangre de pacientes con TB activa tanto de regiones de carga intermedia (Londres) como de alta, carga (Sudáfrica) fue identificada, que es distinta de las firmas de pacientes con TB latente y testigos saludables como es mostrado por el agrupamiento jerárquico y predicción de clase cegada. La firma de TB latente mostró heterogeneidad molecular. El número de pacientes latentes que muestran una firma transcripcional similar a aquella de TB activa, en dos cohortes independientes de pacientes, es consistente con la frecuencia esperada de pacientes en aquel grupo que avanzarían a enfermedad activa 10. Enseguida, estos perfiles de TB latentes representan paira aquellos pacientes que tienen ya sea enfermedad activa sub-clínica o infección latente de carga más alta fue determinada y por consiguiente están a un riesgo más alto de avance a enfermedad activa 11,2 .
La firma transcripcional de TB activa se correlaciona con la extensión radiográfica de la enfermedad.
Fue claro de los resultados (Figuras la a le) que hubo heterogeneidad molecular con respecto a la firma transcripcional de pacientes con TB activa. Aunque la mayoría de los pacientes demostraron el mismo perfil de expresión de 393 genes, unos pocos falsos fueron evidentes, que mostraron ya sea un perfil transcripcional distinto o más débil. Por ejemplo, de los 21 pacientes en el conjunto de pruebas del grupo de TB activa, 4 tuvieron perfiles que no se agruparon con los otros pacientes con TB activa y fueron más en mantenerse con los perfiles de controles saludables o pacientes con TB latente (marcados ·, #, ¦, ? en la Figura Ib) . Estos fueron los 4 pacientes activos mal clasificados por el algoritmo de K-vecinos más cercanos como se discute anteriormente .
Los falos moleculares en el grupo de TB activa podrían surgir por un número de razones. En primer lugar, hay la posibilidad de mala diagnosis, con cultivos positivos falsos que surgen de contaminación cruzada de laboratorio como se reporta previamente 25. Alternativamente la heterogeneidad molecular/transcripcional podría reflejar heterogeneidad en la extensión de enfermedad. Para tratar esta cuestión, radiografías de pecho tomadas al tiempo de la diagnosis para cada uno de los pacientes en el conjunto de entrenamiento y pruebas fueron obtenidas y graduadas por 2 médicos de pecho y un radiólogo para determinar la extensión radiográfica de la enfermedad. Esta determinación fue efectuada sin conocimiento de la diagnosis clínica o perfil transcripcional, utilizando una versión modificada de el U.S. National Tuberculosis and Respiratory Disease Association Scheme, que clasifica enfermedad radiográfica en mínima, moderadamente avanzada y enfermedad bastante avanzada (Falk A, 1969; y Figura 9a). Los 393 perfiles de transcripto para todos los 13 pacientes con TB activa en el conjunto de entrenamiento (Figura 9b) y todos los 21 pacientes con TB activa en el conjunto de prueba (Figura 9c) fueron ordenados en un mapa de calor de acuerdo con su grado de extensión radiográfica de la enfermedad (Conjunto de Entrenamiento, Figura 9b; Conjunto de Prueba, Figura 9c) . Esta comparación de perfiles transcripcionales y grados radiográficos, ejemplos de los cuales son mostrados en la Figura 2a, sugirieron que el perfil transcripcional se puede correlacionar con la extensión de enfermedad; Para tratar esto formalmente, se calculó una puntuación cuantitativa de la alteración molecular reflejada por la firma transcripcional para cada paciente de TB, la "Distancia Molecular a Salud". Esta es una combinación tanto del número de transcriptos en un perfil que difieren significativamente de la referencia de testigo saludable y el grado de aquella diferencia 26. Esta puntuación fue calculada para cada uno de los 393 perfiles transcripcional de los pacientes de TB y luego comparadas con el grado radiográfico para cada pacientes con TB latente (n=38) y activa (n=30) en los Conjuntos de Entrenamiento y Conjunto de Pruebas. El esquema para determinar la extensión radiográfica de enfermedad en este caso es modificado de tal manera que la extensión radiográfica de grado de enfermedad es convertida a una puntuación radiográfica numérica. Los perfiles agrupados de acuerdo con la extensión radiográfica de la enfermedad mostraron que la "Distancia Molecular a la Salud" promedio se incrementó con la extensión radiográfica incrementada de extensión de enfermedad (p<0.001 utilizando ANOVA de Kruskal-Wallis, con pruebas post hoc de comparación múltiple de Dunn para comparar entre grupos) (Figura 2b). Estos resultados muestran por primera vez que la firma molecular en sangre puede proveer una medida cuantitativa de extensión de enfermedad en pacientes con TB activa y confirman que los perfiles transcripcionales de sangre pueden reflejar cambios del sitio de la enfermedad. Asi, utilizando un procedimiento de biología sistemático, se identificó una firma transcripcional de sangre robusto para TB pulmonar activa tanto en regiones intermedias como de alta carga, que se correlaciona con la extensión radiológica de la enfermedad. Este método puede ser usado para monitorear la extensión de enfermedad y posiblemente útil en guía de regímenes de tratamiento.
El tratamiento exitoso disminuye la firma transcripcional de TB activa.
Estos hallazgos demuestran que la firma transcripcional de TB activa se correlaciona con la extensión radiográfica .de la enfermedad fue de interés para determinar si la firma transcripcional disminuiría durante el tratamiento de TB y reflejaría eficacia del tratamiento. Esto también¦ confirmaría que esta firma refleja veradaderamente la enfermedad de TB. Para probar esto, 7 pacientes con TB activa fueron re-muestreados a 2 y 12 meses enseguida del inicio de un tratamiento anti-micobacteriano y su sangre sometida otra vez a análisis de microarreglo como se describe anteriormente, junto con sus muestras de pre-tratamiento de referencia y muestras de control saludables del conjunto de pruebas independiente (n=12) . La firma de 393 transcriptos en pacientes con TB activa fue otra vez observada ser distinta de aquella de los testigos saludables (Figura 3a) . Esta firma transcripcional fue disminuida en la mayoría de los pacientes con TB activa después de 2 meses de tratamiento y extinguida completamente después de 12 meses de tratamiento, de tal manera que la firma de los pacientes con TB activa inició semejándose más estrechamente a aquella de los testigos saludables. Este cambio en el perfil transcripcional después de 2 meses de tratamiento fue más pronunciado en términos de la abundancia incrementada de transcriptos, que disminuyó en aproximadamente 50% de los pacientes con TB. Esto contrastó con los transcriptos con abundancia disminuida, que estuvieron todavía presentes después de 2 meses de tratamiento, pero regresaron a la expresión de referencia después de 12 meses de tratamiento. La desaparición de la firma transcripcional de sangre durante el tratamiento de pacientes con TB activa pareció reflejar mejora radiográfica mejora (Figura 3b) . Se analizó enseguida la diferencia en la distancia molecular a la puntuación de salud entre cada punto en el tiempo durante el tratamiento. La puntuación de "Distancia Molecular a la Salud" de pacientes con TB activa a 12 meses post-tratamiento es significativamente más baja que a un pre-tratamiento de referencia (p<0.001, Prueba de Medidas Repetidas de Friedman) (Figuras 3c y d) . Estos datos sugieren que la firma transcripcional en la sangre de pacientes con TB activa puede ser usada para monitorear la eficacia de tratamiento. Además, provee evidencia de que la firma de 393 transcriptos es verdaderamente reflejante de la respuesta al huésped a infección de M. tuberculosis . Asi, la firma transcripcional de TB activa es disminuida durante el tratamiento exitoso, proporcionando mediante esto un método para monitorear cuantitativamente la respuesta a terapia anti-micobacteriana, incluyendo pruebas clínicas para nuevos agentes terapéuticos.
Pacientes con TB en Sudáfrica y Londres muestran la misma firma modular .
Para ser expedito y enfocar el análisis de la firma transcripcional y caracterizar la respuesta de huésped durante la enfermedad de TB activa, se empleó una estrategia de minería de datos modular 18. Esta estrategia está basada en observaciones de que los grupos de genes son expresados coordinadamente en un intervalo de diferentes enfermedades inflamatorias e infecciosas. Grupos discretos de tales genes pueden ser definidos como módulos específicos, que por medio de perfilado de literatura sin polarizar puede frecuentemente ser mostrado tener una relación funcional coherente 18. El análisis modular facilitó la evaluación e identificación de cambios en abundancia de transcripto de relevancia funcional en la sangre de pacientes con TB activa en comparación con testigos saludables (efectuada en el conjunto de datos de microarreglo entero, filtrando solamente transcriptos que no fueron detectados (OÍ=0.01) en por lo menos 2 individuos) (Figura 4a) . La firma modular observada en la sangre de pacientes con TB activa, (módulos) , fue visualmente muy similar para el Conjunto de Entrenamiento de Londres y conjunto de pruebas y para el Conjunto de Validación de Sudáfrica Independiente, en comparación con testigos saludables (Figura 4a), confirmando por medio de un análisis independiente y sin polarizar, la reproducibilidad de la firma transcripcional observada utilizando análisis de agrupamiento clásico (Figura 1) . La firma modular de pacientes con TB activa reveló abundancia disminuida de transcriptos relacionados con célula B (Módulo, MI.3) y célula T (Módulo, M2.8 ) y abundancia incrementada de transcriptos mieloide relacionados (Módulos, MI .5 y Módulos, M2.6) y a una menor extensión abundancia incrementada de transcriptos relacionados con neutrófilo (Módulo, M2.2). La proporción más grande de transcriptos que cambian en la sangre de pacientes con TB activa en comparación con testigos fueron aquellos dentro del módulo interferón inducible (IFN) (Módulo 3.1; 75 - 82% de los transcriptos) (Figura' 4a; y Figuras 10a - 10c) .
La sangre es un tejido heterogéneo, por consiguiente, la firma transcripcional que se ha definido en paciente's con TB activa podría representar ya sea cambios en composición celular por medio de migración, apoptosis o proliferación celular o cambios en ¦ expresión genética en poblaciones celulares discretas. Los conteos totales de glóbulos blancos sanguíneos/leucocitos en la sangre de pacientes con TB activa no fueron significativamente diferentes de aquellos en testigos saludables (prueba t de Student p=0.085). Para tratar si la reducción aparente en transcriptos de célula B y célula T revelados por el análisis modular (Figura 4a) resultaban de cambios en números de células en la sangre y/o cambios en la expresión genética en células discretas, sangre entera de pacientes con TB activa del conjunto de prueba y testigos saludables fue analizada mediante citometría de flujo de multi-parámetros (Figura 4b, Figuras lia y 11b) . Ambos de los porcentajes y números de células T CD4+ y los porcentajes de células T CD8+ y células B fueron reducidos significativamente en la sangre de pacientes con B activa en comparación con testigos saludables (Figura 4b) . La reducción en el número de células T CD4+ fue extensamente atribuible a disminuciones significativas en números de células de memoria central, con efectos más pequeños pero no significativos sobre células de memoria efectoras y células T CD4+ naive (Figura 11b) . Sin embargo, disminuciones en el número de célula T CD8+ fueron principalmente observados en el compartimiento de célula T nalve. Para confirmar que la abundancia transcripcional reducida de genes relacionados con célula T resultado de la reducción en los números de células en lugar de la expresión disminuida de estos genes, se determinaron los perfiles de expresión genética para un número de genes relacionados con célula T representativos en células T CD4+ y CD8+ purificadas, en comparación con sangre entera (Figura 11c) . Se mostró que estos transcriptos de célula T eran menos abundantes en sangre entera de pacientes con TB activa en comparación con testigos saludables (Figura llc(i)). Sin embargo, no hubo ninguna diferencia en la expresión de estos genes específicos de célula T en células T CD4+ y CD8+ purificadas de la sangre de pacientes con TB activa, en comparación con aquellos de testigos saludables (Figura 11c (ii)). Tomados conjuntamente, estos datos sugieren que la abundancia transcripcional más baja de genes de célula T en la sangre de pacientes con TB activa resultaba solamente de la reducción de números de células. De acuerdo con los hallazgos, un número de estudios han reportado disminuciones en porcentajes y/o números de células T CD4+ en la "sangre de pacientes con TB activa, aunque efectos sobre células T CD8+ y células B fueron más variados 27'28. sin embargo la extensión de esta diferencia entre pacientes con TB y testigos en nuestro estudio sugieren que este fenómeno se extiende más allá de la migración de solamente células T antigeno-especificas de M. tuberculosis, afectando a una proporción sustancial de toda la población de células T circulantes.
Un incremento sustancial en transcriptos relacionados con célula mieloide a nivel modular fue observado en pacientes con TB activa versus testigos saludables para (Módulos Mi .5 y M2.6). Para tratar si esto resultaba de cambios en el número de células y/o cambios en expresión genética, la sangre entera fue primero analizada en cuanto a cambios en células tipo mieloide mediante citometria de flujo (Figura 12a) . No hubo cambio en el porcentaje de monocito (CD14+, CD16") o neutrófilos (CD16+, CD14") o número de células en la sangre de los pacientes con TB activa del conjunto de pruebas en comparación con testigos saludables (Figura 4c) . De interés, un incremento pequeño pero significativo en el porcentaje y número de células de monocitos inflamatorios (CD14+, CD16+) , fue observado en la sangre de pacientes con TB activa en comparación con testigos saludables. Se demostró que los transcriptos relacionados con el mieloide representativos eran sobre-abundantes en la sangre de pacientes con TB activa versus testigos saludables (Figura 12b(i)). Este incremento fue mucho menos pronunciado en monocitos purificados (CD14+) (Figura 12b(ii)), aunque la expresión incrementada de estos transcriptos mieloide-relacionados podría haber sido diluida si su expresión incrementada fuera restringida a una población monocítica pequeña, tal como el subconjunto inflamatorio CD14+, CD16+. Se ha sugerido previamente que los monicitos inflamatorios fue incrementado en enfermedades inflamatorias e infecciosas 29. Así, los cambios en el módulo mieloide pueden a alguna extensión ser explicados por cambios en expresión genética, pero pueden resultar de cambios en números de monocitos inflamatorios en la sangre de pacientes con TB activa versus testigos .
Expresión genética interferón-inducible en ne trófilos domina la firma de TB.
Para confirmar la sobre-representación de los genes
IFN-inducibles en los pacientes con TB activa mostrada por el análisis modular (Figura ,4a) transcriptos que constituyen la firma de 393 transcriptos fueron analizados utilizando los elementos de programación de Ingenuity Pathways Analysis. La señalización de IFN fue confirmada como la ruta funcional sobre-representada más significativamente en los 39.3 transcriptos utilizando la prueba exacta de Fischer con una correlación de prueba múltiple de Ben amini-Hochberg (p<0.0000001 ) en comparación con otras rutas biológicas curadas generadas de la literatura (Figura 13) . Interesantemente, los genes corriente abajo tanto de la señalización del receptor IFN-gamma e IFN a/ß Tipo I fueron significativamente sobre-representados (marcado en rojo en la Figura 4d) en la sangre de pacientes con TB áctiva. Es de notarse que aunque ni las proteínas de IFN-a2a ni IFN-gamma fueron detectables en el suero de pacientes con TB activa (Figura 13b y 13c) , niveles elevados de quimiocina IFN-inducibles CXCL10 (IP10) fueron detectados en la sangre de pacientes con TB activa versus testigos (Figura 4e) .
Aunque IFN-? ha mostrado ser protector durante respuestas inmune a patógenos intracelulares, incluyendo micobacterias14-16'30, el papel de IFN Tipo I es menos claro. La señalización por medio del IFNR Tipo I (IFN-aß?) es crucial para la defensa contra infecciones virales32"34.' Sin embargo, el papel de IFN-aß en la infección TB no es clara; muchos documentos sugieren un papel dañino35-37; aunque otros no 38,39. Hay unos pocos reportes de casos que sugieren una asociación entre el tratamiento de IFN-? para infección viral de hepatitis C e infección de M. tuberculosis 40~41.
Los presentes inventores identificaron una firma de sangre entera de 86 genes TB-especifica por medio de análisis de significado52, en comparación con pacientes con otras enfermedades bacterianas e inflamatorias. Esta firma de 86 genes fue luego probada contra pacientes normalizados con sus propios testigos de 7 conjuntos de datos independientes mediante selección de clase (k-vecino mas cercano) (Figura 4f) . las sensibilidades del conjunto de entrenamiento y validación de TB fueron 92 % y 90 % respectivamente, definiendo TB activa de otras enfermedades con. una especificidad acumulada de 83 %. Como con la firma de 393 genes, esta firma de 86 genes fue disminuida en respuesta al tratamiento (Figura 4g) y- reflejo la misma heterogeneidad en muestras idénticas de pacientes.
Para identificar componentes funcionales de la respuesta de huésped transcripcional durante la TB activa, los inventores usaron una estrategia de minería de datos modular, utilizando conjuntos de genes que son expresados coordinadamente en diferentes enfermedades y definidos como módulos específicos, demostrando frecuentemente relaciones funcionales coherentes por medio de perfilado de la literatura sin coalisar18. La firma modular de sangre de pacientes con TB activa en comparación con controles testigos saludables (filtración solamente de transcriptos sin detectar, <x = 0.01, en por lo menos dos individuos) fue similar en todos los tres conjuntos de datos de TB (Figura 4h) confirmando la reproducibilidad de la firma transcripcional .
La firma de TB modular revelo abundancia disminuida de transcriptos de célula B (Modulo, MI.3) y célula T (M2.8) y abundancia incrementada de transcriptos mieloides-relacionados (MI.5 y M2.6). La proporción natural de transcriptos que cambian en un modulo dado en TB fue dentro del modulo IFN-inducible (M3.1; 75-82 % de transcriptos de modulo de IFN (Figura 4h) ) . Debido a una firma IFN-inducible Tipo I, enlazada con patogénesis de enfermedad, ha sido demostrada en células mononucleares de sangre periférica de pacientes con SLE53'54, los inventores compararon firmas modulares de sangre entera de pacientes con otras enfermedades. Los pacientes con SLE demostraron sobre representación del modulo IFN-inducible (M3.1 (Figura 4h) ) pero mostraron un modulo relacionado con célula de plasma ausente en TB (Mi.1 (Figura 4h) ) . La firma modular de sangre de pacientes con infección de Estreptococos o Estafilocos A o enfermedad de Still, mostraron cambios mínimos a ningún cambio en el modulo IFN-inducible (M3.1) pero sobre representación marcada del modulo neutrofilo-relacionado (M2.2), distinguiendo estas enfermedades de TB (Figura 4h) . Así, la firma IFN-inducible no es común a todas las respuestas inflamatorias, pero, és preferiblemente inducida durante algunas enfermedades, reflejando potencialmente protección o patogénesis. Aungue SLE y TB comparten componentes inflamatorios comunes tales como una respuesta IFN-inducible, el patrón global de cambios transcripcionales (Figura 4h) y su amplitud distingue una enfermedad de otra.
Para determinar la alta abundancia transcripcional de genes IFN-inducible la sangre de pacientes con TB activa fue atribuible a un tipo de célula particular, se determino la expresión de genes tanto para las rutas de señalización del receptor de IFN-? e IFN a/ß Tipo I en neutrofilos purificados, monocitos y células CD4+ y CD8+, en comparación con sangre entera (Figura 5) . Un conjunto representativo de transcriptos IFN-inducible mostró ser mas abundante en la sangre entera de pacientes con TB activa en comparación con testigos saludables (Figura 5a) . Sorprendentemente, los transcriptos IFN-inducibles mostraron ser sobreexpresados sustancialmente en neutrofilos y a una menor extensión monocitos purificados de la sangre con pacientes de TB activa en comparación con las células equivalentes testigos saludables (Figura 5b) . en contraste las células T CD4+ y CD8+ purificadas de sangre de pacientes con TB activa no mostraron diferencia en expresión de estos genes IFN-inducibles en comparación aquellos purificados de individuos testigos saludables (Figura 5b) .
Los neutrofilos son fagocitos profesionales que han demostrado ser el tipo de célula predominante infectada con M. tuberculosis que se replica rápidamente en pacientes con TB42. La prevalescencia y respuestas de neutrofilos en ratones genéticamente susceptibles en comparación con ratones resistentes a conducido a la teoría de . que los neutrofilos en la inflamación de TB contribuyen a la patología, en lugar de protección del huésped43. Los estudios apoyan un papel para neutrofilos en la- patogénesis de TB. Esto puede resultar de su sobre activación tanto por IFN-? como IFN Tipo I, que ahora muestra ser una firma transcripcional dominante en sangre de pacientes con TB activa, expresados principalmente en neutrofilos (Figura 5) .
PDL-1 es sobreexpresado por neutrofilos en pacientes con TB activa .
Un gen con abundancia incrementada en la sangre de pacientes con TB activa que se agrupa con los transcriptos IFN-inducibles fue programado como Ligando 1 de Muerte (PDL-1, también denotado como CD274 y B7-H1) , 1 ligando inmunoregulador expresado en diversas células (Figura 6) . Se ha reportado que PDL-1 suprime la proliferación de células T y función efectora, por medio del enlace del receptor de muerte-1 programado (PD-1) en infecciones virales crónicas44'45. Para determinar cual célula puede estar sobre expresando PDL-1, poblaciones de sangre entera de pacientes con TB activa y testigos saludables fueron analizados mediante citometria de flujo y se demostró el PDL-1 es regulado ascendentemente en leucocitos enteros de pacientes con TB activa, en comparación con testigos/latente en el conjunto de Validación (SA) (Figura 6a y Figuras 14a a 14f) . La expresión de PDL-1 incrementada fue mas evidente en neutrofilos, a una extensión menor en monocitos y no fue evidente en linfocitos de pacientes con TB activa (Figuras 6b y Figuras 14a a 14f) . Manteniéndose con estos hallazgos mediante citometria de flujo, neutrofilos purificados de pacientes con TB activa expresaron niveles más altos de transcriptos de PDL-1, que en neutrofilos de testigos saludables. En contraste, PDL-1 fue solamente expresado en monocitos de dos de siete pacientes con TB activa y no hubo expresión detectable en células T (Figura 6c) . La abundancia incrementada de transcriptos de PDL-1 en la sangre de pacientes con TB activa desapareció después de la terapia exitosa, aunque estuvo todavía presente a dos meses en tratamiento en la mayoría de los pacientes (Figura 6b) .
Estos hallazgos demuestran que la presencia de PDL-1 en la sangre de pacientes con TB activa puede estar relacionada con la patología y falla para controlar la enfermedad, consistente con los reportes en infección viral crónica44,45. Además, se ha reportado que la expresión de PDL-1 es incrementada en células T humanas de pacientes con TB, estimulados con M. tuberculosis H37Rv sonificado y anticuerpos de bloqueo a PDL-l/PD-1 fueron aptos de mejorar respuestas IFN-? antigeno-especificas y CD8+ T citotóxicas46. De relevancia para nuestros hallazgos, la expresión de PDL-1 inducida por VIH, sobre monocitos y células CCR5+ T ha mostrado ser dependiente de IFN- pero no de IFN-?47. Asi, la expresión incrementada de PDL-1 en respuesta a incrementos interferones de Tipo I en neutrofilos, como se muestra en la presente, podría ser una manera en la cual la sobre expresión de interferones podría ser perjudicial a respuesta del huésped. Si el bloqueo de la señalización PDL-l/PD-1 puede conducir a respuestas receptoras mejoradas puede depender del tipo y etapa de infección/vacunación48, 49 y pueden requerir apuntamiento del bloqueo a células y sitios particulares, para obtener protección mejorada mientras que se evita la inmunopatología44. El efecto de PDL-1 sobre la respuesta inmune durante la infección bacteriana puede por consiguiente ser más complicado que como se pensaba primero, lo que es aportado por nuestros hallazgos de que PDL-1 es altamente expresada en neutrofilos pero no células T o monocitos en la sangre de pacientes con TB activa.
El entendimiento mejorado de la respuesta .del huésped en TB es esencial para la diagnosis mejorada, vacunación y terapia (Young et al., 2008, JCI) . El discernimiento a esta enfermedad compleja ha sido deteriorado por un numero de razones, incluyendo el hecho de que TB latente clínicamente definida representa realmente un espectro que corre de la eliminación de micobacterias vivas a la enfermedad subclínica (Young et al., 2009, Trends Micro). Aquí, se ha definido una firma transcripcional de 393 genes (Figuras 1, 14 y 15) de TB activa en la sangre del paciente de Londres y Sudáfrica que esta ausente en la mayoría de los pacientes con TB latente y testigos saludables. Además, utilizando este procedimiento y análisis de números requeridos de pacientes con TB y testigos saludables para obtener significado que tuvo la ' capacidad de demostrar la heterogeneidad de la enfermedad. Por ejemplo, la firma de TB activa fue también observada en la sangre del 10 % de pacientes con TB latente revelando posiblemente aquellos individuos que pueden en el futuro desarrollar enfermedad activa. Esta es la primera evidencia molecular que demuestra la heterogeneidad de TB, sugiriendo que este procedimiento molecular puede ser útil para determinar cuales individuos con TB latente se les debe dar quimioterapia anti-micobacteriana . Estudios longitudinales futuros son requeridos para confirmar que esta firma es por supuesto predictiva de enfermedades TB futuras en pacientes latentes.
El tamaño y complejidad de los datos de microarreglo generados hace la interpretación difícil, forzando frecuentemente a los científicos a enfocarse en un puñado de genes candidatos para estudio adicional50'51, que pueden no ser suficiente como biomarcadores específicos para diagnosis y provee poca información con respecto a la patogénesis de la enfermedad. Para mejorar nuestro entendimiento de los factores huésped subyacentes a la patogénesis de TB se emplearon tres procedimientos analíticos distintos y todavía complementarios, análisis a nivel modular, de ruta y genético con el fin de producir discernimiento a la rutas biológicas reveladas por la firma transcripcional . Cada procedimiento identifico rutas biológicas comunes involucradas en la respuesta transcripcional del huésped a M. tuberculosis e identifico genes IFN-inducibles que forman una parte clave de la firma inmune en TB pulmonar activa. Se empleo el análisis modular primero, ya que este es el procedimiento mas sin supervisar y por consiguiente menos propenso a polarización. Los módulos fueron derivados de múltiples conjuntos de datos independientes y anotados mediante perfilado de literatura, integrando poderosamente tanto datos experimentales como conocimiento de la literatura acumulada18. Este análisis modular revelo una firma IFN-inducible dominante de la enfermedad de TB activa. Esto fue validado por un procedimiento independiente utilizando análisis de rutas de ingenuidad, que es completamente derivado de la literatura publicada y confirmo la redundancia de la firma IFN-inducible y revelo además que consistía de genes IFN-? e IFN-inducibles Tipo I. puesto que los dos procedimientos analizan diferentes listas de transcriptos, la identificación de procesos biológicos comunes mediante ambos métodos confirman la robustez de nuestros hallazgos. Como nivel adicional de validación, el análisis a nivel de gen individual corroborado pero también expandido en los hallazgos de los otros modelos analíticos. Utilizando estos procedimientos y análisis inmunológicos adicionales son revelados los componentes claves de la respuesta transcripcional de sangre del huésped a M. tuberculosis como una firma IFN-inducible neutrofilo-impulsada, que es extendida mediante tratamiento exitoso. Este estudio mejora nuestro entendimiento de la biología fundamental de TB y puede ofrecer adelantos futuros para diagnosis y tratamiento.
La sangre representa un depósito y un compartimiento de migración para células de los sistemas inmunes innato y adaptable incluyendo neutrofilos, células dendríticas y monocitos o linfocitos B y T, respectivamente, que durante la infección habrán sido expuestos a agentes infecciosos en el tejido. Por esta razón, sangre entera de individuos infectados provee una · fuente accesible de material clínicamente relevante en donde un genotipo molecular sin polarizar puede ser obtenido utilizando microarreglos de expresión genética como se describe previamente para el estudio de cáncer en tejidos (Alizadeh AA. , 2000; Golub, TR. , 1999; Bittner, 2000), y autoinmunidad (Bennet, 2003; Baechler, EC, 2003; Burczynski, E, 2005; Chaussabel, D . , 2005; Cobb, JP., 2005; Kaizer, EC, 2007; Allantaz, 2005; Allantaz, 2007), e inflamación (Thach, DC, 2005) y enfermedad infecciosa (Ramillo, Blood, 2007) en sangre o tejido (Bleharski, JR et al., 2003). Los análisis de microarreglo de expresión genética en leucocitos sanguíneos han identificado firmas de expresión genética de diagnostico y prognósticó, que han conducido ha un mejor entendimiento de mecanismos de inicio de enfermedad y respuestas a tratamiento (Bennet, L 2003; Rubins, KH., 2004; Baechler, EC, 2003; Pascual, V., 2005; Allantaz, F. , 2007; Allantaz, F. , 2007). Estos procedimientos de microarreglo han sido implementados para estudio de TB activa y latente, pero también han producido pequeños números de genes expresados diferencialmente solo (Jacobsen, M., Kaufmann, SH., 2006; Mistry, R, Lukey, PT, 2007), y en números relativamente pequeños de pacientes (Mistry, R. , 2007), que pueden no ser lo suficientemente robustos para distinguir entre otras enfermedades inflamatorias e infecciosas.
Métodos Adicionales
Reclutamiento de participantes y caracterización del paciente. El Comité de Ética de Investigación Local en el Hospital San Mary de Londres, Reino Unido de la Gran Bretaña (REC 06/Q0403/128) y la Universidad de Ciudad del Cabo, Ciudad del Cabo, República de Sudáfrica (REC 012/2007) aprobaron el estudio. Todos los participantes eran de 18 años de edad y mayores y dieron consentimiento por escrito. Los participantes fueron reclutados en el Hospital de San ary y Hospital de Hammersmith, Imperial College Healthcare NHS Trust, Reino Unido de la Gran Bretaña, Hospital Hillingdon, de Hillingdon Hospital NHS Trust, Uxbridge, Reino Unido de la Gran Bretaña y la Clínica de TB/VIH de Ubuntu, Khayelitsha, Ciudad del Cabo, Sudáfrica. Los pacientes fueron reclutados prospectivamente y mostrados, antes de que cualquier tratamiento anti-micobacteriano fuera iniciado, pero solamente incluidos en el análisis final si cumplían con todos los criterios clínicos por su grupo de estudio relevante. Un subconjunto de pacientes con TB activa reclutados en el primer cohorte reclutado en Londres fue también mostrado a dos y doce meses después del inicio de la terapia. Los pacientes que estaban embarazadas, eran inmunosuprimidos o tenían diabetes o enfermedad autoinmune no fueron elegibles y fueron excluidos de este estudio. En Sudáfrica, todos los participantes tuvieron pruebas de VIH de rutina utilizando el kit de pruebas de análisis de anticuerpo rápido de VIH 1/2 Determine® de Abbott (Abott Laboratorios, Abott Park, Illinois, Estados Unidos de América) . Los pacientes con TB activa fueron confirmados mediante aislamiento en laboratorio de M. tuberculosis en cultivo micobacteriano de un espécimen respiratorio (ya sea esputo o fluido de lavado bronquio alveolar) con pruebas de sensibilidad efectuadas por el Royal Brompton Hospital Micobacterial Referencia de Laboratorio, Londres, Reino Unido de la Gran Bretaña o de Referencia Lab de el National Health Laboratory Service, Groóte Schuur Hospital, Ciudad del Cabo. En el Reino Unido de la Gran Bretaña, los pacientes con TB latente fueron reclutados de aquellos denominados en la clínica TB con una TST positiva, junto con un resultado positivo utilizando un IGRA. Los participantes con TB latente en Sudáfrica fueron reclutados de individuos qué se auto denominaron como médicos de prueba voluntarios en la clínica de TB/VIH de Ubuntu en la positividad de IGRA sola fue usada para confirmar la diagnosis, sin consideración del resultado de TST (aunque este fue todavía efectuado) . Los participantes testigos saludables fueron reclutados de voluntarios en el Instituto Nacional para Investigación Medica (NIMR) , Mili Hill, Londres, Reino Unido de la Gran Bretaña. Para concluir con los criterios finales para inclusión en el estudio, los voluntarios saludables tenían que se negativos tanto para TST como IGRA.
Pruebas de la piel de tuberculina. Esta fue efectuada de acuerdo con las directrices del Reino Unido de la Gran Bretaña1 utilizando 0.1 mi (2TU) de tuberculina PPD (RT23, Serum Statens Institute, Copenhagen, Dinamarca) . Un TST positivo fue denominado = 6 mm si BCG sin vacunar, = 15 mm si BCG vacunado, según las directrices nacionales del Reino Unido de la Gran Bretaña2.
Pruebas de análisis de liberación de interferon gama. El análisis de en tubo de oro de QuantiFERON® (Cellestis, Carnegie, Australia) fue efectuado de acuerdo con las instrucciones del fabricante.
Conteos de leucocitos totales y diferenciales . 2 mi de sangre entera fueron recolectados en tubos de k2-EDTA de 5 mi de Terumo Venosafe (Terumo Europe, Leuven, Bélgica) . Luego las muestras fueron analizadas en cuatro horas utilizando el analizador de Hematología Automatizada MEK-6400 Nihon Kohden (Nihon Kohden Corporation, Tokyo, Japón) .
Determinación de extensión de enfermedad radiográfica. Radiografías de pecho plenas fueron obtenidas para todos los pacientes reclutados en Londres como imágenes digitales y graduadas por tres clínicos independientes, cegados a los perfiles transcripcionales y los datos clínicos, utilizando una versión modificada del sistema de clasificación de la Asociación de Tuberculosis y Enfermedad Respiratoria Nacional de los Estados Unidos de América3. Este sistema caracteriza la extensión radiográfica de enfermedad en etapas "mínima", "moderadamente avanzada" o "bastante avanzada", de acuerdo con criterios basados en la densidad y
I
extensión de lesiones y presencia o ausencia de cavitación. Se modifico el sistema para uso en nuestro estudio de tal manera que también incluyera una clasificación de "sin enfermedad" y tomar en cuenta la presencia de enfermedad pleural o linfoadenopatia . Luego el sistema fue convertido a un árbol de decisión para ayudar en la clasificación (Figura 9a) .
Toma de muestra de ARN, extracción y procesamiento para análisis de microarreglo. 3 mi de sangre entera fueron recolectados en tubos de Tempus (Applied Biosystems, Foster City, CA, Estados Unidos de America) , mezclados vigorosamente de manera inmediatamente después de la recolección y almacenados a una temperatura de entre -20°C y -80°C antes de la extracción de ARN. El ARN fue aislado de las muestras del conjunto de entrenamiento utilizando un muestra de 1.5 mi de sangre entera y el kit de sangre de ARN Perfect Pura (5 PRIME Inc, Gaithesrsburg, MD, Estados Unidos de America) . Las muestras del conjunto de prueba y validación (SA) fueron extraídas de 1 mi de sangre entera utilizando el kit de Aislamiento de ARN de Sangre MagMAX™ -96 (Applied Biosystems/Ambion, Austin, TX, Estados Unidos de América) de acuerdo con las instrucciones del fabricante. 2.5 mg de ARN total aislado fueron luego reducidos por globina utilizando el kit de formato de 96 cavidades de GLOBINclear™ (Applied Biosystems/Ambion, Austin, TX, Estados Unidos de America) de acuerdo con las instrucciones del fabricante. La integridad de ARN total y globina-reducido fue determinada utilizando un bio analizador Agilent 2100 mostrando una calidad de IRN de 7-9.5 (Agilent Techonologies, Santa Clara, CA, Estados Unidos de America) . El rendimiento del ARN fue determinado utilizando un espectrofotómetro Nanodrop 1000 (NanoDrop Products, de rmo Fisher Scientific Inc., Wilgminton, DE, Estados Unidos de America) . Objetivos de ARN biotinilados complementarios anti sentido amplificados (cRNA) fueron luego preparados a partir de 200 - 250 ng del ARN globina-reducido utilizando el kit de amplificación de ARN CustomPrep de Illumina (Applied Biosystems/Ambion, Austin, TX, USA) . 750 ng del cRNA marcado fueron hibridizados de la noche a la mañana a arreglos de BeadChip HT-12 Humanos de Illumina (Illumina Inc, San Diego, CA, USA), que contenían mas de 48,000 sondas. Los arreglos fueron luego lavados, bloqueados, teñidos y escaneados en un BeadStation 500 de Illumina siguiendo los protocolos del fabricante. Se usaron los elementos de programación BeadStudio v2 de Illumina (Illumina Inc, San Diego, CA, USA) para generar valores de intensidad de señal de los escaneos.
Aislamiento de células separadas y extracción de ARN. La sangre entera fue recolectada en EDTA. Los neutrofilos (CD15+) , monocitos (CD14+) , células T CD14+ células T CD8+ fueron aisladas secuencialmente utilizando Dynabeads de acuerdo con las instrucciones del fabricante. El ARN fue extraído de sangre entera (kit Perfect Puré 5' Prima) o poblaciones de células separadas (Mini Kit RNEasy de Qiagen) y almacenados a -80°C hasta el uso.
Análisis de datos de Microarreglo
Normalización. Se usaron los elementos de programación BeadStudio v2 de Illumina para restar el fondo y la intensidad de señal promedio de escala para cada muestra a la intensidad de señal promedio global para todas las muestras. Un programa de elementos de programación de análisis de expresión genética, GeneSpring GX, versión '7.1.3 (Agilent Technologies, Santa Clara, CA, Estados Unidos de América, denominado posteriormente en la presente como GeneSpring), fue usado para efectuar normalización adicional. Todos los valores de intensidad de señal menores de 10 fueron ajustados igual a 10. Enseguida, se aplico normalización por gen al dividir la intensidad de señal de cada sonda en cada muestra por la intensidad mediana para aquella sonda a través de todas las muestras. Estos datos normalizados fueron usados para todos los análisis corrientes abajo excepto la determinación de instancia molecular a la salud detallada posteriormente en la presente.
Predicción de clase. Se utilizo una de las herramientas de predicción de clases disponibles de GeneSpring. El modelo de predicción empleo el algoritmo de K-vecinos mas cercanos, con 10 vecinos y un corte de proporción de valor de p fue de 0.5. Todos los genes de la lista de 393 transcriptos fueron usados para la predicción. El modelo de predicción fue refinado mediante validación cruzada en el conjunto de entrenamiento, en tanto que el falso activo fue excluido. Este modelo fue luego usado para predecir la clasificación de la muestra en los conjuntos de prueba y validación independientes. En donde no se hizo ninguna predicción, esto fue registrado como un resultado indeterminado. La sensibilidad, especificidad e intervalos de confianza de 95 % (95 % de CI) fueron determinados utilizando GraphPad Prism versión 5.02 para Windows. Los valores p fueron determinados utilizando la prueba exacta de Fisher de dos lados.
Análisis supervisado: (i) varianza transcripcional o "distancia molecular a salud". Esta técnica fue efectuada como se describe previamente4. Tiene como objetivo convertir los valores de abundancia de transcriptos a una puntuación representativa que indica el grado de alteración transcripcional de una muestra dada en comparación con una referencia saludable. Esto es efectuado al determinar si los valores .de expresión de una muestra dada caen dentro o fuera de dos desviaciones estándar de la media de los testigos saludables.
Análisis supervisado: (ii) análisis de ruta. Análisis funcional adicional de genes expresados diferencialmente fue efectuado utilizando el análisis de rutas de ingenuidad (Ingenuity® Systems, Inc., Redwood, CA, Estados Unidos de América, www . ingenuity . com) . El análisis de rutas canónicas identifico las rutas del análisis de rutas de ingenuidad que fueron representadas más significativamente en el conjunto de datos. El significado de la asociación entre el conjunto de datos y la ruta canónica son medidos utilizando la prueba exacta de Fisher para calcular un valor p que representan la posibilidad de que la asociación entre los transcriptos en el conjunto de datos y la ruta canónica sea explicada por probabilidad sola, con una corrección de Benj amin-Hochberg para múltiples pruebas aplicadas. El programa puede también ser usado para mapear la red canónica y superponerla con datos de expresión de conjunto de datos.
Análisis supervisado: (iii) Análisis Modular Transcripcional . Este análisis fue efectuado como se describe previamente4'5' En el contexto de el estudio presente, puesto que la estructura modular fue derivada utilizando GeneChips de Affymetrix HG U133A&B, fue necesario traducir la sondas que comprenden los módulos a sus equivalentes en la plataforma de I Ilumina. Las ID RefSeq fueron usadas para hacer coincidir sombras entre las plataformas de G-6 V2de Affymetrix HG U133 de Illumina. Se encontraron coincidencias no ambiguas para 2,109 de los 5,341 conjuntos de sondas de Affymetrix y estas fueron usadas en el análisis modular presente. Las sondas coincidentes fueron conservadas en sus módulos originales. Para presentar gráficamente los cambios transcripcionales globales para grupo de enfermedad como un todo versus el grupo testigo saludable como un todo, los puntos son alineados en una rejilla, con cada posición correspondiente a un modulo diferente usado en su definición original. La intensidad de fondo indica el porcentaje de transcriptos pesados que cambian en la dirección mostrada, del numero total de transcriptos detectados para aquel modulo, mientras que el color del punto indica que la polaridad del cambio (rojo .= sobre representado, azul = sub representado) .
Medición de proteina en suero multiplex. 1-4 mi de sangre fueron recolectados en tubos activadores de coagulo de suero (ya sea tubos de vacuete de 1 mi, 454098, Greiner BioOne, Kremsmunt, Austria; o tubos vacutainer de 4 mi de BD, 368975; Becton Dickinsom) . Los tubos fueron centrifugados a 2000 de por 5 minutos a temperatura ambiente y la porción de suero extraída y congelada a -80°C pendiente del análisis. El análisis fue efectuado mediante inmunoanálisis a base de perlas de citoquina multiplexado por Millipore UK (Millipore UK Ltd. Dundee, Reino Unido de la Gran Bretaña) , utilizando el sistema de perfilado multi-analito Milliplex® (Millipore, Billerica, MA, Estados Unidos de America) . Los niveles en el suero de 63 citoquinas, quimiocinas, receptores solubles, factores de crecimiento, moléculas, de adhesión y proteínas de fase aguda fueron medidos de esta manera en cada muestra. Las muestras fueron analizadas en cuanto a niveles de MMP-9, proteínas C-reactiva, amiloide A en suero, EGF, Eoataxina, FGF-2, ligando de Flt-3, Fractalquina, G-CSF, GM-CSF, GRO, IFN-a2, IFN-?, IL-10, IL-12p40, I L-12p70, IL-13, IL-15, IL-17, I L- IOÍED , I L-?ß, IL-lRy, IL-2, I L-4, IL-5, I L-6, IL-7, IL-8, IL-9, CXCL10 (IP10), MCP-1, MCP-3, MIP-lDa, ???-?ß, PDGF-AA , PDGF-AB/BB, RANTES, ligando de CD40 soluble, soluble IL-2 RA , TGF- , TNF-a, VEGF, MIF, soluble Fas, Ligando de Fas soluble, tPAI-1, ICAM-1 soluble, VCAM-1 soluble, CD30 soluble, gpl30 soluble, I L-1RII soluble, I L-6R soluble, RAGE soluble, TNF-RI soluble, TNF-RII soluble, IL-16, TGFpl, TGF-ß2 y TGFP-3.
Citometria de flujo. 200 µ? de sangre entera (recolectada en tubos de sodio-heparina ) por panel de teñido fueron incubados con los anticuerpos apropiados por 20 minutos a temperatura ambiente de la oscuridad. Luego los glóbulos rojos sanguíneos fueron sometidos a lisis utilizando la solución de lisis de Fas de BD (BD Biosciences) , incubando por 10 minutos a temperatura ambiente en la oscuridad. Las células fueron identificadas y lavadas en 2 mi de solución reguladora del Ph de FACS. (PBS/ BSA/ Azide) antes de ser explicada en paraformaldehidas al 1 %. luego las muestras se hicieron correr en un Coulter Cyan Beckman utilizando los elementos de programación Summit Versión 3.02. El análisis se llevo a cabo utilizando FlowJo Versión 8.7.3 para Macintosh (Tree Star, Inc.). Las estrategias de recorte usadas son resumidas en las Figuras 11 y 12. En donde el apropiado, los datos de espirometría de flujo acumulados fueron probados en cuanto a significado utilizando la prueba U de suma de rangos de Mann-Whitney . Todos los anticuerpos fueron comprados de BD Pharmingen o Caltag Laboratories (Invitrogen) excepto CD44RA CD45RA, quedo comprando de' Beckman Coulter.
Análisis Estadístico. La distancia molecular a la salud y los cálculos de análisis de estructura molecular son efectuados utilizando Excel 2003 de Microsoft (Microsoft Corporation, Redmond, WA, Estados Unidos de América) . El análisis estadístico de variables continuas y análisis de correlación fue efectuado utilizando GraphPad Prism versión 5.02 para Windows (GraphPad Software, San Diego California, Estados Unidos de América, www.graphpad.com). El análisis de variables categóricas fue efectuado utilizando SPSS versión 14 para Windows (Chicago, Illinois, Estados Unidos de América) .
Figuras 10a a 10b. La firma transcripcional de sangre entera de TB activa refleja tanto cambios distintos en composición celular como cambios en los niveles absolutos de expresión genética. La expresión genética de TB activa en comparación con testigos saludables es mapeada dentro de una estructura modular predefinida. La intensidad del punto representa la proporción de transcriptos expresados diferencialmente significativos para cada modulo (rojo = o incrementado, azul = o disminuido, abundancia de transcriptos) . Interpretaciones funcionales determinadas previamente mediante perfilado de literatura sin polarizar son indicadas por la rejilla codificada en colores en la Figura 4 principal. Aquí se demuestra que el porcentaje de genes en cada modulo esta sobre representado (rojo) o sub representado (azul) en el conjunto de entrenamiento (10a); conjunto de prueba (10b); conjunto de validación (10c) (SA). (lOd.) La distancia molecular ponderada a la salud calculada para cada paciente en el pre-tratamiento de referencia (0 meses) y 2 y 12 meses enseguida del inicio de la terapia anti-micobateriana . Los números de pacientes individuales corresponden a aquellos mostrados en las Figuras 3a a 3d.
Figuras lia a 11c. Análisis de linfocitos en sangre de pacientes con TB activa y testigos. (lia) Se muestran estrategias de recorte citométricas de flujo usadas para analizar sangre entera de testigo saludable del conjunto de pruebas y pacientes con TB activa en cuanto a células T y células B. La hilera superior de paneles muestra la estrategia de retro recorte usada para determinar el recorte de FSC/SSC de linfocito usado en el recorte subsecuente. Un recorte de FSC/SSC grande fue establecido inicialmente (panel izquierdo) y luego analizado en cuanto a CD45 vs CD3. Las •células CD45CD3 fueron recortadas (panel medio) y su perfil de FSC/SSC determinado (panel derecho) . Este perfil fue luego usado para determinar un recorte de FSC/SSC de linfocito apropiado (véase segunda hilera, panel izquierdo) . Este procedimiento de retro recorte fue también llevado a cabo en el recorte en CD45+CD19+ (Células B) para asegurar que estas células fueran incluidas en el recorte de linfocito (no mostrado) . La segunda hilera de paneles muestra la estrategia de recorte usada para identificar poblaciones de células T. Un recorte de FSC/SSC de linfocito fue establecido y estas células fueron determinadas en cuanto a CD45 vs CD3 (segundo panel de la izquierda) . Luego las células* CD45+ fueron recortadas y determinadas en cuanto a CD3 vs CD8. Las células T CD3+ fueron recortadas y determinadas en cuanto a expresión de CD4 y CD8. Los subconjuntos de CD4+ y. CD8+ fueron luego reportados. Las hileras 3-6 muestran la estrategia de recorte usada para definir los subconjuntos de memoria de células T. Las células T CD4 y CD8 recortadas como en la hilera 2 fueron determinadas en cuanto a expresión de CD45RA vs CCR7 y un conjunto de cuadrantes en base a los testigos de isotipo (hilera 5 y 6) para definir células naive (CD45RA+CCR7+) , memoria central (CD45RA-CCR7~) memoria efectora (CD45RA~CCR7~) en el caso de células T CD8+, células T efectoras diferenciadas terminalmente (CD 5RA+CCR7") . Estos subconjuntos fueron también determinados en cuanto a expresión de CD62L. La hilera inferior de paneles muestra la estrategia usada para recortar células B. Un recorte de FSC/SSC de linfocito fue establecido en las células determinadas en cuanto a CD45 vs CD19. Las células CD45+ fueron recortadas y determinadas en cuanto a CD19 y CD20. Las células B fueron definidas como CD19+, CD20+. (11b) Sangre entera de 11 testigos saludables del conjunto de prueba (testigos) y 9 pacientes con TB activa del conjunto de prueba (activo) fue analizada mediante citometria de flujo de multi parámetros en cuanto a poblaciones de memoria de células T. La estrategia de recorte de citometria de flujo plena es mostrada en la Figura lia. Las gráficas muestran datos acumulados de todos los individuos en cuanto a porcentajes de células naive, memoria central (TCM) , memoria efectora (TE ) y subconjuntos de células efectoras diferenciadas terminalmente (TD, células T CD8+ solamente) (hilera superior, cada grupo) y los números de células (por 106/ml) para cada subconjunto de células (hilera inferior , cada grupo). Cada símbolo representa un paciente individual. La línea horizontal representa la mediana. (11c) Abundancia de transcripto de células T genético (i) en muestras de sangre entera de TB activo (conjuntos de entrenamiento, prueba y validación) y (ii) expresión' en poblaciones de leucocitos sanguíneos separados^ de la sangre del conjunto de prueba. La abundancia/expresión genética es mostrada en comparación con la mediana de los testigos saludables (marcados en la Figura 1) . Los números mostrados en el conjunto de prueba y las poblaciones separadas corresponden a pacientes individuales.
Figuras 12a a 12c. Análisis de células mieloides en sangre de pacientes con TB activa y testigos. (12a) Se muestran estrategias de recorte citométricas de flujo usadas para analizar sangre entera de testigos saludables del conjunto de pruebas en pacientes con TB activa en cuanto a monocitos y neutrofilos. Un recorte de FSC/SSC grande fue establecido (hilera superior, panel izquierdo) y fue luego analizado en cuanto a CD45 vs CD14. Las células CD45+ fueron recortadas (panel medio) y determinadas en cuanto a CD14 vs CD16. Los monocitos fueron definidos como CD14+, monocitos inflamatorios como CD14+, CD16+ y neutrofilos como CD16+. También se muestra en esta Figura la estrategia de recorte usada para determinar la superposición posible entre neutrofilos de CD16+ y células NK que expresan CD16. Un recorte de FSC/SSC grande fue establecido para abarcar tanto neutrofilos como células NK. (12b) Las células CD45+ fueron luego determinadas en cuanto CD16 vs CD56 (marcador de células NK) . Los- neutrofilos de CD16+ expresaron altos niveles de CD16 y no de CD56 (como se muestra por la gráfica del testigo de isotipo, panel inferior) . Las células NK CD56+ expresaron niveles intermedios de CD16 y no se traslaparon con células CD16hi. Las células CD56+, CDI6int y células CD16hi tuvieron diferentes propiedades de FSC/SSC. (12c) Abundancia de transcripto de gen de mieloide (i) en muestras de sangre entera de TB activo (conjuntos de entrenamiento, prueba y validación) y (ii) expresión en poblaciones de leucocitos sanguíneos separados de la sangre del conjunto de prueba.'. Se muestra la abundancia/expresión genética en comparación con la mediana de los testigos saludables (marcados como en la Figura 1) . Los números mostrados en el conjunto de prueba y las poblaciones separadas corresponden a pacientes individuales.
Figuras 13a y 13b. Análisis de rutas de ingenuidad de la firma de 393 transcriptos. (13a) La probabilidad (como un menos logaritmo del valor p calculado por la prueba exacta de Fischer con corrección de pruebas múltiples de Benjamini-Hochberg) que cada ruta biológica canónica sea sobre representada significativamente es indicada por los cuadrados anaranjados. Las barras de color solido representan el porcentaje del numero total de genes que comprenden aquella ruta (dada en negritas en el borde derecho de cada barra) presente en la lista de genes analizados. El color de la barra indica la abundancia de aquellos transcriptos en la sangre entera de pacientes con TB activa en comparación con testigos saludables en el conjunto de entrenamiento. (13b) Niveles en el suero de interferon-alfa 2a (IFN-alfa-2a) e interferon -gama (IFN-gama) son mostrados en la presente para los 12 testigos saludables y 13 pacientes con TB activa usados para los análisis de micro arreglo del conjunto de entrenamiento. No se observo ninguna diferencia significativa entre grupos ya sea para una u otra citoquina utilizando la prueba de Mann-Whithney de dos colas. La linea horizontal indica la media para cada grupo y los bigotes indican el intervalo de confianza de 95 %.
Figuras 14a y 14b. Expresión de PDLl (CD274) en sangre entera y subpoblaciones de células de testigos saludables individuales y pacientes con TB activa. (14a) Sangre entera de 11 testigos saludables del conjunto de prueba (testigo) y 11 pacientes con TB activa del conjunto de prueba (activo) fue analizada mediante citometria de flujo en cuanto a expresión de PDLl. Un recorte de FSC/SSC grande fue establecido para abarcar el total de células de sangre entera y la intensidad de fluorescencia media geométrica (MFI) de PDLl (en rojo) en comparación con el testigo de isotipo (verde determinado) . Cada paciente con TB activa fue analizado en un día diferente, los testigos saludables fueron analizados en grupos pequeños (de la izquierda, muestras 1 y 2, 3 y 4, 6-8 y 9-11 se pusieron en operación conjuntamente, 5, se puso en operación individualmente) y las muestras dentro de cada grupo comparten, un testigo de isotipo. (14b) Subpoblaciones de células de la sangre de los mismos 11 testigos saludables del conjunto de prueba (testigo) y 11 pacientes con TB activa del conjunto de prueba (activa) como en la parte a fueron también analizados mediante citometria de flujo en cuanto a expresión de PDL1. Sub-poblaciones de células fueron definidas como la Figura 6b y los MFI de los PDL1 (en rojo) en comparación con el testigo de isotipo (verde) fueron graficadas.
Figuras 15a-f. Los perfiles de 393 transcriptos del conjunto de entrenamiento ordenados de acuerdo con el grupo de estudio son mostrados amplificados con símbolos genéticos son enlistados a la derecha de la Figura. Los transcriptos claves son resaltados por el texto más grande. A la izquierda de cada figura se muestra todo el árbol genético y mapa de calor con el área ampliada marcada por un rectángulo negro. La abundancia relativa de transcriptos es indicada por una escala de colores en la base de la figura (como en la Figura 1) - Las Figuras 16a a 16 son mapas de calor que comparan el testigo latente y el activo para los varios genes como se enlista en el lado derecho de los mapas de calor.
Las Figuras 17a a 17c son tablas con las estadísticas para los varios conjuntos de entrenamiento, conjuntos de prueba y conjuntos de validación como se enlistan en las tablas, es decir, genero, país de origen y etnicidad con varios rompimientos.
Las Figuras 18a a 18c son tablas con las estadísticas para los varios conjuntos de entrenamiento, conjuntos de prueba y conjuntos de validación como se enlista en la tabla, es decir, resultados de prueba para TST, vacunación de BCG y estatus de frotis.
La Figura 19 es una tabla que resume los resultados en cuanto a especificidad y sensibilidad de los conjuntos 'de entrenamiento, conjuntos de prueba y conjuntos de validación entre las varias fuentes para las muestras.
Referencias para métodos.
1. Salisbury, D., Ramsay, M. Immunization against infectious diseases - the Green Book. D.O. Health, London The Stationery Office, 391-408 (2006) .
2. National Institute for Health and Clinical Excellence. (Royal College of Physicians, UK, 2006).
3. Falk, A., O'Connor, J.B. Classification of pulmonary tuberculosis: Diagnosis standards and classification of tuberculosis. National tuberculosis and respiratory disease association 12, 68-76 (1969) .
4. Pankla, R. et al. Genomic Transcriptional Profiling Identifies a Candidate Blood Biomarker Signature for the Diagnosis of Septicemic Melioidosis. Genome Biol In press (2009) .
5. Chaussabel, D. et al. A modular analysis framework for blood genomics studies: application to systemic lupus erythematosus . Immunity 29, 150-64 (2008).
Genes en el Módulo MI .3
Genes en el Módulo MI.5
Genes en los Módulos M2.6
Genes en los Módulos M2.6
·
Genes en el Módulo M2.2
Genes en el Módulo 3.1
Se- contempla que .cualquier modalidad discutida en esta especificación pueden ser implementadas con respecto a cualquier método, kit, reactivo o composición de la invención y viceversa, Además, las composiciones de la invención pueden ser usadas para obtener los métodos de la invención.
Se comprenderá que modalidades particulares descritas en la presente son mostradas a manera de ilustración y no como limitaciones de la invención. Los elementos principales de esta invención pueden ser empleados en varias modalidades sin desviarse del alcance de la invención. Aquellos experimentados en el arte reconocerán o ser aptos de indagar utilizando no más que experimentación de rutina, numerosos equivalentes a los procedimientos específicos descritos en la presente. Se considera que tales equivalentes están dentro del alcance de esta invención y son cubiertos por las reivindicaciones.
Todas las publicaciones y solicitudes de patente mencionadas en la especificación son indicadoras del nivel de habilidad de aquellos experimentados en el arte, con el cual esta invención es concerniente. Todas las publicaciones y solicitudes de patente son incorporadas en la presente por referencia a la misma extensión como si cada publicación o solicitud de patente individual fuera indicada específica e individualmente para ser incorporada por referencia.
El uso de la palabra "uno" o "un" cuando es usada en conjunción con el termino "que comprende" en las reivindicaciones y/o la especificación puede ser significar "uno", pero también es consistente con el significado de "uno o mas", "por lo menos uno " y "uno o mas de uno". El uso del termino "o" en la reivindicaciones es usado para' dar a entender "y" a no ser que sea indicado explícitamente para referente a alternativas solamente o las alternativas son mutuamente exclusivas, aunque la revelación apoya una definición que se refiere a solamente alternativas y "y/o". En toda esta solicitud, el termino "aproximadamente" es usado para indicar que un valor incluye la variación de error inherente para el dispositivo, el método que es empleado para determinar el valor o la variación que existe entre los sujetos de estudio.
Como se usa en esta especificación y reivindicación (es) , las palabras "que comprende" (y cualquier forma de que comprende, tal como "comprender" y "comprende") , "que tiene" (y cualquier forma de que tiene, tal como "tener" y "tiene"), "que incluye" (y cualquier forma de que incluye, tal como "incluye" e "incluir") o "que contiene" (y cualquier forma de que contiene, tal como "contiene" y "contener") son inclusivos o de extremos abiertos y no excluyen elementos adicionales no citados o etapas de método.
El termino "o combinaciones de los mismos" como se usa en la presente, se refiere a todas las permutaciones y combinaciones de los ítems enlistados precedentes al termino. Por ejemplo "A,B,C o combinaciones de los mismos" pretende incluir por lo menos uno de: A, B, C, AB, AC, BC o ABC o si el orden es importante en un contexto particular, también BA, CA, CB, CBA, BCA, ACB, BAC o CAB . Continuando co este ejemplo, expresamente incluida están combinaciones que contienen repeticiones de uno o mas ítems o términos, tales como BB, AAA, MB, BBC, AAABCCCC, CBBAAA, CABABB y así sucesivamente. El experimentado en el arte, entenderá que comúnmente no hay ningún limite en cuanto al numero de ítems o términos en cualquier combinación, a no ser que sea de otra manera evidente del contexto.
Todas las composiciones y/o métodos revelados y reivindicados en la presente pueden ser elaborados y ejecutados sin experimentación indebida a la luz de la presente revelación. En tanto que las composiciones y métodos de esta invención han sido descritos en términos de modalidades preferidas, será evidente para aquellos de habilidad en el arte que se pueden aplicar validaciones a las composiciones y/o métodos y en las etapas o en las secuencias de etapas del método descrito en la presente sin desviarse del contexto, espíritu y alcance de la invención. Todos de tales sustitutos y modificaciones similares evidentes para aquellos experimentados en el arte se considera que están dentro del espíritu, alcance y concepto de la invención como es definida por las reivindicaciones adjuntas.
Referencias
1. WHO. (World Health Organization, Geneva, 2008).
2. Anderson, S. R., Maguire, H. & Carless, J. Tuberculosis in London: a decade and a half of no decline
[corrected] . Thorax 62, 162-7 (2007).
3. Trunz, B. B., Fine, P. & Dye, C. Effect of BCG vaccination on childhood tuberculous meningitis and miliary tuberculosis worldwide: a meta-analysis and assessment of cost-effectiveness. Lancet 367, 1173-80 (2006).
4. Young, D. B. , Perkins, M. D. , Duncan, K. & Barry, C. E., 3rd. Confronting the scientific obstacles to global control of tuberculosis. J Clin Invest 118, 1255-65 (2008) .
5. Center for Communicable Disease Control and
Prevention. (ed. U.S. Department of Health and Human Services, C.) XX (Atlanta, GA, 2007). .
6. Pfyffer, G. E . , Cieslak, C, Welscher, H. M . , Kissling, P. & Rusch-Gerdes , S. Rapid detection of mycobacteria in cliriical specimens by using the automated BACTEC 9000 MB system and comparison with radiometric and solid-culture systems. J Clin Microbiol 35, 2229-34 (1997) .
7. ' Schoch, 0. D. et al. Diagnostic yield of sputum, induced sputum, and bronchoscopy after radiologic tuberculosis screening. Am J Respir Crit Care Med 175, 80-6 (2007).
8. Storla, D. G . , Yimer, S. & Bjune, G. A. A systematic review of delay in the diagnosis and treatment of tuberculosis. BMC Public Health 8, 15 (2008).
9. Cpmstock, G. W., Livesay, V. T. & oolpert, S.
F. The prognosis of a positive tuberculin reaction in childhood and adolescence. Am J Epidemiol 99, 131-8 (1974).
10. Vynnycky, E. & Fine, P. E. Lifetime risks, incubation period, and serial interval of tuberculosis. Am J Epidemiol 152, 247-63 (2000) .
11. Young, D. · B . , Gideon, · H . P. & Wilkinson, R. J. Eliminating latent tuberculosis. Trends icrobiol 17, 183-8 (2009) .
12. National Institute for Health and Clinical Excellence. (Royál College of Physicians, UK, 2006).
13. Ottenhoff, T. H. Overcoming the global crisis: "yes, we can", but also for TB ... ? Eur J Immunol 39, 2014-20 (2009) .
14. Casanova, J. L. & Abel, L. Genetic dissection of immunity to mycobacteria : the human model. Annu Rev
Immunol 20,· 581-620 (2002).
15. Cooper, A. M. Cell-mediated immune responses in tuberculosis. Annu Rev Immunol 27, 393-422 (2009).
16. Flynn, J. L. & Chan, J. Immunology of tuberculosis. Annu Rev Immunol 19, 93-129 (2001).
17. Keane, J. et al. Tuberculosis associated with infliximab, a tumor necrosis factor alpha-neutralizing agent. N Engl J ed 345, 1098-104 (2001) .
18. Chaussabel, D. et al. A modular analysis framework for blood genomics studies: application to systemic lupus erythematosus . Immunity 29, 150-64 (2008).
19. Pascual, V. et al. How the study of children with rheumatic diseases identified interferon-alpha and interleukin-1 as novel therapeutic targets. Immunol Rev 223, 39-59 (2008) .
20. · Benoist, C, Germain, R.< N. & Mathis, D . A plaidoyer for ' systems immunology ' . Immunol Rev 210, 229-34 (2006) .
21. Allmark, P. Should research samples reflect the diversity of the population? J Med Ethics 30, 185-9 (2004).
22. Cottin, V. et al. Small-cell lung cáncer: patients included in clinical triáis are not representative of the patient population as a whole. Ann Oncol 10, 809-15 (1999) .
23. Simón, R. , Radmacher, M. D. , Dobbin, K. & McShane, L. M. Pitfalls in the use of DNA microarray data for diagnostic and prognostic classification . J Nati Cáncer Inst 95, 14-8 (2003) .
24. Barry, C. E., 3rd et al. The spectrum of latent tuberculosis: rethinking the biology and intervention strategies. Nat Rev icrobiol 7, 845-55 (2009).
25. Center for Communicable Disease Control and Prevention. Misdiagnosis of tuberculosis resulting from laboratory cross-contamination of Mycobacterium tuberculosis cultures. MMWR, New Jersey 49, 413-16 (2000).
26. Pankla, R. et al. Genomic Transcriptional Profiling Identifies a Candidate Blood Biomarker Signature for the Diagnosis of Septicemic Melioidosis. Genome Biol Re-submitted (2009) .
27. Beck, J. S., Potts, R. C, Kardjito, T. & Grange, J. M. T4 lymphopenia in patients with active pulmonary tuberculosis. Clin Exp Immunol 60, 49-54 (1985).
28. Rodrigues,. D. S. et al. Immunophenotypic characterization of peripheral T lymphocytes in Mycobacterium tuberculosis infection and disease. Clin Exp Immunol 128, 149-54 (2002).
29. Auffray, C, Sieweke, . H. & Geissmann, F. Blood monocytes: development, heterogeneity, and relationship with dendritic cells. Annu Rev Immunol 27, 669-92 (2009).
30. Sher, A. & Coffman, R. L. Regulation of immunity to parasites by T cells and T cell-derived cytokines. Annu Rev Immunol 10, 385-409 (1992) .
31. Theofilopoulos, A. N., Baccala, R., Beutler, B. & Kono, D. H. Type I interferons (alpha/beta) in immunity and autoimmunity . Annu Rev Immunol 23, 307-36 (2005).
32. Auerbuch, V., Brockstedt, D. G. , Meyer-Morse , N . , O'Riordan, M. & Portnoy, D. A. Mice lacking the type I interferon receptor are resistant to Listeria monocytogenes . J Exp Med 200, 527-33 (2004).
33. Carrero, J. A., Calderón, B. & Unanue, E. R.
Type I interferon sensitizes lymphocytes to apoptosis and reduces resistance to Listeria infection. J Exp Med 200, 535-40 (2004).
34. O'Connell, R. M. et al. Type I interferon production enhances susceptibility to Listeria monocytogenes infection. J Exp Med 200, 437-45 (2004).
35. Bouchonnet, F. , Boechat, N., Bonay, M. & Hance, A. J. Alpha/beta interferon impairs the ability of human macrophages to . control growth of Mycobacterium bovis BCG. Infect Immun 70, 3020-5 (2002) .
36. Manca, C. et al. Hypervirulent M. tuberculosis W/Beijing strains upregulate type I IFNs and increase expression of negative regulators of the Jak-Stat pathway. J Interferon Cytokine Res 25, 694-701 (2005) .
37. Stanley, S. A., Johndrow, J. E., Manzanillo, P. & Cox, J. S. The Type I IFN response to infection with Mycobacterium tuberculosis requires ESX-l-mediated secretion and contributes to pathogenesis . J Immunol 178, 3143-52 (2007).
38. Cooper, A. M., Pearl, J. E . , Brooks, J. V. , Ehlers, S. & Orme, I. M. Expressi.on of the nitric oxide synthase 2 gene is not essential for early control of Mycobacterium tuberculosis in the murine lung. Infect Immun 68, 6879-82 (2000).
39. Shi, S. et al. Expression of many immunologically important genes in Mycobacterium tuberculosis-infected macrophages is independent of both TLR2 and TLR4 but dependent on IFN-alphabeta receptor and STATl. J Immunol 175, 3318-28 (2005) .
40. Farah, R. & Awad, J. The association of interferon with the development of pulmonary tuberculosis. Int J Clin Pharmacol Ther 45, 598-600 (2007).
41. Telesca, C. et al. Interferon-alpha treatment of. hepatitis D induces tuberculosis exacerbation in an immigrant. J Infect 54, e223-6 (2007).
42. Eum, S. Y. et al. Neutrophils are the predominant infected phagocytic cells in the airways of patients with active pulmonary tuberculosis. Chest (2009).
43. Eruslanov, E. B. et al. Neutrophil responses to Mycobacterium tuberculosis infection in genetically susceptible and' resistant mice. Infect Immun 73, 1744-53 (2005) .
44. Barber, D. L. et al. Restoring function in exhausted CD8 T cells during chronic viral infection. Nature 439, 682-7 (2006) .
45. Day, C. L. et al. PD-1 expression on HIV-specific T cells is associated with T-cell exhaustion and disease progression. Nature 443, 350-4 (2006).
46. Jurado, J. O. et al. Programmed death (PD)-l:PD-ligand 1/PD-ligand 2 pathway inhibits T cell effector functions during human tuberculosis. J Immunol 181, 116-25 (2008) .
47. Boasso, A. et al. PDL-1 upregulation on monocytes and T cells by HIV via type I interferon: restricted expression of type I interferon receptor by CCR5-expressing leukocytes. Clin Immunol 129, 132-44 (2008) .
48. Einarsdottir, T. , Lockhart, E. & Flynn, J. L. Cytotoxicity and secretion of gamma interferon are carried out by distinct CD8 T cells during Mycobacterium tuberculosis infection. Infect Immun 77, 4621-30 (2009) .
49. Ha, S. J., West, E. E. , 'Araki, K. , Smith, K. A. & Ahmed, R. Manipulating both the inhibitory and stimulatory immune system towards the success of therapeutic vaccination against chronic viral infections. I munol Rev 223, 317-33 (2008) .
50. Jacobsen, M. et al. Candidate biomarkers for discrimination bet een infection and disease caused by Mycobacterium tuberculosis. J Mol Med 85, 613-21 (2007).
51. Mistry, R. et al. Gene-expression patterns in whole blood identify subjects at risk for recurrent tuberculosis. J Infect Dis 195, 357-65.(2007) .
52. Allantaz, F. et al. Blood leukocyte microarrays to diagnose systemic onset juvenile idiopathic arthritis and follow the response to IL-1 blockade. J. Exp. Med. 204, 2131-2144 (2007).
53. Baechler, E. C. et al. Interferon-inducible gene expression signature in peripheral blood cells of patients with severe lupus. Proc. Nati Acad. Sci. USA 100, 2610-2615 (2003).
54. Bennett, L. et al. Interferon and granulopoiesis signatures in systemic lupus erythematosus blood. J. Exp. Med. 197, 711-723 (2003) .
Claims (25)
1. Un método para detectar una infección de Mycobacterium tuberculosis activa que aparece latente/asintomática, caracterizado porque comprende: obtener un conjunto de datos de expresión genética del paciente de un paciente sospechoso de una infección de Mycobacterium tuberculosis latente/asintomática; curtir el conjunto de datos de expresión genética del paciente a uno o mas módulos genéticos asociados con la infección de Mycobacterium tuberculosis y compara el conjunto de datos de expresión genética del paciente por cada uno del uno o mas módulos genéticos con un conjunto de datos de expresión genética de un no paciente también surtido a los mismos módulos genéticos; en donde un incremento o disminución en la totalidad de expresión genética en el conjunto de datos de expresión genética del paciente en cuanto a uno o mas módulos genéticos es indicador de una infección de Mycobacterium tuberculosis activa en lugar de una infección de Mycobacterium tuberculosis latente/asintomática.
2. El método de la reivindicación 1, caracterizado porque comprende además la etapa de usar la información del producto genético comparativo determinado para formular por lo menos uno de de diagnosis, una prognosis o un plan de tratamiento.
3. El método de la reivindicación 1, caracterizado porque comprende además la etapa de distinguir pacientes con TB latente de pacientes con TB activa.
4. El método de la reivindicación 1, caracterizado porque el conjunto de datos de la expresión genética del paciente es obtenido de células obtenidas de por lo menos uno de sangre entera, células mono nucleares de sangre periférica o esputo.
5. El método de la reivindicación 1, caracterizado porque el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 o 393 genes seleccionados de los genes de la tabla 2.
6. El método de la reivindicación 1, caracterizado porque el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200 módulos Mi.3, M2.8, MI.5, M2.6, M2.2 y 3.1.
7. El método de la reivindicación 1, caracterizado porque los módulos genéticos asociados con infección Mycobacterium tuberculosis son seleccionados del grupo que consiste de Modulo MI.3, Modulo M2.8 ,· Módulos MI.5, Módulos M2.6, Módulos M2.2 y Módulos M3.1.
8. El método de la reivindicación 1, caracterizado porque los módulos genéticos asociados con infección de Mycobacterium tuberculosis son seleccionados con cambios en una disminución en genes relacionados con células B, una disminución en genes relacionados con células T, un incremento en genes mieloides relacionados, un incremento en transcriptos neutrofilos relacionados y genes interferon inducibles (IFN) .
9. El método de la reivindicación 1, caracterizado porque el estado de enfermedad del paciente es determinado adicionalmente mediante análisis radiológico de los pulmones del paciente.
10. El método de la reivindicación 1, caracterizado porque comprende además la etapa dé determinar un conjunto de datos de expresión genética del paciente tratado después que el paciente ha sido tratado y determinar si el conjunto de datos de expresión genética del paciente tratado ha regresado a un conjunto de datos de expresión genética normal determinando mediante esto si el paciente ha sido tratado.
11. Un método para predecir si una infección de Mycobacterium tuberculosis que parece latente/asintomática se convertirá en una infección de Mycobaterium tuberculosis' activa, caracterizado porque comprende: obtener un primer conjunto de datos de expresión activa obtenido de un primer de un primer grupo clínico con infección de Mycobacterium tuberculosis activa, un segundo conjunto de datos de expresión genética obtenido de un segundo grupo clínico con infección de Mycobacterium tuberculosis latente y un tercer conjunto de datos de expresión genética obtenido de un grupo clínico de individuos no infectados; generar un conjunto de datos de grupos genéticos que comprenden la expresión diferencial de genes entre cualesquier dos de los primero, segundos y terceros conjuntos de datos y determinar un patrón único de lá expresión/representación que es indicadora de infección latente, infección activa o que es saludable, en donde el conjunto de datos de expresión genética del paciente comprende por lo menos 6, 10, 20, 40, 50, 70, 80, 90, 100, 125, 150 o 200 genes obtenidos de los genes en por lo menos uno de los Módulos MI.3, M2.8, MI.5, M2.6, M2.2 y 3.1, en donde un . incremento o disminución en la capacidad de expresión genética en el conjunto de datos de expresión genética del paciente para en uno o mas módulos genéticos es indicador de infección de Mycobacterium tuberculosis activa en lugar de una infección latente/asintomática .
12. Un kit para diagnosticar la infección en un paciente que se sospecha que esta infectado con Mycobacterium tuberculosis, el kit esta caracterizado porque comprende: un detector de expresión, genética para obtener un conjunto de datos de expresión genética del paciente en donde los genes expresados son obtenidos de la' sangre entera del paciente y un procesador apto de comparar el conjunto de datos de expresión genética con un conjunto de datos del módulos genético predefinido asociado con infección de Mycobacterium tuberculosis y que distingue entre pacientes infectados y pacientes no infectados, en donde la sangre entera demuestra un cambio de agregación en los niveles de polinucleótidos en el uno o mas módulos de expresión genética transcripcionales en comparación con pacientes no infectados que coinciden, distinguiendo mediante esto entre una infección de Mycobacterium tuberculosis latente/asintomática y una infección que se volverá activa.
13. El kit de la reivindicación 12, caracterizado porque el conjunto de datos de expresión genética de paciente es obtenido de células mono nucleares de sangre periférica.
14. El kit de la reivindicación 12, caracterizado porque el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 o 393 genes seleccionados de los genes de la tabla 2.
15. El kit de la reivindicación 12, caracterizado porque el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, Módulos MI.3, M2.8 , MI.5, M2.6, M2.2 y 3.1.
16. El kit de la reivindicación 12, caracterizado porque los módulos genéticos asociados con infección de Mycobacterium tuberculosis son seleccionados del grupo que consiste del Modulo MI.3, M2.8 , MI.5, M2.6, M2.2 y 3.1.
17. El kit de la reivindicación 12, caracterizado porque los módulos genéticos asociados con infección de Mycobacterium tuberculosis son seleccionados con cambios en una disminución en genes relacionados con células B, una disminución en genes relacionadas con células T, un incremento en genes mieloides relacionados, un incremento en transcriptos neutrofilos relacionados y genes interferon inducibles (IFN) .
18. El kit de la reivindicación 12, caracterizado porque los genes son seleccionados de PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 y C5.
19. Un sistema que detecta una infección de Mycobacterium tuberculosis activa que aparece latente/asintomática caracterizada porque comprende: un detector de expresión genética para obtener un conjunto de datos de expresión clínica del paciente en donde los genes expresados son obtenidos de la sangre entera del paciente y un procesador apto de comparar el conjunto de datos de expresión genética con un conjunto de datos de modulo genético predefinido asociado con infección de Mycobacterium tuberculosis y que distingue entre pacientes con infección de Mycobacterium tuberculosis latente en riesgo de avance a enfermedad activa, en donde la sangre entera demuestra un cambio de agregación en los niveles de polinucleótidos en el uno o mas módulos de expresión genética transcripcionales en comparación con pacientes no infectados coincidentes, distinguiendo mediante esto entre los pacientes con infección de Mycobacterium tuberculosis latente en riesgo de avance a enfermedad activa, en donde el conjunto de datos del modulo genético comprende por lo menos uno de los Módulos MI.3, M2.8, MI.5, M2.6, M2.2 y 3.1.
20. El sistema de la reivindicación 19, ¦ caracterizado porque el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 o 393 genes seleccionados de la tabla 2.
21. El sistema de la reivindicación 19, caracterizado porque el conjunto de datos de expresión genética del paciente es comparado con por lo menos 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, Módulos MI.3, Módulos M2.8, Módulos MI.5, Módulos M2.6, Módulos M2.2 y Módulos 3.1.
22. El sistema de la reivindicación 19, caracterizado porque los Módulos genéticos asociados con infección Mycobacterium tuberculosis son seleccionados del grupo que consiste de Módulos MI.3, Módulos M2.8, Módulos MI.5, Módulos M2.6, Módulos M2.2 y Módulos 3.1.
23. El sistema de la reivindicación 19, caracterizado porque los Módulos genéticos asociados con infección de Mycobacterium tuberculosis son seleccionados con cambios en una disminución en genes relacionados con células B, una disminución en genes relacionados con células t, un incremento en genes mieloides relacionados, un incremento en transcriptos neutrofilos relacionados y genes interferon inducibles (IFN).
24. El sistema de la reivindicación 19, caracterizado porque los genes seleccionados de PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 y C5.
25. Un método para monitorear la eficacia en una prueba de una agente terapéutico, caracterizado porque comprende : obtener un conjunto de datos de expresión genética de pacientes de un paciente que se sospecha que esta infectado con Mycobacterium tuberculosis; surtir el conjunto de datos de expresión genética del paciente a uno o mas módulos genéticos asociados con infección de Mycobacterium tuberculosis y compara el conjunto de datos de expresión genética del paciente para cada uno del uno o mas módulos genéticos con un conjunto de datos de expresión genética de un no paciente ; tratar el paciente con el agente terapéutico y determinar si el agente terapéutico cambio el perfil de expresión genética del paciente al conjunto de datos de expresión genética de un no paciente; en donde un incremento o disminución sin la totalidad de expresión genética en el conjunto de datos de expresión genética del paciente para el uno o mas módulos genéticos es indicador de infección de Mycobacterium tuberculosis activa.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US12/628,148 US20110129817A1 (en) | 2009-11-30 | 2009-11-30 | Blood transcriptional signature of active versus latent mycobacterium tuberculosis infection |
| PCT/US2010/046042 WO2011066008A2 (en) | 2009-11-30 | 2010-08-19 | Blood transcriptional signature of active versus latent mycobacterium tuberculosis infection |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MX2012006031A true MX2012006031A (es) | 2012-10-03 |
Family
ID=44067161
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2012006031A MX2012006031A (es) | 2009-11-30 | 2010-08-19 | Firma transcripcional sanguinea de infeccion de mycobacterium tuberculosis activa versus latente. |
Country Status (20)
| Country | Link |
|---|---|
| US (2) | US20110129817A1 (es) |
| EP (1) | EP2519652A4 (es) |
| JP (1) | JP2013511981A (es) |
| KR (2) | KR20140078768A (es) |
| CN (1) | CN102844444A (es) |
| AP (1) | AP2012006346A0 (es) |
| AR (1) | AR080570A1 (es) |
| AU (1) | AU2010325179B2 (es) |
| BR (1) | BR112012013029A2 (es) |
| CA (1) | CA2782211A1 (es) |
| CL (1) | CL2012001400A1 (es) |
| EA (1) | EA201270650A1 (es) |
| IL (1) | IL220016A0 (es) |
| MX (1) | MX2012006031A (es) |
| PE (1) | PE20121690A1 (es) |
| PH (1) | PH12012501043A1 (es) |
| SG (1) | SG10201407855WA (es) |
| TW (1) | TW201131032A (es) |
| WO (1) | WO2011066008A2 (es) |
| ZA (1) | ZA201204806B (es) |
Families Citing this family (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2524966A1 (en) * | 2011-05-18 | 2012-11-21 | Rheinische Friedrich-Wilhelms-Universität Bonn | Molecular analysis of tuberculosis |
| TWI458978B (zh) * | 2011-12-27 | 2014-11-01 | Chengchung Chou | 判別開放性或潛伏性結核菌感染之方法 |
| WO2013138497A1 (en) * | 2012-03-13 | 2013-09-19 | Baylor Research Institute | Early detection of tuberculosis treatment response |
| EP2836608A4 (en) | 2012-04-13 | 2016-02-24 | Somalogic Inc | TUBERCULOSIS BIOMARKERS AND USES THEREOF |
| GB201211158D0 (en) * | 2012-06-22 | 2012-08-08 | Univ Nottingham Trent | Biomarkers and uses thereof |
| US20150284780A1 (en) * | 2012-10-30 | 2015-10-08 | Imperial Innovations Limited | Method of detecting active tuberculosis in children in the presence of a co-morbidity |
| US20150315643A1 (en) * | 2012-12-13 | 2015-11-05 | Baylor Research Institute | Blood transcriptional signatures of active pulmonary tuberculosis and sarcoidosis |
| EP2962100B1 (en) | 2013-02-28 | 2021-07-28 | Caprion Proteomics Inc. | Tuberculosis biomarkers and uses thereof |
| GB201315748D0 (en) | 2013-09-04 | 2013-10-16 | Imp Innovations Ltd | Biological methods and materials for use therein |
| WO2015048098A1 (en) | 2013-09-24 | 2015-04-02 | Washington University | Diagnostic methods for infectious disease using endogenous gene expression |
| EP3132270A4 (en) * | 2014-04-15 | 2017-09-13 | Stellenbosch University | A method for diagnosing tuberculous meningitis |
| CN103954755B (zh) * | 2014-04-30 | 2017-04-05 | 广东省结核病控制中心 | 一种结核分枝杆菌潜伏感染的诊断试剂盒 |
| US10041945B2 (en) | 2014-05-05 | 2018-08-07 | Emory University | Methods of diagnosing and treating tuberculosis |
| ES2857000T3 (es) * | 2015-10-14 | 2021-09-28 | Univ Leland Stanford Junior | Métodos para el diagnóstico de la tuberculosis |
| GB201519872D0 (en) * | 2015-11-11 | 2015-12-23 | Univ Cape Town And Ct For Infectious Disease Res | Biomarkers for prospective determination of risk for development of active tuberculosis |
| GB2547034A (en) * | 2016-02-05 | 2017-08-09 | Imp Innovations Ltd | Biological methods and materials for use therein |
| KR101888101B1 (ko) * | 2016-09-19 | 2018-08-14 | 충남대학교산학협력단 | Scotin 단백질의 과발현에 의하여 결핵균 생존 및 증식을 억제하는 방법 |
| JP6306124B2 (ja) * | 2016-11-01 | 2018-04-04 | 国立大学法人高知大学 | 結核検査用バイオマーカー |
| CN107653313B (zh) * | 2017-09-12 | 2021-07-09 | 首都医科大学附属北京胸科医院 | Retn和klk1在作为结核病检测标志物中的应用 |
| US11443433B2 (en) * | 2018-02-10 | 2022-09-13 | The Trustees Of The University Of Pennsylvania | Quantification and staging of body-wide tissue composition and of abnormal states on medical images via automatic anatomy recognition |
| GB201804019D0 (en) * | 2018-03-13 | 2018-04-25 | Univ Cape Town | Method for predicting progression to active tuberculosis disease |
| US11036779B2 (en) * | 2018-04-23 | 2021-06-15 | Verso Biosciences, Inc. | Data analytics systems and methods |
| CN109061191B (zh) * | 2018-08-23 | 2021-08-24 | 中国人民解放军第三〇九医院 | S100p蛋白作为标志物在诊断活动性结核病中的应用 |
| CN108828235A (zh) * | 2018-08-23 | 2018-11-16 | 中国人民解放军第三〇九医院 | Pglyrp1蛋白作为标志物在诊断活动性结核病中的应用 |
| US12331320B2 (en) | 2018-10-10 | 2025-06-17 | The Research Foundation For The State University Of New York | Genome edited cancer cell vaccines |
| CN110286231A (zh) * | 2019-06-19 | 2019-09-27 | 中国人民解放军总医院第八医学中心 | 用于检测cd160蛋白的物质在制备用于诊断活动性结核病的产品中的应用 |
| CN111304313A (zh) * | 2019-12-13 | 2020-06-19 | 南方医科大学 | 一种检测fpr1基因表达水平的试剂的应用 |
| EP3868894A1 (en) * | 2020-02-21 | 2021-08-25 | Forschungszentrum Borstel, Leibniz Lungenzentrum | Method for diagnosis and treatment monitoring and individual therapy end decision in tuberculosis infection |
| WO2024119057A2 (en) * | 2022-12-02 | 2024-06-06 | Cornell University | Plasma cell-free rna signatures of tuberculosis |
| CN116994646B (zh) * | 2023-08-01 | 2024-06-11 | 东莞市滨海湾中心医院(东莞市太平人民医院、东莞市第五人民医院) | 一种菌阳活动性肺结核风险评估模型的构建方法与应用 |
| CN119044484B (zh) * | 2024-09-02 | 2025-01-21 | 中国科学院微生物研究所 | 活动性肺结核诊断及鉴别诊断标志物组合及其应用 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6627198B2 (en) * | 1997-03-13 | 2003-09-30 | Corixa Corporation | Fusion proteins of Mycobacterium tuberculosis antigens and their uses |
| US6713257B2 (en) * | 2000-08-25 | 2004-03-30 | Rosetta Inpharmatics Llc | Gene discovery using microarrays |
| AU2002241520A1 (en) * | 2000-11-28 | 2003-03-03 | University Of Cincinnati | Blood assessment of injury |
| AU2002314358C1 (en) * | 2001-07-04 | 2009-03-26 | The Secretary Of State For Health | Mycobacterial antigens expressed during latency |
| WO2004001070A1 (en) * | 2002-06-20 | 2003-12-31 | Glaxo Group Limited | Surrogate markers for the determination of the disease status of an individual infected by mycobacterium tuberculosis |
| AP2011005546A0 (en) * | 2008-06-25 | 2011-02-28 | Baylor Res Intitute | Blood transcriptional signature of mycobacterium tuberculosis infection. |
-
2009
- 2009-11-30 US US12/628,148 patent/US20110129817A1/en not_active Abandoned
-
2010
- 2010-08-19 KR KR1020147014569A patent/KR20140078768A/ko not_active Withdrawn
- 2010-08-19 PH PH1/2012/501043A patent/PH12012501043A1/en unknown
- 2010-08-19 KR KR1020127017108A patent/KR20120107979A/ko not_active Ceased
- 2010-08-19 WO PCT/US2010/046042 patent/WO2011066008A2/en not_active Ceased
- 2010-08-19 AP AP2012006346A patent/AP2012006346A0/xx unknown
- 2010-08-19 SG SG10201407855WA patent/SG10201407855WA/en unknown
- 2010-08-19 EA EA201270650A patent/EA201270650A1/ru unknown
- 2010-08-19 CN CN2010800627107A patent/CN102844444A/zh active Pending
- 2010-08-19 BR BR112012013029A patent/BR112012013029A2/pt not_active IP Right Cessation
- 2010-08-19 AU AU2010325179A patent/AU2010325179B2/en not_active Ceased
- 2010-08-19 EP EP10833713.0A patent/EP2519652A4/en not_active Withdrawn
- 2010-08-19 PE PE2012000735A patent/PE20121690A1/es not_active Application Discontinuation
- 2010-08-19 JP JP2012541071A patent/JP2013511981A/ja not_active Ceased
- 2010-08-19 MX MX2012006031A patent/MX2012006031A/es not_active Application Discontinuation
- 2010-08-19 CA CA2782211A patent/CA2782211A1/en not_active Abandoned
- 2010-11-30 TW TW099141689A patent/TW201131032A/zh unknown
- 2010-11-30 AR ARP100104425A patent/AR080570A1/es unknown
-
2012
- 2012-05-24 IL IL220016A patent/IL220016A0/en unknown
- 2012-05-30 CL CL2012001400A patent/CL2012001400A1/es unknown
- 2012-06-27 ZA ZA2012/04806A patent/ZA201204806B/en unknown
-
2013
- 2013-09-11 US US14/024,142 patent/US20140080732A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| CL2012001400A1 (es) | 2014-05-09 |
| JP2013511981A (ja) | 2013-04-11 |
| EP2519652A4 (en) | 2013-05-01 |
| ZA201204806B (en) | 2013-02-27 |
| KR20140078768A (ko) | 2014-06-25 |
| AP2012006346A0 (en) | 2012-06-30 |
| US20110129817A1 (en) | 2011-06-02 |
| EP2519652A2 (en) | 2012-11-07 |
| CN102844444A (zh) | 2012-12-26 |
| TW201131032A (en) | 2011-09-16 |
| IL220016A0 (en) | 2012-07-31 |
| AR080570A1 (es) | 2012-04-18 |
| WO2011066008A2 (en) | 2011-06-03 |
| PH12012501043A1 (en) | 2013-02-04 |
| AU2010325179A1 (en) | 2012-07-05 |
| PE20121690A1 (es) | 2012-12-16 |
| BR112012013029A2 (pt) | 2016-10-04 |
| KR20120107979A (ko) | 2012-10-04 |
| WO2011066008A3 (en) | 2011-07-21 |
| AU2010325179B2 (en) | 2015-03-12 |
| US20140080732A1 (en) | 2014-03-20 |
| CA2782211A1 (en) | 2011-06-03 |
| SG10201407855WA (en) | 2015-01-29 |
| EA201270650A1 (ru) | 2013-06-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| MX2012006031A (es) | Firma transcripcional sanguinea de infeccion de mycobacterium tuberculosis activa versus latente. | |
| Berry et al. | An interferon-inducible neutrophil-driven blood transcriptional signature in human tuberculosis | |
| JP5279505B2 (ja) | 末梢血白血球の転写プロファイルのモジュールレベル分析 | |
| JP2011526152A (ja) | マイコバクテリウム・ツベルクローシス感染症の血液転写サイン | |
| Burel et al. | Host transcriptomics as a tool to identify diagnostic and mechanistic immune signatures of tuberculosis | |
| US20140179807A1 (en) | Module-level analysis of peripheral blood leukocyte transcriptional profiles | |
| JP2010500038A (ja) | 血液白血球中の遺伝子発現サインが、急性感染の差次的診断を可能にする | |
| Petty et al. | MicroRNAs hsa-miR-99b, hsa-miR-330, hsa-miR-126 and hsa-miR-30c: potential diagnostic biomarkers in natural killer (NK) cells of patients with chronic fatigue syndrome (CFS)/myalgic encephalomyelitis (ME) | |
| Petzke et al. | Global transcriptome analysis identifies a diagnostic signature for early disseminated Lyme disease and its resolution | |
| Armignacco et al. | Whole blood transcriptome signature predicts severe forms of COVID-19: Results from the COVIDeF cohort study | |
| Addo et al. | Genetic diversity and drug resistance profiles of Mycobacterium tuberculosis complex isolates from patients with extrapulmonary tuberculosis in Ghana and their associated host immune responses | |
| Galbraith et al. | Peripheral blood gene expression in postinfective fatigue syndrome following from three different triggering infections | |
| Chang et al. | Deciphering the molecular landscape of rheumatoid arthritis offers new insights into the stratified treatment for the condition | |
| AU2015203028A1 (en) | Blood transcriptional signature of active versus latent mycobacterium tuberculosis infection | |
| Kurtz et al. | Transcriptional signatures measured in whole blood correlate with protection against tuberculosis in inbred and outbred mice | |
| HK1179660A (en) | Blood transcriptional signature of active versus latent mycobacterium tuberculosis infection | |
| Teruel et al. | An integrative multi-omics approach in Sjögren’s Syndrome identifies novel genetic drivers with regulatory function and disease-specificity | |
| WO2024220621A2 (en) | Multi-omic profiling signatures for covid-19 | |
| HK1160923A (en) | Blood transcriptional signature of mycobacterium tuberculosis infection | |
| Meskó | Peripheral Blood Gene Expression Profiling as a Tool in Exploring the Pharmacogenomics of Autoimmune Diseases | |
| HK1135736A (en) | Gene expression signatures in blood leukocytes permit differential diagnosis of acute infections |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FA | Abandonment or withdrawal |