MXPA06014083A

MXPA06014083A - Estructura cristalina de dipeptidil peptidasa iv y usos de la misma.

Info

Publication number: MXPA06014083A
Application number: MXPA06014083A
Authority: MX
Inventors: Xiayang Qiu
Original assignee: Pfizer Prod Inc
Priority date: 2004-06-03
Filing date: 2005-05-26
Publication date: 2007-02-15
Also published as: WO2005119526A1; CA2569095A1; EP1756740A1

Abstract

Una estructura cristalina de dipeptidil peptidasa IV (DPP-IV), y las coordenadas atomicas tridimensionales del dominio extracelular de DPP-IV, tal y como se describe y usa para la identificacion de ligandos, incluyendo inhibidores de DPP-IV, usados para el tratamiento de enfermedades que estan asociadas con proteinas que son objeto de procesamiento por parte de DPP-IV.

Description

ESTRUCTURA CRISTALINA DE DIPEPTIDIL PEPTIDASA IV Y USOS DE LA MISMA CAMPO DE LA INVENCIÓN La presente invención se refiere a composiciones cristalinas de dipeptidil peptidasa IV (DPP-IV) de mamífero, procedimientos para preparar dichas composiciones, procedimientos para determinar las coordenadas atómicas de rayos X tridimensionales (3-D) de dicha composición, procedimientos para identificar ligandos de DPP-IV usando diseño de fármacos basado en la estructura, el uso de las estructuras cristalinas 3-D para diseñar, modificar y evaluar la actividad de inhibidores potenciales, y al uso de dichos inhibidores para el tratamiento de, por ejemplo, diabetes, tolerancia a la glucosa, obesidad, regulación del apetito, lipidemia, osteoporosis, metabolismo de neuropéptidos y activación de células T, entre otros.

ANTECEDENTES DE LA INVENCIÓN La serina peptidasa dipeptidil peptidasa IV (DPP-IV) es una glicoproteína de superficie celular de tipo II multifuncional, que se expresa ampliamente en una diversidad de tipos celulares, particularmente en células epiteliales diferenciales del intestino, hígado, tejido de la próstata, cuerpo lúteo, y túbulos proximales del riñon (Thoma y col., Structure, 11 , 947-959, 947 (2003) citando Hartel y col., Histochemistry 89, 151-161 (1988); McCaughan y col., Hepatology 11 , 534-544 (1990) así como subconjuntos de leucocitos (Thoma y col., (2003) citando a Gorrell y col., Cell. Immunol. 134, 205-215 (1991 )). DPP-IV tiene papeles en muchos procesos biológicos incluyendo su capacidad de modular la actividad biológica de varias hormonas peptídicas, quimioquinas y neuropéptidos por escisión específica después de una prolina o alanina en la posición de aminoácido 2 desde el extremo N-terminal, una etapa limitante de la velocidad en la degradación de péptidos (Mentlein, R. Regul Pept. 85, 9-24 (1999)). Por lo tanto, los sustratos naturales de DPP-IV incluyen varias quimioquinas, citoquinas, neuropéptidos, hormonas en la circulación, y péptidos bioactivos que como apreciarán los especialistas en la técnica, sugiere un papel regulador clave en el metabolismo de hormonas peptídicas y en el transporte de aminoácidos ((Lambeir y col., FEBS Lett. 507, 327-330 (2001 ); (Hildebrandt y col., Clin. Sci. 99, 93-104)). Se ha implicado la DPP-IV en el control de la homeostasis de la glucosa porque sus sustratos incluyen los péptidos de incretina péptido de tipo glucagón 1 (GLP-1 ) y polipéptido inhibidor gástrico (GIP). La escisión de los aminoácidos N-terminales de estos péptidos les vuelve funcionalmente inactivos. Como tal, GLP-1 ha demostrado ser una terapia anti-diabética eficaz en pacientes diabéticos de Tipo 2 y ha demostrado reducir los requisitos de insulina relacionados con la comida en pacientes diabéticos de Tipo 1.

Además, se cree que GLP-1 y/o GIP regulan la saciedad, lipidemia y osteogénesis, y por lo tanto se ha propuesto GLP-1 exógeno como tratamiento para pacientes que padecen síndrome coronario agudo, angina y enfermedad cardiaca isquémica. Como apreciarán los especialistas en la técnica, se han usado varios procedimientos en el pasado y continúan usándose para descubrir inhibidores selectivos de dianas biomoleculares tales como DPP-IV. Los diversos enfoques incluyen descubrimiento de fármacos dirigido por ligando (LDD), análisis de relación cuantitativa entre actividad y estructura (QSAR); y análisis comparativo de campo molecular (CoMFA). CoMFA es un tipo particular de procedimiento QSAR que usa técnicas de correlación estadística para el análisis de la relación cuantitativa entre la actividad biológica de un conjunto de compuestos con una alineación especificada, y sus propiedades electrónicas y estéricas tridimensionales. Otras propiedades tales como hidrofobicidad y formación de enlaces de hidrógeno también pueden incorporarse en el análisis. Un componente inapreciable de estos enfoques de descubrimiento de fármacos es el diseño basado en la estructura, que es una estrategia de diseño para nuevas entidades químicas, o de optimización de compuestos principales identificados por otros procedimientos, usando la estructura 3D de la macromolécula biológica diana obtenida por, por ejemplo, rayos X o estudios de resonancia magnética nuclear (RMN), o a partir de modelos de homología. Analizar estructuras 3-D de proteínas proporciona nuevas percepciones en el comportamiento y mecánica de la unión de fármacos y la actividad biológica. Acoplado con las técnicas por ordenador incluyendo el modelado y simulación, el estudio de las interacciones biomoleculares proporciona detalles de acontecimientos que pueden ser difíciles de investigar experimentalmente en el laboratorio, y puede ayudar a revelar características topológicas importantes para determinar el reconocimiento molecular. Como reconocerán los especialistas en la técnica, esta información puede, a su vez, usarse para predecir la formación de complejos ligando-receptor, y para diseñar ligando y mutaciones en las proteínas que produzcan interacciones ligando-receptor deseadas. Aunque se han descrito previamente estructuras cristalinas de DPP-IV, nadie ha sido capaz de resolver una estructura tridimensional con sólo una molécula por unidad asimétrica, proporcionando a su vez, una mayor ventaja para el diseño basado en la estructura iterativa. (Aertgeets y col., Protein Science, 13:412-421 (2004) hDPP-IV complexed with a decapaptide; Engel y col., PNAS, 100:9:5063-5068 (2003) crystal structure of native porcine DPP-IV; Hiramatsu y col., BBRC, 302:849-854 (2003) crystal structure of hDPP-IV at 2.6A resolution; Rasmussen y col., Nature Structural Biology, 10:19-25 (2003) 2.5A structure of the extracellular región of DPP-IV in complex with the inhibitor valine-pyrrolidide; Thoma y col., Structure, 11 :947-959 (2003) expressed and purified the ectodomain of human DPP-IV in Pichia pastoris and determined X-ray structure at 2.1Á resolution.) Para este fin, continúa la búsqueda de inhibidores de DPP-IV específicos y potentes para su uso en estudios fisiológicos y situaciones terapéuticas. Por tanto, obtener las estructuras tridimensionales (3D) de DPP, tales como DPP-IV como una única molécula de una unidad asimétrica por, por ejemplo, rayos X o estudios de RMN, o a partir de modelos de homología, y analizar las estructuras usando procedimientos computacionales, facilita dichos esfuerzos de descubrimiento.

BREVE DESCRIPCIÓN DE LA INVENCIÓN La presente invención proporciona composiciones cristalinas de DPP-IV, y específicamente de DPP-IV, que tienen una molécula por unidad asimétrica. La invención proporciona adicionalmente procedimientos para preparar dichas composiciones, procedimientos para determinar las coordenadas atómicas de rayos X 3-D de dichas composiciones cristalinas, procedimientos para usar las coordenadas atómicas junto con procedimientos computacionales para identificar sitio o sitios de unión, procedimientos para dilucidar la estructura 3-D de homólogos de DPP-IV, y procedimientos para identificar ligandos que ¡nteraccionen con el sitio o sitios de unión para agonizar o antagonizar la actividad biológica de DPP-IV, procedimientos para identificar inhibidores de DPP-IV, composiciones farmacéuticas de inhibidores, y procedimientos de tratamiento de diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2, usando dichas composiciones farmacéuticas. En una modalidad preferida la invención proporciona composiciones cristalinas del dominio extracelular de DPP-IV (restos 31-766 de SEC ID No. 1 ), por las que se obtiene la estructura cristalina a partir de mamífero, preferiblemente de seres humanos. Un aspecto de la presente invención proporciona procedimientos para cristalizar un polipéptido DPP-IV. Preferiblemente los procedimientos para cristalizar el polipéptido DPP-IV que comprende una secuencia de aminoácidos que abarca los aminoácidos 31 a 766 enumerados en la SEC ID No. 1 comprenden las etapas de: (a) preparar soluciones del polipéptido y precipitante; (b) hacer crecer un cristal que comprende moléculas del polipéptido de dicha solución de mezcla; y (c) separar dicho cristal de dicha solución. El crecimiento cristalino puede realizarse por diversas técnicas conocidas para los especialistas en la técnica, tales como por ejemplo, cristalización discontinua, cristalización por puente líquido, cristalización por difusión de vapor, cristalización, o cristalización por diálisis. Preferiblemente, el crecimiento cristalino se consigue usando técnicas de difusión por vapor. Una modalidad de la presente invención proporciona composiciones cristalinas de DPP-IV que comprenden una forma cristalina de un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , donde la composición cristalina tiene un grupo espacial P432?2 y dimensiones de celda unitaria a=b=68.7 A, c= 421 ,2 A. En un segundo aspecto, la presente invención proporciona vectores útiles en procedimientos para preparar un dominio extracelular sustancialmente purificado de DPP-IV que comprende el polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Otra modalidad más de la presente invención proporciona un cristal de DPP-IV de la SEC ID No. 2, o un homólogo, análogo o variante del mismo. En un tercer aspecto, la presente invención proporciona procedimientos para determinar las coordenadas atómicas de rayos X de las composiciones cristalinas a una resolución de 2.7 A.

En un cuarto aspecto, la presente invención proporciona una molécula o complejo molecular cristalinos, donde el cristal tiene coordenadas atómicas sustancialmente similares a las coordenadas atómicas enumeradas en la figura 2 o partes de las mismas, o cualquier variación a escala de las mismas. En un quinto aspecto, la presente invención proporciona una molécula o complejo molecular cristalinos, donde el cristal comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Una modalidad adicional de la invención proporciona un cristal que comprende una secuencia de aminoácidos que es al menos el 98% o el 95% homologa a un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Una modalidad adicional más de la invención proporciona un cristal que comprende una secuencia de aminoácidos que es al menos el 98% o el 95% homologa a un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , y que tiene las coordenadas atómicas enumeradas en la figura 2. En un sexto aspecto, la presente invención proporciona una molécula o complejo molecular crtistalinos, donde el cristal comprende un polipéptido, o una parte del mismo, con coordenadas atómicas que tienen una raíz de la desviación cuadrática media de los átomos de la estructura de la proteína (N, Ca, C, y O) enumeradas en la figura 2 de menos de 0.2, 0.5, 0.7, 1.0, 1.2, 1.5, 2.0 o 2.5 A. En un séptimo aspecto, la presente invención proporciona una configuración tridimensional que se puede ajustar a escala o trasladar, de puntos obtenidos de coordenadas estructurales de al menos una parte de una molécula o complejo molecular de DPP-IV que comprende un polipéptido con una secuencia de aminoácidos que abarca the aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. En una modalidad de este aspecto, la invención también comprende las coordenadas estructurales de al menos una parte de una molécula o un complejo molecular que es estructuralmente homólogo a una molécula o complejo molecular de DPP-IV. En una escala molecular, la configuración de puntos obtenidos de una molécula o complejo molecular homologa tiene una raíz de la desviación cuadrática media de menos de aproximadamente 0.2, 0.5, 0.7, 1.0, 1.2, 1.5, 2.0 o 2.5 A de las coordenadas estructurales proporcionadas en la figura 2. En un octavo aspecto, la invención proporciona ordenadores para producir una representación tridimensional del octavo aspecto de la presente invención que pueden usarse para diseñar e identificar ligandos o inhibidores potenciales de DPP-IV por, por ejemplo un software de modelado molecular disponible en el mercado junto con el diseño de fármacos basado en la estructura proporcionado en este documento. En un aspecto adicional, la presente invención proporciona un ordenador para producir representaciones tridimensionales de: a. una molécula o complejo molecular que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o una variante del mismo; b. una molécula o complejo molecular, donde los átomos de la molécula o complejo molecular se representan por coordenadas atómicas que son sustancialmente similares a, o son subconjuntos de, las coordenadas atómicas enumeradas en la figura 2; c. una molécula o complejo molecular, donde la molécula o complejo molecular comprende coordenadas atómicas que tienen una raíz de la desviación cuadrática media de menos de 0.2, 0.5, 0.7, 1.0, 1.2, 1.5, 2.0 o incluso 2.5 A de las coordenadas atómicas para los átomos de la estructura de carbono enumeradas en figura 2; o d. una molécula o complejo molecular, donde la molécula o complejo molecular comprende una cavidad o sitio de unión definido por las coordenadas estructurales que son sustancialmente similares a las coordenadas atómicas enumeradas en la figura 2, o un subconjunto de las mismas, o más preferiblemente las coordenadas estructurales de la figura 2 que corresponden a uno o más aminoácidos de DPP-IV, o reemplazos conservativos de los mismos, en la SEC ID No. 1 seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e Hís740; donde dicho ordenador comprende: (i) un medio de almacenamiento de datos legibles en ordenador que comprende un medio de almacenamiento de datos codificado con datos legibles en el ordenador, donde dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas, o coordenadas sustancialmente similares de las mismas; (ii) una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador; (iii) una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y (iv) una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. En un noveno aspecto, la presente invención proporciona procedimientos que implican el reemplazo molecular para obtener información estructural acerca de una molécula o complejo molecular de estructura desconocida. En una modalidad, el procedimiento incluye cristalizar la molécula o complejo molecular, generar un patrón de difracción de rayos X de la molécula o complejo molecular cristalizado, y aplicar al menos una parte de las coordenadas estructurales expuestas en la figura 2 al patrón de difracción de rayos X para generar un mapa de densidad electrónica tridimensional de al menos una parte de la molécula o complejo molecular.

En otro aspecto más, la presente invención proporciona procedimientos para generar coordenadas atómicas 3-D de homólogos proteicos, análogos, o variantes de DPP-IV usando las coordenadas de rayos X de DPP-IV descritas en la figura 2, que comprenden: a. identificar una o más secuencias de polipéptidos homólogos a DPP-IV; b. alinear dichas secuencias con la secuencia de DPP-IV que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 ; c identificar las regiones estructuralmente conservadas y estructuralmente variables entre dicha secuencia o secuencias homologas y DPP-IV; d. generar coordenadas 3-D para restos estructuralmente conservados de dicha secuencia o secuencias homologas de los de DPP-IV usando las coordenadas enumeradas en la figura 2; e. generar conformaciones para los bucles en las regiones estructuralmente variables de dicha secuencia o secuencias homologas; f. construir las conformaciones de cadena lateral para dicha secuencia o secuencias homologas; y g. combinar las coordenadas 3-D de los restos conservados, bucles y conformaciones de cadena lateral para generar coordenadas 3-D completas o parciales para dichas secuencias homologas.

Modalidades del noveno aspecto proporcionan procedimientos que comprenden adicionalmente refinar y evaluar las coordenadas 3-D completas o parciales. Estos procedimientos pueden usarse de este modo, por ejemplo, para generar estructuras tridimensionales para proteínas para las que no se han determinado las coordenadas atómicas tridimensionales. Como tal, la estructura recién generada puede ayudar a dilucidar los mecanismos enzimáticos, o usarse junto con otras técnicas de modelado molecular en el diseño de fármacos basado en la estructura. En el décimo aspecto, la presente invención proporciona procedimientos para identificar inhibidores, ligandos, y similares, de DPP-IV proporcionando las coordenadas de una molécula de DPP-IV a un sistema de modelado computarizado; identificando entidades químicas que probablemente se unen o interaccionan con la molécula (por ejemplo, explorando una pequeña biblioteca molecular); y, opcionalmente, obteniendo o sintetizando y ensayando los compuestos o análogos derivados de los mismos para la bioactividad. Aspectos adicionales de la presente invención se refieren a procedimientos para identificar ligandos potenciales para DPP-IV u homólogos, o análogos o variantes de la misma que comprenden: a. presentar la estructura tridimensional de la enzima DPP-IV u homólogo o análogo o variante de la misma, definida por las coordenadas atómicas que son sustancialmente similares a las coordenadas atómicas enumeradas en la figura 2 en una pantalla de ordenador; b. opcionalmente reemplazar uno o más restos aminoacídicos de la enzima enumerados en la SEC ID No. 1 , o preferiblemente uno o más restos aminoacídicos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740, en dicha estructura tridimensional con un aminoácido de origen natural diferente o un aminoácido no natural para presentar una estructura variante; c. opcionalmente realizar ab intio, cálculos de mecánica molecular o dinámica molecular en la estructura tridimensional presentada para generar una estructura modificada; d. emplear dicha estructura tridimensional, estructura variante, o estructura modificada para diseñar o seleccionar dicho ligando; d. sintetizar u obtener dicho ligando; e. poner en contacto dicho ligando con dicha enzima en presencia de uno o más sustratos; y f. medir la capacidad de dicho ligando para modular la actividad de dicha enzima. Los especialistas en la técnica pueden apreciar que la información obtenida por los procedimientos para identificar inhibidores y ligandos de DPP-IV, como se ha descrito anteriormente, puede usarse para refinar o modificar iterativamente la estructura del ligando original. Por tanto, una vez que se ha encontrado un ligando para modular la actividad de dicha enzima, los aspectos estructurales del ligando pueden modificarse para generar un análogo estructural del ligando. Este análogo después puede usarse en los procedimientos anteriores para identificar ligandos de unión. Un especialista en la técnica conocerá los diversos modos en que puede modificarse una estructura. En modalidades, los procedimientos comprenden adicionalmente modificar computacionalmente la estructura del ligando; determinar computacionalmente el ajuste del ligando modificado usando las coordenadas tridimensionales descritas en la figura 2, o partes de las mismas; poner en contacto dicho ligando modificado con dicha enzima, u homólogo, o variante de la misma en una situación in vitro o in vivo; y medir la capacidad de dicho ligando para modular la actividad de dicha enzima. En un undécimo aspecto, la presente invención proporciona composiciones, tales como, composiciones farmacéuticas que comprenden los inhibidores o ligandos diseñados de acuerdo con cualquiera de los procedimientos de la presente invención. En una modalidad, se proporciona una composición que incluye un inhibidor o ligando diseñado o identificado por cualquiera de los procedimientos anteriores. En otra modalidad, la composición es una composición farmacéutica. El duodécimo aspecto de la presente invención son procedimientos para tratar la diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2, que comprenden administrar composiciones farmacéuticas, identificadas por el diseño basado en la estructura usando las coordenadas atómicas, o partes de las mismas, enumeradas en la figura 2, eficaces para tratar los trastornos o afecciones.

BREVE DESCRIPCIÓN DE LOS DIBUJOS La figura 1 es una vista ortogonal de una modalidad de DPP-IV mostrada en una representación en cintas. También se representan los extremos N y C-terminales del polipéptido. La figura 2 es una lista de las coordenadas de rayos X de un cristal de DPP-IV como se describe en los Ejemplos.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La presente invención se refiere a composiciones cristalinas de DPP-IV, coordenadas atómicas 3-D de rayos X de dichas composiciones cristalinas, procedimientos para preparar dichas composiciones, procedimientos para determinar las coordenadas atómicas 3-D de rayos X de dichas composiciones cristalinas, y procedimientos para usar dichas coordenadas atómicas junto con procedimientos computacionales para identificar sitio o sitios de unión, o identificar ligandos que interaccionen con dicho sitio o sitios de unión para agonizar o antagonizar DPP-IV. Por conveniencia, ciertos términos empleados en la memoria descriptiva, ejemplos, y reivindicaciones adjuntas se recogen ahora. Salvo que se definan de otro modo, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que el entendido comúnmente por un especialista en la técnica. El término "afinidad" como se usa en este documento se refiere a la tendencia de una molécula a asociarse con otra. La afinidad de un fármaco es su capacidad de unirse a su diana biológica (receptor, enzima, sistema de transporte, etc.). Para receptores farmacológicos, la afinidad puede entenderse como la frecuencia con la que el fármaco, cuando se pone en proximidad de un receptor por difusión, se alojará en una posición de mínima energía libre en el campo de fuerza de ese receptor.

El término "agonista" como se usa en este documento se refiere a una sustancia endógena o un fármaco que pueda interaccionar con un receptor e iniciar una respuesta fisiológica o farmacológica característica de ese receptor (contracción, relajación, secreción, activación enzimática, etc.). El término "análogo" como se usa en este documento se refiere a un fármaco o compuesto químico cuya estructura está relacionada de algún modo con la de otro fármaco o compuesto químico, pero cuyas propiedades químicas y biológicas pueden ser bastante diferentes. El término "antagonista" como se usa en este documento se refiere a un fármaco o compuesto que se opone a los efctos fisiológicos de otro. Al nivel del receptor, es una entidad química que se opone a las respuestas asociadas al receptor normalmente inducidas por otro agente bioactivo. La expresión "unidad asimétrica" se refiere al motivo básico, que se repite en el espacio 3-D por los operadores de simetría del grupo espacial cristalográfico, del que se determinan las coordenadas de la estructura. Es la parte más pequeña de la estructura cristalina de la que puede construirse la estructura completa usando la simetría del grupo espacial. Como se usa en este documento la expresión "sitio de unión" se refiere a una región específica (o átomo) en una entidad molecular que es capaz de entrar en una interacción estabilizante con otra entidad molecular.

En ciertas modalidades la expresión también se refiere a las partes reactivas de una macromolécula que participan directamente en su combinación específica con otra molécula. En otras modalidades, un sitio de unión puede estar comprendido o definido por la disposición tridimensional de uno o más restos aminoacídicos en un polipéptido plegado. En otras modalidades adicionales, el sitio de unión comprende adicionalmente grupos prostéticos, moléculas de agua o iones metálicos que pueden interaccionar con uno o más restos aminoacídicos. Los grupos prostéticos, moléculas de agua, o iones metálicos pueden ser evidentes a partir de los datos cristalográficos de rayos X, o pueden añadirse a una apo-proteína o enzima usando procedimientos ín silico. El término "bioactividad" se refiere a la actividad de DPP-IV que muestra una propiedad biológica convencionalmente asociada con un agonista o antagonista de DPP-IV, tal como una propiedad que permitiría el tratamiento de una o más de las diversas enfermedades tales como, por ejemplo, diabetes, tolerancia a la glucosa, obesidad, regulación del apetito, lipidemia, osteoporosis, metabolismo de neuropéptidos y activación de células T, entre otras. La expresión "dominio catalítico" como se usa en este documento, se refiere al dominio catalítico de la clase de enzimas DPP-IV, que presenta un segmento conservado de aminoácidos en la parte carboxi-terminal de las proteínas, donde este segmento ha demostrado incluir el sitio catalítico de estas enzimas. Este dominio catalítico conservado se extiende aproximadamente desde el resto 552 hasta 766 de la enzima de longitud completa de DPP-IV (SEC ID No. 1 ).

"Clonar" como se usa en este documento, significa obtener copias exactas de una molécula polinucleotídica dada usando tecnología de ADN recombinante. Además, "clonar en" puede significar insertar una primera secuencia polinucleotídica dada en una segunda secuencia polinucleotídica, preferiblemente de forma que se produzca una unidad funcional que combine las funciones del primer y segundo polinucleótidos. Por ejemplo, sin limitación, un polinucleótido del que puede proporcionarse por traducción una proteína de fusión, comprendiendo dicha proteína de fusión secuencias de aminoácidos codificadas por la primera y segunda secuencias polinucleotídicas. Pueden encontrarse memorias descriptivas de clonación molecular en varios libros de protocolo de laboratorio habitualmente usados tales como Molecular Cloning: A Laboratory Manual, 2a Ed., ed. por Sambrook, Fritsch y Maniatis (Cold Spring Harbor Laboratory Press: 1989). El término "co-cristalización" como se usa en este documento se entiende que significa cristalización de un complejo proteína/ligando preformado. Los términos "complejo" o "co-complejo" se usan de forma intercambiable y se refieren a una molécula de DPP-IV, o una variante, u homólogo de DPP-IV en asociación covalente o no covalente con un sustrato, ligando, inhibidor. La expresión "poner en contacto" como se usa en este documento se aplica a experimentos in silico, in vitro, y/o in vivo.

"Enfermedades" y particularmente "enfermedades que están asociadas con proteínas que se someten a procesamiento por DPP-IV", incluyen, aunque sin limitación, por ejemplo, diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2. La expresión "dominio extracelular" como se usa en este documento, se refiere al dominio extracelular de DPP-IV, que presenta un segmento conservado de aminoácidos, por el que este segmento ha demostrado incluir sitios de glicosilación, una región rica en cisteína y el sitio activo catalítico. Este dominio extracelular conservado se extiende aproximadamente desde el resto Gly31 hasta Pro766 de la enzima de longitud completa (SEC ID No. 1 ).

Como se usa en este documento, las expresiones "gen", "gen recombinante" y "construcción génica" se refieren a un ácido nucleico que comprende una fase de lectura abierta que codifica un polipéptido, incluyendo secuencias tanto exónicas como (opcionalmente) intrónicas. El término "intrón" se refiere a una secuencia de ADN presente en un gen dado que no se traduce en una proteína y generalmente se encuentra entre exones. "DPP-IV humana" (hDPP-IV) es una glicoproteína de membrana de tipo II de la superficie celular y también se llama proteína de unión a adenosina desaminasa (ADA) o CD26, que se conoce como un antígeno de activación de células T. hDPP-IV es una única cadena polipeptídica de 766 aminoácidos, que está constituida por cinco regiones: una región citoplásmica (restos aproximadamente 1-6), una región transmembrana (restos aproximadamente 7-28), una región altamente glicosilada (restos aproximadamente 29-323), una región rica en cisteína (restos aproximadamente 324-551 ), y una región catalítica (restos aproximadamente 552-766) (Hiramatsu y col., (2003)). La expresión "alta afinidad" como se usa en este documento significa fuerte afinidad de unión entre moléculas con una constante de disociación KD de no más de 1 µM. En un caso preferido, la KD es de menos de 100 nM, 10 nM, 1 nM, 100 pM, o incluso 10 pM o menos. En una modalidad más preferida, las dos moléculas pueden estar unidas covalentemente (KD es esencialmente 0).

El término "homólogo" como se usa en este documento significa una proteína, polipéptido, oligopéptido, o parte de los mismos, que tiene preferiblemente al menos el 95% de identidad de secuencia de aminoácidos con la enzima DPP-IV descrita en la SEC ID No. 1 o SEC ID No. 2 o con cualquier dominio extracelular descrito en este documento, o con cualquier dominio funcional o estructural de proteína de unión a lípidos. La SEC ID No. 1 es la secuencia de aminoácidos de longitud completa de una DPP-IV humana de tipo silvestre, mientras que la SEC ID No. 2 es la construcción de hDPP-IV incluyendo los restos 31-766 que, como se describe en los Ejemplos, se purificó, expresó y cristalizó. Los especialistas en la técnica entienden que un conjunto de coordenadas estructurales determinadas por cristalografía de rayos X no está sin error típico. Como se usa en este documento, y para el propósito de esta invención, la expresión "coordenadas atómicas sustancialmente similares" o coordenadas atómicas que son "sustancialmente similares" se refiere a cualquier conjunto de coordenadas estructurales de DPP-IV u homólogos de DPP-IV, o variantes de DPP-IV, fragmentos polipeptídicos, descritos por las coordenadas atómicas que tienen una raíz de la desviación cuadrática media para las coordenadas atómicas de los átomos de la estructura proteica (N, Ca, C, y O) de menos de aproximadamente 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5, o incluso 0.2 A cuando se superponen usando átomos de la estructura de coordenadas estructurales enumeradas en la figura 2. Para el propósito de esta invención, las estructuras que tienen coordenadas sustancialmente similares a las enumeradas en la figura 2 se considerarán idénticas a las coordenadas enumeradas en la figura 2. La expresión "sustancialmente similar" también se aplica a un ensamblaje de restos aminoacídicos que pueden formar o no una cadena polipeptídica contigua, pero cuya disposición tridimensional de coordenadas atómicas tiene una raíz de la desviación cuadrática media para las coordenadas atómicas de los átomos de la estructura proteica (N, Ca, C, y O), o los átomos de las cadenas laterales, de menos de aproximadamente 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5 o incluso 0.2 A cuando se superponen usando los átomos de la estructura, o los átomos de las cadenas laterales de las coordenadas atómicas de aminoácidos similares o ¡guales de las coordenadas enumeradas en la figura 2. Los especialistas en la técnica entienden adicionalmente que las coordenadas enumeradas en la figura 2 o partes de las mismas pueden transformarse en un conjunto diferente de coordenadas usando diversos algoritmos matemáticos sin alejarse de la presente invención. Por ejemplo, las coordenadas enumeradas en la figura 2, o partes de las mismas, pueden transformarse por algoritmos que trasladan o rotan las coordenadas atómicas. Como alternativa, la mecánica molecular, la dinámica molecular o los algoritmos ab intio pueden modificar las coordenadas atómicas. Las coordenadas atómicas generadas a partir de las coordenadas enumeradas en la figura 2, o partes de las mismas, usando cualquiera de los algoritmos mencionados anteriormente se considerarán idénticas a las coordenadas enumeradas en la figura 2.

La expresión "in silico" como se usa en este documento se refiere a experimentos realizados usando simulaciones por ordenador. En una modalidad, los procedimientos in silico son procedimientos de modelado molecular donde se generan modelos tridimensionales de macromoléculas o ligandos. En otras modalidades, los procedimientos in silico comprenden evaluar computacionalmente las interacciones de unión a ligando. El término "ligando" describe cualquier molécula, por ejemplo, proteína, péptido, peptidomimético, oligopéptido, molécula orgánica pequeña, polisacárido, polinucleótido, etc., que se une o interacciona, generalmente pero no necesariamente específicamente a o con otra molécula. En un aspecto el ligando es un agonista, por el que la molécula regula positivamente (es decir, activa o estimula, por ejemplo, agonizando o potenciando) la actividad, mientras que en otro aspecto de la invención el ligando es un inhibidor o antagonista, por el que la molécula regula negativamente (es decir, inhibe o suprime, por ejemplo antagonizando, disminuyendo o inhibiendo) la actividad. El término "modular" como se usa en este documento se refiere tanto a regulación positiva (es decir, activación o estimulación, por ejemplo, agonizando o potenciando) como a regulación negativa (es decir, inhibición o supresión, por ejemplo, antagonizando, disminuyendo o inhibiendo) de una bioactividad. El término "farmacóforo" como se usa en este documento se refiere al conjunto de características estéricas y electrónicas de una estructura particular que es necesaria para asegurar las interacciones supramoleculares óptimas con una estructura diana biológica específica y para desencadenas (o bloquear) su respuesta biológica. En una modalidad, un farmacóforo es un concepto abstracto que explica las capacidades de interacción molecular comunes de un grupo de compuestos hacia su estructura diana. En una modalidad adicional más, el término puede considerarse como el mayor denominador común compartido por un conjunto de moléculas activas. Las descripciones farmacofóricas se usan para definir un farmacóforo, incluyendo sitios de formación de enlaces de H, sitios de interacción hidrófoba y electrostática, definidos por átomos, centros de anillo y puntos virtuales. Por consiguiente, en el contexto de ligandos enzimáticos, tales como por ejemplo agonistas o antagonistas, un farmacóforo puede representar un conjunto de factores estéricos y electrónicos que son necesarios para asegurar las interacciones supramoleculares con una estructura diana biológica específica. Como tal, un farmacóforo puede representar un molde de propiedades químicas para un sitio activo de una proteína/enzima que representa la relación espacial de estas propiedades entre sí que teóricamente define un ligando que se uniría a ese sitio. El término "precipitante" como se usa en este documento incluye cualquier sustancia que, cuando se añade a una solución, provoca que se forme un precipitado o crezcan cristales. Los ejemplos de precipitantes adecuados incluyen, aunque sin limitación, sales de metales alcalinos (por ejemplo, Li, Na, o K), o de metales alcalino-térreos (por ejemplo, Mg, o Ca), y sales de metales de transición (por ejemplo, Mn, o Zn). Los contraiones comunes a los iones metálicos incluyen, aunque sin limitación, haluros, fosfatos, citratos y sulfatos. El término "profármaco" como se usa en este documento se refiere a fármacos que, una vez administrados, se modifican químicamente por procesos metabólicos para llegar a ser farmacéuticamente activos. En ciertas modalidades el término también se refiere a cualquier compuesto que experimenta biotransformación antes de mostrar sus efectos farmacológicos. Los profármacos por tanto pueden verse como fármacos que contienen grupos protectores no tóxicos especializados usados de un modo transitorio para alterar o eliminar propiedades, habitualmente no deseables, en la molécula parental. El término "receptor" como se usa en este documento se refiere a una proteína o un complejo proteico en o sobre una célula que reconoce específicamente y se une a un compuesto que actúa como un mensajero molecular (neurotransmisor, hormona, linfoquina, lectina, fármaco, etc.). En un sentido más amplio, el término receptor se usa de forma intercambiable con cualquier sitio de unión a fármaco específico (en oposición a no específico, tal como la unión a proteínas plasmáticas), también incluyendo ácidos nucleicos tales como ADN. La expresión "proteína recombinante" se refiere a un polipéptido que se produce por técnicas de ADN recombinante, donde generalmente, se inserta ADN que codifica un polipéptido en un vector de expresión adecuado que, a su vez, se usa para transformar una célula huésped para producir el polipéptido codificado por el ADN. Este polipéptido puede ser uno que se exprese de forma natural por la célula huésped, o puede ser heterólogo para la célula huésped, o la célula huésped puede haberse modificado por ingeniería genética para que haya perdido la capacidad de expresar el polipéptido que de lo contrario se expresa en las formas de tipo silvestre de la célula huésped. El polipéptido también puede ser, por ejemplo, un polipéptido de fusión. Además, la expresión "obtenido de", con respecto a un gen recombinante, se entiende que incluye en el significado de "proteína recombinante" las proteínas que tienen una secuencia de aminoácidos de un polipéptido nativo, o una secuencia de aminoácidos similar a la misma que se genera por mutaciones, incluyendo sustituciones, deleciones y truncamiento, de una forma de origen natural del polipéptido. Como se usa en este documento, la expresión "inhibidor selectivo de DPP-IV" se refiere a una sustancia, tal como por ejemplo, una molécula orgánica, que inhibe de forma eficaz una enzima de la familia de DPP-IV en un grado mayor que cualquier otra enzima DPP. Un inhibidor selectivo de DPP-IV es una sustancia, que tiene una K¡ para la inhibición de DPP-IV que es menos de aproximadamente un medio, un quinto, o un décimo de la K¡ que tiene la sustancia para la inhibición de cualquier otra enzima DPP. En otras palabras, la sustancia inhibe la actividad DPP-IV al mismo grado a una concentración de aproximadamente un medio, un quinto, un décimo o menos que la concentración requerida para cualquier otra enzima DPP. En general una sustancia se considera que inhibe de forma eficaz DPP-IV si tiene una CI50 o K¡ de menos de o aproximadamente 10 mM, 1 mM, 500 nM, 100 nM, 50 nM o 10 nM. Como se usa en este documento la expresión "moléculas pequeñas" se refiere a fármacos que están disponibles por vía oral (a diferencia de las proteínas que se deben administrar por inyección, por vía tópica o inhalación). El tamaño de las moléculas pequeñas está generalmente por debajo de 1000 Dalton, pero muchos estiman que parece variar entre 300 y 700 Dalton. La expresión "grupo espacial" se refiere a la red y simetría del cristal. En una designación de grupo espacial la letra mayúscula indica el tipo de red y los demás símbolos representan las operaciones de simetría que pueden realizarse en los contenidos de la unidad asimétrica sin cambiar su aspecto. Por cantidad "terapéuticamente eficaz" se entiende la cantidad que es capaz de invertir y/o tratar al menos parcialmente los síntomas de la enfermedad. Una cantidad terapéuticamente eficaz puede determinarse en una base individual y se basará, al menos en parte, en una consideración de la especie del mamífero, el tamaño del mamífero, el tipo de sistema de suministro usado, y el tipo de administración con relación a la progresión de la enfermedad. Una cantidad terapéuticamente eficaz puede determinarse por un especialista en la técnica.

Como se usa en este documento, el término "transfección" significa la introducción de un ácido nucleico, por ejemplo, mediante un vector de expresión, en una célula receptora por una transferencia génica mediada por ácido nucleico. "Transformación" se refiere a un proceso en el que se cambia el genotipo de una célula como resultado de la captación celular de ADN o ARN exógeno y, por ejemplo, la célula transformada expresa una forma recombinante de un polipéptido o, en el caso de expresión anti-sentido a partir del gen transferido, se interrumpe la expresión de una forma de origen natural del polipéptido. El término "variantes" en relación a la secuencia polipeptídica de la SEC ID No. 1 o SEC ID No. 2 incluye cualquier sustitución de, variación de, modificación de, reemplazo de, deleción de, o adición de uno o más aminoácidos de o a la secuencia proporcionando una secuencia polipeptídica resultante para una enzima que tiene actividad DPP-IV. Preferiblemente la variante, homólogo, fragmento o parte, de la SEC ID No. 1 o SEC ID No. 2, comprende una secuencia polipeptídica de al menos 5 aminoácidos contiguos, preferiblemente al menos 10 aminoácidos contiguos, preferiblemente al menos 15 aminoácidos contiguos, preferiblemente al menos 20 aminoácidos contiguos, preferiblemente al menos 25 aminoácidos contiguos, o preferiblemente al menos 30 aminoácidos contiguos. El término "vector" se refiere a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que se ha unido. Un tipo preferido de vector es un episoma, es decir, un ácido nucleico capaz de replicación extra-cromosómica. Los sistemas de huésped-vector adecuados incluyen, aunque sin limitación, sistemas celulares de mamífero infectados con virus (por ejemplo, virus vaccinia, adenovirus, etc.); sistemas de células de insecto infectados con virus (por ejemplo, baculovirus); microorganismos tales como levaduras que contienen vectores de levaduras; o bacterias transformadas con bacteriófagos, ADN, ADN plasmídico, o ADN cósmido. Los elementos de expresión de los vectores varían en sus potencias y especificidades. Como aquéllos dependientes del sistema huésped-vector utilizado, puede usarse uno cualquiera de varios elementos de transcripción y traducción adecuados. Los vectores preferidos son aquéllos capaces de replicación autónoma y/o expresión de ácidos nucleicos a los que están unidos. Los vectores capaces de dirigir la expresión de genes a los que están unidos de manera operativa se mencionan como "vectores de expresión". En general, los vectores de expresión de utilidad en las técnicas de ADN recombinante a menudo están en forma de "plásmidos" que generalmente se refieren a bucles de ADN bicatenario circular que, en su forma de vector no están unidos al cromosoma. En la presente memoria descriptiva, "plásmido" y "vector" se usan de forma intercambiable ya que el plásmido es la forma más habitualmente usada de vector. Sin embargo, la invención pretende incluir otras formas de vectores de expresión que ofrecen funciones equivalentes y que han llegado a ser conocidas posteriormente hasta ahora. Las siguientes abreviaturas de aminoácidos se usan en toda esta descripción: A = Ala = Alanina T = Thr = Treonina V = Val = Valina C = Cys = Cisteína L = Leu = Leucina Y = Tyr = Tirosina I = lie = Isoleucina N = Asn = Asparagina P = Pro = Prolina Q = Gln = Glutamina F = Phe = Fenilalanina D = Asp = Ácido aspártico W = Trp = Triptófano E = Glu = Ácido glutámico M = Met = Metionina K = Lys = Lisina G = Gly = Glicina R = Arg = Arginina S = Ser = Serina H = His = Histidina A. Clones y Expresiones Como apreciarán los especialistas en la técnica, la secuencia de nucleótidos que codifica un polipéptido DPP-IV, o un fragmento funcional, incluyendo el fragmento peptídico C-terminal del dominio catalítico de la proteína DPP-IV, y/o derivados o análogos de la misma, incluyendo una proteína quimérica, de la misma, puede insertarse en un vector de expresión adecuado, es decir, un vector que contiene los elementos necesarios para la transcripción y traducción de la secuencia que codifica la proteína insertada. Los elementos mencionados anteriormente se llaman en este documento un "promotor". Por tanto, el ácido nucleico que codifica un polipéptido DPP-IV de la invención o un fragmento funcional que comprende el dominio extracelular de la proteína DPP-IV, o un homólogo, un análogo, o variante del mismo, está asociado de forma operativa con un promotor en un vector de expresión de la invención. En modalidades preferidas, el vector de expresión contiene la secuencia de nucleótidos que codifica el polipéptido que comprende la secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Las secuencias tanto de ADNc y como genómicas pueden clonarse y expresarse bajo el control de dichas secuencias reguladoras. Un vector de expresión también incluye preferiblemente un origen de replicación. Las señales de transcripción y traducción necesarias pueden proporcionarse en un vector de expresión recombinante. Como se detalla a continuación, todas las manipulaciones genéticas descritas para el gen de DPP-IV en esta sección, también pueden emplearse para genes que codifican un fragmento funcional, incluyendo el fragmento peptídico C-terminal del dominio catalítico de la proteína DPP-IV, derivados o análogos de la misma, incluyendo una proteína quimérica de la misma. Los sistemas huésped-vector adecuados incluyen aunque sin limitación sistemas de células de mamífero infectados con virus (por ejemplo, virus vaccinia, adenovirus, etc.); sistemas de células de insecto infectados con virus (por ejemplo, baculovirus); microorganismos tales como levaduras que contienen vectores de levaduras; o bacterias transformadas con bacteriófagos, ADN, ADN plasmídico, o ADN cósmido. Los elementos de expresión de los vectores varían en sus potencias y especificidades. Como aquéllos que dependen del sistema huésped-vector utilizado, puede usarse uno cualquiera de varios elementos de transcripción y traducción adecuados.

Una proteína DPP-IV recombinante de la invención puede expresarse cromosómicamente, después de la integración de la secuencia codificante por recombinación. En este aspecto, puede usarse cualquiera de varios sistemas de amplificación para conseguir altos niveles de expresión génica estable. (Véase Sambrook y col., 1989, infra). Una célula adecuada para los propósitos de esta invención es una en la que se cultiva el vector recombinante que comprende el ácido nucleico que codifica la proteína DPP-IV en un medio de cultivo celular apropiado en condiciones que proporcionan la expresión de la proteína DPP-IV por la célula. Cualquiera de los procedimientos descritos previamente para la inserción de fragmentos de ADN en un vector de clonación puede usarse para construir vectores de expresión que contienen un gen constituido por señales de control de la transcripción/traducción adecuadas y las secuencias que codifican la proteína. Estos procedimientos pueden incluir técnicas de ADN recombinante y sintéticas in vitro, y recombinación in vivo (recombinación genética). La expresión de la proteína DPP-IV puede controlarse por cualquier elemento promotor/potenciador conocido en la técnica, con la condición de que estos elementos reguladores deben ser funcionales en el huésped seleccionado para la expresión, como apreciarán los especialistas en la técnica.

Los vectores que contienen un ácido nucleico que codifica una proteína DPP-IV de la invención pueden identificarse, por ejemplo, por cuatro enfoques generales: (1 ) amplificación por PCR del ADN plasmídico deseado o ARNm específico; (2) hibridación de ácidos nucleicos; (3) presencia o ausencia de las funciones de genes marcadores de selección; y (4) expresión de secuencias insertadas. La invención pretende incluir adicionalmente otras formas de identificación de vectores, que contienen un ácido nucleico que codifica una proteína DPP-IV de la presente invención, que ofrecen funciones equivalentes y que llegan a ser conocidas en la técnica posteriormente hasta ahora. En el primer enfoque, los ácidos nucleicos pueden amplificarse por PCR para proporcionar la detección del producto amplificado. En el segundo enfoque, la presencia de un gen extraño insertado en un vector de expresión puede detectarse por hibridación de ácidos nucleicos usando sondas que comprenden secuencias que son homologas a un gen marcador insertado. En el tercer enfoque, el sistema vector recombinante/huésped puede identificarse y seleccionarse en base a la presencia o ausencia de ciertas funciones de un gen "marcador de selección" (por ejemplo, actividad beta-galactosidasa, actividad timidina quinasa, resistencia a antibióticos, fenotipo de transformación, formación de cuerpos de oclusión en baculovirus, etc.) causadas por la inserción de genes extraños en el vector. En otro ejemplo, si el ácido nucleico que codifica la proteína DPP-IV se inserta en la secuencia del gen "marcador de selección" del vector, los vectores recombinantes que contienen el inserto de la proteína DPP-IV pueden identificarse por la ausencia de la función del gen de la proteína DPP-IV. En el cuarto enfoque, los vectores de expresión recombinantes pueden identificarse ensayando la actividad, bioquímica, o características inmunológicas del producto génico expresado por el vector recombinante, con la condición de que la proteína expresada adquiera una conformación funcionalmente activa. Puede emplearse una amplia diversidad de combinaciones huésped/vector de expresión para expresar las secuencias de ADN de esta invención como saben los especialistas en la técnica. Una vez que la molécula de ADN recombinante particular se ha identificado y aislado, pueden usarse varios procedimientos conocidos en la técnica para propagarla. Una vez que se han establecido el sistema huésped y las condiciones de crecimiento adecuados, los vectores de expresión recombinantes pueden propagarse y prepararse en grandes cantidades. Como se ha indicado anteriormente, los vectores de expresión que pueden usarse incluyen, aunque sin limitación, los siguientes vectores o sus derivados: virus de seres humanos o animales tales como virus vaccinia o adenovirus; virus de insecto tales como baculovirus; vectores de levadura; vectores bacteriófagos (por ejemplo, lambda); y vectores de ADN plasmídico y cósmido, por nombrar algunos. Los vectores pueden introducirse en las células huésped deseadas por procedimientos conocidos en la técnica, por ejemplo, transfección, electroporación, microinyección, transducción, fusión celular, DEAE dextrano, precipitación con fosfato calcico, lipofección (fusión de lisosomas), uso de una pistola génica, o un transportador de vectores de ADN (véase, por ejemplo, Wu y col., 1992, J. Biol. Chem. 267:963-967; Wu y Wu, 1988, J. Biol. Chem. 263:14621-14624; Hartmut y col., Solicitud de Patente Canadiense No. 2,012,311 , presentada el 15 de marzo de 1990).

B. Grupos Cristalinos y Espaciales Las coordenadas estructurales de rayos X definen una configuración única de puntos en el espacio. Los especialistas en la técnica entienden que un conjunto de coordenadas estructurales para una proteína o un complejo proteína/ligando, o una parte de las mismas, define un conjunto relativo de puntos que, a su vez, define una configuración en tres dimensiones. Una configuración similar o idéntica puede definirse por un conjunto completamente diferente de coordenadas, con la condición de que las distancias y ángulos entre las coordenadas atómicas permanezcan esencialmente iguales. Además, una configuración que se puede ajustar a escala de puntos puede definirse aumentando o disminuyendo las distancias entre las coordenadas por un factor de escala manteniendo los ángulos esencialmente iguales. Un aspecto de la presente invención se refiere a una composición cristalina que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1.

En otra modalidad, el complejo cristalizado se caracteriza por las coordenadas estructurales enumeradas en la figura 2, o partes de las mismas. En otras modalidades adicionales, los átomos del ligando están en aproximadamente 5 angstrom de uno o más aminoácidos de DPP-IV en la SEC ID No. 1 preferiblemente seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740. Una modalidad del complejo cristalizado se caracteriza como perteneciente al grupo espacial P432-|2 y dimensiones de celda unitaria a=b= 68.7 A, c= 421 ,2 A, a=ß=?=90.0°. Esta modalidad está abarcada por las coordenadas estructurales de la figura 2. El ligando puede ser una molécula pequeña que se une al dominio extracelular de DPP-IV definido por la SEC ID No. 2, o partes de la misma, con una K¡ de menos de aproximadamente 10 mM, 1 mM, 500 nM, 100 nM, 50 nM, o 10 nM. Pueden usarse diversos procedimientos computacionales para determinar si una molécula o una parte de la cavidad de unión de la misma es "estructuralmente equivalente", definido en términos de su estructura tridimensional, a toda o parte de DPP-IV o de su cavidad o cavidades de unión. Dichos procedimientos pueden realizarse en aplicaciones de software actuales, tales como la aplicación de similitud molecular de QUANTA (Accelrys Inc., San Diego, Calif.). La aplicación de similitud molecular permite comparaciones entre diferentes estructuras, diferentes conformaciones de la misma estructura, y diferentes partes de la misma estructura. El procedimiento usado en la similitud molecular para comparar estructuras se divide en cuatro etapas: (1 ) cargar las estructuras a comparar; (2) opcionalmente definir las equivalencias atómicas en estas estructuras; (3) realizar una operación de ajuste; y (4) analizar los resultados. Cada estructura se define por un nombre. Una estructura se define como la diana (es decir, la estructura fijada), mientras que todas las estructuras restantes son estructuras de trabajo (es decir, estructuras de movimiento). Aunque la equivalencia atómica en las aplicaciones de similitud molecular se define por una entrada de usuario, para el propósito de esta invención los átomos equivalentes se definen como los átomos de la estructura proteica (N, Ca, C, y O) para todos los restos conservados entre las dos estructuras que se están comparando. Un resto conservado se define como un resto que es estructural o funcionalmente equivalente (véase cuadro 2 infra). En modalidades adicionales se consideran operaciones de ajuste rígido. En otras modalidades, pueden considerarse operaciones de ajuste flexible. Cuando se usa un procedimiento de ajuste rígido, la estructura de trabajo se traslada y se rota para obtener un ajuste óptimo con la estructura diana. La operación de ajuste usa un algoritmo que calcula el traslado y rotación óptimos a aplicar a la estructura de movimiento, de modo que la raíz de la desviación cuadrática media del ajuste sobre los pares especificados de átomos equivalentes sea un mínimo absoluto. Este número, dado en angstrom ( ), es proporcionado por la aplicación de similitud molecular.

Cualquier molécula o complejo molecular o cavidad de unión de la misma, o cualquier parte de la misma, que tenga una raíz de la desviación cuadrática media de átomos de la estructura de restos conservados (N, Ca, C, y O) de menos de aproximadamente 2.5, 2.0, 1.5 A, 1.0 A, 0.7 A, 0.5 A o incluso 0.2 A, cuando se superponen sobre los átomos de estructura relevantes descritos por las coordenadas estructurales de referencia enumeradas en la figura 2, se considera "estructuralmente equivalente" a la molécula de referencia. Es decir, las estructuras cristalinas de esas partes de las dos moléculas son sustancialmente idénticas, en un error aceptable. Las moléculas o complejos moleculares estructuralmente equivalentes particularmente preferidos son los que se definen por el conjunto completo de coordenadas estructurales enumeradas en la figura 2, más o menos una raíz de la desviación cuadrática media de los átomos de la estructura conservada de los aminoácidos de no más de 2.5 A. Más preferiblemente, la raíz de la desviación cuadrática media es de menos de aproximadamente 1.0 A. La expresión "raíz de la desviación cuadrática media" significa la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones. Es un modo de expresar la desviación o variación respecto a una tendencia u objeto. Para los propósitos de esta invención, la "raíz de la desviación cuadrática media" define la variación en la estructura de una proteína respecto de la estructura de DPP-IV o una parte de la cavidad de unión de la misma, definida por las coordenadas estructurales de DPP-IV descritas en este documento.

Las coordenadas de rayos X refinadas del dominio extracelular de DPP-IV (aminoácidos 38 a 766 enumerados en la SEC ID No. 2), Zn2+, Mg2+, y 32 moléculas de agua son como las enumeradas en la figura 2. Se muestra una vista ortogonal de la molécula en la figura 1. La estructura cristalina del dominio extracelular (aminoácidos 31 - 766 de la SEC ID No. 1 ) se resolvió a una resolución de 2.7 A. La unidad asimétrica está compuesta de un dímero. En la estructura de la presente invención la estructura incluye dos dominios, el dominio de hélice ß (restos 55-497) y el dominio catalítico (restos 508-766), junto con un par de regiones de engarce (1-54 y 498-507). El dominio de hélice está plegado contra el dominio hidrolasa, y la tríada catalítica de DPP-IV compuesta de los restos Ser630, His740 y Asp708, que se localizan en los últimos 140 restos de la región C-terminal está en la superficie de contacto de los dos dominios. La presente invención proporciona una molécula o complejo molecular que incluye al menos una parte de una DPP-IV y/o cavidad de unión al sustrato. En una modalidad, la cavidad de unión de DPP-IV incluye los aminoácidos enumerados en el cuadro 1 , estando definida la cavidad de unión por un conjunto de puntos que tienen una raíz de la desviación cuadrática media de menos de aproximadamente 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5 o incluso 0.2 A, respecto de los puntos que representan los átomos de la estructura de los aminoácidos del cuadro 1. En otra modalidad, la cavidad de unión al sustrato de DPP-IV incluye los aminoácidos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740 de la SEC ID No. 1.

CUADRO 1 Restos identificados a 5 A de la cavidad de unión de la estructura cristalina de DPP-IV.

C. Polipéptidos Aislados y Variantes Una modalidad de la invención describe un polipéptido aislado constituido por una parte de DPP-IV que funciona como el sitio de unión cuando se pliega en una orientación 3D. Una modalidad es un polipéptido aislado que comprende una parte de DPP-IV, donde la parte empieza en aproximadamente el resto aminoacídico Gly31 , y acaba en aproximadamente el resto aminoacídico Pro766 como se describe en la SEC ID No. 1 , o una secuencia que es al menos el 95% o el 98% homologa a un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Otra modalidad comprende composiciones cristalinas que comprenden variantes de DPP-IV. Las variantes de la presente invención pueden tener una secuencia de aminoácidos que es diferente en una o más sustituciones de aminoácidos a la secuencia descrita en la SEC ID No. 1 o SEC ID No. 2. También se proporcionan modalidades que comprenden deleciones y/o adiciones de aminoácidos. La variante puede, por ejemplo, tener cambios conservativos (similitud de aminoácidos), donde un aminoácido sustituido tiene propiedades estructurales o químicas similares, por ejemplo, el reemplazo de leucina con isoleucina. Los especialistas en la técnica entenderán que la determinación de cuál y cuántos restos aminoacídicos pueden sustituirse, insertarse, o delecionarse sin afectar de forma adversa a la actividad biológica o farmacológica puede deducirse razonablemente a la vista de esta descripción, y puede descubrirse adicionalmente usando programas de ordenador bien conocidos en la técnica, por ejemplo, el software DNAStar® (DNAStar Inc. Madison, Wl). Como los especialistas en la técnica apreciarán, las sustituciones de aminoácidos pueden hacerse, por ejemplo, en base a la similitud de polaridad, carga, solubilidad, hidrofobicidad, hidrofilicidad, y/o la naturaleza anfífila de los restos con la condición de que se mantenga una actividad biológica y/o farmacológica de la molécula nativa. Los aminoácidos cargados negativamente incluyen ácido aspártico y ácido glutámico; los aminoácidos cargados positivamente incluyen lisina y arginina; los aminoácidos con grupos de cabeza polares no cargados que tienen valores de hidrofilicidad incluyen leucina, isoleucina, y valina; los aminoácidos con grupos de cabeza alifáticos incluyen glicina, alanina; asparagina, glutamina, serina; y los aminoácidos con cadenas laterales aromáticas incluyen treonina, fenilalanina, y tirosina. Se exponen ejemplos de sustituciones conservativas en el siguiente cuadro 2: CUADRO 2 "Homología" es una medida de la identidad de las secuencias de nucleótidos o secuencias de aminoácidos. Para caracterizar la homología, se alinean las secuencias objeto de modo que se obtenga el porcentaje más alto de homología (coincidencia), después de introducir huecos, si fuera necesario, para conseguir el porcentaje máximo de homología. Las extensiones N o C- terminales no deben considerarse como que afecten a la homología. "Identidad" per se tiene un significado reconocido en la técnica y puede calcularse usando técnicas publicadas. Los procedimientos de programas de ordenador para determinar la identidad entre dos secuencias, por ejemplo, incluyen el software DNAStar®; el paquete de programas GCG® (Devereux, J., y col. Nucleic Acids Research (1984) 12(1 ): 387); BLASTP, BLASTN, FASTA (Atschul, S.F. y col., J. Molec Biol (1990) 215: 403). Homología (identidad) como se define en este documento se determina convencionalmente usando el programa de ordenador bien conocido, BESTFIT® (Wisconsin Sequence Analysis Package, Versión 8 para Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, Wl, 53711 ). Cuando se usa BESTFIT® o cualquier otro programa de alineamiento de secuencias (tal como el algoritmo Clustal del software MegAlign (DNAStar®)) para determinar si una secuencia particular es, por ejemplo, aproximadamente el 95% homologa a una secuencia de referencia, de acuerdo con la presente invención, los parámetros se establecen de modo que el porcentaje de identidad se calcule sobre la longitud completa de la secuencia de nucleótidos o secuencia de aminoácidos de referencia y que se permitan huecos en homología de hasta aproximadamente el 90% de la cantidad total de nucleótidos en la secuencia de referencia. Por lo tanto se determina una homología del noventa por ciento, por ejemplo, usando el programa BESTFIT® con parámetros establecidos de modo que el porcentaje de identidad se calcule sobre la longitud completa de la secuencia de referencia, por ejemplo, SEC ID No. 1 , y donde hasta el 5% de los aminoácidos en la secuencia de referencia pueden sustituirse con otro aminoácido. Los porcentajes de homología se determinan del mismo modo, por ejemplo, para identificar especies preferidas, en el alcance de conformidad con las reivindicaciones adjuntas, que residen en el intervalo de aproximadamente el 95% al 100% de homología con la SEC ID No. 1 así como el sitio de unión de las mismas. Como se ha indicado anteriormente, las extensiones N o C-terminales no deben considerarse como que afecten a la homología. Por tanto, cuando se comparan dos secuencias, la secuencia de referencia generalmente es la más corta de las dos secuencias. Esto significa que, por ejemplo, si se compara una secuencia de 50 nucleótidos de longitud con identidad precisa con una región de 50 nucleótidos en un polinucleótido de 100 nucleótidos, hay un 100% de homología en oposición a solamente un 50% de homología. Aunque el polipéptido natural de la SEC ID No. 1 y un polipéptido variante pueden tener sólo un cierto porcentaje de identidad, por ejemplo, el 95%, realmente probablemente tengan un grado mayor de similitud, dependiendo de la cantidad de codones diferentes que son cambios conservativos. Las sustituciones conservativas de aminoácidos frecuentemente se pueden hacer en una proteína sin alterar la conformación o función de la proteína. La similitud entre las dos secuencias incluye coincidencias directas así como un sustituto de aminoácido conservado que tiene propiedades estructurales o químicas similares, por ejemplo, carga similar como se describe en el cuadro 2. El porcentaje de similitud (sustituciones conservativas) entre dos polipéptidos también puede valorarse comparando las secuencias de aminoácidos de los dos polipéptidos usando programas bien conocidos en la técnica, incluyendo el programa BESTFIT, empleando ajustes por defecto para determinar la similitud. Una modalidad adicional de la invención es un cristal que comprende las coordenadas de la figura 2, donde la secuencia de aminoácidos está representada por la SEC ID No. 1. Una modalidad adicional de la invención es un cristal que comprende las coordenadas de la figura 2, donde la secuencia de aminoácidos es al menos el 95% o el 98% homologa a la secuencia de aminoácidos representada por la SEC ID No. 1. Se describen diversos procedimientos para obtener coordenadas atómicas de moléculas y complejos moleculares estructuralmente homólogos usando modelado de homología en, por ejemplo, la Patente de Estados Unidos No. 6,356,845.

D. Diseño de Fármacos Basado en la Estructura Una vez que se ha determinado la estructura tridimensional de un cristal que comprende una proteína DPP-IV, un dominio funcional de la misma, un homólogo, análogo o variante de la misma, puede examinarse un ligando (antagonista o agonista) a través del uso de modelado por ordenador usando un programa de acoplamiento tal como GRAM, DOCK, o AUTODOCK (véase por ejemplo, Morris y col., J. Computational Chemistry, 19:1639-1662 (1998)). Este procedimiento puede incluir el ajuste in silico de ligandos potenciales a la estructura cristalina de DPP-IV para determinar cómo de bien se complementarán o interferirán la forma y la estructura química del ligando potencial con el dominio catalítico de DPP-IV. (Bugg y col., Scientific American, diciembre: 92-98 (1993); West y col., TIPS, 16:67-74 (1995)). Como los especialistas en la técnica pueden apreciar, también pueden emplearse programas de ordenador para estimar la atracción, repulsión, e impedimento estérico del ligando con el sitio de unión. Generalmente cuanto más ajustado es el ajuste (por ejemplo, cuanto menor es el impedimento estérico, y/o mayor es la fuerza de atracción) más potente será el fármaco potencial ya que estas propiedades son coherentes con una constante de unión más ajustada. Además, cuanto mayor es la especificidad en el diseño de un fármaco potencial más probable será que el fármaco no interfiera con las propiedades de otras proteínas. Esto minimizará los efectos secundarios potenciales debidos a las interacciones no deseadas con otras proteínas. Una modalidad de la presente invención se refiere a procedimientos para identificar agentes que se unen a un sitio de unión en el dominio extracelular de DPP-IV donde el sitio de unión comprende los restos aminoacídicos Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740 de la SEC ID No. 1 , que comprende: poner en contacto DPP-IV con un ligando de ensayo en condiciones adecuadas para la unión del compuesto de ensayo al sitio de unión, y determinar si el ligando de ensayo se une en el sitio de unión, donde si sucede la unión, el ligando de ensayo es un agente que se une en el sitio de unión. En modalidades adicionales, el ensayo se puede realizar in silico usando una diversidad de algoritmos de software de modelado molecular incluyendo, aunque sin limitación, DOCK, ALADDIN, CHARMM simulations, AFFINITY, C2-LIGAND FIT, Catalyst, LUDÍ, CAVEAT, y CONCORD. (Brooks, y col. CHARMM: a program for macromolecular energy, minimization, and dynamics calculations. J Comp. Chem 1983, 4:187-217; E.C. Meng, B.K. Shoichet & I.D. Kuntz. Automated docking with grid-based energy evaluation. J Comp Chem 1992, 13:505-524. En otra modalidad, puede obtenerse un ligando potencial explorando una biblioteca de péptidos aleatorios producida por un bacteriófago recombinante (Scott y Smith, Science, 249:386-390 (1990); Cwirla y col., Proc. Nati. Acad. Sci., 87:6378-6382 (1990); Devlin y col., Science, 249:404-406 (1990)) o una biblioteca química, o similares. Un ligando seleccionado de esta manera después puede modificarse sistemáticamente por programas de modelado por ordenador hasta que se identifique uno o más ligandos potenciales prometedores. Dicho análisis, por ejemplo, ha demostrado ser eficaz en el desarrollo de inhibidores de la proteasa de VIH. (Lam y col., Science 263:380-384 (1994); Wlodawer y col., Ann. Rev. Biochem. 62:543-585 (1993); Appelt, Perspectives in Drug Discovery and Design 1 :23-48 (1993); Erickson, Perspectives in Drug Discovery and Design 1 : 109-128 ( 1993)). El modelado por ordenador permite la selección de una cantidad finita de modificaciones químicas racionales, en oposición a la cantidad incontable de modificaciones químicas esencialmente aleatorias que podrían hacerse, de las que una cualquiera podría conducir a un fármaco útil. Cada modificación química requiere etapas químicas adicionales, que aunque siendo razonables para la síntesis de una cantidad finita de compuestos, rápidamente llega a abrumar si realmente se sintetizan todas las posibles modificaciones que se necesitan sintetizar. Por tanto, a través del uso de la estructura tridimensional descrita en este documento y el modelado por ordenador, puede explorarse rápidamente una gran cantidad de estos compuestos en un pantalla de ordenador, y pueden determinarse unos pocos candidatos probables sin la síntesis laboriosa de cantidades incontables de compuestos. Una vez que un ligando potencial (agonista o antagonista) se ha identificado, puede seleccionarse de una biblioteca de compuestos químicos que están disponibles en el mercado en la mayoría de las compañías químicas grandes o, como alternativa, el ligando potencial puede sintetizarse de novo. Como se ha mencionado anteriormente, la síntesis de novo de uno o incluso un grupo relativamente pequeño de compuestos específicos es razonable en la técnica de diseño de fármacos. El ligando potencial puede colocarse en cualquier ensayo de unión convencional bien conocido para los especialistas en la técnica para ensayar su efecto sobre la actividad DPP-IV. Cuando se identifica un fármaco adecuado, puede hacerse crecer un cristal suplementarios que comprende un complejo proteína-ligando formado entre una proteína DPP-IV y el fármaco. Preferiblemente, el cristal difracta rayos X permitiendo la determinación de las coordenadas atómicas del complejo proteína-ligando a una resolución de menos de 5.0 Angstrom, más preferiblemente menos de 3.0 Angstrom, e incluso más preferiblemente menos de 2.0 Angstrom. La estructura tridimensional del cristal suplementario puede determinarse por Análisis de Reemplazo Molecular. El reemplazo molecular usa una estructura tridimensional conocida como un modelo de búsqueda para determinar la estructura de una molécula o complejo proteína-ligando estrechamente relacionado en una nueva forma cristalina. Las propiedades de difracción de rayos X medidas del nuevo cristal se comparan con la estructura del modelo de búsqueda para calcular la posición y orientación de la proteína en el nuevo cristal. Los programas de ordenador que pueden usarse incluyen: X-PLOR y AMORE (J. Navaza, Acta Crystallographics ASO, 157-163 (1994)). Como los especialistas en la técnica pueden apreciar, una vez que se conoce la posición y la orientación, puede calcularse un mapa de densidad electrónica usando el modelo de búsqueda para proporcionar fases de rayos X. Después de esto, se inspecciona la densidad electrónica para detectar las diferencias estructurales, y se modifica el modelo de búsqueda para conformar la nueva estructura. Usando este enfoque, es posible usar la estructura de DPP-IV reivindicada para resolver las estructuras tridimensionales de cualquiera de dichas DPP-IV complejadas con un ligando. Otros programas de ordenador adecuados que pueden usarse para resolver las estructuras de dichos cristales STAT incluyen: QUANTA; CHARMM; INSIGHT; SYBYL; MACROMODEL; e ICM. Se describen procedimientos in silico adecuados para explorar, diseñar o seleccionar ligandos, por ejemplo, en la Patente de Estados Unidos No. 6,356,845.

E. Liqandos En un aspecto, la presente invención describe agentes de unión que interaccionan con un sitio de unión de DPP-IV definido por un conjunto de puntos que tienen una raíz de la desviación cuadrática media de menos de aproximadamente 2.5, 2.0, 1.7, 1.5, 1.2, 1.0, 0.7, 0.5 o incluso 0.2 A respecto de los puntos que representan los átomos de la estructura de los aminoácidos representados por las coordenadas estructurales enumeradas en la figura 2. Dichas modalidades representan variantes del cristal de DPP-IV. En otro aspecto, la presente invención proporciona ligandos que se unen a un polipéptido plegado que comprende una secuencia de aminoácidos que abarca los aminoácidos 31 a 766 enumerados en la SEC ID No. 1 , o un homólogo o variante del mismo. En modalidades adicionales, el ligando es un inhibidor competitivo o no competitivo de DPP-IV. En otras modalidades adicionales el ligando inhibe DPP-IV con una Cl50 o K¡ de menos de aproximadamente 10 mM, 1 mM, 500 nM, 100 nM, 50 nM o 10 nM. En otras modalidades adicionales, el ligando inhibe DPP-IV con una K, que es de menos de aproximadamente un medio, un quinto, o un décimo la K, que la sustancia tiene para la inhibición de cualquier otra enzima DPP-IV. En otras palabras, la sustancia inhibe la actividad DPP-IV al mismo grado a una concentración de aproximadamente un medio, un quinto, un décimo o menos de la concentración requerida para cualquier otra enzima DPP. Una modalidad de la presente invención se refiere a ligandos, tales como proteínas, péptidos, peptidomiméticos, moléculas orgánicas pequeñas, etc., diseñados o desarrollados con referencia a la estructura cristalina de DPP-IV representada por las coordenadas presentadas en este documento en la figura 2, y partes de las mismas. Dichos agentes de unión interaccionan con el sitio de unión de DPP-IV representado por uno o más restos aminoacídicos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740.

F. Medios de Almacenamiento Legibles por una Máquina La transformación de las coordenadas estructurales para toda o una parte de DPP-IV o una de sus cavidades de unión, para moléculas estructuralmente homologas definidas a continuación, o para los equivalentes estructurales de cualquiera de estas moléculas o complejos moleculares definidos anteriormente, en representaciones gráficas tridimensionales de la molécula o complejo puede conseguirse convenientemente a través del uso de un software disponible en el mercado. La invención por tanto proporciona adicionalmente un medio de almacenamiento legible en una máquina que comprende un material de almacenamiento de datos codificado con datos legibles en una máquina que, cuando se usa una máquina programada con instrucciones para usar dichos datos, es capaz de presentar una representación tridimensional gráfica de cualquiera de las moléculas o complejos moleculares de esta invención que se han descrito anteriormente. En una modalidad preferida, el medio de almacenamiento de datos legibles en una máquina comprende un material de almacenamiento de datos codificado con datos legibles en una máquina que, cuando se usa una máquina programada con instrucciones para usar dichos datos, es capaz de presentar una representación tridimensional gráfica de una molécula o complejo molecular que comprende todo o cualquier parte de una cavidad de unión de DPP-IV, como se ha definido anteriormente. En otra modalidad preferida, el medio de almacenamiento de datos legibles en una máquina es capaz de presentar una representación tridimensional gráfica de una molécula o complejo molecular definido por las coordenadas estructurales de los aminoácidos enumerados en la figura 2, más o menos una raíz de la desviación cuadrática media respecto de los átomos de la estructura de dichos aminoácidos de no más de 2.0 A. En una modalidad alternativa, el medio de almacenamiento de datos legibles en una máquina comprende un material de almacenamiento de datos codificado con un primer conjunto de datos legibles en una máquina que comprende la transformada de Fourier de las coordenadas estructurales expuestas en la figura 2, y que, cuando se usa una máquina programada con instrucciones para usar dichos datos, puede combinarse con un segundo conjunto de datos legibles en una máquina que comprende el patrón de difracción de rayos X de una molécula o complejo molecular para determinar al menos una parte de las coordenadas estructurales que corresponden al segundo conjunto de datos legibles en una máquina. Por ejemplo, un sistema para leer un medio de almacenamiento de datos puede incluir un ordenador que comprende una unidad de procesamiento central ("CPU"), una memoria de trabajo que puede ser, por ejemplo, memoria RAM (memoria de acceso aleatorio) o "núcleo", memoria de almacenamiento en masa (tal como uno o más accesos de disco o accesos de CD-ROM), uno o más dispositivos de pantalla (por ejemplo, pantallas de tubo de rayos catódicos ("CRT"), pantallas de diodo emisor de luz ("LED"), pantallas de cristal líquido ("LCD"), pantallas electroluminiscentes, pantallas fluorescentes de vacío, pantallas de emisión de campo ("FED"), pantallas de plasma, paneles de proyección, etc.), uno o más dispositivos de entrada de usuario (por ejemplo, teclados, micrófonos, ratones, pantallas táctiles, etc.), una o más líneas de entrada, y una o más líneas de salida, todo lo cual está interconectado por un sistema bus bidireccional convencional. El sistema puede ser un ordenador de un único puesto de trabajo, o puede estar en red (por ejemplo, a través de redes de área local, redes de área amplia, intranets, extranets, o internet) con otros sistemas (por ejemplo, ordenadores, anfitriones, servidores, etc.). El sistema también puede incluir dispositivos controlados por ordenador adicionales tales como componentes electrónicos para el consumidor y aplicaciones. El hardware de entrada puede acoplarse al ordenador por líneas de entrada y puede aplicarse de una diversidad de modos. Los datos legibles en una máquina de esta invención pueden introducirse mediante el uso de un módem o módems conectados por una línea telefónica o línea de datos especializada. Alternativa o adicionalmente, el hardware de entrada puede comprender accesos de CD-ROM o accesos de disco. Junto con un terminal de pantalla, también puede usarse un teclado como dispositivo de entrada. El hardware de salida puede acoplarse al ordenador por líneas de salida y puede aplicarse de forma similar por dispositivos convencionales. A modo de ejemplo, el hardware de salida puede incluir un dispositivo de pantalla para presentar una representación gráfica de una cavidad de unión de esta invención usando un programa tal como QUANTA como se ha descrito en este documento. El hardware de salida también puede incluir una impresora, de modo que pueda producirse una copia impresa de salida, o un acceso de disco, para almacenar la salida del sistema para su uso posterior. En funcionamiento, una CPU coordina el uso de los diversos dispositivos de entrada y salida, coordina los accesos a los datos de los dispositivos de almacenamiento en masa, los accesos a y desde la memoria de trabajo, y determina la secuencia de etapas de procesamiento de datos.

Pueden usarse varios programas para procesar los datos legibles en una máquina de esta invención. Dichos programas se analizan con referencia a los procedimientos computacionales de descubrimiento de fármacos descritos en este documento. Se incluyen referencias a los componentes del sistema de hardware según sea apropiado en toda la siguiente descripción del medio de almacenamiento de datos. Los dispositivos de almacenamiento legibles en una máquina útiles en la presente invención incluyen, aunque sin limitación, dispositivos magnéticos, dispositivos eléctricos, dispositivos ópticos, y combinaciones de los mismos. Los ejemplos de dichos dispositivos de almacenamiento de datos incluyen, aunque sin limitación, dispositivos de disco duro, dispositivos de CD, dispositivos de discos de video digitales, dispositivos de disco flexible, dispositivos de disco duro portátil, dispositivos de disco magneto-óptico, dispositivos de cinta magnética, dispositivos de memoria instantánea, dispositivos de memoria de burbuja, dispositivos de almacenamiento holográfico, y cualquier otro dispositivo periférico de almacenamiento en masa. Debe entenderse que estos dispositivos de almacenamiento incluyen el hardware necesario (por ejemplo, accesos, controladores, suministros de potencia, etc.) así como cualquier medio necesario (por ejemplo, discos, tarjetas instantáneas, etc.) para posibilitar el almacenamiento de datos.

G. Composiciones Farmacéuticas La presente invención proporciona procedimientos para tratar ciertas enfermedades en un mamífero, preferiblemente un ser humano, en necesidad de dicho tratamiento usando los ligandos, y preferiblemente los inhibidores, descritos en este documento. El ligando puede formularse ventajosamente en composiciones farmacéuticas que comprenden una cantidad terapéuticamente eficaz del ligando, un vehículo farmacéuticamente aceptable y otros ingredientes compatibles, tales como adyuvantes, adyuvante completo o incompleto de Freund, adecuados para formular dichas composiciones farmacéuticas como saben los especialistas en la técnica. Las composiciones farmacéuticas que contienen el ligando pueden usarse para el tratamiento de enfermedades que están asociadas con proteínas que se someten a procesamiento por DPP-IV, tales como diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2. La composición farmacéutica se administra al mamífero en una cantidad terapéuticamente eficaz de modo que suceda el tratamiento de la enfermedad. La presente invención se ilustra adicionalmente por los siguientes ejemplos, que no deben entenderse como limitantes de ningún modo. Los contenidos de todas las referencias citadas (incluyendo referencias a la bibliografía, patentes, solicitudes de patente publicada citadas en toda esta solicitud) se incorporan expresamente por la presente como referencia en sus totalidades. La práctica de la presente invención empleará, a menos que se indique otra cosa, técnicas convencionales de biología celular, cultivo celular, biología molecular, microbiología y ADN recombinante, cristalografía por rayos X, y modelado molecular que están dentro de la experiencia habitual de la técnica. Como los especialistas en la técnica entenderán, dichas técnicas se explican completamente en la bibliografía. Véase, por ejemplo, Molecular Cloning: A Laboratory Manual, 2a Ed., ed. Por Sambrook, Fritsch y Maniatis (Cold Spring Harbor Laboratory Press: 1989); DNA Cloning, Volúmenes I y II (D. N. Glover ed., 1985); Oligonucleotide Synthesis (M. J. Gait ed., 1984); Mullís y col. Patente de Estados Unidos No. 4,683,195; Nucleic Acid Hybridization (B. D. Hames & S. J. Higgins eds. 1984); Transcription and Translation (B. D. Hames & S. J. Higgins eds. 1984); B. Perbal, A Practical Guide To Molecular Cloning (1984); el tratrado, Methods In Enzymology (Academic Press, Inc., N.Y.); Methods In Enzymology, Vols. 154 y 155 (Wu y col. eds.), Crystallography Made Clear: A Guide For Users Of Macromolecular Models (Gales Rhodes, 2a Ed. San Diego: Academic Press, 2000).

EJEMPLOS EJEMPLO 1 Clonación y Expresión de DPP-IV humana en células de insecto Sf21 A. Construcción de hDPP-IV: Se amplificaron los restos 31 a 766 de DPP-IV de tipo silvestre de homo sapiens (ser humano) (SEC ID No. 1 ) por PCR usando los siguientes cebadores DPPIV-Fc31- BamF (5'- TTAAGGATCCTGGCACAGATGATGCTACAGCTGAC-3' (SEC ID No. 3)), que introducía un sitio Bam Hl en el extremo N-terminal, y DPPIV-ChisT-XhoR (5'-AATTCTCGAGTTACTAGTGATGATGGTGGTGATGG CTGCCGCGCGGCACCAGAGGTAAAGAGAAACATTGTTTTATGAAGTGGC-3' (SEC ID No. 4)), que introducía un marca His6, un sitio de escisión por trombina y un sitio Xho I en el extremo C-terminal. El producto de PCR (2208 pb) purificado en columna spin (Roche Applied Sciences Indianapolis, IN) se digirió con las enzimas de restricción Bam Hl y Xho I y se subclonó en un vector de transferencia de baculovirus tratado con las enzimas correspondientes. El vector contenía un promotor de polihedrina y la señal de secreción de melitina de abejas para la secreción eficaz de alto nivel de la proteína recombinante.

B. Producción de baculovirus recombinante Las etapas de clonación se controlaron por mapeado de endonucleasas de restricción y análisis de secuenciación. Se obtuvieron clones de E. coli con bácmido recombinante después de la transformación de células de E. coli DHIOBac (Invitrogen Corp., Frederick, MD) con 5 ng de la construcción final que codifica los restos 31-766 de hDPP-IV en pMCG243 (vector de transferencia de baculovirus) (ADN plasmídico de DPPIV-HBM31 -HT) y se exploraron las azules/blancas de acuerdo con el protocolo del fabricante (Invitrogen Corp.). Se transfectaron monocapas de células Sf9 (20 X 106 células en un matraz de cultivo de 162 cm2) cubriendo con 20 ml de mezcla de transfección que contenía 100 µl de ADN de bácmido mini-prep y 100 µl de reactivo CelIFECTIN (Gibco BRL Gaithersburg, MD) en Sf-900 II SFM. La mezcla de transfección se retiró después de 5 h de incubación (27°C) y las células se cubrieron con 25 ml de Sf-900 II SFM. El virus recombinante se recogió a las 72 h después de la transfección y se consiguió una amplificación adicional del virus infectando 100 ml de células Sf-9 (1 ,2 X 106 células/ml) con 2 ml del virus recombinante durante 65-72 h. Se prepararon soluciones madre de Células de Insecto Infectadas con Baculovirus (BMC) del siguiente modo; cuando el diámetro celular aumentó en 2-4 µm por encima de la medida inicial (habitualmente 65-72 h) y mientras la viabilidad celular aún era > 80%, las BMC se centrifugaron suavemente y se resuspendieron en un medio de congelación (90% de SF900 II, 1% p/v de BSA, 10% v/v de DMSO) a 1 X 107 células viables/ml. Las BIIC se congelaron como alícuotas de 1 ml usando procedimientos de crioconservación normales y se almacenaron a -70°C o en nitrógeno líquido para un almacenamiento de larga duración.

C. Expresión de DPP-IV recombinante Las etapas de clonación se controlaron por mapeado de endonucleasas de restricción y análisis de secuenciación. Se obtuvieron clones de E. coli con bácmido recombinante después de la transformación de células de E. coli DHI OBac (Invitrogen Corp., Frederick, MD) con 5 ng del ADN plasmídico de DPPIV-HBM31-HT y se exploraron las azules/blancas de acuerdo con el protocolo del fabricante (Invitrogen Corp.). Se transfectaron monocapas de células Sf9 (20 X 106 células en un matraz de cultivo de 162 cm2) cubriendo con 20 ml de mezcla de transfección que contenía 100 µl de ADN de bácmido mini-prep y 100 µl de reactivo CelIFECTIN (Gibco BRL Gaithersburg, MD) en Sf-900 II SFM. La mezcla de transfección se retiró después de 5 h de incubación (27°C) y las células se cubrieron con 25 ml de Sf-900 II SFM. El virus recombinante se recogió a las 72 h después de la transfección y se consiguió una amplificación adicional del virus infectando 100 ml de células Sf-9 (1 ,2 X 106 células/ml) con 2 ml del virus recombinante durante 65-72 h. Se prepararon soluciones madre de Células de Insecto Infectadas con Baculovirus (BIIC) del siguiente modo; cuando el diámetro celular aumentó en 2-4 µm por encima de la medida inicial (habitualmente 65-72 h) y mientras la viabilidad celular aún era > 80%, las BMC se centrifugaron suavemente y se resuspendieron en un medio de congelación (90% de SF900 II, 1% p/v de BSA, 10% v/v de DMSO) a 1 X 107 células viables/ml. Las BIIC se congelaron como alícuotas de 1 ml usando procedimientos de crioconservación normales y se almacenaron a -70°C o en nitrógeno líquido para un almacenamiento de larga duración.

EJEMPLO 2 Purificación del dominio extracelular de tipo silvestre de DPP-IV marcado con His6 Después del aclaramiento por centrifugación y filtración, se concentraron 10-20 veces 10 litros de medio de cultivo que contenía DPP-IV-31-766-C-his6 humana secretada usando una unidad de filtración de fibra hueca que se había lavado con Tampón de intercambio A (Tris 50 mM, NaCI 0.3 M, TCEP 1 mM, pH 8). El medio concentrado se intercambió con 5 volúmenes de Tampón A. Después del aclaramiento por filtración se añadió imidazol hasta concentración 10 mM por la adición de Tampón B (TrisCI 50 mM, NaCI 0.3 M, imidazol 0,25 M, TCEP 1 mM, pH 8). Se aplicó la muestra a una columna de afinidad de metal inmovilizado de 40 ml (Ni-NTA Superflow, Qiagen), que se había equilibrado en Tampón A (TrisCI 50 mM, NaCI 0.3 M, TCEP 1 mM, pH 8) a 6-8 ml/min. La columna se lavó con Tampón A para conseguir una línea basal estable a 280 nm. La proteína unida se eluyó a un caudal inferior en un gradiente lineal de 0 - 20% de B en 4 volúmenes de columna (cv) (5% de B / cv) seguido por una etapa hasta 100% de B, mantenida ¡socráticamente para 4 cv. Las fracciones se analizaron por SDS-PAGE en bis-tris al 4-12% en tampón MOPS usando el sistema NuPAGE (Invitrogen). Las fracciones que contenían DPP-IV se combinaron y dializaron a 4 grados C frente a 2 cambios de tampón de diálisis (TrisCI 50 mM, NaCI 0.1 M, TCEP 1 mM, pH 8). Después de la diálisis, la muestra se concentró a 6-10 mg/ml y se fraccionó por cromatografía de exclusión por tamaño en Superdex 200 prep grade HiLoad 16/60 (Amersham Biosciences). DPP-IV eluyó como un dímero aparente. Las fracciones se analizaron por SDS-PAGE en bis-tris al 4-12% en tampón MOPS usando el sistema NuPAGE (Invitrogen). La DPP-IV aislada de esta manera se usó para la cristalización.

EJEMPLO 3 Cristalización de DPP-IV Se concentró la DPP-IV del Ejemplo 2 en tampón que contenía TrisCI 50 mM, NaCI 25 mM, TCEP 1 mM, pH 8, a 8-10 mg/ml. Se obtuvieron cabezas de serie a través de una exploración en matriz dispersa a 22°C. Los cristales optimizados crecieron en gotas hechas de 1.5 µl de proteína + 1.5 µl de solución de reserva (TrisCI 0.1 M, pH 8.5, acetato sódico 0.2 M, PEG 4000 al 10-16%) equilibrando sobre la misma solución de reserva. Los cristales se transfirieron a una solución que contenía TrisCI 0.1 M, pH 8.5, acetato sódico 0.2 M, PEG 4000 al 14-16%, y etilenglicol al 20%. Los cristales se congelaron instantáneamente en nitrógeno gaseoso o líquido para la recogida de datos.

EJEMPLO 4 Recogida de datos de rayos X, determinación de la estructura y refinamiento de DPP-IV Los cristales preparados en el Ejemplo 3 se transfirieron a un solución crioprotectora, constituida por la solución de reserva, con etilenglicol al 15-25%, y después se congelaron instantáneamente en una corriente de nitrógeno gaseoso frío a 100K. Se recogió un conjunto completo de datos de un cristal congelado de este modo en el Advanced Photon Sources de Argonne National Laboratory en un detector ADSC Quantum 210 CCD. Los datos se procesaron usando el juego de software HKL2000 (Otwinowski, Z. & Minor, W. Methods Enzymology 276, 307-326 (1997)). La estadística de los datos recogidos se resume en el cuadro 3A. Los cristales pertenecen al grupo espacial P432-|2 con dimensiones de celda unitaria a=b= 68.7 A, c= 421.2 A, a=ß=?= 90°. Contienen una molécula del polipéptido por unidad asimétrica.

La estructura se resolvió por el procedimiento de reemplazo molecular, usando el programa AMORE (Navaza, J., Acta Cryst, 157-163 (1994)). La mosaicidad del cristal es 0.6 A. Los datos son un 96.5% completos a una resolución de 2.7 A con una R erge de 0.062 y una redundancia media de 4.4. El modelo final se construyó con reconstrucción manual en la pantalla de gráficos, usando el programa XtalView (McRee, D. E., Practical Protein Crystallography, Academic Press, San Diego, 1993). El refinado en Refmac se realizó usando todos los datos en el intervalo de resolución de 50.0-2.7 A. El factor R para el modelo actual es 0.257 (factor R libre, 5% de los datos, 0.340). La estadística del refinado se resume en el cuadro 3B. El modelo actual contiene los restos 38-766 (los otros están desordenados en el cristal), 12 moléculas de azúcar y 32 moléculas de agua.

CUADRO 3A Estadística de los datos 1 Los números entre paréntesis se refieren al intervalo de resolución más alto (2.80-2.70 A) 2 Rsim = ?(l-<l>)/?<l> CUADRO 3B Estadística del Refinado D R - = ?|| Fobs| - Ar|Fcalc||/S|Fobs| Equivalentes Aunque se han analizado modalidades específicas de la presente invención, la anterior memoria descriptiva es ilustrativa y no restrictiva. Muchas variaciones de la invención serán evidentes para los especialistas en la técnica después de la revisión de esta memoria descriptiva. Las reivindicaciones adjuntas deben interpretarse como referencia a las reivindicaciones, junto con su alcance completo de equivalentes, y la memoria descriptiva, junto con dichas variaciones.

Claims

NOVEDAD DE LA INVENCIÓN REIVINDICACIONES 1.- Una composición cristalina del dominio extracelular de la dipeptidil peptidasa IV (DPP-IV) de mamífero, caracterizada porque comprende una molécula por unidad asimétrica del cristal. 2.- El cristal de conformidad con la reivindicación 1 , caracterizado además porque dicho dominio extracelular tiene una estructura tridimensional caracterizada por las coordenadas atómicas estructurales de la figura 2. 3.- Un cristal de DPP-IV, caracterizado porque comprende la SEC ID No. 2, o un homólogo, análogo o variante del mismo. 4.- Un cristal que tiene una molécula por unidad asimétrica, caracterizado porque comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, análogo o variante del mismo. 5.- El cristal de conformidad con la reivindicación 4, caracterizado además porque el homólogo o variante tiene una identidad de aminoácidos de al menos el 95% con un polipéptido que tiene una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. 6.- El cristal de conformidad con la reivindicación 4 ó 5, caracterizado además porque el homólogo o variante del mismo tiene una estructura proteica que comprende las coordenadas atómicas, o partes de las mismas, que están dentro de una raíz de la desviación cuadrática media de menos de 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5, o 0.2 A de las coordenadas atómicas, o partes de las mismas, enumeradas en la figura 2. 7 '.- Un polipéptido caracterizado porque comprende la secuencia de aminoácidos expuesta en la SEC ID No. 1 o un homólogo, o variante del mismo, en el que las moléculas están dispuestas de un modo cristalino en un grupo espacial de P432?2 para formar una celda unitaria de dimensiones a=b= 68.7 A, c= 421.2 A y que difracta los rayos X de forma eficaz para la determinación de las coordenadas atómicas del polipéptido DPP-IV a una resolución de aproximadamente 2.7 A. 8.- Un cristal de una molécula proteína-ligando o complejo molecular, caracterizado porque comprende: (a) a polipéptido con una secuencia de aminoácidos desde Asp38 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o variante del mismo; (b) un ligando; (c) y el cristal difracta los rayos X de forma eficaz para la determinación de las coordenadas atómicas del complejo proteína-ligando a una resolución de más de 2.7 Angstrom. 9.- Un procedimiento para diseñar un compuesto que se una a DPP-IV que comprende la secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o variante de la misma usando un cristal como el que se reclama en la reivindicación 1 , caracterizado porque comprende seleccionar un compuesto realizando el diseño de fármacos basado en la estructura con las coordenadas atómicas determinadas para el cristal, donde dicha selección se realiza junto con modelado por ordenador. 10.- Un procedimiento para cristalizar una molécula polipeptídica de DPP-IV o complejo molecular, caracterizado porque comprende: (a) preparar una mezcla de una solución acuosa que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o una variante del mismo; (b) mezclar dicha solución acuosa con una solución de reserva que comprende un precipitante para formar un volumen mixto; y (c) cristalizar dicho volumen mixto. 11.- El procedimiento de conformidad con la reivindicación 10, caracterizado además porque la etapa (c) se realiza por cristalización por difusión por vapor, cristalización discontinua, cristalización por puente líquido, o cristalización por diálisis. 12.- Un ordenador para producir una representación tridimensional de un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o una variante del mismo, caracterizado porque comprende: un medio de almacenamiento de datos legible en ordenador que comprende un material de almacenamiento de datos codificado con datos legibles en ordenador, en el que dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas; una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador, una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. 13.- Un ordenador para producir una representación tridimensional de una molécula o complejo molecular que comprende las coordenadas atómicas que tienen una raíz de la desviación cuadrática media de menos de 2.5, 2.0, 1.7, 1.5, 1.2, 1.0, 0.7, 0.5, o 0.2 A de las coordenadas atómicas para los átomos de la estructura de carbono enumeradas en la figura 2, caracterizado porque comprende: un medio de almacenamiento de datos legibles en ordenador que comprende un material de almacenamiento de datos codificado con datos legibles en ordenador, en el que dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas; una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador; una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. 14.- Un ordenador para producir una representación tridimensional de una molécula o complejo molecular que comprende: un sitio de unión definido por las coordenadas estructurales de la figura 2, o las coordenadas estructurales de una parte de los restos de la figura 2, o las coordenadas estructurales de uno o más aminoácidos de DPP-IV de la SEC ID No. 1 seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740, dicho ordenador caracterizado porque comprende; un medio de almacenamiento de datos legible en ordenador que comprende un material de almacenamiento de datos codificado con datos legibles en ordenador, en el que dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas; una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador; una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. 15.- Un procedimiento para identificar ligandos potenciales para DPP-IV, u homólogos, análogos o variantes de la misma, caracterizado porque comprende: presentar la estructura tridimensional de la enzima DPP-IV, o partes de la misma, definida por las coordenadas atómicas de la figura 2, en una pantalla de ordenador; opcionalmente reemplazar uno o más restos aminoacídicos de la enzima DPP-IV enumerados en la SEC ID No. 1 , o uno o más de los aminoácidos enumerados en el cuadro 1 , o uno o más restos aminoacídicos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740, en dicha estructura tridimensional con un aminoácido de origen natural diferente o un aminoácido no natural; emplear dicha estructura tridimensional para diseñar o seleccionar dicho ligando; poner en contacto dicho ligando con DPP-IV, o variante de la misma, en presencia de uno o más sustratos; y medir la capacidad de dicho ligando para modular la actividad DPP-IV.