WO2002056000A1 - Procede de discrimination avec reperage et/ou identification de situations de pertubations biologiques par spectrometrie et reconnaissance de forme - Google Patents
Procede de discrimination avec reperage et/ou identification de situations de pertubations biologiques par spectrometrie et reconnaissance de forme Download PDFInfo
- Publication number
- WO2002056000A1 WO2002056000A1 PCT/FR2002/000117 FR0200117W WO02056000A1 WO 2002056000 A1 WO2002056000 A1 WO 2002056000A1 FR 0200117 W FR0200117 W FR 0200117W WO 02056000 A1 WO02056000 A1 WO 02056000A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sep
- variables
- analysis
- biological
- discrimination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R33/00—Arrangements or instruments for measuring magnetic variables
- G01R33/20—Arrangements or instruments for measuring magnetic variables involving magnetic resonance
- G01R33/44—Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
- G01R33/46—NMR spectroscopy
- G01R33/465—NMR spectroscopy applied to biological material, e.g. in vitro testing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Spectroscopy & Molecular Physics (AREA)
- High Energy & Nuclear Physics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
Description
Procédé de discrimination avec repérage et/ou identification de situations de perturbations biologiques par spectrométrie et reconnaissance de forme
L'invention a pour objet un procédé de discrimination avec repérage et/ou identification de situations de perturbations biologiques, qu'elles soient d'origine physiologique, génétique ou pathologique, auxquelles sont soumis des organismes vivants.
Par situation de perturbation physiologique, on entend l'état dans lequel se trouve un organisme dans des conditions de milieu précises, étant entendu qu'une situation physiologique perturbée peut aussi avoir des causes génétiques, environnementa. les ou pathologiques, comme par exemple dans le cas dans du diabète de type 1 ou 2.
Un exemple de perturbation de situation physiologique est illustré par l'application de traitements anabolisants en élevage bovin. Ainsi, les anabolisants sont administrés de manière à provoquer sur l'animal un accroissement de la masse musculaire, et corollairement, une diminution de la proportion de graisse. Cette utilisation conduit à une situation physiologique précise, différentiable par des critères morphologiques et anatomiques de la situation où les anabolisants ne sont pas mis en oeuvre, critères qui sont sous-tendus par des différences métaboliques.
L'expression anabolisant , telle qu'utilisée dans la description et les revendications englobe, sauf indications contraires, une molécule ou une association de molécules ayant comme effet au niveau de l'organisme de modifier sensiblement le métabolisme géneral, et ainsi la constitution de l'organisme en terme de rapport tissu musculaire/tissu adipeux, de même que la composition tissulaire en lipides, glucides et protéines. La modification du métabolisme général induite par le traitement anabolisant se traduit, au niveau des effets à grande échelle, notamment par l'accroissement relatif ou absolu. de la masse musculaire, la fonte des graisses, la modification du comportement.
On compte différentes familles d'anabolisants parmi lesquels : les stéroïdes, les J3-agonistes, les substances thyréostatiques et les peptides mimant l'action de l'hormone de croissance ou stimulant sa production.
Dans le domaine de la sécurité alimentaire, de nombreuses recherches sont menées pour mettre au point des méthodes de diagnostic (dépistage, reconnaissance, authentification) de l'utilisation des anabolisants en élevage, permettant aux services vétérinaires de contrôle de s'assurer de la qualité des carcasses et des produits animaux. Des techniques d'isolement et d'analyse directe ont été mises en oeuvre comme les techniques immunologiques qu'elles soient radioimmunologiques [Scippo et al., 1993 ; Scippo & Maghuin-Rogister, 1995] ou immuno-enzymatiques [Degand et al., 1989].
Elles permettent une analyse précise et très sensible des substances incriminées. Toutefois, ces méthodes immunologiques nécessitent de disposer d'une connaissance a priori des substances à contrôler, afin de produire les anticorps spécifiques des anabolisants recherchés. Elles permettent cependant, du fait d'affinités de liaison voisines de celles existant pour la molécule-cible, de diagnostiquer une molécule apparentée, mais pas forcément une nouvelle famille d'anabolisants.
Ces techniques permettent de conforter une présomption de traitement illicite.
Une autre technique directe très utilisée est constituée par l'analyse par chromatographie gazeuse ou liquide couplée à la spectrométrie de masse. Au contraire des méthodes immunochimiques, cette méthode analytique permet de prouver la présence d'une molécule interdite. Il s'agit de la seule méthode, à ce jour, permettant d'identifier et de confirmer la présence de stéroïdes anabolisants à l'état de traces dans les matrices biologiques complexes, telles que le muscle [Hartwig et al., 1997], l'urine [Daeseleire et al., 1992] ou le plasma [Van Ginkel et al., 19931. Elle permet dans certains cas une analyse globale (multirésidus) des substances incriminées, avec de très bonnes sensibilités.
En ce qui concerne l'utilisation de stéroïdes naturels (hormones naturellement présentes dans l'organisme), une méthode de contrôle'met en oeuvre le calcul du rapport des concentrations urinaires entre la molécule recherchée et un de ses métabolites, comme par exemple le rapport testostérone/androstènedione [Gatti etal., 1993]. Toutefois, ces analyses ne peuvent se faire qu'avec une connaissance préalable de ladite substance, qui permet de mettre en place un protocole adapté à la ou les substances recherchées. Beaucoup présentent une étape de digestion enzymatique qui est sujette à controverses [Nlassé et al., 1989].
Dans le cas des anabolisants naturels une variante consiste aussi à mesurer par spectrométrie'de masse (GC-IRMS) le rapport isotopique 13C/12C pour une molécule-cible, et ainsi de déterminer les quantités endogènes'et exogènes [Ferchaud et al.., 1998].
Ces méthodes permettent en effet de rechercher directement un anabolisant ou ses métabolites générés par les processus de détoxication (métabolisation) par l'organisme, à partir des fluides biologiques comme 1'urine ou le plasma sanguin, ou bien dans les tissus (muscle, foie, tissu adipeux, rein, etc.) ou les phanères (poils). La détection par spectrométrie de masse permet une détermination structurale du composé recherché, qu'il soit xénobiotique ou endogène.
Dans le cas de l'utilisation d'une nouvelle famille de molécules à effet anabolisant, il n'existe en revanche aucune connaissance de nature physico-chimique de l'anabolisant en question, encore moins de ses voies de métabolisation. En conséquence, la recherche de la preuve de l'utilisation illicite d'une telle molécule par toutes les techniques analytiques ciblées sur des molécules déjà connues sera vouée à l'échec.
La recherche d'arguments indirects, fondée sur les effets provoqués par un traitement anabolisant sur le métabolisme général dont la résultante en terme d'effets morphologiques est l'accroissement de la masse musculaire et la diminution de la quantité de graisse, peut s'orienter vers un suivi des perturbations métaboliques engendrées.
Quelques travaux ont rapporté l'utilisation de la résonance magnétique nucléaire (RMN) et des statistiques multidimensionnelles dans une optique de diagnostic des anabolisants de type 13- agoniste utilisés en élevage [Vogels et al., 1996], de criblage de substances à effet thérapeutique ou toxicologique [Beckwith-Hall et al., 1998] et de diagnostic du cancer [Nadal et al., 1997 ; Somorjai et al., 1995, Tate et cil,, 1996]. il s'agit dans ces différentes études de techniques RMN monodimensionneiles ('H, P ou C) pour lesquelles les raies structurales se superposent.
Ceci conduit à un biais au niveau de l'intégration des signaux RMN qui est l'étape préalable au repérage par les outils de la statistique multidimensionnelle de la perturbation de la situation physiologique.
La recherche de moyens fiables de discrimination avec repérage et/ou identification de situations de perturbations biologiques a conduit les inventeurs à prendre en compte tous les composés présents dans une matrice ou échantillon d'origine biologique, et à les traiter selon un protocole normalisé d'analyses spectroscopiques et statistiques.
L'invention se propose donc d'identifier le facteur causal des variations coordonnées du métabolisme, par comparaison de sa signature avec celles enregistrées dans une banque de données.
Les travaux réalisés dans cette optique ont montré qu'il existait des constantes qualitatives et quantitatives propres à une situation physiologique, caractérisées par une signature, et qu'il était possible d'y déceler une variabilité associée.
L'expression signature biologique englobe la notion d'empreinte caractéristique et reconnaissable d'une situation métabolique décrite au moyen d'une technique analytique précise.
Le procédé selon l'invention de discrimination avec repérage et/ou identification d'une situation de perturbation biologique est caractérisé en ce qu'on soumet un échantillon biologique à une technique analytique hautement résolutive et qu'on associe cette technique à un traitement statistique et/ou de classification prenant en compte toutes les variations observées en référence à une situation de perturbation biologique validée.
Selon un mode de réalisation de l'invention, on soumet l'échantillon à étudier à au moins une mesure RMN multidimensionnelle, suivie d'une analyse quantitative des signaux, d'une intégration des signaux, et du traitement des données d'intégration. Les données obtenues sont alors caractéristiques des situations biologiques observées dans l'échantillon analysé et constituent une signature biologique.
L'analyse spectrométrique par RMN est, plus particulièrement, une analyse par RMN bidimensionnelle. On obtient, ainsi des corrélations dont la modulation selon une-seconde dimension donnent lieu à des variables déconvoluées. La RMN 2D utilisée est homonucléaire, par exemple lH-lH et/ou hétéronucléaire, par exemple IH-l3C.
La détection protonique est obtenue au moyen d'une sonde de détection dite inverse 1H-13C, de grande sensibilité puisque utilisant le proton'H, noyau d'hydrogène (99,98% en abondance naturelle), comme noyau de détection au lieu du 13C (1,1% en abondance naturelle). Les corrélations entre le'H et le 13C (taches de corrélation) sont obtenues par le biais de leur couplage mutuel.
Il s'agit, notamment, d'une analyse HMBC (Heteronuclear Multiple Bonding Connectivity) qui établit des corrélations hétéronucléaires à longues distances. Il est possible d'observer les couplages de noyaux de carbone 13 se situant à deux, trois voire quatre liaisons chimiques d'intervalle du proton sujet à la détection. La séquence d'impulsions utilisée est, notamment, celle d'une BC-GAS (Gradient Accelerated Spectroscopy) [Hurd & John, 1991]. Des impulsions de gradients de champs magnétiques sont envoyées au cours de l'expérience.
Avec ces gradients, il est possible de sélectionner des cohérences'H-3C, ce qui permet une suppression très. satisfaisante des signaux résiduels liés notamment à la résonance de l'eau et ne contenant pas d'informations sur le squelette hydrocarboné situé dans la partie médiane de la dimension proton. Cette suppression se fait dans une plage de temps d'expérience réduite par rapport à la mise en oeuvre d'une HMBC sans gradient.
Par ailleurs, les cartes HMBC-GAS présentent l'avantage d'une grande lisibilité : elles ne contiennent pas de bruit t, artéfactuel, sous la forme de trainées verticales situées à la fréquence de chaque signal et qui sont liées, dans le cas d'une détection en quadrature, à une imperfection instrumentale du système d'élimination de ces signaux dans les expériences sans gradient.
Les paramètres d'acquisition, fréquence d'excitation dans la dimension JH et dans la dimension 3C, ainsi que les fenêtres spectrales dans les deux dimensions sont déterminés spécifiquement pour chaque type d'analyse. Chaque interférogramme (FI) est multiplié par une fonction sinusoïdale carrée. Pour augmenter le rapport signal/bruit, on applique une apodisation (double zéro-filling) à chaque interférogramme. Dans le cas de l'ABC-GAS, on effectue ensuite une transformation de
Fourier du signal en mode magnitude.
Les cartes ainsi obtenues sont comparées. Les taches de corrélation sont intégrées et les données obtenues font !'obet el'une anllyse-.. alistique multidimelsionnelle. L'intégration correspond au calcul de l'intégrale du signal RMN, représenté en intensité par unité de surface, la plus petite unité indivisible étant le point mémoire. Ces points mémoire sont caractérisés par un triplet : les deux coordonnées dans les dimensions proton et carbone, ainsi que la valeur d'intensité du signal pour ce point. L'intégration d'une tache de corrélation de surface donnée résulte alors de la somme de l'intensité de tous les points mémoire compris dans la surface en question, délimitée autour de la tache de corrélation.
D'un point de vue statistique, chaque tache de corrélation dûment caractérisée et intégrée selon la même surface pour toutes les cartes devient une variable précise, et chaque carte établie pour un animal, un végétal ou tout échantillon à étudier, est dénommé individu.
L'exploitation des données des cartes RMN obtenues selon l'invention permet de disposer d'une technique de reconnaissance de grande fiabilité des situations physiologiques auxquelles les échantillons à l'origine de la variabilité ont été soumis.
Selon un autre mode de réalisation de l'invention, on utilise, complémentairement ou alternativement, la spectrométrie de masse comme technique analytique hautement résolutive.
On a recours en particulier à la spectrométrie de masse de type Py-NIAB-Tof MS avec détection en temps de vol des ions formés par bombardement par atomes métastables après pyrolyse de l'échantillon. Différents gaz tels que N2 ou des gaz rares peuvent être utilisés.
Les variables obtenues par la technique analytique mise en oeuvre sont soumises à une étape préalable de filtration. Les étapes de discrimination des groupes d'individus et de classification des individus dits supplémentaires sont réalisées sur le jeu réduit de variables issues de la filtration.
L'étape de filtration des variables est réalisée avantageusement au moyen d'une analyse en composantes principales (ACP) et/ou d'une classification hiérarchique etlou d'une analyse de variance et/ou d'une analyse des corrélations partielles, l'analyse de variance et l'analyse des corrélations partielles pouvant s'effectuer sur la totalité du jeu de variables ou sur les variables regroupées dans un cluster.
La filtration des variables est effectuée avant l'analyse factorielle discriminante (AFD) de façon à éliminer la redondance d'information présente dans le système initial de variables, en particulier, dans les cas très fréquents où il y a plus de variables que d'individus.
Dans les cas de surinformation du système, il s'ensuit un défaut d'inversibilité (ou pseudosingularité) de la matrice à analyser, ce qui rend impossible le déroulement de l'algorithme d'AFD [Lebart, Morineau & Piron 1998 ; McLachlan, 1992]. L'invention cherche donc à diminuer le nombre de dimensions redondantes (donc de variables) sans dégénérer l'information totale. La filtration par classification hiérarchique de variables permet par ailleurs de générer des regroupements de variables qui peuvent avoir une pertinence au point de vue de l'interprétation de ces variables en terme de structure.
La filtration de variables se fait de façon composite. Il est nécessaire d'utiliser et de croiser plusieurs méthodes complémentaires afin d'augmenter le caractère informatif des variables sélectionnées ou générées.
Dans chaque regroupement ou cluster, qui correspond à un ensemble de variables au comportement très similaire, on cherche à synthétiser au maximum l'information. Pour cela, une variante de la méthode consiste en la sélection d'une seule variable au moyen d'une analyse de variance (ANOVA). Dans une seconde variante ; est effectuée une analyse des corrélations partielles. Une troisième variante de la méthode consiste en la création d'une variable synthétique à partir de celles de départ, qui prend en compte le maximum d'information (inertie totale) contenu dans le cluster.
Ceci se fait grâce à une ACP.
L'ACP représente les individus (animaux, végétaux, microorganismes) dans un espace de plus faible dimension, les individus étant initialement présents dans un espace à n dimensions, n désignant le nombre de variables initiales. Cette analyse cherche à isoler les directions d'hétérogénéité maximale (ou composante priiictpaies) du nuage des individus et du nuage des variables, sans formuler d'ce priori sur la structure de groupe des individus ni celle des variables.
L'AFD ou autre méthode de discrimination (arbre de classification ou réseaux neuromimétiques) est utilisée pour discriminer les groupes de traitement prédéfinis [Ripley, 1996 ; Venables & Ripley, 1999]. Il y a, à ce niveau, un a priori sur la structure de groupe. C'est elle qui définit a priori la signature biologique au sens statistique du terme.
La discrimination optimale des individus répartis en sous-groupes définis (espèces, variétés, groupes de traitement, groupes physiologiques), ces distinctions n'étant pas exhaustives, ni limitatives, par une classification d'individus ou par la connaissance préalable de ces groupes, est effectuée avantageusement par une AFD ou par des analyses neuromimétiques. Au lieu de séparer les individus suivant l'hétérogénéité du nuage, en maximisant la distance entre individus, l'AFD cherche à maximiser la distance entre les barycentres des groupes. Dans un second temps, l'AFD sert à reconnaître la signature d'individus supplémentaires à tester, ceux-ci n'ayant pas servi à construire les fonctions ou axes discriminants, pour les affecter au groupe dont ils sont le plus proche.
L'invention, de ce point de vue, génère une règle de décision. La signature biologique devient équivalente à l'ensemble des fonctions (ou axes) discriminantes définies par combinaison linéaire des variables d'origines retenues.
La signature biologique peut être, alors, utilisée à des fins de repérage, sur des individus n'ayant pas servi à construire les fonctions discriminantes ni le modèle de classification. De manière concomitante, les fonctions discriminantes et les groupes de variables étant définis, il est possible d'effectuer une interprétation physiologique des voies métaboliques affectées par la perturbation en rapport avec son contexte, dans le cas ou les variables entrant dans le calcul des fonctions discriminantes sont déjà connues sur le plan structural.
Ensuite, le repérage des individus inconnus se fait par l'analyse comparée des résultats obtenus par la mise en oeuvre des techniques analytiques et de traitement statistique sur ces individus et des données issues d'un référentiel correspondant à l'espèce ou traitement auquel l'échantillon analysé pourrait être affecté.
Ce référentiel est évolutif et obtenu par accumulation de résultats d'analyses en opérant comme défini ci-dessus, les échantillons étant traités de manière identique, dans des conditions identiques à celles appliquées aux échantillons à analyser.
Les échantillons mis en oeuvre, selon l'invention, sont d'origine animale, végétale ou microbiologique. Ils proviennent, le plus généralement, de produits d'excrétion ou de secrétion, de tissus, de cellules ou de milieux de culture. Ils peuvent être sous forme de lyophilisais totaux ou partiels, d'extraits ou de broyats préparés à partir de matrices biologiques.
Les fluides biologiques utilisables comprennent l'urine, le plasma sanguin, le fluide séminal, la salive, le liquide céphalorachidien, la lymphe pour les animaux, la sève, les exsudats foliaires et floraux pour les végétaux, milieux de culture de microorganismes.
La fiabilité du procédé implique que les échantillons et les analyses soient effectuées dans les mêmes conditions.
Le procédé de discrimination de l'invention présente un grand intérêt dans de nombreuses applications comme mentionné ci-après.
L'invention vise, en particulier, l'application du procédé défini ci-dessus comme méthode d'investigation du phénotype pour permettre d'accéder à la composante génétique d'un individu. Elle peut aussi permettre de révéler l'incidence sur le métabolisme d'une perturbation d'origine environnementale. On citera par exemple la détermination d'indices de pollution.
L'invention vise également l'application dudit procédé à la. caractérisation de l'état physiologique propre à une population : l'invention permet notamment la vérification par signature de différents paramètres physiologiques (âge, sexe, état d'engraissement, lactation) ou nutritionnels (équilibre nutritionnel, origine et/ou qualification des matières premières alimentaires, présence de facteurs antinutritionnels ou bénéfiques à la santé). L'invention permet également la recherche biomédicale de signatures et/ou le diagnostic et/ou le suivi d'une pathologie (notamment celles dont la période de latence peut être longue : cancer, encéphalopathies, neurodégénérescences, maladies auto-immunes, diabète).
Selon encore un autre aspect, l'invention vise l'application dudit procédé de discrimination au repérage et/ou à l'identification de perturbations d'un système biologique par une substance d'activité pharmacologique ou par un microorgcUlisme ; l'invention permet le suivi des effets d'une substance entre groupes de traitement, c'est-à-dire la recon.
Llaissance via leur signature biologique de l'utilisation d'anabolisants, mais également de substances thérapeutiques, ainsi que les effets de différents polluants ou xénobiotiques, de même que l'influence de l'infection par un microorganisme pathogène sur une population,
Dans l'application, par exemple à l'identification d'anabolisants dans un échantillon biologique prélevé sur un individu, l'étude simultanée et sans a priori de toutes les variations du métabolisme selon le procédé de l'invention permet de rendre compte de manière très fine des variations du métabolisme générées par l'utilisation des anabolisants.
Ainsi, il est possible de dégager une signature biologique de l'état physiologique de traitement aux anabolisants, sans doser directement les anabolisants ou leurs résidus. Il est possible notamment de différencier indirectement les animaux selon le traitement anabolisant qu'ils ont suivi, mais également selon la dose administrée par rapport à des animaux non traités. Il est également possible au sein d'un groupe donné d'individus d'explorer la variabilité du métabolisme liée au sexe et à l'âge des animaux examinés.
Ainsi, l'invention permet une observation indirecte et sans a priori d'un phénotype, grâce à l'utilisation de nouvelles techniques non invasives, ou si possible non destructives pour l'organisme quant à l'obtention de l'échantillon étudié.
L'invention permet d'obtenir une information sur la totalité du métabolisme de l'animal, et ainsi de générer une signature biologique de la situation physiologique dans laquelle il se trouve, par comparaison au reste de la population étudiée ou à une population de référence.
L'invention vise, en outre, l'utilisation de telles données pour constituer un système de référence, et une banque de données, pour une espèce animale ou un autre organisme, élaborés à partir des caractéristiques des profils des échantillons étudiés. De tels moyens permettent de vérifier la nature de la physiologie d'un animal inconnu ou d'un autre organisme vivant par sa signature biologique.
La constitution d'un référentiel ou d'une banque de données peut être réalisée à partir d'une ou de plusieurs méthode (s) spectrophysique (s) génératrice (s) de variables, avec possibilité d'établir dans ce dernier cas des liens canoniques entre clusters de variables provenant de tableaux de données séparés construit à partir des mêmes individus.
L'invention vise également l'application du procédé défini ci-dessus pour caractériser sur le plan biochimique les ensembles de biomarquage caractérisant la discrimination de groupes d'individus à partir de la caractérisation structurale des variables entrant dans la construction des variables discriminantes.
L'invention vise en outre l'application dudit procédé pour générer des fonctions discriminantes utilisables sur des données produites au moyen de dosages biologiques conventionnels des entités biochimiques appartenant aux ensembles de biomarquage de ladite perturbation biologique.
D'autres caractéristiques et avantages sont donnés dans les exemples qui suivent-aux fins d'illustration. Dans ces exemples, il est fait référence aux figures 1 à 10, qui représentent respectivement : - figure 1 : la carte H C-GAS pour l'individu n 22 (vache de réforme), - figure 2 : le résultat issu de la filtration de variables, - figure 3 : l'analyse multidimensionnelle AFD, - figure 4 : la carte'HNIBC-GAS pour l'urine collectée à l'abattage sur l'individu n 4463, implanté 4 fois, - figure 5 : le résultat de la filtration de variables, - figure 6 : l'analyse multidimensionnelle AFD, - figure 7 : les empreintes Py-MAB/Tof MS N2 d'urines de bovin, - figure 8 :
le résultat de la filtration de variables pour les variables candidates situées dans la gamme m/z 55-m/z 350 Th à partir d'empreintes MAB/Tof MS N2, - figure 9 : la signature biologique de traitements anabolisants par Py-MAB/TofMS N2 et Analyse
Factorielle Discriminante, et -figure 10 : le spectre1H-l3C-HNSC et le spectre'H d'une urine enregistrée à 303K.
Exemple 1 : Etude de la variabilité physiologique d'un croupe d'urines de bovins prélevés en abattoir
Il s'agit d'urines provenant de trois catégories d'animaux : vaches de réforme, mâles castrés de 3-4 ans, veaux de moins d'un an.
Ce mode opératoire comprend : 1-la préparation (lyophilisation) des urines, 2-l'analyse RMN des lyophilisais obtenus, 3-l'intégration des données de l'analyse RMN, 4-l'analyse statistique des résultats.
Chacune des étapes est détaillée ci-après.
Lylailisatio des urines
Chaque échantillon urinaire est préparé en procédant comme suit.
Les urines prélevées sont conservées à-30 C jusqu'au moment de l'analyse. Une première analyse est destinée à estimer la quantité d'urine nécessaire pour récolter 500 mg de matière sèche. Environ 10 ml d'urine sont placés dans un tube à centrifugation de 50 ml, préalablement taré. Le volume introduit est alors pesé, avant recongélation dans le tube à centrifugation. Une congélation à une température de-80 C est préférable à une température de-30 C, car elle est plus rapide (2 h) et fournit un volant thermique plus important lors du lancement de l'étape suivante. L'échantillon est ensuite lyophilisé jusqu'à sublimation de la totalité de l'eau contenue dans l'échantillon. Le lyophilisat est alors pesé, ce qui permet de connaître le volume nécessaire pour obtenir 500 mg de. lyophilisat.
L'opération de lyophilisation est réitérée sur le même flacon. Le lyophilisat ainsi récolté au terme de cette seconde étape est à nouveau pesé, puis repris dans un volume d'eau afin d'assurer une concentration finale ajustée à 500 mg par ml. L'échantillon est alors congelé.
Deux lyophilisations sont effectuées pour chaque échantillon urinaire. Chaque lyophilisat est mesuré indépendamment en RMN
Mesure RMN
Pour chaque urine, deux échantillons de concentration constante (500 mglml) sont analysés par
RMN 2D. Une série d'expériences est enregistrée pour chaque lyophilisat.
Une sonde de détection inverse t 13C, est utilisée pour sa grande sensibilité proton. Sont enregistrés : - un spectre proton sans élimination du pic de l'eau, - un spectre proton avec élimination du pic de l'eau par la technique dite Watergate [Piotto et al., 1992] ou par présaturation. Dans le cas d'une élimination de type Watergate, l'atténuation atteint un facteur 105, - une expérience HMBC donnant les corrélations hétéronucléaires ('H-13C) à longues distances (2Jc n et Jc-n) [Bax & Summers, 1986], un proton Watergate de contrôle.
La séquence d'impulsion utilisée est celle d'une HMBC-GAS. Les paramètres d'acquisition sont les suivants. La fréquence d'excitation basale dans la dimension 1H est de 500,13 MHz. A cette fréquence basale est ajoutée une fréquence additionnelle 9031 Hz + 2Hz, fluctuant d'une mesure sur l'autre, car centrée sur le pic de l'eau.
La fréquence d'excitation est de 125,7728 MHz en dimension 13C. La fenêtre spectrale en tH est de 10,0982 ppm, soit 5050,50 Hz et de 222 ppm (soit 27921 Hz) en 13C
Chaque signal de précession libre (FID) est digitalisé en 2048 points. 256 incréments (expériences unitaires d'une analyse en 2D) sont enregistrés en dimension ssC Chaque incrément est le résultat de l'accumulation de 16 interférogrammes (FED) dans des conditions identiques, en vue d'augmenter le rapport signal/bruit.
Les données acquises dans le domaine temps sont multipliées par une fonction de fenêtre de type sinus carré, afin d'augmenter la résolution du signal, puis elles subissent une transformation de Fourier en magnitude. Préalable à l'obtention de la transformée de Fourier, un double zéro-filling est effectué dans la dimension carbone, portant la résolution de 256 à 512 points dans cette dimension. Le temps d'acquisition de cette expérience est de 2 heures, ce qui porte la totalité de l'expérience à 2 h 40. Une carte HMBC-GAS est présentée en figure 1. Il s'agit de l'individu n 22 qui appartient au groupe des vaches de réforme.
L'échelle dans la dimension horizontale correspond aux déplacements chimiques IH. Elle s'étend sur une fenêtre de 10, 098 ppm autour de la résonance de l'eau. Le spectre projeté est celui du 1H Watergate. On note la présence du pic de l'eau fortement atténué au centre du spectre, ainsi que la forte redondance de signaux dans cette dimension, information qui est révélée par l'utilisation d'une technique multidimensionnelle.
La seconde dimension, verticale, est la dimension 13C dont l'échelle s'étend sur 220 ppm.
Intérrnfion
L'information contenue dans les cartes RMN 2D (BIC) de chaque urine est traduite en données numériques par le calcul du volume de chaque pic de corrélation, en utilisant un système informatisé. Ce dernier applique un canevas dûment caractérisé, défini une seule fois pour toutes les cartes. Autour de chaque tache, des secteurs sont délimités et le volume est calculé par addition des intensités des points contenus dans le secteur en question. Ainsi, chaque tache de corrélation est digitalisée en variable ayant pour valeur l'intégrale des intensités sur le secteur donné. L'intégration a donné lieu à 266 variables. Les données obtenues font alors l'objet d'un traitement statistique multidimensionnel.
ANALYSE STATISTIQUE MULTIDIMENSIONNELLE DES DONNEES OBTENUES PAR HMBC-GAS
Filtration des variables
La filtration des variables sert à définir les regroupements de variables corrélées structurellement et physiologiquement. De ces regroupements, seules les variables les plus informatives sont retenues.
Ainsi, sur les 266 variables intégrées, 94 ont été retenues par l'analyse de variance (F significatif au seuil de 5%). Elles ont alors fait l'objet d'une classification hiérarchique selon leurs profils de corrélation. Enfin. une sélection a été opérée sur les 30 variables explicatives candidates (significatives au seuil de 1%) par l'analyse de leurs corrélations partielles. A chaque pas est sélectionnée la variable observée et sont rejetées toutes celles qui sont linéairement corrélées à celles-ci. La figure 2 montre que les variables sélectionnées décrivent au mieux l'ensemble des variables explicatives avec un minimum de redondance d'information.
Les variables définitivement retenues sont les suivantes : varl83, var47, varl23, varl32, varl96, var180, var218, varl75, varl25, var58, var112, var266, varl70, varl33, var49, varl42, varl41. Ces variables correspondent principalement à des taches de corrélation de protons se situant entre 1 et 4,3 ppm, d'une part, et entre 6 et 7,5 ppm d'autre part.
Analeafactorielle cliscrinzimcnte
L'analyse factorielle discriminante a été effectuée sur la matrice de dimensions réduites (18 variables retenues), concernant une mesure pour chacune des lyophilisations d'un échantillon urinaire. La variabilité des trois groupes est entièrement résumée sur les deux premiers facteurs. On rapporte sur la figure 3 la projection sur le plan défini par les axes factoriels 1 et 2 des individus appartenant aux trois groupes suivants : groupe 1 : vaches de réforme (F), groupe 2 : mâles castrés (boeufs de 3-4 ans) (Mc), groupe 3 : veaux de moins d'un an (V).
La discrimination est significative au. seuil de 10'4 (n = 54). On constate que les trois groupes sont parfaitement séparés.
Cette analyse met en avant la possibilité de discriminer des animaux selon leur sexe et leur âge, c'est-à-dire selon des caractères phénotypiques.
Validation de la règle de décision
Une fois générée la règle de discrimination, l'estimation des erreurs associées à cette règle fournit un outil de validation de celle-ci.
La validation croisée permet d'appréhender la robustesse de la méthode de discrimination, sans avoir recours à un jeu d'individus à tester, et de clarifier l'incidence d'un nombre restreint de mesures sur le modèle [MacLachlan, 1992]. Un individu est successivement retiré de l'échantillon statistique total. Pour n individus, sont générés n échantillons de taille n-1. Sur chaque échantillon, une AFD est effectuée, puis !'individu enlevé est projeté. Ses coordonnées sont calculées à partir des équations discriminantes du modèle obtenu avec n-1 individus. L'individu est ensuite attribué au groupe dont il est le plus proche, selon la règle de prédiction déterminée lors de la calibration de l'AFD. Cette attribution se retrouve dans la matrice de confusion .
Un taux de mauvais classement par rapport au groupe d'origine est alors calculé [Lebart, Morineau, Piron, 1998].
L'appréciation de ces taux permet de valider la technique et de lui attribuer un intervalle de confiance.
Matrice de confusion
EMI15.1
<tb> <SEP> Prédictions <SEP> Appartenances
<tb> (nombres <SEP> et
<tb> <SEP> pourcentages)
<tb> <SEP> Initiales <SEP> Prédites
<tb> <SEP> Groupes <SEP> Total <SEP> F <SEP> Me <SEP> V
<tb> <SEP> F <SEP> 32 <SEP> 28 <SEP> 1 <SEP> 3
<tb> <SEP> '% <SEP> 100 <SEP> 87,5 <SEP> 3,13 <SEP> 9,38
<tb> <SEP> Me <SEP> 16 <SEP> 0 <SEP> 16 <SEP> 0
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 100 <SEP> 0
<tb> <SEP> V <SEP> 6 <SEP> 2 <SEP> 0 <SEP> 4
<tb> <SEP> % <SEP> 100 <SEP> 33, <SEP> 33 <SEP> 0 <SEP> 66, <SEP> 67
<tb> <SEP> Total <SEP> 54 <SEP> 30 <SEP> 17 <SEP> 7
<tb> <SEP> '% <SEP> 100 <SEP> 55,56 <SEP> 31, <SEP> 48 <SEP> 12,96
<tb>
F : vaches de réforme, Me : boeufs de 3-4 ans, V : veaux de moins d'un an
Les individus appartenant aux groupes de la première colonne sont attribués selon chaque ligne aux différents groupes.
Estimatiorr des taux d'erreur de classement en fonction des groupes d'appartenance
EMI15.2
<SEP> Groupes <SEP> F <SEP> Mc <SEP> V <SEP> Erreur <SEP> totale
<tb> Taux <SEP> d'erreur <SEP> de
<tb> <SEP> 12,50 <SEP> 0 <SEP> 33,33 <SEP> 15,28
<tb> <SEP> classement <SEP> (%)
<tb>
F : vaches de réforme, Mc : boeufs de 3-4 ans, V : veaux de moins d'un an.
Ce taux d'erreur est relativement faible, compte tenu de la taille de l'échantillon, et de sa grande variabilité. Il provient essentiellement de la mauvaise attribution de 2 veaux sur un total de 6, ce qui est faible par rapport aux effectifs des autres groupes. Par ailleurs, 3 vaches de réforme ont été classées dans le groupe des veaux de moins d'un an. Un bon niveau de discrimination peut être atteint en augmentant le nombre d'animaux analysés.
Exemple 2 : Discrimination d'urine de bovins selon le traitement anabolisant
On rapporte le mode opératoire appliqué aux urines de bovins implantés en 1999 avec l'association hormonale acétate de trenbolone-estradiol-17ss (Revalor-S) selon plusieurs groupes de traitement.
Il s'agit d'urines provenant de quatre catégories : mâles castrés non-implantés dits témoins, traités avec un implant en début de traitement, un implant'en début plus un implant à mi-période d'implantation, soit au bout de 45 jours, et enfin 4 implants en début de traitement. Deux prélèvements d'urine ont été effectués, à 10 et 90 jours après implantation. Ce mode opératoire comprend : 1-la lyophilisation des urines, 2-l'analyse RMN des lyophilisais obtenus, 3-l'intégration des données de l'analyse RMN, 4-l'analyse statistique des résultats.
Préparation les échantillons
Le protocole de préparation des échantillons est le même que dans l'exemple 1.
Analyse RMN des lyophilisats
Pour chaque urine, deux échantillons de concentration constante (500 mglml) sont analysés par
RMN 2D. Une série d'expériences est enregistrée pour chaque lyophilisat. Une sonde de détection inverse'H-'3C est utilisée pour sa grande sensibilité proton.
Sont enregistrés : - un spectre proton sans élimination du pic de l'eau, - un spectre proton avec élimination du pic de l'eau par la technique dite Watergate [Piotto et cl., 1992] ou par présaturation Dans le cas d'une élimination de type Watergate, l'atténuation atteint un facteur 105, - une expérience IVIBC donnant les corrélations hétéronucléaires (tH-l3C) à longues distances 2JC-H et 3JC-H, [Bax & Summers, 1986], - un spectre proton de contrôle avec élimination du pic de l'eau par la technique dite Watergate.
La séquence d'impulsion utilisée est celle d'une HMBC-GAS. Les paramètres d'acquisition sont les mêmes que ceux décrits dans l'exemple 1. Le temps d'acquisition de cette expérience est de 2 heures, ce qui porte la totalité de l'expérience à 2 h 40. La figure 4 présente une HMBC-GAS pour l'individu n 4463. Il s'agit d'un veau traité avec 4 implants de type Revalor-S. La mesure a été effectuée sur le prélèvement à l'abattage.
Intégration des données de l'analyse RMN
L'information contenue dans les cartes RMN 2D (HMBC) de chaque urine est traduite en données numériques par le calcul du volume de chaque pic de corrélation, en utilisant un système informatisé comme décrit dans l'exemple 1.
L'intégration a permis de générer 313 variables Les données obtenues font alors l'objet d'un traitement statistique multidimensionnel.
ANALYSE STATISTIQUE MULTIDIMENSIONNELLE DES DONNEES OBTENUES PAR HMBC-GAS Filtrrition rles occriables
La filtration de variables sert à définir les regroupements de variables corrélées parce que liées structuralement ou physiologiquement. De ces regroupements, seules les variables les plus informatives sont retenues. L'analyse de variance a révélé 106 variables explicatives (F significatif au seuil de 5%). La classification hiérarchique a été réalisée sur le profil des corrélations (r2) entre les variables explicatives candidates. La sélection itérative sur l'analyse des corrélations partielles (p2) de ces variables candidates permet de rejeter celles qui sont redondantes avec les variables sélectionnées.
Cette classification a été recoupée avec l'analyse des corrélations partielles.
Finalement, 10 regroupements de variables ont été retenus. Une seule variable partiellement corrélée à la variable de classes est retenue par groupe. Les résultats de cette filtration sont présentés dans la figure 5. Cette figure montre l'intérêt d'une sélection drastique des variables : sur 313 corrélations RMN intégrées, 10 ont été retenues de manière à ce qu'elles soient toutes explicatives et présentent un minimum de redondance d'information.
Les variables sélectionnées sont celles qui caractérisent un cluster et qui ont le puzzle plus élevé du cluster, avec un seuil de rejet de 104. Les variables sont les suivantes : var28, varl90, var63, varl87, var51, var49, varl27, varl83, var231, var215. Ces variables correspondent principalement à des taches de corrélation de protons se situant entre 1 et 4,3 ppm, d'une part, et entre 6 et 7,5 ppm d'autre part.
Analyse factorielle discriminante
L'analyse factorielle discriminante a été effectuée sur la matrice de dimensions réduites (10 variables), pour le prélèvement à 90 jours. La variabilité des quatre groupes est résumée sur les trois facteurs discriminants. On rapporte sur la figure 6 les résultats de l'AFD sur le plan décrit par les deux premiers axes factoriels.
Les groupes projetés sont les suivants : groupe 1 témoins non implantés (T), a groupe 2 : traitement avec 1 implant de stéroïdes (1), groupe 3 : traitement avec 2 implants de stéroïdes (2), groupe 4 : traitement avec 4 implants de stéroïdes (4).
La discrimination est significative au seuil de lu-4 (n=30).
Ces résultats permettent une excellente discrimination graphique qui est par ailleurs très hautement significative. Il est ainsi possible de discriminer les animaux témoins des animaux traités qualitativement sur le premier axe. Cette séparation représente 69% de la variabilité totale. La signature biologique urinaire des animaux témoins est très différente de celle des animaux implantés. En revanche, le second axe discrimine les animaux traités selon la dose d'implantation.
Cet axe représente 24% de la variance totale. La discrimination selon cet axe permet de révéler l'intensité du traitement appliqué. Cette analyse met en évidence la possibilité de discriminer les animaux implantés (traités aux stéroïdes) des témoins, non seulement qualitativement mais quantitativement, et ce, dès le dixième jour de traitement (non représenté),. lors de la mise en place des perturbations physiologiques conduisant à l'accrétion protéique et la fonte lipidique.
Validation de la règle de décision
Les mêmes règles de tests de validation que celles présentées à l'exemple 1 ont été utilisées pour attester de la robustesse de la méthode de discrimination établie sur le jeu d'essai.
Matrice de confusion
EMI19.1
<tb> <SEP> Prédictions <SEP> Appartenances
<tb> (nombres <SEP> et
<tb> <SEP> pourcentages)
<tb> <SEP> Initiales <SEP> Prédites
<tb> <SEP> Groupes <SEP> Total. <SEP> 4
<tb> <SEP> T <SEP> 8 <SEP> 8 <SEP> 0 <SEP> 0 <SEP> 0
<tb> % <SEP> 100 <SEP> 100 <SEP> 0 <SEP> 0 <SEP> 0
<tb> <SEP> 1 <SEP> 4 <SEP> 0 <SEP> 3 <SEP> 1 <SEP> 0
<tb> % <SEP> 100 <SEP> 0 <SEP> 75 <SEP> 25 <SEP> 0
<tb> <SEP> 2 <SEP> 10 <SEP> 0 <SEP> 1 <SEP> 9 <SEP> 0
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 75 <SEP> 25 <SEP> 0
<tb> <SEP> 2 <SEP> 10 <SEP> 0 <SEP> 1 <SEP> 9 <SEP> 0
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 10 <SEP> 90 <SEP> 0
<tb> <SEP> 4 <SEP> 8 <SEP> 0 <SEP> 0 <SEP> 0 <SEP> 8
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 0 <SEP> 0 <SEP> 100
<tb> <SEP> Total <SEP> 30 <SEP> 10 <SEP> 8
<tb> <SEP> % <SEP> 100 <SEP> 26,67 <SEP> 13,33 <SEP> 33,33 <SEP> 26, <SEP> 67
<tb>
T :
témoins, 1 : traitement par 1 implant, 2 : traitement par 2 implants successivement, 4 : traitement par 4 implants.
Les individus appartenant aux groupes de la première colonne sont attribués selon chaque. ligne aux différents groupes.
Estimation des taux d'erreur de classement en fonction des groupes d'appartenance
EMI19.2
<SEP> Groupes <SEP> T <SEP> 1 <SEP> 2 <SEP> 4 <SEP> Erreur
<tb> <SEP> totale
<tb> Taux <SEP> d'erreur <SEP> de <SEP> 0 <SEP> 25, <SEP> 0 <SEP> 10, <SEP> 0 <SEP> 0 <SEP> 8, <SEP> 75
<tb> <SEP> classement(%)
<tb>
T : témoins, 1 : traitement par 1 implant, 2 : traitement par 2 implants successivement, 4 : traitement par 4 implants.
Le taux d'erreur faible provient du fait que l'échantillon est bien décrit par les variables retenues pendant la phase d'apprentissage (établissement de la règle de discrimination), ce qui permet d'attribuer l'individu retiré avec un risque d'erreur relativement faible. Si l'on augmente le nombre de variables introduites, la discrimination n'est pas plus précise. La règle de discrimination ainsi calibrée permet de reconnaître une situation frauduleuse de traitement aux anabolisants sur ce type d'animaux.
Exemple 3 : Discrimination par MAB-Tof-MS d'urine de bovins selon le traitement anabolisant
On rapporte le mode opératoire appliqué aux mêmes urines de bovins implantés en 1999 avec l'association hormonale acétate de trenbolone-estradiol-1713 (Revalor-S) que dans l'exemple 2. Le mode opératoire comprend : 1-la lyophilisation des urines, 2-l'analyse par spectrométrie de masse de type MAB-Tof après pyrolyse de l'échantillon préparé à partir des lyophilisats, 3-l'intégration des données de l'analyse en spectrométrie de masse, 4-l'analyse statistique des résultats.
Préparation des échantillons
Le protocole de préparation des échantillons est le même que dans l'exemple 1.
Analvse MAB-Tof-MS après pyrolyse des lyophilisats
Pour chaque urine, deux échantillons de concentration constante (50 mg/ml) sont analysés par la technique de spectrométrie de masse dite MAB-Tof-pyrolyse (metastable atom bombardment-time of flight detection after pyrolysis of sample). Une série d'expériences est enregistrée pour chaque lyophilisât. Une ionisation des espèces moléculaires provenant de la pyrolyse des solutés urinaires à l'aide d'azote moléculaire N2 à l'état excité fournissant une énergie d'ionisation quantifiée est utilisée pour générer une empreinte pour chaque échantillon.
- Une correction dépendante de la matrice utilisée de l'intensité de réponse de chaque variable de masse notée m/z dans le spectre de masse (empreinte) par une opération de transformation de variable de type y=xl-k pour obtenir une stabilisation des variances afin d'augmenter la reproductibilité de l'analyse, k étant calculé par la relation loglo (EC) = c + k x loglo (M), EC et M désignant respectivement les écart-types et les moyennes des mesures pour chaque variable m/z.
Les paramètres instrumentaux utilisés sont les suivants : - Spectromètre de masse de type MAB-Tof équipé d'une sonde à pyrolyse ; - Pyrolyse des échantillons effectuée en utilisant un gradient de température de 20 C/ms de la température ambiante jusqu'à une température finale de 1100-1200 C maintenue 180-300 s ; - Flux d'hélium à travers le capillaire de quartz soumis à la pyrolyse permettant le transfert des produits de pyrolyse dans la source MAB fixé à 1-2 ml/min ; - Azote gazeux utilisé pour générer des atomes métastables au moyen d'une décharge en couronne à-350 V et 5-10 mA ; - Lyophilisats repris dans l'eau distillée à une concentration de 50 mg/ml et injection dans la sonde de pyrolyse d'un volume de 0,2 vil ;
- Détection des ions produits entre 55 et 800 Th ; - Fréquence d'acquisition sur le détecteur en temps de vol (Tof, time of flight) à une fréquence de 32 KHz
Les spectres de masse sont préparés à partir du pyrogramme moyen en soustrayant le bruit de fond de détection mesuré avant et après l'étape de pyrolyse.
Les empreintes urinaires pour un animal témoin et un animal implanté avec 4 implants sont représentées dans la figure 7. Il s'agit d'un veau traité avec 4 implants de type Revalor-S. La mesure a été effectuée sur le prélèvement obtenu à l'abattage.
Intégration des données de l'analyse Py-MAB-Tof
L'information contenue dans les empreintes de chaque urine est retraitée en transformant chaque variable m/z en pourcentage du pic de base porté à la valeur de 100. L'étude de la répétabilité du signal obtenu sur un même échantillon analysé 30 fois permet de stabiliser la variance de la mesure, d'en diminuer le coefficient de variation à une valeur inférieure à 15% pour les valeurs de masse m/z comprises entre 50 et 350 Th, ceci grâce à une opération de transformation de variable, ici y=x '182. L'opération d'intégration et filtration après transformation des variables a permis de générer 350 variables. Les données obtenues font alors l'objet d'un traitement statistique multidimensionnel comme décrit dans les exemples 1 et 2.
Analyse statistique multidimensionnelle des données obtenues par Py-MAB-Tof MS a. Filtration des variables
La filtration de variables sert à définir les regroupements de variables corrélées parce que liées structuralernent ou physiologiquement. De ces regroupements, seules les variables les plus informatives sont retenues. L'analyse de variance a révélé un faible nombre de variables explicatives (F significatif au seuil de 1%). La classification hiérarchique a été réalisée sur le profil des corrélations (r2) entre les variables explicatives candidates. La sélection itérative sur l'analyse des corrélations partielles (p2) de ces variables candidates permet ensuite de rejeter celles qui sont redondantes avec les variables sélectionnées. Cette classification a été recoupée avec l'analyse des corrélations partielles.
On rapporte sur la figure 8 le résultat de la filtration de variables pour les variables candidates situées dans la gamme m/z 55 et m/z 350 Th à partir d'empreintes MAB- Tof/MS obtenues avec N2* comme agent ionisant. Les légendes correspondent aux variables retenues avec un seuil de rejet de 1%. Les corrélations entre variables introduites sont représentées par un dendrogramme, dont l'indice d'agrégation correspond à 1-r, r étant le coefficient de corrélation entre les deux clusters (ou singletons) analysés. Les fortes corrélations qui se situent en bas du dendrogramme sont d'ordre instrumental, et celles plus au-dessus sont d'ordre physiologique. Les variables sélectionnées sont régulièrement distribuées dans les clusters.
Le caractère informatif provient de la probabilité de rejet inférieure à 1% et de leur relative décorrélation, du fait que ces variables explicatives sont ensuite sélectionnées itérativement sur la base de leur r2 de manière à rejeter les variables linéairement corrélées au sous-espace déjà sélectionné. 9 variables ont été sélectionnées dans ce jeu de données.
Les variables sélectionnées sont celles qui caractérisent un cluster et qui ont le p2 le plus élevé avec le sous-espace orthogonal au sous-espace explicatif déjà sélectionné, avec un seuil de rejet de 10-2.
Les variables retenue sont les suivantes : m/z 133, mlz 132, m/z 146, m/z 130, m/z 109, m/z 81, M/z 69, m/z 196, m/z 113 (figure 8). b. Analyse factorielle discriminante
L'analyse factorielle discriminante a été effectuée sur la matrice de dimensions réduites (9 variables), pour le prélèvement à 90 jours. La variabilité des quatre groupes est résumée sur les trois facteurs discriminants. Les résultats concernant la signature biologique de traitements anabolisants par Py-MAB-Tofì'MS N2 et Analyse Factorielle Discriminante sur le plan décrit par'les deux premiers axes factoriels sont rapportés sur la figure 9.
Le premier axe (56%) permet la discrimination entre animaux témoins et animaux implantés avec des implants de Revalort'-S depuis 90 jours. Le second axe, expliquant 23% de la variabilité totale, correspond à une discrimination des animaux traités selon le nombre d'implants apportés. Le dernier axe (non représenté) explique les derniers 21% de variabilité, lié au caractère simple ou redoublé de l'administration dans le temps. Les axes sont significatifs au seuil de 10-4.
Ces résultats permettent une excellente discrimination graphique qui est hautement significative. Il est ainsi possible de discriminer les animaux témoins des animaux traités qualitativement sur le premier axe factoriel. Cette séparation représente 56% de la variabilité totale. La signature biologique urinaire des animaux témoins est très différente de celle des animaux implantés. En revanche, le second axe discrimine les animaux traités selon la dose utilisée pour implanter les animaux. La discrimination selon cet axe permet de révéler l'intensité du traitement appliqué. Cette analyse met en évidence la possibilité de discriminer les animaux implantés (traités aux stéroïdes) des témoins, non seulement qualitativement mais aussi quantitativement. c.
Validation de la règle de décision
Les mêmes règles de tests de validation que celles présentées aux exemples 1 et 2 ont été utilisées pour attester de la robustesse de la méthode de discrimination établie sur le jeu d'essai.
Matrice de confusion
EMI23.1
<tb> <SEP> Prédictions <SEP> Appartenances
<tb> (nombreset <SEP> pourcentages)
<tb> <SEP> Initiales <SEP> Prédites
<tb> <SEP> Groupes <SEP> Total <SEP> T <SEP> 1 <SEP> 2 <SEP> 4
<tb> <SEP> T <SEP> 8 <SEP> 8 <SEP> 0 <SEP> 0 <SEP> 0
<tb> <SEP> % <SEP> 100 <SEP> 100 <SEP> 0 <SEP> 0 <SEP> 0
<tb> <SEP> 4 <SEP> 0 <SEP> 4 <SEP> 0 <SEP> 0
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 100 <SEP> 0 <SEP> 0
<tb> <SEP> 2 <SEP> 10 <SEP> 0 <SEP> 0 <SEP> 10 <SEP> 0
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 0 <SEP> 100 <SEP> 0
<tb> <SEP> 8 <SEP> 0 <SEP> 0 <SEP> 0 <SEP> 8
<tb> <SEP> % <SEP> 100 <SEP> 0 <SEP> 0 <SEP> 0 <SEP> 100
<tb> <SEP> Total <SEP> 30 <SEP> 8 <SEP> 4 <SEP> 10 <SEP> 8
<tb> <SEP> % <SEP> 100 <SEP> 26,67 <SEP> 13, <SEP> 33 <SEP> 33, <SEP> 33 <SEP> 26, <SEP> 67
<tb>
T : témoins, 1 : traitement par 1 implant, 2 :
traitement par 2 implants successivement, 4 : traitement par 4 implants.
Les individus appartenant aux groupes de !. a première colonn@sont attribués selon chaque ligne aux différents groupes.
Estimation des taux d'erreur de classement en fonction des groupes d'appartenance
EMI23.2
<tb> <SEP> Groupes <SEP> T <SEP> 1 <SEP> 2 <SEP> 4 <SEP> Erreur
<tb> <SEP> totale
<tb> Taux <SEP> d'erreur <SEP> de <SEP> 0 <SEP> 0 <SEP> 0
<tb> <SEP> classement(%)
<tb>
T : témoins, 1 : traitement par 1 implant, 2 : traitement par 2 implants successivement, 4 : traitement par 4 implants.
Le taux d'erreur sur ce jeu de données est nul. La règle de discrimination ainsi calibrée permet de reconnaître une situation frauduleuse de traitement aux anabolisants sur ce type d'animaux.
Exemple 4 : Discrimination par analyse RMN 2D des urines de bouvillons et de vaches traités aux anabolisants
On rapporte le mode opératoire appliqué aux urines de bovins présentées dans les exemples 1 et 2, ainsi qu'à celles provenant de vaches traitées par une injection Am. unique de 250 mg d'Androtardyls (énanthate de testostérone, Schering, Lys-lez-Lannoy, France). Le mode opératoire est détaillé dans les exemples 1 et 2 et comprend : 1-la lyophilisation des urines, 2-l'analyse RMN des lyophilisats obtenus, 3-l'analyse structurale, 4-l'intégration des données de l'analyse RMN, 5-l'analyse statistique des résultats.
Préparation des échantillons
Le protocole de préparation des échantillons est le même que dans l'exemple 1.
Analyse RMN des lyophilisats
L'analyse RMN 2D des échantillons est réalisée comme indiqué dans les exemples 1 et 2. La caractérisation de plusieurs métabolites est obtenue grâce à l'assignation des résonances présentes dans les cartes RMN (figure 10). Ces assignations sont confirmées par une analyse combinée des déplacements chimiques, des motifs de couplage de spins, des constantes de couplage et de données présentes dans la littérature (Wilker et al., J. Magn. Reson. Analysis 2 (1996) 21 ; Holmes et al.,
Chem. Res.
Toxicol., 13 (2000) 471) et en recourant à des analyses RMN 2D complémentaires (TOCSY, HSQC) sur quelques échantillons représentatifs. L'ensemble des variables caractéristiques de différents métabolites urinaires est résumé dans le tableau 1 présenté ci-dessous.
Ces variables sont caractérisées par leur déplacement chimique dans les dimensions'H et 13C. Les métabolites majeurs présents dans les échantillons urinaires sont le citrate, le glucose, la diméthylamine (DMA), la triméthylamine-N-oxyde (TMAO), l'hippurate, la créatine et la créatinine, l'allantoïne, l'urée (observable en RMN du 1H) ainsi que deux composés partiellement décrits notés A et B.
Tableau 1. Caractérisation des métabolites urinaires d'après l'assignation des déoiacements chimiques.
Composés Variables #{barycentre #1H, barycentre #13C}
I17 {2, 62,78,7} ; 250 (2, 62, 184, 9} ; 7 (2, 62,49, 2}; 249{2,62, 181,9}
Citrate 248 79, 181,9} ; 123{2,79, 49,2} ; 118{2, 79,78,7}
Allantoïne 360{5,38, 169,3}; 362{5,38, 186,1}; 359{5, 38,162,3}
288 (7, 62,130,2}
283 (7, 53,136,3} ; 294 {7, 53,173,1} ; 287{7, 53,131, 8}; 290{7,53, 130,2} 278{8,02,130,2}
Hippurate 279{7,83, 130,2} ; 280 {7, 83,173,1} ; 281{7,83, 135,2}
299 {7, 62,135,2}
189{3, 98,179,7} ; 188 {3, 98,173, 1}
184{3, 91,160,5} ;
78 (3, 91,40, 0}
Créatine 180{3, 01,160,5}
Ill {3, 01, 57,0}
186{3,91,177,5}
112{2,94,59,5}
257{3,89,171,9}
Créatinine 108{3, 89,33,3}
185{3,89,191,5}
181{2,94,171,9}
TMAO 105 {3, 28,62, 4}
Diméthylamine 122 {2, 72, 37, 8}
291 {7, 41, 132,1}
286{7,34,130,2}
A 285{7, 41,132, 1} ; 284 {7, 41, 138, 2} ;
156{7,34,45,6}
190{3, 66, 177}; 198{3, 66,138,2} ; 199{3, 66,132,1}
265 {7, 23,123,8} ; 157 {7, 23,123,2} ; 270 {7,23,132, 7}; 350{7,23, 151,6} ;
B 275 {7, 23,138,8}
178{2, 31,138,8} ;
179 {2, 31,132,7}
Intégration des données de l'analyse RMN
L'information contenue dans les cartes RMN 2D (HMBC) de chaque urine est traduite en données numériques par le calcul du volume de chaque pic de corrélation, en utilisant un système informatisé comme décrit dans les exemples 1 et 2.
Analyse statistique multidimensionnelle des données obtenues par HMBC-GAS, a. Filtration des variables
La filtration de variables a été réalisée comme indiqué dans les exemples 1 et-2, Les variables sélectionnées sont celles qui caractérisent un cluster et qui ont le p2 le plus élevé, avec un seuil de rejet de 1 0 2@ b.
Analyse factorielle discriminante
Les 4 groupes d'animaux sont constitués de la manière suivante : - groupe 1 : témoins mâles castrés non implantés notés MC, - groupe 2 : mâles castrés traités avec 1, 2 ou 4 implants de Révalor-S notés, - groupe 3 : témoins femelles notés FC, - groupe 4 : femelles traitées avec une injection i, na, de 250 mg d'énanthate de testostérone notées
FE.
L'analyse factorielle discriminante a été effectuée sur la matrice de dimensions réduites (106 variables retenues) et est significative au seuil de 10-4 avec n = 182 individus. Une analyse de variance à un seul facteur et une comparaison de moyennes par le test de Student-Neuman-Keuls (SNK) sont réalisées pour chacune des variables assignées à un métabolite urinaire. La variabilité des quatre groupes est résumée sur les trois facteurs discriminants avec 46, 8% de l'information totale attachée au premier axe factoriel, 33, 6% au deuxième factoriel et 19,7% au troisième axe factoriel.
Au moyen de l'analyse des valeurs des corrélations canoniques entre les variables biochimiques et les axes discriminants, il apparaît que le premier axe factoriel est principalement expliqué par des métabolites tels que le TMAO, l'hippurate, le compound B, la créatinine, et la créatine, qui apparaissent comme étant relativement plus concentrés dans l'urine des femelles que dans celle des mâles indépendamment du traitement anabolisant utilisé. En revanche, le citrate est le métabolite le mieux corrélé positivement à LD1, et de ce fait est retrouvé en concentrations relativement plus importantes chez les mâles castrés par rapport aux femelles (tableau 2).
Le deuxième axe discrimine les animaux témoins (valeurs négatives) des animaux traités (valeurs positives), indépendamment du traitement hormonal administré et du sexe considéré. Ainsi, cet axe révèle une réponse globale liée au processus d'anabolisme, Bien qu'il n'y ait que peu de corrélations positives avec des entités biochimiques caractérisées, le citrate, la TMAO et l'hippurate sont les métabolites urinaires les plus corrélés à cette fonction linéaire discriminante. Ces métabolites s'opposent à la DMA, la créatine, la créatinine, le glucose et le composé B, qui sont plus caractéristiques des animaux témoins (Tableau 2).
Il apparaît clairement que la perturbation hormonale induite par les stéroïdes anabolisants influe sur la concentration des métabolites urinaires tels qu'ils ont pu être identifiés partiellement ou totalement par la technique lH-t3C HMBC/RMN et quantifiés par la même technique spectroscopique. Les métabolites urinaires ainsi décrits appartiennent donc à un ensemble dit de biomarquage, ces métabolites pouvant servir alors à construire un référentiel multidimensionnel pour discriminer des individus soumis à un traitement hormonal comparable, les données pouvant être générées par dosage conventionnel.
Tableau 2.
Corrélations canoniques, analyses de variance (ANOVA) and tests de comparaison de moyennes CSNK) pour les variables caractérisant des métabolites urinaires impliquées dans la construction des axes discriminants à partir de 106 variables
EMI28.1
<SEP> Caractérisation <SEP> des <SEP> variables <SEP> Corrélations <SEP> canoniques <SEP> (r) <SEP> ANOVA <SEP> Test <SEP> de <SEP> comparaison <SEP> de
<tb> <SEP> moyennes <SEP> (SNK)
<tb> LD1 <SEP> LD2
<tb> <SEP> #1H <SEP> #13C <SEP> FC <SEP> FE <SEP> MC <SEP> M
<tb> Probabilités
<tb> <SEP> Comnosés <SEP> #
<SEP> rang <SEP> rang <SEP> n <SEP> = <SEP> 44 <SEP> n <SEP> = <SEP> 32 <SEP> n <SEP> = <SEP> 32 <SEP> n <SEP> = <SEP> 74
<tb> <SEP> (moyenne) <SEP> (moyenne) <SEP> r <SEP> r
<tb> #r# <SEP> #r#
<tb> <SEP> A <SEP> 156 <SEP> 7,347 <SEP> 45 <SEP> -0,2720 <SEP> 51 <SEP> -0,9524 <SEP> 37 <SEP> 4,8 <SEP> 10-10 <SEP> A <SEP> C <SEP> B <SEP> C
<tb> <SEP> 270 <SEP> 7,25 <SEP> 133 <SEP> -0,5727 <SEP> 16 <SEP> -0,7998 <SEP> 82 <SEP> 8,5 <SEP> 10-Úê <SEP> A <SEP> B <SEP> B <SEP> C
<tb> <SEP> B <SEP> 275 <SEP> 7,208 <SEP> 139,2 <SEP> -0,6556 <SEP> 9 <SEP> -0,7240 <SEP> 88 <SEP> 2,9 <SEP> 10-10 <SEP> A <SEP> B <SEP> B <SEP> C
<tb> <SEP> 266 <SEP> 7,058 <SEP> 124,2 <SEP> -0,5404 <SEP> 20 <SEP> -0,8224 <SEP> 79 <SEP> 1,7 <SEP> 10-14 <SEP> A <SEP> B <SEP> B <SEP> C
<tb> <SEP> DMA <SEP> 122 <SEP> 2,757 <SEP> 38-0,0088 <SEP> 103-0, <SEP> 9964 <SEP> 6 <SEP> 4,
<SEP> 0 <SEP> 10-13 <SEP> A <SEP> B <SEP> A <SEP> B
<tb> <SEP> 7f7 <SEP> 2,633 <SEP> 78, <SEP> 3 <SEP> 0,7093 <SEP> 6 <SEP> 0,2931 <SEP> 100 <SEP> 6,1 <SEP> 10-6 <SEP> BC <SEP> C <SEP> B <SEP> A
<tb> Citrate
<tb> <SEP> 248 <SEP> 2,789 <SEP> 181,7 <SEP> 0,5649 <SEP> 17 <SEP> 0,6020 <SEP> 93 <SEP> 1,9 <SEP> 10-13 <SEP> B <SEP> B <SEP> B <SEP> A
<tb> <SEP> 180 <SEP> 3,02 <SEP> 160,2 <SEP> -0,2197 <SEP> 57 <SEP> -0,9565 <SEP> 32 <SEP> 1,6 <SEP> 10-13 <SEP> A <SEP> C <SEP> B <SEP> C
<tb> Créatine
<tb> <SEP> 111 <SEP> 3,02 <SEP> 57 <SEP> -0, <SEP> 3281 <SEP> 42-0,9073 <SEP> 55 <SEP> < <SEP> 10-16 <SEP> A <SEP> C <SEP> B <SEP> D
<tb> <SEP> 181 <SEP> 2,961 <SEP> 172, <SEP> 4-0,0024 <SEP> 106-0, <SEP> 9693 <SEP> 29 <SEP> < <SEP> 10-16 <SEP> A <SEP> B <SEP> A <SEP> B
<tb> <SEP> Créatinine <SEP> 75 <SEP> 3, <SEP> 749 <SEP> 57, <SEP> 2-0, <SEP> 2338 <SEP> 53-0,
9511 <SEP> 38 <SEP> 1,1 <SEP> 10-16 <SEP> A <SEP> C <SEP> B <SEP> C
<tb> <SEP> 283 <SEP> 7,535 <SEP> 136, <SEP> 3-0,8218 <SEP> 3-0,5070 <SEP> 97 <SEP> 8, <SEP> 6 <SEP> 10-4 <SEP> A <SEP> AB <SEP> BC <SEP> C
<tb> <SEP> 282 <SEP> 7,77 <SEP> 135 <SEP> -0, <SEP> 6063 <SEP> 12 <SEP> 0, <SEP> 7665 <SEP> 86 <SEP> 0,008 <SEP> AB <SEP> A <SEP> B <SEP> A
<tb> <SEP> 105 <SEP> 3,286 <SEP> 62, <SEP> 8-0, <SEP> 9612 <SEP> 1 <SEP> 0, <SEP> 2749 <SEP> 101 <SEP> 1, <SEP> 6 <SEP> 10-4 <SEP> BA <SEP> A <SEP> C <SEP> B
<tb> <SEP> TMAO <SEP> 106 <SEP> 3,434 <SEP> 62, <SEP> 6 <SEP> 0,2309 <SEP> 54 <SEP> 0,6061 <SEP> 92 <SEP> 1, <SEP> 110-' <SEP> B <SEP> B <SEP> B <SEP> A
<tb> <SEP> 92 <SEP> 3, <SEP> 748 <SEP> 77,7-0,4779 <SEP> 27 <SEP> -0, <SEP> 5389 <SEP> 94 <SEP> 0, <SEP> 003 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 87 <SEP> 3, <SEP> 668 <SEP> 77, <SEP> 0-0, <SEP> 4392 <SEP> 31-0,
<SEP> 8677 <SEP> 69 <SEP> 1,1 <SEP> 10-16 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 73 <SEP> 3,728 <SEP> 63, <SEP> 7-0, <SEP> 3854 <SEP> 38-0,8921 <SEP> 64 <SEP> < <SEP> 10-16 <SEP> A <SEP> C <SEP> B <SEP> BC
<tb> <SEP> 88 <SEP> 3,641 <SEP> 81, <SEP> 3-0, <SEP> 5956 <SEP> 13-0,7740 <SEP> 85 <SEP> < 10-16 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 89 <SEP> 3, <SEP> 834 <SEP> 8t, <SEP> 6-0,4771 <SEP> 28-0,8370 <SEP> 77 <SEP> 5, <SEP> 6 <SEP> 10-15 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 133 <SEP> 3,667 <SEP> 106, <SEP> 0-0,5316 <SEP> 21-0,8114 <SEP> 81 <SEP> < 10-16 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> Glucose <SEP> 99 <SEP> 3,339 <SEP> 77, <SEP> 6-0.
<SEP> 5624 <SEP> 18-0,8189 <SEP> 80 <SEP> < 10-16 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 70 <SEP> 3, <SEP> 629 <SEP> 63,5-0,4247 <SEP> 33-0, <SEP> 8719 <SEP> 66 <SEP> 3, <SEP> 9 <SEP> 10-13 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 95 <SEP> 3, <SEP> 520 <SEP> 81, <SEP> 4-0, <SEP> 5875 <SEP> 14 <SEP> -0.
<SEP> 7841 <SEP> 83 <SEP> 1, <SEP> 5 <SEP> 10-12 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 96 <SEP> 3,972 <SEP> 81, <SEP> 5,-0, <SEP> 4039 <SEP> 35-0,8969 <SEP> 60 <SEP> 1,6 <SEP> 10-11 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 103 <SEP> 4,488 <SEP> 77, <SEP> 6-0,4251 <SEP> 32-0,8694 <SEP> 67 <SEP> 8, <SEP> 1 <SEP> 10-12 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 132 <SEP> 4,369 <SEP> 105, <SEP> 8 <SEP> -0, <SEP> 4209 <SEP> 34-0, <SEP> 8603 <SEP> 71 <SEP> 1,810-15 <SEP> A <SEP> B <SEP> B <SEP> B
<tb> <SEP> 86 <SEP> 3,961 <SEP> 71,32 <SEP> -0,2383 <SEP> 52 <SEP> -0,9405 <SEP> 47 <SEP> 2,5 <SEP> 10-2 <SEP> A <SEP> C <SEP> B <SEP> BC
<tb>
La variation des valeurs entre les 4 groupes est testée par analyse de variance.
Le test de comparaison des moyennes est réalisé par le test de Student-Newman-Keuls avec l'identité des moyennes désignée par une lettre commune établie avec un risque de 5%. Les lettres A, B, C et D sont rangées par ordre décroissant des valeurs des moyennes de groupe pour chacune des variables testées.
Légendes des figures
Exemple 1
Figure 1 : Carte HMBC-GAS pour l'individu n 22 (vache de réforme), L'échelle dans la dimension horizontale correspond aux déplacements chimiques 1H. Elle s'étend sur une fenêtre de 10, 098 ppm autour de la résonance de l'eau, Le spectre projeté est celui du IH Watergate, à titre indicatif. Noter la présence du pic de l'eau fortement atténuée au centre du spectre, ainsi que la forte redondance de signaux dans cette dimension, information qui-est révélée par l'utilisation d'une technique multidimensionnelle. La seconde dimension, verticale, est la dimension 13C, dont l'échelle s'étend sur 222 ppm.
Figure 2 : Filtration de variables produites par HMBC-GAS par classification hiérarchique provenant des individus décrivant la variabilité biologique en élevage bovin. La classification hiérarchique permet de classer selon leurs corrélations les variables candidates. Les variables dont le nom est indiqué ont été retenues au terme de la filtration. L'échelle d'indices d'agrégation indiquée sur le dendrogramme correspond au coefficient de corrélation des clusters (regroupements ou singleton). Les fortes corrélations se situant en bas du dendrogramme sont essentiellement d'ordre structural. Les corrélations d'ordre physiologique se situent plus au-dessus. Il apparaît que les variables sélectionnées sont décorrélées et présentent une redondance d'information minimale.
Les variables de la classification sont explicatives de façon significative pour une probabilité de rejet de 5%. Les variables définies comme candidates sont explicatives de la structure en groupes car leur F est significatif (seuil de probabilité de rejet fixé à 1%). Sont ensuite sélectionnées itérativement celles dont le p2 est maximal. Celles qui sont linéairement corrélées à la variable sélectionnée sont alors rejetées. Ainsi, les variables sélectionnées sont explicatives de la structure en groupes et sont très peu corrélées entre elles, 18 variables ont été sélectionnées.
Figure 3 : Analyse Factorielle Discriminante à partir de variables produites par HNBC-GAS sur la variabilité biologique d'animaux de l'espèce bovine abattus. Le premier axe discriminant permet une discrimination entre les femelles et les veaux (sur la gauche), d'une part, et les mâles castrés (sur la droite) d'autre part. Cet axe discriminant explique 90% de la variabilité totale du jeu, Le deuxième axe explique 10% de la variabilité totale. Les adultes se situent en bas, les veaux en haut, ce qui correspond à une discrimination selon la maturité de l'animal.
La significativité de la discrimination est calculée par le test ? de Wilks, qui donne la probabilité pour que la discrimination observée soit due au hasard. Dans ce cas, elle est de 0,0001.
Légendes des groupes
F : vaches de réforme,
Mc : mâles castrés âgés de 3-4 ans,
V : veaux de moins d'un an.
S Exemple 2
Figure 4 : Carte HMBC-GAS pour l'individu 4463 traité par 4 implants de Revalor-S. La mesure est effectuée sur l'urine collectée à l'abattage. L'animal étudié a été implanté avec une quadruple dose pendant 90 jours. L'échelle dans la dimension horizontale correspond aux déplacements chimiques'H. Elle s'étend sur une fenêtre de 10,098 ppm autour de la résonance de l'eau. Le spectre projeté est celui du'H Watergate, à titre indicatif. Noter la présence du pic de l'eau fortement atténué au centre du spectre, ainsi que la forte redondance de signaux dans cette dimension, information qui est révélée par l'utilisation d'une technique multidimensionnelle.
La seconde dimension, verticale, est la (limension 13C, dont l'échelle s'étend sur 222 ppm.
Figure 5 : Filtration de variables produites par HIvIBC-GAS par classification hiérarchique des variables candidates, recoupée avec une analyse des corrélations partielles sur le jeu traitements stéroïdiens . La classification hiérarchique permet de classer selon leurs corrélations les variables candidates. Les variables dont le nom est indiqué ont été retenues au terme de la filtration. L'échelle. d'indices d'agrégation indiquée sur le dendrogramme correspond au coefficient de corrélation des clusters (regroupements ou singleton). Les fortes corrélations se situant en bas du dendrogramme sont essentiellement d'ordre structural. Les corrélations d'ordre physiologique se situent plus audessus.
II apparaît que les variables sélectionnées sont décorrélées et présentent une redondance d'information minimale.
Les variables définies comme candidates sont explicatives de la structure en groupes car leur valeur de F est significative (seuil de probabilité de rejet 59 ont ensuite sélectionnées itérativement celles dont le pz est maximal. Celles qui sont linéairement corrélées à la variable sélectionnée sont alors rejetées. Ainsi, les variables sélectionnées sont explicatives de la structure en groupe et sont très peu corrélées entre elles, 10 variables ont ainsi été sélectionnées.
Figure 6 : Signature biologique de traitements anabolisants par Analyse Factorielle Discriminante à partir de variables produites par HMBC-GAS. Le premier axe discriminant permet une discrimination entre animaux témoins (sur la gauche), d'une part, et animaux traités aux anabolisants (Revalor@-S) depuis 90 jours (sur la droite) d'autre part. Cet axe discriminant explique 69% de la variabilité totale du jeu. Le deuxième axe explique 24% de la variabilité totale, et correspond à une discrimination selon la dose implantée, c'est-à-dire selon le gradient d'intensité du. traitement anabolisant. Le troisième axe (non représenté) explique les derniers 7% de variabilité.
La significativité de la discrimination est calculée par le test 1-due Wilks, qui donne la probabilité pour que la discrimination observée soit due au hasard. Dans ce cas, elle est de 0,0001.
Légende des groupes :
T : animaux témoins non implantés, 1 : animaux ayant subi un traitement anabolisant avec 1 implant de stéroïdes, 2 : animaux ayant subi un traitement anabolisant avec 2 implanis de stéroïdes, 4 : animaux ayant subi un traitement anabolisant avec 4 implants de stéroïdes.
> Exempte 3 :
Figure 7 : Empreintes Py-MAB/Tof MS N2* d'urines de bovins : a) urine de l'individu mâle témoin n 4506 prélevée au bout de 10 jours, b) urine de l'individu mâle traité n 4463 implanté au Revalor-S avec 4 doses, prélevée à l'abattage. L'échelle dans la dimension horizontale correspond aux masses nominales égales au rapport de la masse moléculaire sur la charge de l'analyte (m/z), exprimée en Th. La gamme de masse balayée varie de m/z 55 à m/z 800 Th. Noter la décroissance de l'empreinte aux alentours de 350 Th, correspondant aux fragments d'analytes de plus haute masse.
Figure 8 : Résultat de la filtration de variables pour les variables candidates situées dans la gamme m/z 55-m/z 350 Th à partir d'empreintes MAB-Tof/MS N2*. Les légendes correspondent aux variables retenues avec un seuil de rejet de 1%. Les corrélations entre variables introduites sont représentées par un dendrogramme, dont l'indice d'agrégation correspond à 1--pur, sr étant le coefficient de corrélation entre les deux clusters (ou singletons) analysés. Les fortes corrélations qui se situent en. bas du dendrogramme sont d'ordre instrumental, et celles plus au-dessus sont d'ordre physiologique. Les variables sélectionnées sont régulièrement distribuées dans les clusters.
Le caractère informatif provient de la probabilité de rejet inférieure à 1% et de leur relative décorrélation, du fait que ces variables explicatives sont ensuite sélectionnées itérativement sur la base de leur p2 de manière à rejeter les variables linéairement corrélées au sous-espace déjà sélectionné, 9 variables ont été sélectionnées dans ce jeu de données.
Figure 9 : Signature biologique de traitements anabolisants par Py-MAB-Tof/MS N2*et Analyse
Factorielle Discriminante. Le premier axe (56%) permet la discrimination entre animaux témoins et animaux implantés avec des implants de Revalor@-S depuis 90 jours. Le second axé, expliquant 23% de la variabilité totale, correspond à une discrimination des animaux traités selon le nombre d'implants apportés. Le dernier axe (non représenté) explique les derniers 21% de variabilité, lié au caractère simple ou redoublé de l'administration dans le temps. Les axes sont significatifs au seuil de 0,0001.
Légende des groupes :
C : animaux témoins non implantés 1 : animaux ayant subi un traitement anabolisant avec 1 implant de stéroïdes, 2 : animaux ayant subi un traitement anabolisant avec 2 implants de stéroïdes, 4 : animaux ayant subi un traitement anabolisant avec 4 implants de stéroïdes.
> Exemple 4 :
Figure 10 : Spectre 1H-13C-HMBC et spectre 1rI d'une urine enregistrée à 303K. L'attribution des déplacements chimiques des principaux métabolites urinaires identifiés est indiquée sur la figure 2D.
Références bibliographiques Beckwith-Hall BM, Nicholson JK, Nichols AW, Foxall PJD, Lindon JC, Connor SC, Abdi M,
Connelly J & Holmes E. Nuclear magnetic resonance spectroscopic and principal component analysis investigations into biochemical effects of three model hepatotoxins. Chem. Res. Toxicol.
(1998) 11,260-272.
Daeseleire EAI, De Guesquière A & van Peteghem CH. Multiresidue analysis of anabolic agents in muscle tissues and urines of cattle by GC-MS. J Chromatogr Sci (1992) 30, 409-414.
Degand G, Schmitz P & Maghuin-Rogister G. Enzyme immunoassay screening procedure for the synthetic anabolic estrogens and androgens, diethylstiltestrol, nortestosterone, methyltestosterone and trenbolone in bovine. J Chromatogr (1989) 489,235-243.
Ferchaud V, Le Bizec B, Monteau F & André F. Determination of the exogenous character of testosterone in bovine urine by gas-chromatography-combustion-isotope-ratio mass spectrometry.
Analyst (1998) 123,2617-2620.
Gatti GC, Zoboli G, Zuchi M Ramazza V & Cantoni C IDiXaary excretion of androstenedione in cattle as an indicator of possible illegal use iii livestock breeding. Anal Chim Actcl (1993) 275,105112.
Hartwig M, Hartman S & Steinhart H Physiological quantities of naturally occurring steroid hormones (androgens & progestogens), precursors and metabolites in beef of differing sexual origin. Z Lebensm Unters Forsch A (1997) 205,5-10.
Hurd RE and John BK. Gradient-Enhanced Proton-Detected Heteronuclear Multiple Quantum
Coherence Spectroscopy. Journal of Magnetic Resonance (1991) 91 : 648-653.
Lebart L, Morineau A & Piron M. Statistique exploratoire multidimensionnelle. 2, d Edition, 1998,
Dunod, Paris.
Mac Lachlan GJ. Discriminant analysis and statistical pattern recognition, 1992, John Wiley &
Sons, NY.
Massé R, Ayotte C & Dugal R. Studies on anabolic steroids. I integrated methodological approach to the gas chromatography-mass spectrometric analysis of anabolic steroid metabolites in urine. J Chrontcltogl (1989) 489 (1), 23-50.
Nadal L, Leray G, Desbarats C, Darcel F, Bansard JY, Bondon A & de Certaines JD, Proton and phosphorus magnetic nuclear resonance spectroscopy of human brain tumor extracts with automated data classification : a preliminary study. Cell. lvlot. Biot (1997) 43,659-673.
Piotto M, Saudek V & Sklenar V. Gradient-tailored excitation for single quantum NMR in aquous solutions. JBiomol NMR (1992) 2 (6), 661-665
Ripley BD. Pattern Recognition and Neural Networks, 1996, Cambridge University Press,
Cambridge.
Scippo ML & Maghuin-Rogister G. Methods of detection and surveillance of natural sex steroid hormones, in Scientific conference on growth promotion in meat production, Europan commission, directorate general VI Agriculture, Bruxelles, Belgique, 29/11 to 1/12/1995, 541-566.
Scippo ML, Gaspar P, Degand G, Brose F & Maghuin-Rogister G. Control of the illegal administration of natural steroid hormones in urine and tissues of veal calves and in plasma of bulls.
Analytica Chimica Acta (1993) 275,57-74.
Somorjai RL, Nikulin AE, Pizzi N, Jackson D, Scarth G, Dolenko B, Gordon H, Russell P, Lean
CL, Delbridge L, Mountford CE & Smith ICP. Computerized consensus diagnosis : A classification strategy for the robust analysis of MR spectra. I Application to 1H spectra of thyroid neoplasms.
Magnetic Resonance in Medicine (1995) 33,257-263.
Tate AR, Watson D, Eglen S, Arvanitis TN, Thomas EL & Bell JD. Automated feature extraction for the classification of human in vivo 13 C spectra using statistical pattern recognition and wavelets. ilsIag7leíic Resonance in Medicine (1996) 35, 834-840.
Van Ginkel LA, Stephany R, Spaan A & Sterk SS. Bovine blood analysis for natural hormones : an overview of analytical strategies. Arralytica Chin ? ica Acta (19 3) 275,75-80.
Venables WN & Ripley BD. Modern Applied Statistics with S-PLUS. Edition, 1999, Springer
Verlag, NY Vogels JWTE, Arts CJM, Tas AC, van Baak MJ & van der Greef J. Application of proton nuclear magnetic resonance spectroscopy and multivariate analysis as an indirect screening method for monitoring the illegal use of growth promoters. in EuroResidue III, 6-8 may 1996, Veldhoven,
Pays-Bas, 968-972.
Claims
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP02710987A EP1368641A1 (fr) | 2001-01-12 | 2002-01-11 | Procede de discrimination avec reperage et/ou identification de situations de pertubations biologiques par spectrometrie et reconnaissance de forme |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR01/00422 | 2001-01-12 | ||
| FR0100422A FR2819591A1 (fr) | 2001-01-12 | 2001-01-12 | Procede de discrimination avec reperage et/ou identification de situations de perturbations biologiques par spectrometrie et reconnaissance de forme |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2002056000A1 true WO2002056000A1 (fr) | 2002-07-18 |
Family
ID=8858772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/FR2002/000117 Ceased WO2002056000A1 (fr) | 2001-01-12 | 2002-01-11 | Procede de discrimination avec reperage et/ou identification de situations de pertubations biologiques par spectrometrie et reconnaissance de forme |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP1368641A1 (fr) |
| FR (1) | FR2819591A1 (fr) |
| WO (1) | WO2002056000A1 (fr) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104713895A (zh) * | 2015-03-13 | 2015-06-17 | 中国科学院武汉物理与数学研究所 | 基于氢核磁共振结合偏最小二乘法鉴别蜂蜜真假的方法 |
| CN106018452A (zh) * | 2016-04-29 | 2016-10-12 | 大连工业大学 | 一种基于核磁共振技术的花生品种无损检测方法 |
| CN107703173A (zh) * | 2017-06-23 | 2018-02-16 | 孟扬 | 一种基于1h‑nmr数据库的珍贵植物木材的鉴定装置及方法 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| BRPI0501384A8 (pt) * | 2005-04-15 | 2017-02-14 | Cesar Abib Fernando | processo de validação estatística de amostras e analítico de células endoteliais da córnea |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5318031A (en) * | 1990-07-23 | 1994-06-07 | Bruker Analytische Messtechnik Gmbh | Method and apparatus for determining chemical states of living animal or human tissue using nuclear magnetic resonance |
| WO1996018911A1 (fr) * | 1994-12-16 | 1996-06-20 | Conseil Interprofessionnel Du Vin De Bordeaux | Procede d'identification d'especes vegetales et de leurs hybrides |
| WO2000047992A1 (fr) * | 1999-02-10 | 2000-08-17 | Oxford Natural Products Plc | Procede de controle de qualite et de standardisation pour produits a base de plantes medicinales |
| WO2000065472A1 (fr) * | 1999-04-26 | 2000-11-02 | Surromed, Inc. | Systeme d'identification du phenotype et du marqueur biologique |
-
2001
- 2001-01-12 FR FR0100422A patent/FR2819591A1/fr active Pending
-
2002
- 2002-01-11 EP EP02710987A patent/EP1368641A1/fr not_active Withdrawn
- 2002-01-11 WO PCT/FR2002/000117 patent/WO2002056000A1/fr not_active Ceased
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5318031A (en) * | 1990-07-23 | 1994-06-07 | Bruker Analytische Messtechnik Gmbh | Method and apparatus for determining chemical states of living animal or human tissue using nuclear magnetic resonance |
| WO1996018911A1 (fr) * | 1994-12-16 | 1996-06-20 | Conseil Interprofessionnel Du Vin De Bordeaux | Procede d'identification d'especes vegetales et de leurs hybrides |
| WO2000047992A1 (fr) * | 1999-02-10 | 2000-08-17 | Oxford Natural Products Plc | Procede de controle de qualite et de standardisation pour produits a base de plantes medicinales |
| WO2000065472A1 (fr) * | 1999-04-26 | 2000-11-02 | Surromed, Inc. | Systeme d'identification du phenotype et du marqueur biologique |
Non-Patent Citations (9)
| Title |
|---|
| C.BEAUGRAND ET AL.: "Detection of Toxins in Environmental Samples Using Py-MAB-Tof", 48TH ANNUAL CONFERENCE OF THE AMERICAN SOCIETY FOR MASS SPECTROMETRY (ASMS), 2000, SESSION CODE TPH, SLOT 252, XP002198727 * |
| E HOLMES ET AL: "Automatic Data Reduction and Pattern Recognition Methods for Analysis of H-1 Nuclear Magnetic Resonance Spectra of Human Urine from Normal and Pathological States", ANALYTICAL BIOCHEMISTRY,ACADEMIC PRESS, SAN DIEGO, CA,US, vol. 220, August 1994 (1994-08-01), pages 284 - 296, XP002120595, ISSN: 0003-2697 * |
| EL-DEREDY W: "Pattern recognition approaches in biomedical and clinical magnetic resonance spectroscopy: a review", NMR IN BIOMEDICINE, MAY 1997, WILEY, UK, vol. 10, no. 3, pages 99 - 124, XP001008095, ISSN: 0952-3480 * |
| GOODACRE ROYSTON ET AL: "Rapid identification of urinary tract infection bacteria using hyperspectral whole-organism fingerprinting and artificial neural networks.", MICROBIOLOGY (READING), vol. 144, no. 5, May 1998 (1998-05-01), pages 1157 - 1170, XP001069089, ISSN: 1350-0872 * |
| M.PASCAL ET AL.: "An Integrate Benchtop Mass Spectrometer for Pyrolytic Analysis of Complex Chemical and Biological Systems", 47TH ANNUAL CONFERENCE OF THE AMERICAN SOCIETY FOR MASS SPECTROMETRY (ASMS), 1999, SESSION CODE WPD, SLOT 088, XP002198728 * |
| SCHMIDT M A E ET AL: "Characterisation of milk samples with various whey protein contents by pyrolysis-mass spectrometry (Py-MS).", FOOD CHEMISTRY, vol. 65, no. 1, April 1999 (1999-04-01), pages 123 - 128, XP002198725, ISSN: 0308-8146 * |
| SPRAUL M ET AL: "Automatic reduction of NMR spectroscopic data for statistical and pattern recognition classification of samples.", JOURNAL OF PHARMACEUTICAL AND BIOMEDICAL ANALYSIS, vol. 12, no. 10, 1994, pages 1215 - 1225, XP001007980, ISSN: 0731-7085 * |
| WARNE MARK A ET AL: "An NMR-based metabonomic investigation of the toxic effects of 3-trifluoromethyl-aniline on the earthworm Eisenia veneta.", BIOMARKERS, vol. 5, no. 1, January 2000 (2000-01-01), pages 56 - 72, XP001008018, ISSN: 1354-750X * |
| WILDOM I D WADE K E ET AL: "ANALYSIS OF BIOLOGICAL FLUIDS BY HIGH-FIELD NUCLEAR MAGNETIC RESONANCE SPECTROSCOPY", TRAC, TRENDS IN ANALYTICAL CHEMISTRY,GB,ANALYTICAL CHEMISTRY. CAMBRIDGE, vol. 8, no. 10, 1 November 1989 (1989-11-01), pages 368 - 374, XP000086051, ISSN: 0165-9936 * |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104713895A (zh) * | 2015-03-13 | 2015-06-17 | 中国科学院武汉物理与数学研究所 | 基于氢核磁共振结合偏最小二乘法鉴别蜂蜜真假的方法 |
| CN104713895B (zh) * | 2015-03-13 | 2017-01-18 | 中国科学院武汉物理与数学研究所 | 基于氢核磁共振结合偏最小二乘法鉴别蜂蜜真假的方法 |
| CN106018452A (zh) * | 2016-04-29 | 2016-10-12 | 大连工业大学 | 一种基于核磁共振技术的花生品种无损检测方法 |
| CN107703173A (zh) * | 2017-06-23 | 2018-02-16 | 孟扬 | 一种基于1h‑nmr数据库的珍贵植物木材的鉴定装置及方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1368641A1 (fr) | 2003-12-10 |
| FR2819591A1 (fr) | 2002-07-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Savorani et al. | A primer to nutritional metabolomics by NMR spectroscopy and chemometrics | |
| Assfalg et al. | Evidence of different metabolic phenotypes in humans | |
| Emwas et al. | NMR-based metabolomics in human disease diagnosis: applications, limitations, and recommendations | |
| Bonnier et al. | Understanding the molecular information contained in principal component analysis of vibrational spectra of biological systems | |
| Howells et al. | An investigation of tumor 1H nuclear magnetic resonance spectra by the application of chemometric techniques | |
| US20100173346A1 (en) | Methods for detecting coronary artery disease | |
| Balog et al. | Metabonomic investigation of human Schistosoma mansoni infection | |
| Capati et al. | Diagnostic applications of nuclear magnetic resonance–based urinary metabolomics | |
| Diem | Comments on recent reports on infrared spectral detection of disease markers in blood components | |
| Basoglu et al. | NMR‐Based Plasma Metabolomics at Set Intervals in Newborn Dairy Calves with Severe Sepsis | |
| EP2569628B1 (fr) | Procédé d'évaluation toxicologique, procédé de criblage toxicologique et système associé | |
| Jones et al. | An introduction to metabolomics and its potential application in veterinary science | |
| Schmitt et al. | Food profiling: determination of the geographical origin of walnuts by 1H NMR spectroscopy using the polar extract | |
| Zhang et al. | Artificial intelligence based discovery of the association between depression and chronic fatigue syndrome | |
| Zhang et al. | Age estimation of Phormia regina pupae based on ATR-FTIR and chemometrics | |
| WO2002056000A1 (fr) | Procede de discrimination avec reperage et/ou identification de situations de pertubations biologiques par spectrometrie et reconnaissance de forme | |
| Holman et al. | A nondestructive technique for the sex identification of third instar Cochliomyia macellaria larvae | |
| Cao et al. | Efficient discrimination of some moss species by fourier transform infrared spectroscopy and chemometrics | |
| CN107884431B (zh) | 基于1h-nmr的代谢组学鉴别鲜鹿茸与热炸茸的方法 | |
| del-Valle et al. | The impact of scan number and its preprocessing in micro-FTIR imaging when applying machine learning for breast cancer subtypes classification | |
| CN113887826B (zh) | 一种基于核磁共振氢谱技术的大鼠死亡时间推断方法 | |
| McKenzie et al. | Peak fitting in 2D 1H–13C HSQC NMR spectra for metabolomic studies | |
| Ferguson et al. | Weakly supervised anomaly detection coupled with Fourier transform infrared (FT-IR) spectroscopy for the identification of non-normal tissue | |
| Kaiser et al. | Metabolic profiling | |
| Huang et al. | Rapid quantitative typing spectra model for distinguishing sweet and bitter apricot kernels |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| AK | Designated states |
Kind code of ref document: A1 Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZW |
|
| AL | Designated countries for regional patents |
Kind code of ref document: A1 Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG |
|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
| DFPE | Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101) | ||
| WWE | Wipo information: entry into national phase |
Ref document number: 2002710987 Country of ref document: EP |
|
| REG | Reference to national code |
Ref country code: DE Ref legal event code: 8642 |
|
| WWP | Wipo information: published in national office |
Ref document number: 2002710987 Country of ref document: EP |
|
| NENP | Non-entry into the national phase |
Ref country code: JP |
|
| WWW | Wipo information: withdrawn in national office |
Country of ref document: JP |
|
| WWW | Wipo information: withdrawn in national office |
Ref document number: 2002710987 Country of ref document: EP |