WO2018050802A1 - Method for classifying spectra of objects having complex information content - Google Patents
Method for classifying spectra of objects having complex information content Download PDFInfo
- Publication number
- WO2018050802A1 WO2018050802A1 PCT/EP2017/073236 EP2017073236W WO2018050802A1 WO 2018050802 A1 WO2018050802 A1 WO 2018050802A1 EP 2017073236 W EP2017073236 W EP 2017073236W WO 2018050802 A1 WO2018050802 A1 WO 2018050802A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- spectra
- classification
- classifiers
- series
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
- G01J3/28—Investigating the spectrum
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0059—Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
- A61B5/0075—Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence by spectroscopy, i.e. measuring spectra, e.g. Raman spectroscopy, infrared absorption spectroscopy
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/02—Food
- G01N33/08—Eggs, e.g. by candling
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/02—Food
- G01N33/08—Eggs, e.g. by candling
- G01N33/085—Eggs, e.g. by candling by candling
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6486—Measuring fluorescence of biological material, e.g. DNA, RNA, cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1293—Using chemometrical methods resolving multicomponent spectra
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Definitions
- the invention relates to a method for classifying spectra of objects having a complex information content with at least two different object information, in particular of optical molecular spectra for the assignment of the object information.
- Optical molecular spectra have a high information content about the molecular properties of the examined object.
- vibration spectra are considered to be the fingerprint of molecules because of their high information density over the molecular structure.
- Chemometrics also multivariate methods used in higher-dimensional data.
- the supported classification methods are distinguished from other methods by a higher accuracy in the detection and quantitative evaluation of the information sought.
- a classifier 50 is calculated by means of a training set 19, which consists of representative spectra with assigned properties.
- the classifier 50 is then evaluated on the basis of an independent test set 29, i. the spectra are not used to construct the classifier 50, as shown in FIG. 4 a, validated and evaluated for validation, and achieved a classified test set 24.
- the construction of the classifier 50 by means of the training set 19 is performed by a test set 29 with e.g. a maximum of 30% of the spectra (dashed line to the created classifier) is verified according to FIG. 4 b, so that, as a result, a classified test set 24 (dashed line from the classifier 50) to the classified test set 24 is achieved.
- a general problem of the supported classification methods is the trade-off between the accuracy of the assignments obtained and the robustness of the classification. Often very high accuracies can only be achieved with a so-called overtraining of the classifier. This means that the classifier can only correctly assign certain spectra, with very high accuracy. By contrast, even the slightest deviation or interference leads to a dramatically reduced accuracy of the Classification. An attempt is therefore made to adapt between best possible classification and high robustness of the classification.
- the basic approach is the parallelization of the classification across different decision trees.
- the Random Forest method is based on a network of uncorrelated decision trees, where the decision trees are grown by randomization during the training process. Every so-called tree makes a decision. The group of trees with the most identical decisions determines the result of the classification, ie the assignment of the spectrum.
- the Random Forest method can not respond to different disturbances or variations in the spectra. Again, by putting up too many trees, overtraining can occur.
- the document US20120321 174 A1 describes a classification method based on the Random Forest method for image evaluation. This supported classification method is designed to take into account, in particular, small but relevant features for classification.
- optical in-ovo spectra are often characterized by a very high natural variability, which clearly overlap the comparatively small signals of gender information.
- the document WO 2010/150265 A describes a method based on a coloring, in particular of the feathers of the developed embryo. The method is based on the fact that in the advanced stage of development (day 12 of incubation), the color of the feathers in certain breeds of chicken allows conclusions about the sex. The evaluation is carried out with an algorithm for classification. Furthermore, the document WO 2014/021715 A2 describes a method in which the sex of the embryo is determined by means of endocrinological analysis.
- the document DE 10 2007 013 107 A1 describes the application of Raman spectroscopy for sexing of birds, wherein generally cell-containing material is examined. However, no method for in ovo sex determination is described.
- the molecular spectra are registered by means of methods and devices according to the following publications: A method and apparatus for determining the sex of chicken eggs, based on the optical, preferably fiber-coupled spectroscopy are described in the document DE 10 2010 006 161 B3. However, no methods for spectral analysis and classification are described
- the documents DE 10 2014 010 150 A1 and WO 2016/000678 A1 describe methods and devices for Raman spectroscopy in ovo sex determination.
- the evaluation of the spectra can advantageously be carried out using chemometric methods.
- Document EP 2 336 751 A1 describes a method for determining the sex of bird eggs.
- the germinal disc of an egg is illuminated with light and the emitted fluorescence detected time-resolved.
- the recognition of the gender is done by means of a supported classification, whereby a classifier is calculated by means of the method of the fractal dimension.
- the document US 6 029 080 B describes a method for in ovo sex determination. From the analysis of MRI images of the egg, the sexual organs can be identified and used for sex determination at a certain developmental stage of the embryo.
- the drawbacks are that in order to safely extract the searched gender information from the registered spectra, therefore, the use of only a single classifier is insufficient to consider the recognition certainty of the particular sex information sufficient. Rather, the variable influences and the variations in the biochemical composition of the egg as well as in the different stages of development. In order to incorporate this large range of variations in a recognition-proof method for classification, it is estimated that therefore the calculation of only one classifier will not be sufficient.
- the invention is therefore based on the object of specifying a method for the classification of spectra of objects with complex information content, which is designed so that a maximum accuracy of the determination of the associated selected features of objects is achieved, at the same time at least maintain the stability of the classification should stay.
- a maximum accuracy of the determination of the associated selected features of objects is achieved, at the same time at least maintain the stability of the classification should stay.
- an adaptation between best possible classification and high robustness of the classification should be sought.
- an overtraining of the classifier should be avoided.
- a multiple classification method is carried out with at least two different methods of data pretreatment of spectral data and a classification method associated with the respective data pretreatment.
- the recording, determination and storage of spectra and the generation of spectra are intended to include the registration of spectra digitized signals are available for storage, which are available for the further data pretreatment of the spectral data.
- the data pre-treatments generate different corrected pretreated spectra with many data points, which are assigned to at least one classification procedure.
- Classifiers in the determination of a classification result.
- both the circumference of the spectral data points vs and the double half width of the spectral regions ws and the number of selected spectral regions R s for the classification in equation (I ) considered:
- Equation (I) ensures that each data point v can be selected with equal probability.
- the data points belonging to a circumference of the spectral data points can also be weighted.
- At least one of the spectral pretreatments is structured in such a way that particular features emerge and other specific features are suppressed, so that different characteristics are used for the classification.
- At least one pretreatment of spectra can be designed with the same specific features and at least one of the abovementioned spectral pretreatments with differently determined characteristics can be used for the classification.
- the pretreated spectra can be interpreted as variable training sets, and several classifiers of the series or classifiers are determined and validated iteratively.
- the classification is to be understood as the classification of the pretreated spectra into a respective class determined according to a predetermined algorithm.
- the method of classification is carried out with the aid of predetermined parameters and the result of the classification is expressed by a calculated classifier.
- At least one supported classification and / or non-assisted classification method may be used to select spectral regions or single wavelength ranges and subsequent analysis.
- a linear or nonlinear discriminant analysis can be used.
- methods of neural networks and / or a method of linear time-frequency transformations English: Wavelets
- the spectra of optical molecular spectroscopy such as absorption, emission, scattering or UV / vis, NIR, IR absorption, fluorescence or Raman, can be classified here.
- data pre-treatments of the registered spectral data or raw spectra baseline corrections, normalizations, derivatives, covariance and / or a principal component analysis can be used.
- a calculation of a median or a performance of a cluster analysis can be provided.
- the median or central value is given as an average for distributions in the statistics.
- the median of a list of numeric values is the value that is at the middle (central) location when the values are sorted by size.
- the value of the size here represents in each case the point value of a classifier or the probability of the class membership determined by the classifier.
- any bird eggs optionally chicken eggs can be used and as object information can be used in a specific application, the dual information about the female or the male sex.
- the method thus includes steps for performing a multiple classification based on different conventional evaluation methods after a spectral detection and registration downstream Spectral pretreatment and a subsequent multiple calculation of different classifiers.
- at least one spectra pretreatment is involved, in which the spectral pretreatment is structured in such a way that, taking into account the equivalence of features, consideration of particular features is more pronounced and other features are more strongly suppressed.
- the pretreated spectra are now designed as a training set, whereby several series of classifiers are calculated. The classifiers are calculated and validated iteratively. In this way several classifiers can be determined. The spectra of the test set are subsequently classified with all classifiers.
- the classification of the spectra into a specific class of object information / features is preferably done as a score or an expression of a class membership probability.
- the relationships within the classifiers are determined.
- a simple means for ratio representation is this, for example, a calculation of the median or a cluster analysis.
- At least one detecting optical device having at least one spectrometer and / or further detectors for recording and registering the spectra
- a unit for generating digitized signals in the form of data points that realize the spectra A unit for generating digitized signals in the form of data points that realize the spectra.
- Storage units for storing the registered spectra in the classification units / groups of an evaluation unit comprising the classification units, - units for spectral pretreatment, in which the registered spectra are individually pretreated in the individual storage units and the associated digitized evaluated signals - the data points determined - are made available for further processing,
- a unit for classifying the pretreated spectra into at least one dual class - in chickens male or female - of object (egg) information with an expression of probability
- a rating unit for calculating the classification result e.g. in the form of the median or by performing a cluster analysis to determine the probability of at least one of the dual class - in chickens: female or male - associated
- FIG. 1 is a schematic block diagram of a method according to the invention for the classification of spectra of objects with complex Information content, in particular of optical molecular spectra for the assignment and determination of dual object information, the method being implemented as a multiple classification method
- FIG. 2a a schematic representation of a single classification procedure with spectral pretreatment: raw spectra, taking all features into consideration as equal (circles of equal size),
- 2b shows a schematic representation of a single classification method with spectral pretreatment: linear baseline correction, with a favored large feature circle of the fluorescence intensity and several less relevant small feature circles,
- Fig. 2c is a schematic representation of a single classification method with spectra pretreatment: normalization, with a favored large
- 2d is a schematic representation of a single spectrally pretreatment classification method: Raman spectra, with a favored large feature set of molecular composition and several less relevant small feature circles.
- Fig. 3a is a schematic representation of the Rohspektrum classification method associated spectra of FIG. 2a, wherein the punctured
- Spectrum is assigned to the female chicken egg spectrum
- 3b shows a schematic representation of the spectra associated with the linear baseline correction classification method according to FIG. 2b, the dotted spectrum being associated with the female chicken egg spectrum;
- 3c shows a schematic representation of the spectra associated with the nomination classification method according to FIG. 2c, wherein the dotted spectrum is assigned to the female chicken egg spectrum,
- FIG. 3d shows a schematic representation of the spectra associated with the Raman spectrum classification method according to FIG. 2d, wherein the dotted spectrum is assigned to the female hen's egg spectrum
- FIG. 4a a schematic representation of the sequence of a classification with FIG
- 4b shows a flowchart for the multiple classification method according to the invention with training set and test set in algorithmic connection with classification result design from a large number of classifiers
- FIG. 5 is a schematic representation of a probability / classifier column representation for twenty classifiers of FIG. 1 for a chicken egg used as an example, with the one above the dashed line.
- FIG. 5 is a schematic representation of a probability / classifier column representation for twenty classifiers of FIG. 1 for a chicken egg used as an example, with the one above the dashed line.
- FIG. 6 is a plan view of the pillar representation of an egg according to FIG. 5 and a possible view on a display
- FIG. 7 shows a probability (female) / classifier number representation with the indication of the calculated median for an egg with the 20 classifiers according to FIG. 6, wherein a bold-dashed separation limit at 0.5 .mu.m
- Figure 8 is a schematic representation of a probability / classifier number column representation for an egg for an optional 120 classifiers, where the end portions of the columns above the bold dashed line boundary are the female gender of an egg and the end portions of the columns below the fat dashed separation limit
- FIG. 9 shows a representation of the calculated median, shown dashed, for an egg recognized as female with the 120 classifiers according to FIG. 8 in a probability / classifier number representation, FIG.
- Fig. 10a is a schematic representation of a single
- Spectral Pretreatment Classification Procedure Raw spectra, taking into account all features as equal, with eight selected spectral regions Rsi to Rse at a spectral data point per area spectral range between wavenumbers 570 cm “1 to 2750 cm “ 1 to determine the number of classifiers per data pretreatment,
- FIG. 10 c shows an enlarged detail (11) of the data point representation in FIG
- FIG. 1 a is a representation of the calculated median, shown dashed, for an egg recognized as male with the 120 classifiers similar to the one in a probability / classifier number representation
- FIG. 11b shows a first histogram representation of the dependence between the number of elements of the cluster and the center of gravity of the cluster
- FIG. 11c shows a second histogram representation of the dependence between the FIG
- FIG. 1 is a schematic block diagram of a method 1 according to the invention for classifying spectra 4 of an object 2 having a complex information content with at least two / dual and different object information / features, in particular optical molecular spectra 4 for assigning object information / features 3 a probable determination of example dual object information 31, 32 is shown.
- Bird eggs for example chicken eggs
- FIG. 1 For this purpose, a block-wise sequence of the method 1 according to the invention is shown in FIG.
- the calculation of a classifier takes place.
- the following steps are carried out after registration and data pretreatment of the spectra, the steps relating to FIG. 1:
- the spectral pretreatments 6, 7, 8 can be structured in accordance with FIGS. 2b, 2c, 2d such that particular features are favored and stand out and other features are suppressed.
- the pretreated spectra 4 are designed as a training set 24 according to FIG. 4b and several classifiers of the series 13, 14, 15, 16 or eg in detail for series 13 the classifiers 131, 132, 133, 134, 135, etc.
- At least two of the determined classifiers can be obtained as a whole 131, 141, 151, 161 for the evaluation and the subsequent determination of a probability result 18 with respect to the predetermined different object information 31, 32 achieved and are used, wherein the probability result 18 is output, so that a conclusion is made possible at least on the highest value determined object information 31 or 32.
- At least one method of supported classification and / or unsupported classification may be used to select spectral regions R s or single wavelength ranges / wavenumber ranges and subsequent analysis.
- the subsequent analysis may be a linear discriminant analysis or a non-linear discriminant analysis.
- the spectra 4 of the optical molecular spectroscopy such as absorption, emission, scattering or UV / vis, NIR, IR absorption, fluorescence, Raman can be classified by the method according to the invention.
- raw spectra 25, baseline corrections 26, normalizations 27, derivatives, covariance and / or a principal component analysis / Raman spectra 28 can be defined and used.
- a data pretreatment consists in the formation of digital signals, that is to say of data points which, when lined up, yield the respective calculated spectral curve of 25, 26, 27, 28 and which can thus be assigned to the individual different classification methods used.
- a calculation of a median 30 (FIG. 7, 9, 11 a) for an object 2 or a feedthrough (FIG a, Fig. 1 1 b) are provided a cluster analysis.
- the known k-means cluster analysis can be used. In this case, at least two clusters for "male” or "female” are given in FIG. 11a.
- a cluster is a group of composite elements with similar properties (here: probabilities - classification results).
- FIG. 11 c a second histogram representation 44 of the dependence between the number of elements of the cluster and the center of gravity of the cluster, whereby the achieved classification results apply as elements.
- the method 1 according to the invention can be realized by means of the following steps using hardware components of an associated device:
- Spectral pretreatment 5 6, 7, 8, in that the stored spectra 4 consisting of the data points vs are evaluated individually in the individual storage units and the associated digitized evaluated signals are made available for further processing,
- test set 29 with e.g. verified as a maximum of 30% of the spectra (dashed line to the classifiers 13, 14, 15, 16) according to FIG. 4b, so that as a result a classified test set 24 (broken line from the classifiers of the series 13, 14, 15, 16 to the classified Test set 24) is achieved.
- FIG. 2 a shows a schematic representation of the raw spectra 25 as one of all considered individual classification methods in FIG. 1 of the four individual classification methods.
- Three classes / features 20, 21, 22 of the four classes / features 20, 21, 22, 23 contain gender-relevant information. However, it is not possible to eliminate the variation 23 of the physical parameters from the spectra 4 such that no or only a small loss of information arises in the three other classes 20, 21, 22.
- the raw spectra 25 thus have the highest content of all information, but also the highest content of disturbances due to the equality of all certain characteristics.
- said data pre-treatment e.g. 26 from the data pre-treatment 26, 27, 28 with differently valued features the interference is reduced.
- additional data pre-treatments 27, 28 the original disturbances are minimized or even eliminated.
- the in-ovo spectra 4 registered as digital signals are subjected to a linear baseline correction 26, whereby the fluorescence intensity signal 21 (large circle) stands out.
- signals 23 of physical parameters in the spectra are suppressed (small circle). Due to the usually large differences in intensity between fluorescence signal and Raman signal, the information on the molecular Composition 20 (small circle) in the background.
- the fluorescence intensity 21 (large circle) itself is a potential marker for sex recognition because male embryos often, but not always, have a biochemical composition in the blood that has increased fluorescence intensity 21 over female embryos or female embryo blood.
- FIG. 2c shows that by means of the methods of spectral normalization 27, for example by means of vector or surface normalization, it is possible to compensate for variations in the fluorescence intensity 21 (small circle) and to minimize the random influences of physical parameters 23 (small circle).
- the fluorescence profile 22 (large circle) can preferably be emphasized.
- only a small amount of molecular composition information 20 (small circle) based on Raman signals is minimized. Since the fluorescence profile 22, ie the spectral characteristic of the fluorescence, is determined by the molecular composition 20, information relevant to gender can be highlighted.
- FIG. 2d shows that as complete a correction as possible of the so-called background of Raman spectra 28 leads to the sole highlighting of the Raman bands, that is to say the information about the molecular structure and composition 20 (large circle) of the examined object 2.
- FIGS. 3a, 3b, 3c and 3d each show a schematic representation of the spectra associated with the individual classification methods (relative to the relative wavenumber) with reference to FIGS. 2a, 2b, 2c, 2d.
- the spectral pretreatment 5 with identically determined features of at least one of the spectral pretreatments 6, 7, 8 with differently determined features is added to the evaluation.
- 4b shows a flow chart for the multiple classification method according to the invention with training set and test set in local separation, but in algorithmic connection with a classification result design from a large number of classifiers.
- the respective spectral pretreatment is structured so that in each case certain features stand out more clearly and other features are more strongly suppressed.
- the pretreated spectra 4 are now designed as a variable training set 19, with several series 13, 14, 15, 16 of classifiers being calculated, for example, in detail of a series 131, 132, 133, 134, 135 and so on.
- an evaluation of the classified spectra is carried out with respect to a specified criterion or several specified criteria.
- the criteria used are, for example, a limit of accuracy or a maximum number of iterative steps.
- the criteria may be logical AND or logical OR linked.
- the classifiers are passed to classify the "unknown" spectra of the test set 29.
- the test set 29 comprises 50 spectra. These were each classified with 120 classifiers, i. Each spectrum is assigned 120 probabilities for class membership. According to the median or the cluster analysis, this results in belonging to a class. This is the result of the multiple classification for each individual spectrum. For example, if 41 of the 50 spectra are correctly classified, this results in an accuracy of 82% for the entire test set 24. From the comparison with the feature list, the thus created method 1 of the multiple classification is finally evaluated. Thus, the method is created and can now be used for spectra without knowledge of the features.
- FIG. 5 shows a schematic representation of a probability / classifier number column representation 38 for 20 classifiers according to FIG. 1 for the display of an egg 2 identified as female.
- This can be the unshaded End portions / end faces 33 of columns 34 belonging to the female gender above a certain line - the separation boundary 42 - lie and the columns 35 lie with the hatched end portions / end faces 36 as the male sex belonging to the separation boundary 42.
- the separation limit value is 0.5 in FIG. 5 and the median 30 has the value 0.72 there.
- the egg 2 is classified as clearly "female".
- Fig. 6 Shown in Fig. 6 is the perspective view associated with the perspective view of the column, which is indicated on a color display as the classification result image 37 with the plurality of unshaded end areas / end faces 33 for the object information 31 "female.”
- the unshaded faces 33 red and the hatched end faces 36 may be blue, so that a color visual representation of the rating of the sex can be made.
- the shaded squares can be displayed in blue and the unshaded squares in red.
- the few blue squares indicate the male object information 32.
- the predominantly red squares indicate the female object information 31. Since the red squares predominate, the gender of the incubated chicken egg 2 can be identified as a female trait 31.
- FIG. 7 shows a representation of the calculated median 30 for 10 classifiers in relation to the number of twenty classifiers for an egg 2 according to FIG. 1 with a series of five classifiers 131, 132, 133, 134, 135 per group in four groups 9, 10, 1 1, 12 indicated.
- 17 classifiers give the indication of a female egg 2.
- the total classification result 18 can be given with the calculated median 30.
- FIG. 8 is a schematic representation of another exemplary probability / classifier number column representation 39 for 120 Classifiers, shown as columns, for displaying an egg 2 identified as female.
- the separation boundary 42 also shows the boundary between the feature "male” and the feature "female".
- the columns 34 (31) ending above the separation boundary 42 are hatched on the end faces and the hatches 35 (32) ending below the separation boundary 42 are indicated by hatching.
- another column representation may be formed, in which case the above the separation boundary 42 lying end faces of the formed columns 35 in their majority compared to the non-hatched end faces of the columns 34 are hatched (not shown).
- FIG. 9 shows a plot of the calculated median 30 in relation to the number of total 120 classifiers according to the column representation in FIG. 8 in a probability / classifier representation for a female gender feature 31 with classifiers sorted by increasing points.
- the median 30 is half of the calculated 120 classifiers and has a probability of 0.95.
- the classification units / groups 9, 10, 11, 12 for determining the object information in the form of dual sex characteristics 31, 32 - female or male - of fertilized and non-hatched and incubated eggs 2, which are contained in an evaluation unit, function as follows:
- classifier series 13, 14, 15, 16 From each class 25, 26, 27, 28, several classifiers of the series 13, 14, 15, 16 are calculated after the spectral pre-treatment 5, 6, 7, 8.
- the determination of the classifier series 13, 14, 15, 16 takes place according to an algorithm which initially selects spectral regions R s from the coordinate of the relative wavenumbers in a kind of tandem method and subsequently classifies the intensity values of the selected regions R s by means of discriminant analysis.
- a selection of spectral classes and the classification of the intensity values takes place in a repeated step again. This cycle is repeated iteratively until reaching a no longer improvable accuracy, wherein the termination criterion can be specified.
- the hardware units assigned to the classifications work the same for all four groups 9, 10, 11, 12. Thus, instead of the four units driven in parallel, only one unit can be used which serially creates the series 13, 14, 15, 16 of the classifiers in a predetermined sequence.
- N G the number of calculated classifiers N G in the series 13, 14, 15, 16 per group 9, 10, 11, 12, the circumference of the spectral data points v s and the double half width of the spectral regions ws and the number of the selected spectral regions R s :
- Equation (I) ensures that each data point vs can be selected with equal probability.
- FIGS. 10a and 10b twenty classifiers per data pretreatment 25 are given using the example of the raw spectra (intensity / wavenumber curves). For this purpose, a section of the associated male intensity / wavenumber curves is shown enlarged in FIG. 10a.
- the circumference of the spectral data points v s in the entire spectral range between 500 cm “1 and 2750 cm " is 1 data point.
- the data points v s can also be weighted additionally.
- a weighting diagram 40 is indicated from which it can be seen that the highest weighting value is assigned to the middle data point 41.
- the rating 17 and the classification of the results assigned to the classifiers of the series 13, 14, 15, 16 are performed in a rating unit and led to a classification result 18 (30). Finally, a classification result 18 is output in the form of the median 30, which represents the sexually most probable dual sex information 31, 32 (male or female) in the sexing of chicken eggs.
- FIG. 1 is a schematic block diagram of an inventive method 1 for the classification of spectra 4 of an object 2 with complex information content, in particular of optical molecular spectra 4 for the assignment of object information / features 3 for a probable determination of a
- dual object information 31, 32 or four object information 51, 52, 53, 54 are shown.
- tissue samples such as brain tumors
- dual feature information 31, 32 for example, four different features 3 with 51, 52, 53, 54 selected and determined, for example
- Feature 54 necrotic tissue.
- the recording and registration of the backscatter radiation from the tissue sample is carried out by means of at least one optical device, for example as described in the publication DE 10 2014 010 150 A1.
- the registered backscatter spectra 4 are digitized and stored in an evaluation unit.
- the data pretreatment is carried out by, for example, three different methods 5, 6, 7, the data sets obtained may contain, for example, raw spectra, normalized spectra and spectra with a nonlinear baseline correction, wherein the stored spectra are evaluated individually in the individual memory units and the associated digitized evaluated signals for Further processing can be provided.
- the pretreated spectra are designed as a training set, wherein according to the invention a calculation of the classifiers of the series of the considered individual classification methods is carried out involving iterative methods and a validation in the classification units.
- the classification is evaluated with the calculation of the median or by means of a cluster analysis and the probability result / classification result of the object information belonging to the class of the test set is shown.
- a device for classifying spectra 4 of objects 2 having complex information content, preferably with objects in the form of chicken eggs 2 for a determination of dual egg information 31, 32 - female or male - in which the aforesaid method is realized and which largely represents the block (FIG. Box) - representation in Fig. 1 is formed accordingly, may comprise at least the following units
- At least one detecting optical device with at least one spectrometer and / or further detectors for recording and registering the spectra 4,
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Food Science & Technology (AREA)
- Chemical & Material Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Heart & Thoracic Surgery (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
Description
Verfahren zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt Method for classifying spectra of objects with complex information content
Die Erfindung betrifft ein Verfahren zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt mit mindestens zwei unterschiedlichen Objektinformationen, insbesondere von optischen Molekülspektren zur Zuordnung der Objektinformationen. The invention relates to a method for classifying spectra of objects having a complex information content with at least two different object information, in particular of optical molecular spectra for the assignment of the object information.
Bekannt sind Druckschriften zu Verfahren zur gestützten Klassifizierung optischer Spektren. Dazu gehören u.a. die Druckschrift A. E. Nikulin, B. Dolenko, T., Bezabeh, R. L. Somorjai: Near-optimal region selection for feature space reduction: novel preprocessing methods for classifying MR spectra, NMR Biomed. 1 1 (4-5), 1998, S. 209-216, die Druckschrift B. K. Lavine, C. E. Davidson, A. J. Moores: Genetic algorithms for spectral pattern recognition, Vibrational Spectroscopy, Volume 28, Issue 1 , 2002, Pages 83-95, wobei darin der Algorithmus auf den Hauptkomponenten basiert und eine Wichtung spektraler Bereiche zur Klassifizierung herangezogen wird, sowie die Druckschrift J. Jacques, C. Bouveyron, S. Girard, O. Devos, L. Duponchel, C. Ruckebusch: Gaussian mixture models for the Classification of high-dimensional vibrational spectroscopy data, Journal of Chemometrics, Volume 24, Issue 1 1 -12, S. 719-727. There are known publications on methods for the supported classification of optical spectra. These include u.a. The document A. E. Nikulin, B. Dolenko, T., Bezabeh, R.L. Somorjai: Near-optimal region selection for feature space reduction: novel preprocessing methods for classifying MR spectra, NMR Biomed. 1 1 (4-5), 1998, pp. 209-216, BK Lavine, CE Davidson, AJ Moore's: Genetic Algorithms for Spectral Pattern Recognition, Vibrational Spectroscopy, Volume 28, Issue 1, 2002, Pages 83-95, in which the algorithm is based on the main components and a classification of spectral ranges is used for the classification, and the publication J. Jacques, C. Bouveyron, S. Girard, O. Devos, L. Duponchel, C. Ruckebusch: Gaussian mixture models for the Classification of high-dimensional vibrational spectroscopy data, Journal of Chemometrics, Volume 24, Issue 1 1 -12, pp. 719-727.
Darin wird ein Verfahren beschrieben, bei dem besonders hochdimensionale spektrale Daten in sogenannte Teilräume (engl, subspaces) zerlegt werden, die nachfolgend mittels Diskriminanzanalyse klassifiziert werden. Optische Molekülspektren weisen einen großen Informationsgehalt über die molekularen Eigenschaften des untersuchten Objektes auf. Insbesondere Schwingungsspektren gelten aufgrund ihrer hohen Informationsdichte über die molekulare Struktur als Fingerabdruck von Molekülen. Bei der spektroskopischen Analyse komplexer biologischer Objekte müssen die entsprechend der Vorgabe relevanten Informationen von den weniger oder nicht bedeutsamen Informationen als auch von Störungen separiert werden. Dazu werden üblicherweise Verfahren der Chemometrik, bei höherdimensionalen Daten auch multivariate Verfahren eingesetzt. It describes a method in which particularly high-dimensional spectral data are split into so-called subspaces, which are subsequently classified by means of discriminant analysis. Optical molecular spectra have a high information content about the molecular properties of the examined object. In particular, vibration spectra are considered to be the fingerprint of molecules because of their high information density over the molecular structure. In the spectroscopic analysis of complex biological objects, the information relevant to the specification must be separated from the less or insignificant information as well as from interferences. These are usually procedures Chemometrics, also multivariate methods used in higher-dimensional data.
Sind wichtige spektrale Merkmale der gesuchten molekularen Information von Objekten bekannt, können gestützte (supervidierte) Klassifikationsverfahren eingesetzt werden, wie beispielsweise in der Druckschrift G. Steiner, S. Kuchler, A. Herrmann, E. Koch, R. Salzer, G. Schackert, M. Kirsch: Cytometry, Part A 2008, 73A, 1 158-1 164 beschrieben. If important spectral features of the desired molecular information of objects are known, supported (supervised) classification methods can be used, as for example in the publication G. Steiner, S. Kuchler, A. Herrmann, E. Koch, R. Salzer, G. Schackert, M. Kirsch: Cytometry, Part A 2008, 73A, 1 158-1 164.
Die gestützten Klassifikationsverfahren zeichnen sich gegenüber anderen Verfahren durch eine höhere Genauigkeit in der Erkennung und quantitativen Bewertung der gesuchten Informationen aus. Bei dem bekannten Verfahren der gestützten Klassifizierung gemäß Fig. 4a wird mittels eines Trainingsset 19, das aus repräsentativen Spektren mit zugeordneten Eigenschaften besteht, ein Klassifikator 50 berechnet. Der Klassifikator 50 wird dann anhand eines unabhängigen Testsets 29, d.h. die Spektren werden nicht zum Aufbau des Klassifikators 50 eingesetzt, wie in Fig. 4a gezeigt, zur Validierung überprüft und bewertet und ein klassifiziertes Testset 24 erreicht. The supported classification methods are distinguished from other methods by a higher accuracy in the detection and quantitative evaluation of the information sought. In the known method of the supported classification according to FIG. 4 a, a classifier 50 is calculated by means of a training set 19, which consists of representative spectra with assigned properties. The classifier 50 is then evaluated on the basis of an independent test set 29, i. the spectra are not used to construct the classifier 50, as shown in FIG. 4 a, validated and evaluated for validation, and achieved a classified test set 24.
Der Aufbau des Klassifikators 50 mittels des Trainingssets 19 wird durch ein Testset 29 mit z.B. maximal 30% der Spektren (gestrichelte Linie zu dem erstellten Klassifikator) gemäß Fig. 4b verifiziert, so dass im Ergebnis ein klassifiziertes Testset 24 (gestrichelte Linie von dem Klassifikator 50) zum klassifizierten Testset 24 erreicht wird. The construction of the classifier 50 by means of the training set 19 is performed by a test set 29 with e.g. a maximum of 30% of the spectra (dashed line to the created classifier) is verified according to FIG. 4 b, so that, as a result, a classified test set 24 (dashed line from the classifier 50) to the classified test set 24 is achieved.
Ein generelles Problem der gestützten Klassifizierungsverfahren ist die Abwägung zwischen Genauigkeit der erzielten Zuordnungen und Robustheit der Klassifizierung. Häufig lassen sich sehr hohe Genauigkeiten nur bei einem sogenannten Übertraining des Klassifikators erzielen. Darunter wird verstanden, dass der Klassifikator nur bestimmte Spektren noch richtig zuordnen kann, wobei dies mit sehr hoher Genauigkeit geschieht. Dagegen führen bereits geringste Abweichungen oder Störeinflüsse zu einer dramatisch reduzierten Genauigkeit der Klassifikation. Es wird daher eine Anpassung zwischen bestmöglicher Klassifizierung und hoher Robustheit der Klassifizierung angestrebt. A general problem of the supported classification methods is the trade-off between the accuracy of the assignments obtained and the robustness of the classification. Often very high accuracies can only be achieved with a so-called overtraining of the classifier. This means that the classifier can only correctly assign certain spectra, with very high accuracy. By contrast, even the slightest deviation or interference leads to a dramatically reduced accuracy of the Classification. An attempt is therefore made to adapt between best possible classification and high robustness of the classification.
Liegen Spektren mit sehr hoher Variabilität vor, wie zum Beispiel bei in-ovo Spek- tren zur Geschlechtsbestimmung von Hühnereiern, müssen zwangsläufig für die Bewahrung einer ausreichenden Robustheit der Klassifizierung Abstriche bei der Genauigkeit vorgenommen werden. Grundsätzlich lässt sich dieser immanente Widerspruch nicht lösen. Um dennoch eine gute Stabilität bei ausreichender Genauigkeit zu erzielen, wurden in den zurückliegenden Jahren verschiedenen Verfahren zur Klassifizierung neu entwickelt. Die grundsätzliche Herangehensweise ist dabei die Parallelisierung der Klassifizierung über verschiedene Entscheidungsbäume. Das Random Forest Verfahren (engl. Random Forest Methode) basiert auf einem Netz von unkorrelierten Entscheidungsbäumen, wobei die Entscheidungsbäume durch Randomisierung während des Trainingsprozesses gewachsen sind bzw. verknüpft werden. Jeder sogenannte Baum trifft eine Entscheidung. Die Gruppe der Bäume mit den meisten, jeweils identischen Entscheidungen, bestimmt das Ergebnis der Klassifizierung, also die Zuordnung des Spektrums. Allerdings kann das Random Forest Verfahren nicht auf unterschiedlich auftretende Störungen oder Variationen in den Spektren reagieren. Auch hier kann allein durch das Aufstellen von zu vielen Bäumen ein Übertraining auftreten. If spectra with very high variability are present, as for example in in-ovo species for determining the sex of chicken eggs, it is inevitable that accuracy will be compromised to ensure sufficient robustness of the classification. Basically, this immanent contradiction can not be solved. Nevertheless, in order to achieve good stability with sufficient accuracy, various methods of classification have been newly developed in recent years. The basic approach is the parallelization of the classification across different decision trees. The Random Forest method is based on a network of uncorrelated decision trees, where the decision trees are grown by randomization during the training process. Every so-called tree makes a decision. The group of trees with the most identical decisions determines the result of the classification, ie the assignment of the spectrum. However, the Random Forest method can not respond to different disturbances or variations in the spectra. Again, by putting up too many trees, overtraining can occur.
In der Schrift US20120321 174 A1 wird ein Klassifikationsverfahren, beruhend auf dem Random Forest Verfahren für die Bildauswertung, beschrieben. Dieses gestützte Klassifizierungsverfahren ist so gestaltetet, dass insbesondere kleine, aber relevante Merkmale für die Klassifizierung berücksichtigt werden. The document US20120321 174 A1 describes a classification method based on the Random Forest method for image evaluation. This supported classification method is designed to take into account, in particular, small but relevant features for classification.
Diese relevanten Merkmale des allgemeinen Klassifizierungsverfahrens können auch z.B. in der in-ovo Spektroskopie von Hühnereiern in Form von kleinen auf die Spektren bezogenen Signale der Geschlechtsinformationen definiert werden und eine Rolle spielen. Bei der in-ovo Spektroskopie von Hühnereiern wird jeweils ein gestütztes Klassifizierungsverfahren zur Identifizierung des Geschlechts eingesetzt. These relevant features of the general classification method can also be defined and play a role, for example, in the in-ovo spectroscopy of chicken eggs in the form of small spectral-related signals of the sex information. In in ovo spectroscopy of chicken eggs a supported classification method is used to identify the sex.
Optische in-ovo Spektren zeichnen sich aber oftmals durch eine sehr hohe natürliche Variabilität aus, die die vergleichsweise kleinen Signale der Geschlechtsinformation deutlich überlagern. Hinzu kommen nicht vermeidbare externe Einflüsse von der Umgebung der Messung selbst. However, optical in-ovo spectra are often characterized by a very high natural variability, which clearly overlap the comparatively small signals of gender information. In addition, there are unavoidable external influences from the environment of the measurement itself.
Derzeit werden folgende unterschiedliche Verfahren zur Klassifizierung der Spek- tren von Objekten, insbesondere zur Geschlechtsbestimmung von befruchteten und/oder bebrüteten Eiern in den unten genannten Druckschriften angegeben: At present, the following different methods for classifying the spectra of objects, in particular for the sex determination of fertilized and / or incubated eggs, are given in the documents cited below:
In der Druckschrift WO 2010/150265 A wird ein Verfahren, beruhend auf einer Färbung, insbesondere der Federn des entwickelten Embryos beschrieben. Das Verfahren beruht darauf, dass im fortgeschrittenen Entwicklungsstadium (Tag 12 der Bebrütung) die Farbe der Federn bei bestimmten Hühnerrassen Rückschluss auf das Geschlecht zulässt. Die Auswertung erfolgt mit einem Algorithmus zur Klassifizierung. Des Weiteren wird in der Druckschrift WO 2014/021715 A2 ein Verfahren beschrieben, bei dem das Geschlecht des Embryos mittels endokrinologischer Analyse bestimmt wird. The document WO 2010/150265 A describes a method based on a coloring, in particular of the feathers of the developed embryo. The method is based on the fact that in the advanced stage of development (day 12 of incubation), the color of the feathers in certain breeds of chicken allows conclusions about the sex. The evaluation is carried out with an algorithm for classification. Furthermore, the document WO 2014/021715 A2 describes a method in which the sex of the embryo is determined by means of endocrinological analysis.
Die Druckschrift DE 10 2007 013 107 A1 beschreibt die Anwendung der Raman- Spektroskopie zur Geschlechtsbestimmung von Vögeln, wobei allgemein zellhaltiges Material untersucht wird. Es wird jedoch kein Verfahren zur in-ovo Geschlechtsbestimmung beschrieben. The document DE 10 2007 013 107 A1 describes the application of Raman spectroscopy for sexing of birds, wherein generally cell-containing material is examined. However, no method for in ovo sex determination is described.
Die Molekülspektren werden mittels Verfahren und Vorrichtungen gemäß den nachfolgend genannten Druckschriften registriert: Ein Verfahren und Vorrichtungen zur Bestimmung des Geschlechtes von Hühnereiern, basierend auf der optischen, vorzugsweise fasergekoppelten Spektroskopie werden in der Druckschrift DE 10 2010 006 161 B3 beschrieben. Es werden jedoch keine Verfahren zur Analyse der Spektren und zur Klassifizierung beschrieben The molecular spectra are registered by means of methods and devices according to the following publications: A method and apparatus for determining the sex of chicken eggs, based on the optical, preferably fiber-coupled spectroscopy are described in the document DE 10 2010 006 161 B3. However, no methods for spectral analysis and classification are described
In den Druckschriften DE 10 2014 010 150 A1 und WO 2016/000678 A1 werden Verfahren und Vorrichtungen zur Ramanspektroskopischen in ovo Geschlechtsbestimmung beschrieben. Die Auswertung der Spektren kann vorteilhaft mit chemometrischen Verfahren erfolgen. The documents DE 10 2014 010 150 A1 and WO 2016/000678 A1 describe methods and devices for Raman spectroscopy in ovo sex determination. The evaluation of the spectra can advantageously be carried out using chemometric methods.
Die Druckschrift EP 2 336 751 A1 beschreibt ein Verfahren zur Bestimmung des Geschlechts von Vogeleiern. Bei dem Verfahren wird die Keimscheibe eines Eies mit Licht beleuchtet und die emittierte Fluoreszenz zeitaufgelöst erfasst. Die Erkennung des Geschlechtes geschieht mit Hilfe einer gestützten Klassifizierung, wobei mittels des Verfahrens der fraktalen Dimension ein Klassifikator berechnet wird. Document EP 2 336 751 A1 describes a method for determining the sex of bird eggs. In the method, the germinal disc of an egg is illuminated with light and the emitted fluorescence detected time-resolved. The recognition of the gender is done by means of a supported classification, whereby a classifier is calculated by means of the method of the fractal dimension.
In der Schrift US 6 029 080 B wird ein Verfahren zur in ovo Geschlechtsbestim- mung beschrieben. Aus der Analyse von MRT-Bildern des Eies lassen sich ab einem bestimmten Entwicklungsstadium des Embryos die Geschlechtsorgane erkennen und für die Geschlechtsbestimmung heranziehen. The document US 6 029 080 B describes a method for in ovo sex determination. From the analysis of MRI images of the egg, the sexual organs can be identified and used for sex determination at a certain developmental stage of the embryo.
Der Nachteile in der Auswertung dieser Verfahren besteht darin, dass jedes dieser Verfahren letztendlich für sich ein Verfahren zur Klassifizierung von Spektren von Objekten mit nur einem Klassifikator nutzt. The disadvantages in the evaluation of these methods is that each of these methods ultimately uses a method for classifying spectra of objects with only one classifier.
Zu den Nachteilen ist zusammenfassend zu bemerken, dass, um die gesuchten Geschlechtsinformationen dennoch sicher aus den registrierten Spektren zu extrahieren, deshalb die Verwendung nur eines einzigen Klassifikators nicht ausreichend ist, um die Erkennungssicherheit der bestimmten Geschlechtsinformationen als ausreichend zu betrachten. Vielmehr müssen die variablen Einflüsse und die Variationen in der biochemischen Zusammensetzung des Eies als auch in den unterschiedlichen Entwicklungsstadien berücksichtigt werden. Um diese große Variationsbreite in ein erkennungssicheres Verfahren zur Klassifizierung einzubeziehen, wird eingeschätzt, dass deshalb die Berechnung nur eines Klassifikators nicht ausreichen wird. To summarize, the drawbacks are that in order to safely extract the searched gender information from the registered spectra, therefore, the use of only a single classifier is insufficient to consider the recognition certainty of the particular sex information sufficient. Rather, the variable influences and the variations in the biochemical composition of the egg as well as in the different stages of development. In order to incorporate this large range of variations in a recognition-proof method for classification, it is estimated that therefore the calculation of only one classifier will not be sufficient.
Der Erfindung liegt deshalb die Aufgabe zugrunde, ein Verfahren zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt anzugeben, das derart geeignet ausgebildet ist, dass eine maximale Genauigkeit der Bestimmung der zugeordneten ausgewählten Merkmale von Objekten erreicht wird, wobei zugleich zumindest die Stabilität der Klassifizierung erhalten bleiben soll. Es soll somit eine Anpassung zwischen bestmöglicher Klassifizierung und hoher Robustheit der Klassifizierung angestrebt werden. Gleichzeitig soll ein Übertrainieren des Klassifikators vermieden werden. The invention is therefore based on the object of specifying a method for the classification of spectra of objects with complex information content, which is designed so that a maximum accuracy of the determination of the associated selected features of objects is achieved, at the same time at least maintain the stability of the classification should stay. Thus, an adaptation between best possible classification and high robustness of the classification should be sought. At the same time an overtraining of the classifier should be avoided.
Die Aufgabe wird mit den Merkmalen des Patentanspruchs 1 gelöst. The object is achieved with the features of claim 1.
In dem Verfahren zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt mit mindestens zwei unterschiedlichen Objektinformationen, unter Einsatz eines Verfahrens zur Registrierung und zur Vorbehandlung von spektralen Daten und eines der Datenvorbehandlung zugehörigen Verfahrens der Klassifizierung mit der Berechnung eines Klassifikators, wird gemäß dem Kennzeichenteil des Patentanspruchs 1 nach der Registrierung der Spektren und der Vorbehandlung von spektralen Daten ein multiples Klassifizierungsverfahren mit mindestens zwei unterschiedlichen Verfahren der Datenvorbehandlung spektraler Daten und eines der jeweiligen Datenvorbehandlung zugeordneten Verfahrens zur Klassifizierung durchgeführt. In the method for classifying spectra of complex information content objects with at least two different object information, using a method for registering and pretreating spectral data and a data pretreatment associated method of classification with the calculation of a classifier, according to the characterizing part of claim 1 after the registration of the spectra and the pretreatment of spectral data, a multiple classification method is carried out with at least two different methods of data pretreatment of spectral data and a classification method associated with the respective data pretreatment.
Im Rahmen der Erfindung soll unter der Registrierung von von Spektren die Aufnahme, Ermittlung und Speicherung von Spektren und die Erzeugung von digitalisierten Signalen zur Speicherung verstanden werden, die für die weitere Datenvorbehandlung der spektralen Daten zur Verfügung stehen. Within the scope of the invention, the recording, determination and storage of spectra and the generation of spectra are intended to include the registration of spectra digitized signals are available for storage, which are available for the further data pretreatment of the spectral data.
In den Datenvorbehandlungen werden je nach eingesetztem Vorbehandlungs- Algorithmus unterschiedliche korrigierte, vorbehandelte Spektren mit vielen Datenpunkten erzeugt, die mindestens einem Verfahren zur Klassifizierung zugeordnet werden. Depending on the pre-treatment algorithm used, the data pre-treatments generate different corrected pretreated spectra with many data points, which are assigned to at least one classification procedure.
Dabei werden folgende Schritte nach Registrierung und Datenvorbehandlung in dem Auswerteverfahren von registrierten Spektren von Objekten durchgeführt:The following steps are performed after registration and data pre-treatment in the evaluation procedure of registered spectra of objects:
- eine Berechnung mehrerer Klassifikatoren von Serien pro Art der Datenvorbehandlung, a calculation of several classifiers of series per type of data pre-treatment,
- eine Ermittlung der Klassifikatoren der Serien, iterativ berechnet und validiert, a determination of the classifiers of the series, iteratively calculated and validated,
- eine Berechnung von Wahrscheinlichkeiten der Klassenzugehörigkeit, - a calculation of probabilities of class membership,
- eine gleichberechtigte Einbeziehung aller Klassifikatoren der Serien bzw. - an equal inclusion of all classifiers of the series or
Klassifikatoren in die Ermittlung eines Klassifikationsergebnisses. Classifiers in the determination of a classification result.
Bei der Festlegung und Ermittlung der Anzahl der berechneten Klassifikatoren NG in den Serien je Klassifizierungsgruppe werden sowohl der Umfang der spektralen Datenpunkte vs und die doppelte Halbbreite der spektralen Regionen ws als auch die Anzahl der ausgewählten spektralen Regionen Rs für die Klassifizierung in Gleichung (I) berücksichtigt: In determining and determining the number of calculated classifiers N G in the series per classification group, both the circumference of the spectral data points vs and the double half width of the spectral regions ws and the number of selected spectral regions R s for the classification in equation (I ) considered:
wobei mit der Gleichung (I) sichergestellt wird, dass jeder Datenpunkt vs mit gleicher Wahrscheinlichkeit ausgewählt werden kann. the equation (I) ensures that each data point v can be selected with equal probability.
Die zu einem Umfang der spektralen Datenpunkte gehörenden Datenpunkte können aber auch gewichtet werden. Zumindest eine der Spektrenvorbehandlungen wird derart strukturiert, dass jeweils bestimmte Merkmale hervortreten und andere bestimmte Merkmale unterdrückt werden, so dass unterschiedlich bestimmte Merkmale für die Klassifikation eingesetzt werden. However, the data points belonging to a circumference of the spectral data points can also be weighted. At least one of the spectral pretreatments is structured in such a way that particular features emerge and other specific features are suppressed, so that different characteristics are used for the classification.
Zumindest eine Spektrenvorbehandlung kann mit gleich bestimmten Merkmalen ausgebildet sein und zumindest einer der vorgenannten Spektrenvorbehandlungen mit unterschiedlich bestimmten Merkmalen für die Klassifikation eingesetzt werden. Die vorbehandelten Spektren können als variable Trainingssets ausgelegt werden, und mehrere Klassifikatoren der Serien bzw. Klassifikatoren werden iterativ bestimmt und validiert. At least one pretreatment of spectra can be designed with the same specific features and at least one of the abovementioned spectral pretreatments with differently determined characteristics can be used for the classification. The pretreated spectra can be interpreted as variable training sets, and several classifiers of the series or classifiers are determined and validated iteratively.
Im Rahmen der Erfindung soll unter der Klassifizierung die nach einem vorgegebenen Algorithmus bestimmte Einordnung der vorbehandelten Spektren in eine jeweilige Klasse verstanden werden. Dabei wird das Verfahren der Klassifizierung mit Hilfe vorgegebener Parameter durchgeführt und das Ergebnis der Klassifikation durch einen berechneten Klassifikator ausgedrückt. Es kann mindestens ein Verfahren der gestützten Klassifizierung und/oder der nichtgestützten Klassifizierung zur Selektion spektraler Regionen oder einzelner Wellenlängenbereiche und nachfolgender Analyse eingesetzt werden. Dabei kann eine lineare oder nichtlinieare Diskriminanzanalyse eingesetzt werden. Es können zur Klassifizierung auch Verfahren der neuronalen Netze und/oder ein Verfahren der linearen Zeit-Frequenz-Transformationen (engl. Wavelets) eingesetzt werden. In the context of the invention, the classification is to be understood as the classification of the pretreated spectra into a respective class determined according to a predetermined algorithm. The method of classification is carried out with the aid of predetermined parameters and the result of the classification is expressed by a calculated classifier. At least one supported classification and / or non-assisted classification method may be used to select spectral regions or single wavelength ranges and subsequent analysis. A linear or nonlinear discriminant analysis can be used. For classification, methods of neural networks and / or a method of linear time-frequency transformations (English: Wavelets) can be used.
Es können dabei die Spektren der optischen Molekülspektroskopie, wie Absorption, Emission, Streuung oder UV/vis, NIR, IR Absorption, Fluoreszenz oder Raman, klassifiziert werden. Als Datenvorbehandlungen der registrierten spektralen Daten oder Rohspektren können Basislinienkorrekturen, Normierungen, Ableitungen, Covarianz und/oder eine Hauptkomponentenanalyse eingesetzt werden. The spectra of optical molecular spectroscopy, such as absorption, emission, scattering or UV / vis, NIR, IR absorption, fluorescence or Raman, can be classified here. As data pre-treatments of the registered spectral data or raw spectra, baseline corrections, normalizations, derivatives, covariance and / or a principal component analysis can be used.
Zur Bewertung der Klassifikatoren der Serien für ein Klassifikationsergebnis kann eine Berechnung eines Medians oder eine Durchführung einer Clusteranalyse vorgesehen werden. To evaluate the classifiers of the series for a classification result, a calculation of a median or a performance of a cluster analysis can be provided.
Dabei wird der Median oder Zentralwert als ein Mittelwert für Verteilungen in der Statistik angegeben. Der Median einer Auflistung von Zahlenwerten ist der Wert, der an der mittleren (zentralen) Stelle steht, wenn die Werte der Größe nach sortiert werden. Der Wert der Größe stellt hier jeweils den Punktwert eines Klassifikators oder die durch den Klassifikator ermittelte Wahrscheinlichkeit der Klassenzugehörigkeit dar. The median or central value is given as an average for distributions in the statistics. The median of a list of numeric values is the value that is at the middle (central) location when the values are sorted by size. The value of the size here represents in each case the point value of a classifier or the probability of the class membership determined by the classifier.
Das erfindungsgemäße Verfahren kann im Allgemeinen mit folgenden Schritten im Detail absolviert werden: The method according to the invention can generally be completed in detail with the following steps:
- Aufnahme und Registrierung der Spektren mittels zumindest einer optischen Einrichtung mit zumindest einem Spektrometer und/oder weiteren Detektoren, Recording and registration of the spectra by means of at least one optical device with at least one spectrometer and / or further detectors,
- Erzeugung von digitalisierten Signalen in Form von Datenpunkten und Speicherung der registrierten Spektren in Speichereinheiten von Klassifikationseinheiten einer Auswerteeinheit, Generation of digitized signals in the form of data points and storage of the registered spectra in storage units of classification units of an evaluation unit,
- Spektrenvorbehandlung, indem die registrierten und gespeicherten Spektren in den einzelnen Speichereinheiten einzeln vorbehandelt werden und die zugehörigen digitalisierten ausgewerteten Signale zur Weiterverarbeitung bereit gestellt werden, Spectral pretreatment by individually pretreating the registered and stored spectra in the individual storage units and providing the associated digitized evaluated signals for further processing,
- Trennung der vorbehandelten Spektren als Trainingsset und als Testset, Separation of the pretreated spectra as a training set and as a test set,
- Auslegung und Einsetzung der vorbehandelten Spektren als Trainingsset und von einem vom Trainingsset getrennten Testset, - design and use of the pretreated spectra as a training set and of a test set separate from the training set,
wobei erfindungsgemäß zumindest eine - Berechnung der Klassifikatoren der Serien der berücksichtigten einzelnen Klassifizierungsverfahren unter Einbeziehung von iterativen Verfahren und einer Validierung in den Klassifizierungsgruppen, wherein according to the invention at least one - Calculation of the classifiers of the series of individual classification methods considered, including iterative procedures and validation in the classification groups,
- Klassifizierung der vorbehandelten Spektren des Trainingssets mit allen Klassifikatoren der Serien, Classification of the pretreated spectra of the training set with all classifiers of the series,
- Einordnung der Spektren des Trainingssets in eine Klasse von Objektinformationen mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit, Classifying the spectra of the training set into a class of object information with an expression of a class membership probability,
- Berechnung eines Klassifikationsergebnisses durch Berechnung des Medians oder durch Durchführung einer Clusteranalyse zur Darstellung des Calculation of a classification result by calculation of the median or by carrying out a cluster analysis to represent the
Wahrscheinlichkeitsergebnisses der einer Klasse zugehörigen Objektinformationen des Trainingssets, Likelihood result of the object information belonging to the class of the training set,
- Klassifizierung der vorbehandelten Spektren des Testsets mit allen Klassifikatoren der Serien, Classification of the pretreated spectra of the test set with all classifiers of the series,
- Einordnung der Spektren des Testsets in eine Klasse von Objektinformationen mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit und Classifying the spectra of the test set into a class of object information with an expression of a class membership probability; and
- Berechnung des Klassifikationsergebnisses durch Berechnung des Medians oder durch Durchführung eine Clusteranalyse zur Darstellung des Wahrscheinlichkeitsergebnisses der einer Klasse zugehörigen Calculation of the classification result by calculation of the median or by performing a cluster analysis to represent the probability result of a class
Objektinformationen des Testsets Object information of the test set
durchgeführt werden. be performed.
Als Objekte mit Objektinformationen können jegliche Vogeleier, wahlweise Hühnereier eingesetzt werden und als Objektinformationen können in einem speziellen Anwendungsfall die dualen Informationen über das weibliche Eigeschlecht oder über das männliche Eigeschlecht benutzt werden. As objects with object information any bird eggs, optionally chicken eggs can be used and as object information can be used in a specific application, the dual information about the female or the male sex.
Das Verfahren enthält somit Schritte zur Durchführung einer multiplen Klassifikation, beruhend auf unterschiedlichen herkömmlichen Auswerte verfahren nach einer der Spektrendetektierung und -registrierung nachgeordneten Spektrenvorbehandlung und einer nachfolgenden mehrfachen Berechnung von unterschiedlichen Klassifikatoren. Dabei ist zumindest eine Spektrenvorbehandlung beteiligt, bei der die Spektrenvorbehandlung so strukturiert ist, dass bei Berücksichtigung der Gleichwertigkeit von Merkmalen auch eine Berücksichtigung jeweils bestimmter Merkmale deutlicher hervortritt und andere Merkmale stärker unterdrückt werden. Die so vorbehandelten Spektren werden nun als Trainingsset ausgelegt, wobei mehrere Serien von Klassifikatoren berechnet werden. Die Klassifikatoren werden iterativ berechnet und validiert. Auf diese Art lassen sich mehrere Klassifikatoren bestimmen. Die Spektren des Testsets werden nachfolgend mit allen Klassifikatoren klassifiziert. Die Einordnung der Spektren in eine bestimmte Klasse der Objektinformationen/Merkmale (bei Hühnern: männlich, weiblich) geschieht dabei vorzugsweise als Punkt-Wert (engl. Score) oder in einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit. Um aus den Klassifikatoren eine alleinige Aussage zu gewinnen, werden die Verhältnisse innerhalb der Klassifikatoren ermittelt. Ein einfaches Mittel zur Verhältnisdarstellung ist hierzu z.B. eine Berechnung des Medians oder eine Clusteranalyse. The method thus includes steps for performing a multiple classification based on different conventional evaluation methods after a spectral detection and registration downstream Spectral pretreatment and a subsequent multiple calculation of different classifiers. In this case, at least one spectra pretreatment is involved, in which the spectral pretreatment is structured in such a way that, taking into account the equivalence of features, consideration of particular features is more pronounced and other features are more strongly suppressed. The pretreated spectra are now designed as a training set, whereby several series of classifiers are calculated. The classifiers are calculated and validated iteratively. In this way several classifiers can be determined. The spectra of the test set are subsequently classified with all classifiers. The classification of the spectra into a specific class of object information / features (in chickens: male, female) is preferably done as a score or an expression of a class membership probability. In order to obtain a sole statement from the classifiers, the relationships within the classifiers are determined. A simple means for ratio representation is this, for example, a calculation of the median or a cluster analysis.
Eine Vorrichtung zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt, vorzugsweise mit Objekten in Form von Hühnereiern für eine Bestimmung einer dualen Eiinformation - weiblich oder männlich -, wobei in der Vorrichtung das vorgenannte Verfahren realisiert wird, An apparatus for classifying spectra of objects having complex information content, preferably with objects in the form of chicken eggs for a determination of dual egg information - female or male -, wherein the device performs the aforesaid method,
kann zumindest folgende Einheiten umfassen may include at least the following units
- zumindest eine detektierende optische Einrichtung mit zumindest einem Spektrometer und/oder weiteren Detektoren zur Aufnahme und Registrierung der Spektren, at least one detecting optical device having at least one spectrometer and / or further detectors for recording and registering the spectra,
- eine Einheit zur Erzeugung von digitalisierten Signalen in Form von Datenpunkten, die die Spektren realisieren. - A unit for generating digitized signals in the form of data points that realize the spectra.
- Speichereinheiten zur Speicherung der registrierten Spektren in den Klassifikationseinheiten/-gruppen einer die Klassifikationseinheiten umfassenden Auswerteeinheit, - Einheiten zur Spektrenvorbehandlung, in denen die registrierten Spektren in den einzelnen Speichereinheiten einzeln vorbehandelt werden und die zugehörigen digitalisierten ausgewerteten Signale - die ermittelten Datenpunkte - zur Weiterverarbeitung bereitgestellt werden, Storage units for storing the registered spectra in the classification units / groups of an evaluation unit comprising the classification units, - units for spectral pretreatment, in which the registered spectra are individually pretreated in the individual storage units and the associated digitized evaluated signals - the data points determined - are made available for further processing,
- Trainingssets zur Auslegung und Einsetzung der vorbehandelten Spektren, - Training sets for the interpretation and use of pretreated spectra,
- Mindestens eine Klassifizierungseinheit für die Gruppen zur Berechnung der Klassifikatoren der Serien der berücksichtigten einzelnen herkömmlichen Klassifizierungsverfahren unter Einbeziehung von iterativen Verfahren und einer Validierung in den Klassifizierungseinheiten, At least one classification unit for the groups for the calculation of the classifiers of the series of the considered individual conventional classification methods, including iterative methods and a validation in the classification units,
- Testsets zur Klassifizierung der vorbehandelten Spektren mit allen Klassifikatoren der Serien, - test sets for the classification of the pretreated spectra with all classifiers of the series,
- eine Einheit zur Einordnung der vorbehandelten Spektren in mindestens eine duale Klasse - bei Hühnern: männlich oder weiblich - von Objekt(Ei)informationen mit einem Ausdruck einer Wahrscheinlichkeit zur a unit for classifying the pretreated spectra into at least one dual class - in chickens: male or female - of object (egg) information with an expression of probability
Klassenzugehörigkeit, Class membership,
- eine Bewertungseinheit zur Berechnung des Klassifikationsergebnisses z.B. in Form des Medians oder mittels Durchführung einer Clusteranalyse zur Bestimmung des Wahrscheinlichkeitsergebnisses zumindest einer der dualen Klasse - bei Hühnern: weiblich oder männlich - zugehörigen a rating unit for calculating the classification result e.g. in the form of the median or by performing a cluster analysis to determine the probability of at least one of the dual class - in chickens: female or male - associated
Objekt(Ei)information. Object (egg) information.
Weiterbildungen und weitere Ausgestaltungen der Erfindung sind in weiteren Unteransprüchen angegeben. Further developments and further embodiments of the invention are specified in further subclaims.
Die Erfindung wird mittels Ausführungsbeispielen anhand von Zeichnungen erläutert. The invention will be explained by means of exemplary embodiments with reference to drawings.
Es zeigen: Show it:
Fig. 1 eine schematische Block-Darstellung eines erfindungsgemäßen Verfahrens zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt, insbesondere von optischen Molekülspektren zur Zuordnung und Bestimmung von dualen Objektinformationen, wobei das Verfahren als multiples Klassifizierungsverfahren ausgeführt ist, Fig. 2a eine schematische Darstellung eines einzelnen Klassifizierungsverfahrens mit Spektrenvorbehandlung: Rohspektren, wobei alle Merkmale als gleichwertig berücksichtigt werden (gleich große Kreise), Fig. 1 is a schematic block diagram of a method according to the invention for the classification of spectra of objects with complex Information content, in particular of optical molecular spectra for the assignment and determination of dual object information, the method being implemented as a multiple classification method, FIG. 2a a schematic representation of a single classification procedure with spectral pretreatment: raw spectra, taking all features into consideration as equal (circles of equal size),
Fig. 2b eine schematische Darstellung eines einzelnen Klassifizierungsverfahrens mit Spektrenvorbehandlung: Linearer Basislinienkorrektur, mit einem favorisierten großen Merkmalskreis der Fluoreszenzintensität und mehreren weniger relevanten kleinen Merkmalskreisen, 2b shows a schematic representation of a single classification method with spectral pretreatment: linear baseline correction, with a favored large feature circle of the fluorescence intensity and several less relevant small feature circles,
Fig. 2c eine schematische Darstellung eines einzelnen Klassifizierungsverfahrens mit Spektrenvorbehandlung: Normierung, mit einem favorisierten großenFig. 2c is a schematic representation of a single classification method with spectra pretreatment: normalization, with a favored large
Merkmalskreis des Fluoreszenzprofils und mehreren weniger relevanten kleinen Merkmalskreisen, Feature circle of the fluorescence profile and several less relevant small feature circles,
Fig. 2d eine schematische Darstellung eines einzelnen Klassifizierungsverfahrens mit Spektrenvorbehandlung: Ramanspektren, mit einem favorisierten großen Merkmalskreis der molekularen Zusammensetzung und mehreren weniger relevanten kleinen Merkmalskreisen, 2d is a schematic representation of a single spectrally pretreatment classification method: Raman spectra, with a favored large feature set of molecular composition and several less relevant small feature circles.
Fig. 3a eine schematische Darstellung der dem Rohspektrum-Klassifizierungs- verfahren zugeordneten Spektren gemäß Fig. 2a, wobei das punktierteFig. 3a is a schematic representation of the Rohspektrum classification method associated spectra of FIG. 2a, wherein the punctured
Spektrum dem weiblichen Hühnerei-Spektrum zugeordnet ist, Spectrum is assigned to the female chicken egg spectrum,
Fig. 3b eine schematische Darstellung der dem liniearen Basislinienkorrektur- Klassifizierungsverfahren zugeordneten Spektren gemäß Fig. 2b, wobei das punktierte Spektrum dem weiblichen Hühnerei-Spektrum zugeordnet ist, Fig. 3c eine schematische Darstellung der dem Nomierungs-Klassifizierungsver- fahren zugeordneten Spektren gemäß Fig. 2c, wobei das punktierte Spektrum dem weiblichen Hühnerei-Spektrum zugeordnet ist, 3b shows a schematic representation of the spectra associated with the linear baseline correction classification method according to FIG. 2b, the dotted spectrum being associated with the female chicken egg spectrum; 3c shows a schematic representation of the spectra associated with the nomination classification method according to FIG. 2c, wherein the dotted spectrum is assigned to the female chicken egg spectrum,
Fig. 3d eine schematische Darstellung der dem Ramanspektrum-Klassifizierungs- verfahren zugeordneten Spektren gemäß Fig. 2d, wobei das punktierte Spektrum dem weiblichen Hühnerei-Spektrum zugeordnet ist, Fig. 4a eine schematische Darstellung des Ablaufs einer Klassifizierung mit FIG. 3d shows a schematic representation of the spectra associated with the Raman spectrum classification method according to FIG. 2d, wherein the dotted spectrum is assigned to the female hen's egg spectrum, FIG. 4a a schematic representation of the sequence of a classification with FIG
Ermittlung eines Klassifikators nach dem Stand der Technik, Determination of a classifier according to the prior art,
Fig. 4b ein Flussdiagramm für das erfindungsgemäße multiple Klassifizierungsverfahren mit Trainingsset und Testset in algorithmischer Verbindung mit Klassifikationsergebnis-Gestaltung aus einer großen Anzahl von Klassifi- katoren, 4b shows a flowchart for the multiple classification method according to the invention with training set and test set in algorithmic connection with classification result design from a large number of classifiers,
Fig. 5 eine schematische Darstellung einer Wahrscheinlichkeits/Klassifikator- anzahl-Säulendarstellung für zwanzig Klassifikatoren gemäß Fig. 1 für ein als Beispiel verwendetes Hühner-Ei, wobei die über der gestricheltenFIG. 5 is a schematic representation of a probability / classifier column representation for twenty classifiers of FIG. 1 for a chicken egg used as an example, with the one above the dashed line. FIG
Linienführung - Trenngrenze - liegenden Säulen dem weiblichen Line - separating boundary - lying columns of the female
Geschlecht zugeordnet werden, Be assigned to gender,
Fig. 6 eine Draufsicht auf die Säulendarstellung eines Eies gemäß der Fig. 5 und eine mögliche Ansicht auf einem Display, 6 is a plan view of the pillar representation of an egg according to FIG. 5 and a possible view on a display,
Fig. 7 eine Wahrscheinlichkeits(weiblich)/Klassifikatorenanzahl-Darstellung mit der Angabe des berechneten Medians für ein Ei mit den 20 Klassifikatoren gemäß Fig. 6, wobei eine fettgestrichelte Trenngrenze bei 0,5 der FIG. 7 shows a probability (female) / classifier number representation with the indication of the calculated median for an egg with the 20 classifiers according to FIG. 6, wherein a bold-dashed separation limit at 0.5 .mu.m
Wahrscheinlichkeit und ein dünngestrichelter Medianwert bei etwa 0,72 der Probability and a thin-dashed median at about 0.72 of the
Wahrscheinlichkeit„weiblich" liegen, so dass das Geschlecht des Eies als weiblich identifiziert werden kann, Probability "female" lie, so the sex of the egg can be identified as female,
Fig. 8 eine schematische Darstellung einer Wahrscheinlichkeits/Klassifikator- anzahl-Säulendarstellung für ein Ei für wahlweise 120 Klassifikatoren, wobei die über der fettgestrichelten Linienführung - Trenngrenze - liegenden Endbereiche der Säulen dem weiblichen Geschlecht eines Eies und die unter der fettgestrichelten Trenngrenze liegenden Endbereiche der Säulen dem männlichen Geschlecht eines Eies zugeordnet werden, Fig. 9 eine Darstellung des berechneten, gestrichelt dargestellten Medians für ein als weiblich erkanntes Ei mit den 120 Klassifikatoren gemäß Fig. 8 in einer Wahrscheinlichkeits/Klassifikatoranzahl-Darstellung, Figure 8 is a schematic representation of a probability / classifier number column representation for an egg for an optional 120 classifiers, where the end portions of the columns above the bold dashed line boundary are the female gender of an egg and the end portions of the columns below the fat dashed separation limit FIG. 9 shows a representation of the calculated median, shown dashed, for an egg recognized as female with the 120 classifiers according to FIG. 8 in a probability / classifier number representation, FIG.
Fig. 10a eine schematische Darstellung eines einzelnen Fig. 10a is a schematic representation of a single
Klassifizierungsverfahrens mit Spektrenvorbehandlung: Rohspektren, wobei alle Merkmale als gleichwertig berücksichtigt werden, mit acht ausgewählten spektralen Regionen Rsi bis Rse bei einem Umfang der spektralen Datenpunkte im gesamten Spektralbereich zwischen den Wellenzahlen 570 cm"1 bis 2750 cm"1 zur Ermittlung der Anzahl der Klassifikatoren pro Datenvorbehandlung, Spectral Pretreatment Classification Procedure: Raw spectra, taking into account all features as equal, with eight selected spectral regions Rsi to Rse at a spectral data point per area spectral range between wavenumbers 570 cm "1 to 2750 cm " 1 to determine the number of classifiers per data pretreatment,
Fig. 10b einen vergrößerten Ausschnitt (l-l) der Datenpunktdarstellung in der 10b shows an enlarged detail (l-1) of the data point representation in FIG
vorgebenen spektralen Region RS8 gemäß Fig. 10a, Fig. 10c einen vergrößerten Ausschnitt (l-l) der Datenpunktdarstellung in der give spectral region R s 8 according to FIG. 10 a, FIG. 10 c shows an enlarged detail (11) of the data point representation in FIG
spektralen Region Rse mit einer Angabe der Wichtung von Datenpunkten im Bereich der Region Rse gemäß Fig. 10a und Fig. 10b, spectral region Rse with an indication of the weighting of data points in the region of the region Rse according to FIGS. 10a and 10b,
Fig. 1 1 a eine Darstellung des berechneten, gestrichelt dargestellten Medians für ein als männlich erkanntes Ei mit den 120 Klassifikatoren ähnlich der Fig. in einer Wahrscheinlichkeits/Klassifikatoranzahl-Darstellung, Fig. 1 1 b eine erste Histogramm-Darstellung der Abhängigkeit zwischen der Anzahl von Elementen des Clusters und dem Schwerpunkt des Clusters und Fig. 1 1 c eine zweite Histogramm-Darstellung der Abhängigkeit zwischen der 1 a is a representation of the calculated median, shown dashed, for an egg recognized as male with the 120 classifiers similar to the one in a probability / classifier number representation, FIG. 11b shows a first histogram representation of the dependence between the number of elements of the cluster and the center of gravity of the cluster; and FIG. 11c shows a second histogram representation of the dependence between the FIG
Anzahl von Elementen des Clusters und dem Schwerpunkt des Clusters. Number of elements of the cluster and the center of gravity of the cluster.
Im Folgenden werden die Fig. 1 und die Fig. 2a, 2b, 2c, 2d gemeinsam betrachtet. In Fig. 1 ist in einer schematischen Block-Darstellung ein erfindungsgemäßes Verfahren 1 zur Klassifizierung von Spektren 4 eines Objektes 2 mit komplexem Informationsgehalt mit mindestens zwei/dualen und unterschiedlichen Objektinformationen/Merkmalen, insbesondere von optischen Molekülspektren 4 zur Zuordnung von Objektinformationen/Merkmale 3 für eine wahrscheinliche Bestimmung einer beispielsweisen dualen Objektinformation 31 , 32 gezeigt. In the following, Fig. 1 and Figs. 2a, 2b, 2c, 2d are considered together. 1 is a schematic block diagram of a method 1 according to the invention for classifying spectra 4 of an object 2 having a complex information content with at least two / dual and different object information / features, in particular optical molecular spectra 4 for assigning object information / features 3 a probable determination of example dual object information 31, 32 is shown.
Als zu untersuchende Objekte 2 können Vogeleier, beispielsweise Hühnereier eingesetzt werden und als duale Objektinformationen 3 können beispielsweise das Merkmal 31 über das weibliche Eigeschlecht und das Merkmal 32 über das männliche Eigeschlecht gesucht und bestimmt werden. Bird eggs, for example chicken eggs, can be used as objects 2 to be examined, and as dual object information 3, for example, the feature 31 can be searched and determined via the female gender and the characteristic 32 via the male gender.
Es folgt die Beschreibung des erfindungsgemäßen Verfahrens 1 zur Durchführung der Klassifizierung. The following is the description of the method 1 according to the invention for carrying out the classification.
Dazu ist in der Fig. 1 eine blockweise Abfolge des erfindungsgemäßen Verfahrens 1 gezeigt. For this purpose, a block-wise sequence of the method 1 according to the invention is shown in FIG.
In dem Verfahren 1 zur Klassifizierung von Spektren 4 von Objekten 2 mit komplexem Informationsgehalt mit mindestens zwei unterschiedlichen Objektinformationen erfolgt nach der Registrierung unter Einsatz eines Verfahrens der Vorbehandlung von Daten und eines der Datenvorbehandlung zugehörigen Verfahrens der Klassifizierung die Berechnung eines Klassifikators. Erfindungsgemäß wird nach Registrierung und Datenvorbehandlung von Spektren 4 ein multiples Klassifizierungsverfahren mit mindestens zwei unterschiedlichen Verfahren der Datenvorbehandlung 5, 6, 7, 8 der Spektren 4 und des der jeweiligen Datenvorbehandlung 5, 6, 7, 8 zugeordneten Verfahrens zur Klassifizierung in den Gruppen 9, 10, 1 1 , 12 zur Ermittlung von mehreren, z.B. fünf Klassifikatoren je Gruppe 9, 10, 1 1 , 12, also von insgesamt vielen, z.B. zwanzig (fünf Klassifikator/Gruppe x vier Guppen) Klassifikatoren 131 , 132, 133, 134, 135, usw. für die Serien 14, 15, 16 durchgeführt. Dabei werden folgende Schritte nach Registrierung und Datenvorbehandlung der Spektren durchgeführt, wobei sich die Schritte auf die Fig. 1 beziehen: In the method 1 for classifying spectra 4 of objects 2 having complex information content with at least two different object information, after the registration using a method of pretreating data and a method of classification associated with the data pretreatment, the calculation of a classifier takes place. According to the invention, after registration and data pretreatment of spectra 4, a multiple classification method with at least two different methods of data pretreatment 5, 6, 7, 8 of the spectra 4 and the method for classification in groups 9 assigned to the respective data pretreatment 5, 6, 7, 8 10, 1 1, 12 for determining a plurality, eg five classifiers per group 9, 10, 1 1, 12, that is from a total of many, eg twenty (five classifier / group x four groups) classifiers 131, 132, 133, 134, 135, etc. performed for the series 14, 15, 16. The following steps are carried out after registration and data pretreatment of the spectra, the steps relating to FIG. 1:
- eine Berechnung von fünf Klassifikatoren der Serien 13, 14, 15, 16 pro Art der Datenvorbehandlung 5, 6, 7, 8, so dass schließlich zwanzig Klassifikatoren 131 , 132, 133, 134, 135, usw. ermittelt werden, a calculation of five classifiers of series 13, 14, 15, 16 per type of data pre-treatment 5, 6, 7, 8 so that finally twenty classifiers 131, 132, 133, 134, 135, etc. are determined,
- eine Ermittlung der fünf Klassifikatoren der Serien 13, 14, 15, 16, iterativ angepasst und validiert, - a determination of the five classifiers of series 13, 14, 15, 16, iteratively adapted and validated,
- eine Berechnung von Wahrscheinlichkeiten der Klassenzugehörigkeit, - a calculation of probabilities of class membership,
- eine gleichberechtigte Einbeziehung aller fünf Klassifikatoren der Serien 13, 14, 15, 16 bzw. Klassifikatoren 131 , 132, 133, 134, 135 usw. in die Ermittlung eines Klassifikationsergebnisses 18, z.B. in Form eines Medians 30. an equal inclusion of all five classifiers of the series 13, 14, 15, 16 or classifiers 131, 132, 133, 134, 135 etc. into the determination of a classification result 18, e.g. in the form of a median 30.
Bei der Festlegung bzw. Ermittlung der Anzahl der zu berechnenden Klassifikatoren NG in den Serien 13, 14, 15, 16 bezogen auf die Gruppen 9, 10, 1 1 , 12 werden ein Umfang der spektralen Datenpunkte vs und eine doppelte Halbbreite ws von spektralen Regionen Rs als auch eine Anzahl der ausgewählten spektralen Regionen Rs in folgender Gleichung (I) berücksichtigt: In determining or determining the number of classifiers N G to be calculated in the series 13, 14, 15, 16 with respect to the groups 9, 10, 11, 12, a circumference of the spectral data points vs and a double half-width w s of spectral regions R s as well as a number of the selected spectral regions R s in the following equation (I):
Nc = — N c = -
2ws - Rs ^ wobei mit der Gleichung (I) sichergestellt wird, dass jeder Datenpunkt vs mit gleicher Wahrscheinlichkeit ausgewählt werden kann. Für insgesamt zwanzig Klassifikatoren der vier Serien 13, 14, 15, 16 mit NG (13), Q (14), NG (15) und NG (16) gemäß Fig. 1 sowie gemäß der Fig. 5, Fig. 6 und Fig. 7 sind für den gesamten Spektralbereich von 500 cm"1 bis 2750 cm"1 beispielsweise folgende Parameter vorgegeben: 2w s - R s ^, where equation (I) ensures that each data point vs can be selected with equal probability. For a total of twenty classifiers of the four series 13, 14, 15, 16 with N G (13), Q (14), N G (15) and N G (16) according to FIG. 1 as well as according to FIG. 5, FIG. 6 and FIG. 7, the following parameters are given for the entire spectral range of 500 cm "1 to 2750 cm " 1, for example:
Umfang der spektralen Datenpunkte vs in einem vorgegebenen gesamten Spektralbereich 500 cm"1 bis 2750 cm"1 mit vs = 800, Scope of the spectral data points vs in a given entire spectral range 500 cm "1 to 2750 cm " 1 with v s = 800,
Anzahl der ausgewählten spektralen Regionen Rs mit Rs = 8, Number of selected spectral regions R s with R s = 8,
Breite B der spektralen Regionen Rs mit B = 2 ■ ws = 5, d.h. in einer Region Rs können sich zwanzig Datenpunkte vs befinden. Die Halbbreite ws beträgt damit ws = 2,5. Width B of the spectral regions R s with B = 2 ■ w s = 5, ie in a region R s there may be twenty data points vs. The half-width ws is thus ws = 2.5.
Die Spektrenvorbehandlungen 6, 7, 8 können gemäß Fig. 2b, 2c, 2d derart strukturiert werden, dass jeweils bestimmte Merkmale favorisiert werden und hervortreten und andere Merkmale unterdrückt werden. The spectral pretreatments 6, 7, 8 can be structured in accordance with FIGS. 2b, 2c, 2d such that particular features are favored and stand out and other features are suppressed.
Bei der Spektrenvorbehandlung 5 der Rohspektren 25 gemäß Fig. 2a können alle berücksichtigten Merkmale als gleichberechtigt behandelt und vorbehandelt werden. Die vorbehandelten Spektren 4 werden als Trainingsset 24 gemäß Fig. 4b ausgelegt und mehrere Klassifikatoren der Serien 13, 14, 15, 16 bzw. z.B. im Detail für Serie 13 die Klassifikatoren 131 , 132, 133, 134, 135 usw. iterativ bestimmt und validiert. Nach Durchlauf mindestens zweier mit je einer vorangegangenen spektrumunterschiedlichen Datenvorbehandlung 5, 6, 7, 8 versehenen Klassiizierungsverfahren 9, 10, 1 1 , 12 mit mindestens einem ermittelten Klassifikator 131 , 141 , 151 , 161 können gemäß Fig. 1 gesamtheitlich mindestens zwei der ermittelten Klassifikatoren 131 , 141 , 151 , 161 zur Bewertung und der nachfolgenden Ermittlung eines Wahrscheinlichkeitsergebnisses 18 bezüglich der vorgegebenen unterschiedlichen Objektinformationen 31 , 32 erreicht und eingesetzt werden, wobei das Wahrscheinlichkeitsergebnis 18 ausgegeben wird, so dass ein Schluss zumindest auf die mit einem höchsten Wert ermittelte Objektinformation 31 oder 32 ermöglicht wird. Es kann mindestens ein Verfahren der gestützten Klassifizierung und/oder der nichtgestützten Klassifizierung zur Selektion spektraler Regionen Rs oder einzelner Wellenlängenbereiche/Wellenzahlbereiche und nachfolgender Analyse eingesetzt werden. In the spectral pretreatment 5 of the raw spectra 25 according to FIG. 2a, all the features taken into consideration can be treated as equal and pretreated. The pretreated spectra 4 are designed as a training set 24 according to FIG. 4b and several classifiers of the series 13, 14, 15, 16 or eg in detail for series 13 the classifiers 131, 132, 133, 134, 135, etc. iteratively determined and validated , After passing through at least two classifying processes 9, 10, 11, 12, each with a preceding spectrum-different data pretreatment 5, 6, 7, 8 with at least one determined classifier 131, 141, 151, 161, at least two of the determined classifiers can be obtained as a whole 131, 141, 151, 161 for the evaluation and the subsequent determination of a probability result 18 with respect to the predetermined different object information 31, 32 achieved and are used, wherein the probability result 18 is output, so that a conclusion is made possible at least on the highest value determined object information 31 or 32. At least one method of supported classification and / or unsupported classification may be used to select spectral regions R s or single wavelength ranges / wavenumber ranges and subsequent analysis.
Die nachfolgende Analyse kann eine lineare Diskriminanzanalyse oder eine nichtlineare Diskriminanzanalyse sein. The subsequent analysis may be a linear discriminant analysis or a non-linear discriminant analysis.
Es kann aber auch als ein Verfahren zur Klassifizierung in den Gruppen 9, 10, 1 1 , 12 ein Verfahren der neuronalen Netze und/oder ein Verfahren der linearen Zeit- Frequenz-Transformationen (engl. Wavelets) eingesetzt werden. However, it is also possible to use as a method for classification in groups 9, 10, 11, 12 a method of neural networks and / or a method of linear time-frequency transformations (English: Wavelets).
Die Spektren 4 der optischen Molekülspektroskopie, wie Absorption, Emission, Streuung bzw. UV/vis, NIR, IR Absorption, Fluoreszenz, Raman können mit dem erfindungsgemäßen Verfahren klassifiziert werden. Zu den in Fig. 1 gezeigten Datenvorbehandlungen 5, 6, 7, 8 können Rohspektren 25, Basislinienkorrekturen 26, Normierungen 27, Ableitungen, Covarianz und/oder eine Hauptkomponentenanalyse/Ramanspektren 28 festgelegt und eingesetzt werden. Eine Datenvorbehandlung besteht in der Ausbildung von digitalen Signalen, also von Datenpunkten, die aneinandergereiht die jeweilige berechnete Spektralkurve von 25, 26, 27, 28 ergeben und die somit den einzelnen eingesetzten unterschiedlichen Klassifizierungsverfahren zugeordnet werden können. The spectra 4 of the optical molecular spectroscopy, such as absorption, emission, scattering or UV / vis, NIR, IR absorption, fluorescence, Raman can be classified by the method according to the invention. For the data pretreatments 5, 6, 7, 8 shown in FIG. 1, raw spectra 25, baseline corrections 26, normalizations 27, derivatives, covariance and / or a principal component analysis / Raman spectra 28 can be defined and used. A data pretreatment consists in the formation of digital signals, that is to say of data points which, when lined up, yield the respective calculated spectral curve of 25, 26, 27, 28 and which can thus be assigned to the individual different classification methods used.
Zur Bewertung der Klassifikatoren der Serien 13, 14, 15, 16 für ein Klassifikationsergebnis 18 kann eine Berechnung eines Medians 30 (Fig. 7. Fig. 9, Fig. 1 1 a) für ein Objekt 2 oder eine Durchführung (Fig. 1 1 a, Fig. 1 1 b) einer Clusteranalyse vorgesehen werden. Als Beispiel für eine Auswertung kann die bekannte k-means Clusteranalyse eingesetzt werden. Dabei werden in Fig. 1 1 a mindestens zwei Cluster für „männlich" bzw.„weiblich" vorgegeben. Jener Cluster, dem die meisten Elemente, d.h. Wahrscheinlichkeiten, zugeordnet werden, definiert das Geschlecht (Fig. 1 1 b— männlich). Als Cluster wird eine Gruppe von zusammengestellten Elementen mit ähnlichen Eigenschaften (hier: Wahrscheinlichkeiten - Klassifikationsergebnisse) bezeichnet. Die Fig. 1 1 a zeigt eine Kurve der Abhängigkeit zwischen Wahrscheinlichkeit mit einem Merkmal„männlich" und einer Klassifikatorenanzahl von 120 Klassifikatoren. Im Plot der sortierten Wahrscheinlichkeiten zeigt sich, dass der Median 30 knapp oberhalb der Trenngrenze 42 von 0,5 der Wahrscheinlichkeitskoordinate liegt. Damit wird das Ei 2 gerade noch als männlich klassifiziert werden. Die bekannte k- means Clusteranalyse führt hier zu einem deutlicheren Ergebnis. For evaluating the classifiers of the series 13, 14, 15, 16 for a classification result 18, a calculation of a median 30 (FIG. 7, 9, 11 a) for an object 2 or a feedthrough (FIG a, Fig. 1 1 b) are provided a cluster analysis. As an example of an evaluation, the known k-means cluster analysis can be used. In this case, at least two clusters for "male" or "female" are given in FIG. 11a. The cluster to which most of the elements, ie probabilities, are assigned, defines the gender (Fig. 11b-male). A cluster is a group of composite elements with similar properties (here: probabilities - classification results). 1 a shows a curve of the dependence between probability with a characteristic "male" and a classifier number of 120 classifiers The plot of the sorted probabilities shows that the median 30 is just above the separation limit 42 of 0.5 of the probability coordinate Thus, the egg 2 is barely classified as male, and the well-known k-means cluster analysis leads to a clearer result.
Dazu sind in der Fig. 1 1 b eine erste Histogramm-Darstellung 43 der Abhängigkeit zwischen der Anzahl von Elementen des Clusters und dem Schwerpunkt des Clusters und in der Fig. 1 1 c eine zweite Histogramm-Darstellung 44 der Abhängigkeit zwischen der Anzahl von Elementen des Clusters und dem Schwerpunkt des Clusters gezeigt, wobei als Elemente die erreichten Klassifikationsergebnisse gelten. 1 1 b, a first histogram representation 43 of the dependence between the number of elements of the cluster and the center of gravity of the cluster, and FIG. 11 c a second histogram representation 44 of the dependence between the number of elements of the cluster and the center of gravity of the cluster, whereby the achieved classification results apply as elements.
Dazu sind in Fig. 1 1 b zwei Cluster gebildet, deren Schwerpunkte bei 0,84 und 0,17 liegen. Da dem Cluster mit dem Schwerpunkt 0,84 mehr Elemente, d.h. Klassifikationsergebnisse, zugeordnet werden, kann das Ei 2 als eindeutig männlich bewertet werden. For this purpose, 1 b two clusters are formed in Fig. 1, the centers of gravity are 0.84 and 0.17. Because the cluster with the centroid 0.84 has more elements, i. Classification results are assigned, the egg 2 can be rated as clearly male.
Bei der Wahl von fünf Clustern in der Histogramm-Darstellung 44 gemäß Fig. 1 1 c wird das Ergebnis ebenso bestätigt. Hier werden 65 berechnete Wahrscheinlichkeitswerte als männlich eingeordnet, wobei der Cluster (Nummer 4 = #4) mit dem stärksten Wert 0,96 für„männlich" auch die meisten Elemente gemäß Fig. 1 1 a enthält. Damit ist das Geschlecht des Eies 2 eindeutig„männlich". In the selection of five clusters in the histogram representation 44 according to FIG. 11c, the result is also confirmed. Here 65 calculated probability values are classified as male, whereby the cluster (number 4 = # 4) with the strongest value 0.96 for "male" also contains most of the elements according to Fig. 11a, so that the gender of the egg 2 is clearly "male".
Gleiches und Ähnliches gilt auch für die Clusteranalyse, wenn das Geschlecht des Eies 2 als weiblich ermittelt wird. The same and the same applies to the cluster analysis, if the sex of the egg 2 is determined as female.
Das erfindungsgemäße Verfahren 1 kann mittels folgender Schritte unter Verwendung von Hardware-Komponenten einer zugehörigen Vorrichtung realisiert werden: The method 1 according to the invention can be realized by means of the following steps using hardware components of an associated device:
- Aufnahme und Registrierung der Spektren 4 mittels zumindest einer optischen Einrichtung mit zumindest einem Spektrometer und/oder weiteren - Recording and registration of the spectra 4 by means of at least one optical device with at least one spectrometer and / or further
Detektoren, detectors,
- Erzeugung von digitalisierten Signalen, den Datenpunkten, und Speicherung der detektierten Spektren 4 in Speichereinheiten der Klassifikationseinheiten einer Auswerteeinheit, Generation of digitized signals, the data points, and storage of the detected spectra 4 in storage units of the classification units of an evaluation unit,
- Spektrenvorbehandlung 5, 6, 7, 8, indem die aus den Datenpunkten vs bestehenden gespeicherten Spektren 4 in den einzelnen Speichereinheiten einzeln ausgewertet werden und die zugehörigen digitalisierten ausgewerteten Signale zur Weiterverarbeitung bereitgestellt werden, Spectral pretreatment 5, 6, 7, 8, in that the stored spectra 4 consisting of the data points vs are evaluated individually in the individual storage units and the associated digitized evaluated signals are made available for further processing,
- Auslegung oder Ausbildung der vorbehandelten Spektren 25, 26, 27, 28 als Trainingsset 19 und als davon getrenntes Testset 29, - design or formation of the pretreated spectra 25, 26, 27, 28 as a training set 19 and as a separate test set 29,
- Berechnung der Klassifikatoren der Serien 13, 14, 15, 16 in Form von einzelnen Klassifikatoren 131 , 132, 133, 134, 135 einer Serie 13 usw. der berücksichtigten einzelnen Klassifizierungsverfahren 9, 10, 1 1 , 12 unter Einbeziehung von iterativen Verfahren und einer Validierung in den Klassifizierungseinheiten/-gruppen, - Calculation of classifiers of series 13, 14, 15, 16 in the form of individual classifiers 131, 132, 133, 134, 135 of a series 13, etc. of the considered individual classification methods 9, 10, 1 1, 12 involving iterative methods and a validation in the classification units / groups,
- Klassifizierung der ausgewerteten Spektren 25, 26, 27, 28 des Testsets 24 mit allen Klassifikatoren der Serien 13, 14, 15, 16, Classification of the evaluated spectra 25, 26, 27, 28 of the test set 24 with all classifiers of the series 13, 14, 15, 16,
- Einordnung der Spektren 25, 26, 27, 28 in eine Klasse von Objektinformationen mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit, - Berechnung des Medians 30 oder Durchführung einer vordem genannten Clusteranalyse zur Darstellung des Wahrscheinlichkeitsergebnisses in Form eines Klassifikationsergebnisses 18 der einer Klasse zugehörigen Objektinformationen. Classifying the spectra 25, 26, 27, 28 into a class of object information with an expression of a class membership probability, Calculation of the median 30 or execution of a previously mentioned cluster analysis to display the probability result in the form of a classification result 18 of the object information associated with a class.
Der Aufbau von Klassifikatoren bezüglich der Serien 13, 14, 15, 16 mittels eines Trainingssets 19 wird durch ein Testset 29 mit z.B. maximal 30% der Spektren (gestrichelte Linie zu den Klassifikatoren 13, 14, 15, 16) gemäß Fig. 4b verifiziert, so dass im Ergebnis ein klassifiziertes Testset 24 (gestrichelte Linie von den Klassifikatoren der Serien 13,14, 15, 16 zum klassifizierten Testset 24) erreicht wird. The construction of classifiers with respect to the series 13, 14, 15, 16 by means of a training set 19 is performed by a test set 29 with e.g. verified as a maximum of 30% of the spectra (dashed line to the classifiers 13, 14, 15, 16) according to FIG. 4b, so that as a result a classified test set 24 (broken line from the classifiers of the series 13, 14, 15, 16 to the classified Test set 24) is achieved.
Dazu ist zu bemerken, dass im Allgemeinen die registrierten in-ovo Spektren 4 naturgemäß hochvariabel sind. Dies begründet sich zum einen in der immanenten Variabilität biologischer Systeme und zum anderen in der Sensitivität der ramanspektroskopischen Messungen. It should be noted that in general the registered in-ovo spectra 4 are naturally highly variable. This is due, on the one hand, to the inherent variability of biological systems and, on the other hand, to the sensitivity of Raman spectroscopic measurements.
Externe Störungen systematischer und zufälliger Art führen zu einer hohen Variabilität der spektralen Merkmale und überlagern somit die geschlechtsrelevanten Informationen. External perturbations of a systematic and random nature lead to a high variability of the spectral features and thus superimpose the gender-relevant information.
Weiterhin tritt bei dem Verfahren der Ramanspektroskopie auch Fluoreszenzlicht auf, das zwar ebenso molekulare Informationen enthält, jedoch gleichzeitig die in der Regel viel schwächeren Ramanspektroskopischen molekularen Informationen über die Zusammensetzung des untersuchten Objektes 2 überlagert. In Fig. 2a ist eine schematische Darstellung der Rohspektren 25 als eines aller berücksichtigten einzelnen Klassifizierungsverfahren in Fig. 1 der vier einzelnen Klassifizierungsverfahren angegeben. Furthermore, in the method of Raman spectroscopy also fluorescent light occurs, which also contains molecular information, but at the same time superimposes the generally much weaker Raman spectroscopic molecular information on the composition of the examined object 2. FIG. 2 a shows a schematic representation of the raw spectra 25 as one of all considered individual classification methods in FIG. 1 of the four individual classification methods.
Generell lassen sich gemäß Fig. 2a, Fig. 2b, Fig, 2c und Fig. 2d mindestens vier Klassen von Signalen bzw. bestimmten Merkmalen bilden: In general, according to FIGS. 2 a, 2b, 2c and 2d, at least four classes of signals or specific features can be formed:
- molekulare Zusammensetzung 20, - Fluoreszenzintensität 21 , molecular composition 20, Fluorescence intensity 21,
- Fluoreszenzprofil 22 und - Fluorescence profile 22 and
- Variation physikalischer Parameter 23, wobei diese bestimmten Merkmale 20, 21 , 22, 23 zur sichtbaren Darstellung in Fig. 3a, Fig. 3b, Fig. 3c und Fig. 3d als gleich große umrandete und/oder unterschiedlich gestrichelt umrandete Kreise ausgebildet sind. - Variation of physical parameters 23, wherein these specific features 20, 21, 22, 23 are formed for visual representation in Fig. 3a, Fig. 3b, Fig. 3c and Fig. 3d as the same large bordered and / or different dashed lines surrounded circles.
Hinter den Klassifikatoren steht jeweils ein mathematischer Ausdruck zur Trennung der Signale gemäß der Objektinformationen 3 (31 weiblich, 32 männlich). Behind each classifier is a mathematical expression for the separation of the signals according to the object information 3 (31 female, 32 male).
Drei Klassen/Merkmale 20, 21 , 22 der vier Klassen/Merkmale 20, 21 , 22, 23 enthalten geschlechtsrelevante Informationen. Allerdings ist es nicht möglich, die Variation 23 der physikalischen Parameter aus den Spektren 4 so zu eliminieren, dass kein oder nur ein geringer Informationsverlust in den drei anderen Klassen 20, 21 , 22 entsteht. Die Rohspektren 25 haben somit durch die Gleichberechtigung aller bestimmten Merkmale den höchsten Gehalt an allen Informationen, aber auch den höchsten Gehalt an Störungen. Durch Hinzunahme mindestens einer der genannten Datenvorbehandlung z.B. 26 aus den Datenvorbehandlungen 26, 27, 28 mit unterschiedlich bewerteten Merkmalen werden die Störungen verringert. Durch Einsatz weiterer Datenvorbehandlungen 27, 28 werden die ursprünglichen Störungen minimiert oder sogar beseitigt. Three classes / features 20, 21, 22 of the four classes / features 20, 21, 22, 23 contain gender-relevant information. However, it is not possible to eliminate the variation 23 of the physical parameters from the spectra 4 such that no or only a small loss of information arises in the three other classes 20, 21, 22. The raw spectra 25 thus have the highest content of all information, but also the highest content of disturbances due to the equality of all certain characteristics. By adding at least one of said data pre-treatment e.g. 26 from the data pre-treatment 26, 27, 28 with differently valued features, the interference is reduced. By using additional data pre-treatments 27, 28, the original disturbances are minimized or even eliminated.
In Fig. 2b ist gezeigt, dass die als digitale Signale registrierten in-ovo Spektren 4 einer linearen Basislinienkorrektur 26 unterzogen werden, wobei sich das Fluoreszenzintensitätssignal 21 (großer Kreis) heraushebt. Gleichzeitig werden Signale 23 physikalischer Parameter in den Spektren unterdrückt (kleiner Kreis). Aufgrund der üblicherweise großen Intensitätsunterschiede zwischen Fluoreszenzsignal und Ramansignal treten auch die Informationen zur molekularen Zusammensetzung 20 (kleiner Kreis) in den Hintergrund. Die Fluoreszenzintensität 21 (großer Kreis) selbst ist jedoch ein potenzieller Marker für die Geschlechtserkennung, da männliche Embryonen häufig, jedoch nicht immer, eine biochemische Komposition im Blut aufweisen, die gegenüber weiblichen Embryonen bzw. dem Blut weiblicher Embryonen eine erhöhte Fluoreszenzintensität 21 aufweisen. It is shown in FIG. 2b that the in-ovo spectra 4 registered as digital signals are subjected to a linear baseline correction 26, whereby the fluorescence intensity signal 21 (large circle) stands out. At the same time, signals 23 of physical parameters in the spectra are suppressed (small circle). Due to the usually large differences in intensity between fluorescence signal and Raman signal, the information on the molecular Composition 20 (small circle) in the background. However, the fluorescence intensity 21 (large circle) itself is a potential marker for sex recognition because male embryos often, but not always, have a biochemical composition in the blood that has increased fluorescence intensity 21 over female embryos or female embryo blood.
In Fig. 2c ist gezeigt, dass mittels der Verfahren der Spektrennormierung 27, beispielsweise mittels Vektor- oder Flächennormierung, sich Variationen in der Fluoreszenzintensität 21 (kleiner Kreis) kompensieren und die zufälligen Einflüsse physikalischer Parameter 23 (kleiner Kreis) minimieren lassen. Damit lässt sich vorzugsweise das Fluoreszenzprofil 22 (großer Kreis) hervorheben. Gleichzeitig werden nur wenige Informationen der molekularen Zusammensetzung 20 (kleiner Kreis), beruhend auf den Ramansignalen, minimiert. Da das Fluoreszenzprofil 22, also die spektrale Charakteristik der Fluoreszenz, durch die molekulare Zusammensetzung 20 bestimmt wird, lassen sich geschlechtsrelevante Informationen hervorheben. FIG. 2c shows that by means of the methods of spectral normalization 27, for example by means of vector or surface normalization, it is possible to compensate for variations in the fluorescence intensity 21 (small circle) and to minimize the random influences of physical parameters 23 (small circle). Thus, the fluorescence profile 22 (large circle) can preferably be emphasized. At the same time, only a small amount of molecular composition information 20 (small circle) based on Raman signals is minimized. Since the fluorescence profile 22, ie the spectral characteristic of the fluorescence, is determined by the molecular composition 20, information relevant to gender can be highlighted.
In Fig. 2d ist gezeigt, dass eine möglichst vollständige Korrektur des sogenannten Untergrundes von Ramanspektren 28 zur alleinigen Hervorhebung der Ramanbanden, also der Informationen zur molekularen Struktur und Zusammensetzung 20 (großer Kreis) des untersuchten Objektes 2 führt. FIG. 2d shows that as complete a correction as possible of the so-called background of Raman spectra 28 leads to the sole highlighting of the Raman bands, that is to say the information about the molecular structure and composition 20 (large circle) of the examined object 2.
In den Fig. 3a, 3b, 3c und 3d sind jeweils eine schematische Darstellung der den einzelnen Klassifizierungsverfahren zugeordneten Spektren (bezogen auf die relative Wellenzahl) in Bezug auf die Fig. 2a, 2b, 2c, 2d angegeben. FIGS. 3a, 3b, 3c and 3d each show a schematic representation of the spectra associated with the individual classification methods (relative to the relative wavenumber) with reference to FIGS. 2a, 2b, 2c, 2d.
Dabei wird zumindest die Spektrenvorbehandlung 5 mit gleich bestimmten Merkmalen zumindest einer der Spektrenvorbehandlungen 6, 7, 8 mit unterschiedlich bestimmten Merkmalen zur Auswertung hinzugefügt. In Fig. 4b ist ein Flussdiagramm für das erfindungsgemäße multiple Klassifizierungsverfahren mit Trainingsset und Testset in örtlicher Trennung, aber in algorithmischer Verbindung mit einer Klassifikationsergebnis-Gestaltung aus einer großen Anzahl von Klassifikatoren gezeigt. Dabei ist die jeweilige Spektrenvorbehandlung dabei so strukturiert, dass jeweils bestimmte Merkmale deutlicher hervortreten und andere Merkmale stärker unterdrückt werden. Die so vorbehandelten Spektren 4 werden gemäß Fig. 4b nun als variables Trainingsset 19 ausgelegt, wobei mehrere Serien 13, 14, 15, 16 von Klassifikatoren z.B. im Detail einer Serie 131 , 132, 133, 134, 135 usw. berechnet werden. Üblicherweise werden alle Klassifikatoren der Serien 13, 14, 15, 16 iterativ berechnet und validiert. Variabilität bedeutet, dass ohne weitere Vorbedingungen beliebige Spektren für jeden zu berechnenden Klassifikator ausgewählt werden können. Auf diese Art lassen sich z.B. mehrere Klassifikatoren 131 , 132, 133, 134, 135 für die erste Serie 13 usw. bestimmen. Für die anderen Serien 14, 15, 16 gilt dies ebenso. Die ausgesuchten Spektren des Testsets 29, z.B. 30%, werden gemäß Fig. 4b nachfolgend mit allen Klassifikatoren zu einem klassifizierten Testset 24 klassifiziert. Die Einordnung der Spektren 4; 25, 26, 27, 28 in eine bestimmte Klasse der Merkmale (männlich, weiblich) geschieht dabei vorzugsweise als Punkt- Wert (engl. Score) oder in einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit. Um aus den Klassifikatoren der Serien 13, 14, 15, 16 bzw. 131 , 132 133, 134, 135 usw. eine alleinige Aussage zu gewinnen, werden die Verhältnisse innerhalb der Klassifikatoren 13, 14, 15, 16; 131 , 132, 133, 134, 135 ermittelt. Ein einfaches Mittel hierzu ist die Berechnung des Medians 30 oder, wie z.B. vordem angegeben, die Durchführung einer Clusteranalyse. In this case, at least the spectral pretreatment 5 with identically determined features of at least one of the spectral pretreatments 6, 7, 8 with differently determined features is added to the evaluation. 4b shows a flow chart for the multiple classification method according to the invention with training set and test set in local separation, but in algorithmic connection with a classification result design from a large number of classifiers. In this case, the respective spectral pretreatment is structured so that in each case certain features stand out more clearly and other features are more strongly suppressed. According to FIG. 4b, the pretreated spectra 4 are now designed as a variable training set 19, with several series 13, 14, 15, 16 of classifiers being calculated, for example, in detail of a series 131, 132, 133, 134, 135 and so on. Usually all classifiers of series 13, 14, 15, 16 are calculated and validated iteratively. Variability means that without further preconditions any spectra can be selected for each classifier to be calculated. In this way, for example, several classifiers 131, 132, 133, 134, 135 for the first series 13, etc. can be determined. This also applies to the other series 14, 15, 16. The selected spectra of the test set 29, eg 30%, are classified according to FIG. 4b below with all classifiers to a classified test set 24. Classification of spectra 4; 25, 26, 27, 28 into a certain class of the characteristics (male, female) is preferably carried out as a score or in an expression of a probability for class membership. In order to obtain a sole statement from the classifiers of the series 13, 14, 15, 16 or 131, 132, 133, 134, 135, etc., the relationships within the classifiers 13, 14, 15, 16; 131, 132, 133, 134, 135 determined. A simple means of doing this is to compute the median 30 or, as stated previously, perform a cluster analysis.
In dem in Fig. 4b dargestellten Flussdiagramm erfolgt in dem mit dem Bezugszeichen 45 = © versehenen Punkt ein Vergleich jedes klassifizierten Spektrums jeder Form der Vorbehandlung mit dem Merkmal. Dabei wird als Ergebnis nur„richtig" oder„falsch" ausgegeben. In the flow chart shown in Fig. 4b, at the point indicated by 45 = ein, a comparison is made of each classified spectrum of each form of pretreatment with the feature. As a result, only "correct" or "wrong" is output.
Beispiel: Das Trainingset 19 umfasst 100 Spektren. Davon werden 60 für die Berechnung der Klassifikatoren ausgewählt. Werden vier Verfahren der Datenvorbehandlung 5, 6, 7, 8 eingesetzt, liegen 60 x 4 = 240 klassifizierte Spektren vor. Aus dem Vergleich mit der Merkmals liste ergeben sich somit 240 Aussagen entweder „richtig" oder„falsch". Dieses Ergebnis wird beispielsweise in der festgelegten 129. Iterationsstufe erzielt. Example: The training set 19 comprises 100 spectra. Of these, 60 are selected for the calculation of the classifiers. If four methods of data pre-treatment 5, 6, 7, 8 are used, there are 60 x 4 = 240 classified spectra. From the comparison with the feature list, 240 statements result either "right" or "wrong". This result is achieved, for example, in the specified 129th iteration stage.
In dem mit dem Bezugszeichen 46 = © bezeichneten Punkt erfolgt eine Bewertung der klassifizierten Spektren hinsichtlich eines festgelegten Kriteriums oder mehrerer festgelegter Kriterien. Als Kriterien dienen zum Beispiel eine Schranke der Genauigkeit oder eine maximale Anzahl iterativer Schritte. Die Kriterien können logisch UND oder logisch ODER verknüpft sein. In the point denoted by the reference numeral 46 = ©, an evaluation of the classified spectra is carried out with respect to a specified criterion or several specified criteria. The criteria used are, for example, a limit of accuracy or a maximum number of iterative steps. The criteria may be logical AND or logical OR linked.
Beispiel: Von den möglichen 240 Aussagen sind 205„richtig" und 35„falsch". Damit ergibt sich eine Richtigkeit für das Trainingset von 85%. Example: Of the possible 240 statements, 205 are "right" and 35 are "wrong". This results in a correctness for the training set of 85%.
Vor Beginn der Klassifizierung werden als Kriterien festgelegt: Before the start of the classification, criteria are set as:
1. Richtigkeit > 80% und 1st accuracy> 80% and
2. eine maximale Anzahl von Iterationen: 1000. 2. a maximum number of iterations: 1000.
d.h: nach der beendeten that is, after the finished
129. Iterationsstufe < 1000 129. iteration stage <1000
und bei and at
einer erzielten Richtigkeit von 85% > vorgegebene Richtigkeit. an accuracy of 85% achieved> given correctness.
Bei logisch UND kann„schlecht" (wobei aber die Klassifikatoren als bestes If logical AND can be "bad" (but the classifiers as the best
Zwischenergebnis gespeichert werden) und Intermediate result are saved) and
bei logisch ODER kann„gut" erreicht werden. with logical OR, "good" can be achieved.
Wenn an der mit dem Bezugszeichen 47 = © angegebenen Stelle die Anzahl der vorgegebenen, zu bestimmenden Klassifikatoren erreicht ist, werden alle Klassifikatoren (und zwar jeweils die zu dem besten Ergebnis bei Punkt © = 45 geführt haben) an die Validierung des gesamten Trainingsets 19 übergeben. Beispiel: Es wird vorgegeben, 30 Klassifikatoren je Datenvorbehandlung 5, 6, 7, 8 zu berechnen und zu einer multiplen Klassifikation geführt. Damit werden 30 x 4 = 120 Klassifikatoren zur Validierung übergeben. An dem mit dem Bezugszeichen 48 = ® angegebenen Punkt/Vergleichsstelle erfolgt eine gemeinsame Bewertung der Klassifizierung von allen Spektren des Trainingsets 19 nach der Methode Leave-one-out oder Cross-Validierung. If the number of predefined classifiers to be determined is reached at the point indicated by reference symbol 47 = ©, all classifiers (each having led to the best result at point © = 45) are passed to the validation of the entire training set 19 , Example: It is prescribed to calculate 30 classifiers per data pre-treatment 5, 6, 7, 8 and lead to a multiple classification. This will pass 30 x 4 = 120 classifiers for validation. At the point / reference junction indicated by the reference symbol 48 = ®, a joint evaluation of the classification of all spectra of the training set 19 is carried out by the method of leave-one-out or cross-validation.
Bei „bestandenem Test" werden die Klassifikatoren zur Klassifizierung der „unbekannten" Spektren des Testsets 29 übergeben. In the case of an "passed test", the classifiers are passed to classify the "unknown" spectra of the test set 29.
Wird der Test nicht bestanden, ist keine Klassifizierung entsprechend den vorgegebenen Kriterien möglich. If the test fails, classification is not possible according to the given criteria.
In dem mit dem Bezugszeichen 49 = © angegebenen Punkt/Vergleichsstelle wird eine abschließende Bewertung der Klassifizierung der Spektren des Testsets 24 anhand deren bekannter Merkmale durchgeführt. In the point / reference junction indicated by the reference symbol 49 = ©, a final evaluation of the classification of the spectra of the test set 24 is carried out on the basis of its known features.
Beispiel: Example:
Das Testset 29 umfasst 50 Spektren. Diese wurden jeweils mit 120 Klassifikatoren klassifiziert, d.h. jedem Spektrum werden 120 Wahrscheinlichkeiten für die Klassenzugehörigkeit zugeordnet. Entsprechend des Medians oder der Clusteranalyse ergibt sich daraus die Zugehörigkeit zu einer Klasse. Dies ist das Ergebnis der multiplen Klassifizierung für jedes einzelne Spektrum. Sind von den 50 Spektren beispielsweise 41 richtig klassifiziert, ergibt sich daraus eine Richtigkeit für das gesamte Testset 24 von 82%, Aus dem Vergleich mit der Merkmalsliste wird das so erstellte Verfahren 1 der multiplen Klassifikation abschließend bewertet. Damit ist das Verfahren erstellt und kann nun für Spektren ohne Kenntnis der Merkmale eingesetzt werden. The test set 29 comprises 50 spectra. These were each classified with 120 classifiers, i. Each spectrum is assigned 120 probabilities for class membership. According to the median or the cluster analysis, this results in belonging to a class. This is the result of the multiple classification for each individual spectrum. For example, if 41 of the 50 spectra are correctly classified, this results in an accuracy of 82% for the entire test set 24. From the comparison with the feature list, the thus created method 1 of the multiple classification is finally evaluated. Thus, the method is created and can now be used for spectra without knowledge of the features.
In Fig. 5 ist eine schematische Darstellung einer Wahrscheinlichkeits/Klassifikato- renanzahl-Säulendarstellung 38 für 20 Klassifikatoren gemäß Fig. 1 für die Anzeige eines als weiblich identifizierten Eies 2 gezeigt. Dabei können die unschraffierten Endbereiche/Stirnflächen 33 von Säulen 34 als dem weiblichen Geschlecht zugehörig oberhalb einer bestimmten Linienführung - der Trenngrenze 42 - liegen und die Säulen 35 mit den schraffierten Endbereichen/Stirnflächen 36 als dem männlichen Geschlecht zugehörig unterhalb der Trenngrenze 42 liegen. Der Trenngrenzenwert liegt in Fig. 5 bei 0,5 und der Median 30 hat dort den Wert 0.72. Damit wird das Ei 2 als eindeutig„weiblich" eingeordnet. FIG. 5 shows a schematic representation of a probability / classifier number column representation 38 for 20 classifiers according to FIG. 1 for the display of an egg 2 identified as female. This can be the unshaded End portions / end faces 33 of columns 34 belonging to the female gender above a certain line - the separation boundary 42 - lie and the columns 35 lie with the hatched end portions / end faces 36 as the male sex belonging to the separation boundary 42. The separation limit value is 0.5 in FIG. 5 and the median 30 has the value 0.72 there. Thus, the egg 2 is classified as clearly "female".
In Fig. 6 ist die zur perspektivischen Säulendarstellung zugehörige Draufsicht gezeigt, die auf einem Farb-Display als Klassifikationsergebnisbild 37 mit der Mehrzahl der unschraffierten Endbereiche/Stirnflächen 33 für die Objektinformation 31 „weiblich" angegeben ist. Auf dem Farb-Display können die unschraffierten Stirnflächen 33 rot und die schraffierten Stirnflächen 36 blau ausgebildet sein, so dass auch eine farbliche sichtbare Darstellung der Bewertung des Geschlechts gemacht werden kann. Shown in Fig. 6 is the perspective view associated with the perspective view of the column, which is indicated on a color display as the classification result image 37 with the plurality of unshaded end areas / end faces 33 for the object information 31 "female." On the color display, the unshaded faces 33 red and the hatched end faces 36 may be blue, so that a color visual representation of the rating of the sex can be made.
Dabei können die schraffierten Quadrate in blauer Farbe und die unschraffierten Quadrate in roter Farbe dargestellt sein. Die wenigen blauen Quadrate zeigen die männliche Objektinformation 32 an. Die überwiegend roten Quadrate zeigen die weibliche Objektinformation 31 an. Da die roten Quadrate überwiegen, kann das Geschlecht des bebrüteten Hühnereies 2 als weibliches Merkmal 31 identifiziert werden. The shaded squares can be displayed in blue and the unshaded squares in red. The few blue squares indicate the male object information 32. The predominantly red squares indicate the female object information 31. Since the red squares predominate, the gender of the incubated chicken egg 2 can be identified as a female trait 31.
In Fig. 7 ist eine Darstellung des berechneten Medians 30 bei 10 Klassifikatoren im Verhältnis zur Anzahl der zwanzig Klassifikatoren für ein Ei 2 gemäß Fig. 1 mit einer Serie von je fünf Klassifikatoren 131 , 132, 133, 134, 135 pro Gruppe bei vier Gruppen 9, 10, 1 1 , 12 angegeben. Dabei ergeben in der Säulen- und Median- Darstellung 17 Klassiikatoren die Anzeige eines weiblichen Eies 2. Das Gesamtklassifikationsergebnis 18 kann mit dem berechneten Median 30 angegeben werden. In Fig. 8 ist eine schematische Darstellung einer weiteren beispielshaften Wahrscheinlichkeits/Klassifikatorenanzahl-Säulendarstellung 39 für 120 Klassifikatoren, als Säulen dargestellt, für die Anzeige eines als weiblich identifizierten Eies 2 gezeigt. Die Trenngrenze 42 zeigt auch hier die Grenze zwischen dem Merkmal„männlich" und dem Merkmal„weiblich". Auch hier sind die oberhalb der Trenngrenze 42 endenden Säulen 34 (31 ) auf den Stirnflächen unschraffiert und die unterhalb der Trenngrenze 42 endenden Säulen 35 (32) schraffiert angegeben. FIG. 7 shows a representation of the calculated median 30 for 10 classifiers in relation to the number of twenty classifiers for an egg 2 according to FIG. 1 with a series of five classifiers 131, 132, 133, 134, 135 per group in four groups 9, 10, 1 1, 12 indicated. In the column and median representation, 17 classifiers give the indication of a female egg 2. The total classification result 18 can be given with the calculated median 30. FIG. 8 is a schematic representation of another exemplary probability / classifier number column representation 39 for 120 Classifiers, shown as columns, for displaying an egg 2 identified as female. The separation boundary 42 also shows the boundary between the feature "male" and the feature "female". Here, too, the columns 34 (31) ending above the separation boundary 42 are hatched on the end faces and the hatches 35 (32) ending below the separation boundary 42 are indicated by hatching.
Bei einem Ei 2 mit männlichem Geschlechtsmerkmal 32 kann eine andere Säulendarstellung ausgebildet sein, wobei dann die oberhalb der Trenngrenze 42 liegenden Stirnflächen der ausgebildeten Säulen 35 in ihrer Mehrzahl gegenüber den nicht schraffierten Stirnflächen der Säulen 34 schraffiert sind (nicht gezeichnet). In an egg 2 with male gender feature 32, another column representation may be formed, in which case the above the separation boundary 42 lying end faces of the formed columns 35 in their majority compared to the non-hatched end faces of the columns 34 are hatched (not shown).
In Fig. 9 ist eine Darstellung des berechneten Medians 30 im Verhältnis zur Anzahl der insgesamt 120 Klassifikatoren gemäß der Säulendarstellung in Fig. 8 in einer Wahrscheinlichkeits/Klassifikatoranzahl-Darstellung für ein Ei 2 mit weiblichem Geschlechtsmerkmal 31 mit nach steigenden Punkten sortierten Klassifikatoren angegeben. Der Median 30 liegt hier bei der Hälfte der ermittelten 120 Klassifikatoren und hat einen Wert der Wahrscheinlichkeit von 0,95. FIG. 9 shows a plot of the calculated median 30 in relation to the number of total 120 classifiers according to the column representation in FIG. 8 in a probability / classifier representation for a female gender feature 31 with classifiers sorted by increasing points. Here, the median 30 is half of the calculated 120 classifiers and has a probability of 0.95.
Die in einer Auswerteeinheit enthaltenen Klassifizierungseinheiten/-gruppen 9, 10, 1 1 , 12 zur Bestimmung der Objektinformation in Form von dualen Geschlechtsmerkmalen 31 , 32 - weiblich oder männlich - von befruchteten und unbebrüteten und bebrüteten Eiern 2 funktionieren folgendermaßen: The classification units / groups 9, 10, 11, 12 for determining the object information in the form of dual sex characteristics 31, 32 - female or male - of fertilized and non-hatched and incubated eggs 2, which are contained in an evaluation unit, function as follows:
Es wird die Funktionsweise erläutert. It explains the operation.
Von jeder Klasse 25, 26, 27, 28 werden nach der Spektrenvorbehandlung 5, 6, 7, 8 mehrere Klassifikatoren der Serien 13, 14, 15, 16 berechnet. Die Bestimmung der Klassifikatoren-Serien 13, 14, 15, 16 geschieht nach einem Algorithmus der in einer Art Tandemverfahren zunächst spektrale Regionen Rs aus der Koordinate der relativen Wellenzahlen auswählt und die Intensitätswerte der ausgewählten Regionen Rs nachfolgend mittels Diskriminanzanalyse klassifiziert. Im Vergleich zu den Trainingsdaten der Klassengehörigkeit erfolgt in einem wiederholten Schritt erneut eine Auswahl von Spektren-Klassen und die Klassifzierung der Intensitätswerte. Dieser Zyklus wird iterativ bis zum Erreichen einer nicht mehr verbesserbaren Genauigkeit wiederholt, wobei das Abbruchkriterium vorgegeben werden kann. From each class 25, 26, 27, 28, several classifiers of the series 13, 14, 15, 16 are calculated after the spectral pre-treatment 5, 6, 7, 8. The determination of the classifier series 13, 14, 15, 16 takes place according to an algorithm which initially selects spectral regions R s from the coordinate of the relative wavenumbers in a kind of tandem method and subsequently classifies the intensity values of the selected regions R s by means of discriminant analysis. In comparison with the training data of the class affiliation, a selection of spectral classes and the classification of the intensity values takes place in a repeated step again. This cycle is repeated iteratively until reaching a no longer improvable accuracy, wherein the termination criterion can be specified.
Die Gefahr des Übertrainierens und damit ein Erreichen hoher Instabilitäten wächst, je mehr spektrale Klassen 25, 26, 27, 28 für die Klassifizierung herangezogen werden. Daher ist es wünschenswert, nur wenige (3 bis maximal 20) spektrale Klassen für die Erstellung der Klassifikator-Serien 13, 14, 15, 16 einzusetzen. Da aber die geschlechtsrelevanten Informationen über den gesamten Spektralbereich, wenn auch unterschiedlich, verteilt sind, würden bei der Erstellung nur eines Klassifikators sogar wesentliche spektrale Informationen ungenutzt bleiben. Aus diesem Grund ist es zweckmäßig, dass mehrere (10 bis 30) Klassifikatoren in den Serien 13, 14, 15, 16 pro Gruppe der Datenvorbehandlung 5, 6, 7, 8 berechnet werden. The risk of over-training and thus the achievement of high instabilities increases the more spectral classes 25, 26, 27, 28 are used for the classification. Therefore, it is desirable to use only a few (3 to a maximum of 20) spectral classes for the creation of the classifier series 13, 14, 15, 16. However, since the gender-relevant information is distributed over the entire spectral range, albeit differently, even the creation of just one classifier would even make essential spectral information unused. For this reason, it is expedient that several (10 to 30) classifiers are calculated in the series 13, 14, 15, 16 per group of data pretreatment 5, 6, 7, 8.
Dies hat zum Vorteil, dass zum einen die Genauigkeit der Klassifizierung verbessert wird, allein darauf beruhend, dass möglichst viele spektrale Informationen einbezogen werden und zum anderen die Robustheit, d.h. die Stabilität, vergrößert wird, da mehrere Klassifikatoren der Serien 13, 14, 15, 16 die Zuordnung tragen und einzelne Fehlzuordnungen kompensiert werden. This has the advantage that on the one hand the accuracy of the classification is improved, based solely on the fact that as much spectral information as possible is included and on the other hand the robustness, i. the stability is increased, since several classifiers of the series 13, 14, 15, 16 carry the assignment and individual misalignments are compensated.
Die den Klassifizierungen zugeordneten Hardware-Einheiten arbeiten für alle vier Gruppen 9, 10, 1 1 , 12 gleich. Somit kann auch anstelle der vier parallel angesteuerten Einheiten nur eine Einheit eingesetzt werden, die seriell in einer vorgegebenen Reihenfolge die Serien 13, 14, 15, 16 der Klassifikatoren erstellt. Bei der Festlegung der Anzahl der berechneten Klassifikatoren NG in den Serien 13, 14, 15, 16 je Gruppe 9, 10, 1 1 , 12 ist der Umfang der spektralen Datenpunkte vs und die doppelte Halbbreite der spektralen Regionen ws als auch die Anzahl der ausgewählten spektralen Regionen Rs zu berücksichtigen: The hardware units assigned to the classifications work the same for all four groups 9, 10, 11, 12. Thus, instead of the four units driven in parallel, only one unit can be used which serially creates the series 13, 14, 15, 16 of the classifiers in a predetermined sequence. In determining the number of calculated classifiers N G in the series 13, 14, 15, 16 per group 9, 10, 11, 12, the circumference of the spectral data points v s and the double half width of the spectral regions ws and the number of the selected spectral regions R s :
Mit der Gleichung (I) wird sichergestellt, dass jeder Datenpunkt vs mit gleicher Wahrscheinlichkeit ausgewählt werden kann. Equation (I) ensures that each data point vs can be selected with equal probability.
In den Fig. 10a und Fig. 10b werden am Beispiel der Rohspektren (Intensitäts/Wellenzahl-Kurven) zwanzig Klassifikatoren pro Datenvorbehandlung 25 angegeben. Dazu ist in Fig. 10a ein Ausschnitt aus den zugehörigen männlichen Intensitäts/Wellenzahl-Kurven vergrößert dargestellt. Dabei beträgt der Umfang der spek- tralen Datenpunkte vs im gesamten Spektralbereich zwischen 500 cm"1 und 2750 cm"1 Datenpunkte. Die Anzahl der ausgewählten spektralen Regionen Rs beträgt in den Fig. 10a und Fig. 1 b Rs = 8 mit RSi, Rs2, Rs3, Rs4, Rss, Rs6, Rs7, und Rse-In FIGS. 10a and 10b, twenty classifiers per data pretreatment 25 are given using the example of the raw spectra (intensity / wavenumber curves). For this purpose, a section of the associated male intensity / wavenumber curves is shown enlarged in FIG. 10a. The circumference of the spectral data points v s in the entire spectral range between 500 cm "1 and 2750 cm " is 1 data point. The number of selected spectral regions R s in FIGS. 10 a and 1 b is Rs = 8 with R s i, R s 2, R s 3, R s 4, R s s , R s 6, R s 7, and R s
Daraus können gemäß Gleichung (I) zwanzig Klassifikatoren NG für das Rohspek- trum 25 berechnet werden. Das bedeutet bei vier Datenvorbehandlungen 25, 26, 27, 28 insgesamt 80 erzeugte (20 Klassifikatoren/Gruppe x 4 Gruppen) Klassifikatoren. From this, twenty classifiers N G for the raw spectrum 25 can be calculated according to equation (I). This means that in four data pre-treatments 25, 26, 27, 28 a total of 80 generated (20 classifiers / group x 4 groups) classifiers.
Nach dem vergrößerten Ausschnitt in Fig. 10c können die Datenpunkte vs auch zusätzlich gewichtet werden. Dazu ist ein Wichtungs-Diagramm 40 angegeben, aus dem erkenntlich ist, dass dem mittleren Datenpunkt 41 der höchste Wichtungswert zugeordnet ist. After the enlarged section in FIG. 10 c, the data points v s can also be weighted additionally. For this purpose, a weighting diagram 40 is indicated from which it can be seen that the highest weighting value is assigned to the middle data point 41.
Das kann sowohl mit dem männlichen Spektrum als auch mit dem weiblichen Spektrum durchgeführt werden. This can be done with both the male spectrum and the female spectrum.
Die Bewertung 17 und die Klassifizierung der den Klassifikatoren der Serien 13, 14, 15, 16 zugeordneten Ergebnisse werden in einer Bewertungseinheit durchgeführt und zu einem Klassifikationsergebnis 18 (30) geführt. Schließlich wird ein Klassifikationsergebnis 18 in Form des Medians 30 ausgegeben, das bei der Geschlechtsbestimmung von Hühnereiern die duale Geschlechtsinformation 31 , 32 (männlich oder weiblich) mit der höchsten Wahrscheinlichkeit darstellt. The rating 17 and the classification of the results assigned to the classifiers of the series 13, 14, 15, 16 are performed in a rating unit and led to a classification result 18 (30). Finally, a classification result 18 is output in the form of the median 30, which represents the sexually most probable dual sex information 31, 32 (male or female) in the sexing of chicken eggs.
Das erfindungsgemäße Verfahren kann im Allgemeinen mit folgenden Schritten im Detail absolviert werden: The method according to the invention can generally be completed in detail with the following steps:
- Aufnahme und Registrierung der Spektren mittels zumindest einer optischen Einrichtung mit zumindest einem Spektrometer und/oder weiteren Detektoren, Recording and registration of the spectra by means of at least one optical device with at least one spectrometer and / or further detectors,
- Erzeugung von digitalisierten Signalen in Form von Datenpunkten und Speicherung der detektierten Spektren in Speichereinheiten von Klassifikationseinheiten einer Auswerteeinheit, Generation of digitized signals in the form of data points and storage of the detected spectra in storage units of classification units of an evaluation unit,
- Spektrenvorbehandlung, indem die gespeicherten Spektren in den einzelnen Speichereinheiten einzeln ausgewertet werden und die zugehörigen digitalisierten ausgewerteten Signale zur Weiterverarbeitung bereit gestellt werden, Spectral pretreatment by individually evaluating the stored spectra in the individual storage units and providing the associated digitized evaluated signals for further processing,
- Trennung der vorbehandelten Spektren als Trainingsset und als Testset, Separation of the pretreated spectra as a training set and as a test set,
- Auslegung der vorbehandelten Spektren als Trainingsset und von einem vom Trainingsset getrennten Testset, - interpretation of the pretreated spectra as a training set and of a test set separated from the training set,
wobei erfindungsgemäß zumindest eine wherein according to the invention at least one
- Berechnung der Klassifikatoren der Serien der berücksichtigten einzelnen Klassifizierungsverfahren unter Einbeziehung von iterativen Verfahren und einer Validierung in den Klassifizierungseinheiten, - calculation of the classifiers of the series of individual classification methods considered, including iterative procedures and validation in the classification units,
- Klassifizierung der ausgewerteten Spektren des Trainingssets mit allen Klassifikatoren der Serien, - Classification of the evaluated spectra of the training set with all classifiers of the series,
- Einordnung der Spektren des Trainingssets in eine Klasse von Objektinformationen mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit, - Berechnung des Medians oder Durchführung einer Clusteranalyse zur Darstellung des Wahrscheinlichkeitsergebnisses der einer Klasse zugehörigen Objektinformationen des Trainingssets, Classifying the spectra of the training set into a class of object information with an expression of a class membership probability, Calculation of the median or execution of a cluster analysis for displaying the probability result of the object information belonging to the class of the training set,
- Klassifizierung der ausgewerteten Spektren des Testsets mit allen Klassifikatoren der Serien, - Classification of the evaluated spectra of the test set with all classifiers of the series,
- Einordnung der Spektren des Testsets in eine Klasse von Objektinformationen mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit und Classifying the spectra of the test set into a class of object information with an expression of a class membership probability; and
- Berechnung des Medians oder eine Durchführung einer Clusteranalyse zur Darstellung des Wahrscheinlichkeitsergebnisses/Klassifikationsergebnisses der einer Klasse zugehörigen Objektinformationen des Testsets Calculation of the median or execution of a cluster analysis for displaying the probability result / classification result of the object information belonging to the class of the test set
durchgeführt werden. be performed.
Zusätzlich ist zu bemerken, dass im Allgemeinen die registrierten Spektren 4 naturgemäß hochvariabel sind. Dies begründet sich zum einen in der immanenten Variabilität biologischer Systeme und zum anderen in der Sensitivität der ramanspektroskopischen Messungen. Externe Störungen systematischer und zufälliger Art führen zu einer hohen Variabilität der spektralen Merkmale und überlagern somit die merkmalsrelevanten Informationen. Weiterhin tritt bei dem Verfahren der Ramanspektroskopie auch Fluoreszenzlicht auf, das zwar ebenso molekulare Informationen enthält, jedoch gleichzeitig die in der Regel viel schwächeren Ramanspektroskopischen molekularen Informationen über die Zusammensetzung des untersuchten Objektes 2 überlagert. Anhand dieser Vorbemerkung und der Fig. 1 soll ein weiteres Ausführungsbeispiel mit mehr als zwei Merkmalen von Objektinformationen erläutert werden. In Fig. 1 ist in der schematischen Block-Darstellung ein erfindungsgemäßes Verfahren 1 zur Klassifizierung von Spektren 4 eines Objektes 2 mit komplexem Informationsgehalt, insbesondere von optischen Molekülspektren 4 zur Zuordnung von Objektinformationen/Merkmale 3 für eine wahrscheinliche Bestimmung einer beispielsweisen dualen Objektinformation 31 , 32 oder von vier Objektinformationen 51 , 52, 53, 54 gezeigt. In addition, it should be noted that in general the registered spectra 4 are naturally highly variable. This is due, on the one hand, to the inherent variability of biological systems and, on the other hand, to the sensitivity of Raman spectroscopic measurements. External disturbances of a systematic and random nature lead to a high variability of the spectral features and thus superimpose the feature-relevant information. Furthermore, in the method of Raman spectroscopy also fluorescent light occurs, which also contains molecular information, but at the same time superimposes the generally much weaker Raman spectroscopic molecular information on the composition of the examined object 2. On the basis of this preamble and FIG. 1, a further embodiment with more than two features of object information will be explained. 1 is a schematic block diagram of an inventive method 1 for the classification of spectra 4 of an object 2 with complex information content, in particular of optical molecular spectra 4 for the assignment of object information / features 3 for a probable determination of a For example, dual object information 31, 32 or four object information 51, 52, 53, 54 are shown.
Als zu untersuchende Objekte 2 können auch Gewebeproben, beispielsweise Hirntumore, benutzt und eingesetzt werden und anstelle der dualen Merkmalsinformationen 31 , 32 können beispielsweise auch vier unterschiedliche Merkmale 3 mit 51 , 52, 53, 54 ausgewählt und bestimmt werden, beispielsweise As objects to be examined 2 also tissue samples, such as brain tumors, can be used and used and instead of the dual feature information 31, 32, for example, four different features 3 with 51, 52, 53, 54 selected and determined, for example
> Merkmal 51 : gesundes Gewebe, > Characteristic 51: healthy tissue,
> Merkmal 52: Tumorgewebe mit Tumorgrad I und II entsprechend dem > Characteristic 52: Tumor tissue with tumor grade I and II in accordance with
histolgischen Gradierungsschema der Weltgesundheitsorgani- sation (WHO), histological grading scheme of the World Health Organization (WHO),
> Merkmal 53: Tumorgewebe mit Tumorgrad III und IV entsprechend WHO und > Characteristic 53: tumor tissue with tumor grade III and IV according to WHO and
> Merkmal 54: nekrotisches Gewebe. Feature 54: necrotic tissue.
Die Aufnahme und Registrierung der Rückstreustrahlung von der Gewebeprobe aus erfolgt mittels zu mindestens einer optischen Einrichtung beispielsweise wie in der Druckschrift DE 10 2014 010 150 A1 beschrieben. Die registrierten Rückstreuspektren 4 werden digitalisiert und in einer Auswerteeinheit gespeichert. Die Datenvorbehandlung erfolgt durch beispielsweise drei verschiedene Verfahren 5, 6, 7, die dabei erhaltenen Datensätze können beispielsweise jeweils Rohspektren, normierte Spektren und Spektren mit einer nichtlinearen Basislinienkorrektur enthalten, wobei die gespeicherten Spektren in den einzelnen Speichereinheiten einzeln ausgewertet und die zugehörigen digitalisierten ausgewerteten Signale zur Weiterverarbeitung bereit gestellt werden. Die vorbehandelten Spektren werden als Trainingsset ausgelegt, wobei erfindungsgemäß eine Berechnung der Klassifikatoren der Serien der berücksichtigten einzelnen Klassifizierungsverfahren unter Einbeziehung von iterativen Verfahren und einer Validierung in den Klassifizierungseinheiten durchgeführt wird. Es erfolgt weiterhin die Klassifizierung der ausgewerteten Spektren des Testsets mit allen Klassifikatoren der Serien und die Einordnung der Gewebespektren in eine Klasse von Objektinformationen entsprechend den Merkmalen 51 bis 54 mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit. Die Klassifizierung wird mit der Berechnung des Medians oder mittels einer Clusteranalyse bewertet und das Wahrscheinlichkeitsergebnis/Klassifikationser- gebnisses der einer Klasse zugehörigen Objektinformationen des Testsets dargestellt. Das heißt, dass für jedes registrierte Spektrum einer Gewebeprobe mittels multipler Klassifikation ein Punktwert berechnet wird, der nach festgelegten Trenngrenzen in einem der 4 Wahrscheinlichkeitsbereiche liegt, die dem histologischen Befund der Merkmale: 51 - Gesund / 52 - WHO I.II / 53 - WHO III, IV / 54 - Nekrose entsprechen. Eine Vorrichtung zur Klassifizierung von Spektren 4 von Objekten 2 mit komplexem Informationsgehalt, vorzugsweise mit Objekten in Form von Hühnereiern 2 für eine Bestimmung einer dualen Eiinformation 31 , 32 - weiblich oder männlich -, in der das vorgenannte Verfahren realisiert wird und die weitgehend der Block(Box)- Darstellung in Fig. 1 entsprechend ausgebildet ist, kann zumindest folgende Einheiten umfassen The recording and registration of the backscatter radiation from the tissue sample is carried out by means of at least one optical device, for example as described in the publication DE 10 2014 010 150 A1. The registered backscatter spectra 4 are digitized and stored in an evaluation unit. The data pretreatment is carried out by, for example, three different methods 5, 6, 7, the data sets obtained may contain, for example, raw spectra, normalized spectra and spectra with a nonlinear baseline correction, wherein the stored spectra are evaluated individually in the individual memory units and the associated digitized evaluated signals for Further processing can be provided. The pretreated spectra are designed as a training set, wherein according to the invention a calculation of the classifiers of the series of the considered individual classification methods is carried out involving iterative methods and a validation in the classification units. The classification of the evaluated spectra of the test set with all classifiers of the series and the classification of the tissue spectra into a class of object information according to the features 51 to 54 with an expression of a probability of Class membership. The classification is evaluated with the calculation of the median or by means of a cluster analysis and the probability result / classification result of the object information belonging to the class of the test set is shown. This means that, for each registered spectrum of a tissue sample, multiple scores are used to calculate a score which, after fixed cut-offs, lies in one of the 4 probability ranges corresponding to the histological findings of the characteristics: 51 - Healthy / 52 - WHO I.II / 53 - WHO III, IV / 54 - correspond to necrosis. A device for classifying spectra 4 of objects 2 having complex information content, preferably with objects in the form of chicken eggs 2 for a determination of dual egg information 31, 32 - female or male - in which the aforesaid method is realized and which largely represents the block (FIG. Box) - representation in Fig. 1 is formed accordingly, may comprise at least the following units
- zumindest eine detektierende optische Einrichtung mit zumindest einem Spektrometer und/oder weitere Detektoren zur Aufnahme und Registrierung der Spektren 4, at least one detecting optical device with at least one spectrometer and / or further detectors for recording and registering the spectra 4,
- eine Einheit zur Erzeugung von digitalisierten Signalen in Form von Datenpunkten, die die Spektren 4 realisieren. a unit for generating digitized signals in the form of data points that realize the spectra 4.
- Speichereinheiten zur Speicherung der Spektren 4 in den Klassifikationseinheiten/-gruppen 9, 10, 1 1 , 12 einer die Klassifikationseinheiten umfassenden Auswerteeinheit, Storage units for storing the spectra 4 in the classification units / groups 9, 10, 11, 12 of an evaluation unit comprising the classification units,
- Einheiten zur Spektrenvorbehandlung 5, 6, 7, 8, in denen die gespeicherten Spektren 4 in den einzelnen Speichereinheiten einzeln ausgewertet werden und die zugehörigen digitalisierten ausgewerteten Signale zur Weiterverarbeitung bereitgestellt werden, - Units for spectral pretreatment 5, 6, 7, 8, in which the stored spectra 4 are evaluated individually in the individual storage units and the associated digitized evaluated signals are provided for further processing,
- Trainingssets 19 zur Auslegung und Einsetzung der vorbehandelten Spektren 4; 25, 26, 27, 28, - training sets 19 for the design and use of pretreated spectra 4; 25, 26, 27, 28,
- mindestens eine Klassifizierungseinheit für die Gruppen 9, 10, 1 1 , 12 zur Berechnung der Klassifikatoren der Serien 13, 14, 15, 16 der berücksichtigten einzelnen herkömmlichen Klassifizierungsverfahren 25, 26, 27, 28 unter Einbeziehung von iterativen Verfahren und einer Validierung in den Klassifizierungseinheiten, at least one classification unit for the groups 9, 10, 11, 12 for the calculation of the classifiers of the series 13, 14, 15, 16 of considered individual conventional classification methods 25, 26, 27, 28 involving iterative methods and validation in the classification units,
- Testsets 29 zur Klassifizierung der ausgewerteten Spektren 4 mit allen Klassifikatoren der Serien 13, 14,1 5, 16, Test sets 29 for classifying the evaluated spectra 4 with all classifiers of the series 13, 14.1 5, 16,
- eine Einheit zur Einordnung der Spektren 4 in beispielsweise eine duale Klasse - männlich 32 oder weiblich 31 - von Objekt(Ei)informationen mit einem Ausdruck einer Wahrscheinlichkeit zur Klassenzugehörigkeit, a unit for classifying the spectra 4 into, for example, a dual class - male 32 or female 31 - of object (egg) information with an expression of a class membership probability,
- eine Bewertungseinheit zur Berechnung des Klassifikationsergebnisses 18 z.B. in Form des Medians 30 oder nach Durchführung einer Clusteranalyse zur Darstellung des Wahrscheinlichkeitsergebnisses der beispielsweise einer der dualen Klasse - weiblich oder männlich - zugehörigen Objekt(Ei)information 31 , 32. Eine gleiche Vorrichtung kann für das multiple Klassifizierungsverfahren mit den vier Merkmalen 51 , 52, 53, 54 oder mit weiteren vorgegebenen Merkmalen aufgebaut werden. an evaluation unit for calculating the classification result 18, for example in the form of the median 30 or after carrying out a cluster analysis for representing the probability result of the object (egg) information 31, 32, for example one of the dual class - female or male multiple classification methods are constructed with the four features 51, 52, 53, 54 or with other predetermined features.
Bezugszeichenliste LIST OF REFERENCE NUMBERS
1 Verfahren in einer Box-Darstellung 1 procedure in a box presentation
2 Objekt/Ei 2 object / egg
3 Objektinformationen/Merkmale 3 Object Information / Features
4 registrierte Spektren 4 registered spectra
5, 6, 7, 8 Vorbehandlung 5, 6, 7, 8 pretreatment
9, 10, 1 1 , 12 Klassifizierung 9, 10, 1 1, 12 classification
13, 14, 15, 15, 16 Serie von Klassifikatoren 13, 14, 15, 15, 16 series of classifiers
131 , 132, 133,134, 135, 136 Klassifikator 131, 132, 133, 134, 135, 136 classifier
17 Bewertung 17 rating
18 Klassifikationsergebnis 18 classification result
19 Trainingsset 19 training set
20 Molekulare Zusammensetzung 20 Molecular composition
21 Fluoreszenzintensität 21 fluorescence intensity
22 Fluoreszenzprofil 22 fluorescence profile
23 Variation physikalische Parameter 23 variation physical parameters
24 Klassifiziertes Testset 24 Classified Test Set
25, 26, 27, 28 vorbehandelte Spektren 25, 26, 27, 28 pretreated spectra
29 Testset mit vorzugsweise ausgewählten 30% der 29 test set with preferably selected 30% of the
Spektren spectra
30 Median 30 median
31 Objektinformation/Merkmal weiblich 31 Object information / characteristic female
32 Objektinformation/Merkmal männlich 32 Object information / characteristic male
33 unschraffierte Stirnfläche, dem weiblichen 33 unshaded face, the female
Geschlecht zugeordnet Assigned to gender
34 Säule des weiblichen Geschlechts 34 Pillar of the female sex
35 Säule des männlichen Geschlechts 35 Column of the male sex
36 Schraffierte Stirnfläche, dem männlichen 36 Hatched face, the male
Geschlecht zugeordnet Assigned to gender
37 Klassifikationsergebnisbild 38, 39 Säulendarstellung 37 classification result image 38, 39 Column display
40 Wichtungs-Diagramm 40 weighting chart
41 Mittlerer Datenpunkt in der Region einer 41 Middle data point in the region of one
Spektrumskurve spectrum curve
42 Festgelegte Trenngrenze 42 Fixed separation limit
43 erstes Histogramm der Clusteranalyse 43 first histogram of cluster analysis
44 zweites Histogramm der Clusteranalyse 44 second histogram of cluster analysis
45 = © Vergleichspunkt 45 = © comparison point
46 = © Vergleichspunkt 46 = © comparison point
47 = © Vergleichspunkt 47 = © comparison point
48 = ® Vergleichspunkt 48 = ® comparison point
49 = © Vergleichspunkt 49 = © comparison point
50 Klassifikator nach dem Stand der Technik 50 classifier according to the prior art
51 , 52, 53, 54 Merkmal 51, 52, 53, 54 feature
Claims
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CA3047337A CA3047337A1 (en) | 2016-09-16 | 2017-09-15 | Method for classifying spectra of objects having complex information content |
| EP17777502.0A EP3513355A1 (en) | 2016-09-16 | 2017-09-15 | Method for classifying spectra of objects having complex information content |
| US16/333,734 US11879778B2 (en) | 2016-09-16 | 2017-09-15 | Method for classifying spectra of objects having complex information content |
| ZA2019/01496A ZA201901496B (en) | 2016-09-16 | 2019-03-11 | Method for classifying spectra of objects having complex information content |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102016011348.0A DE102016011348A1 (en) | 2016-09-16 | 2016-09-16 | Method for classifying spectra of objects with complex information content |
| DE102016011348.0 | 2016-09-16 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2018050802A1 true WO2018050802A1 (en) | 2018-03-22 |
Family
ID=59997316
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/EP2017/073236 Ceased WO2018050802A1 (en) | 2016-09-16 | 2017-09-15 | Method for classifying spectra of objects having complex information content |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US11879778B2 (en) |
| EP (1) | EP3513355A1 (en) |
| CA (1) | CA3047337A1 (en) |
| DE (1) | DE102016011348A1 (en) |
| WO (1) | WO2018050802A1 (en) |
| ZA (1) | ZA201901496B (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110796163B (en) * | 2019-09-19 | 2021-03-19 | 中国地质大学(武汉) | Hyperspectral image space spectrum classification method and device considering spectral importance |
| DE102021127696B3 (en) | 2021-10-25 | 2023-03-09 | Technische Universität Dresden, Körperschaft des öffentlichen Rechts | Method and arrangement for in ovo sexing of avian eggs |
| CN114460033B (en) * | 2022-02-07 | 2024-03-15 | 北京理工大学 | A handheld device for detecting flame retardant elements in exterior wall insulation materials |
| CN119360129B (en) * | 2024-12-23 | 2025-03-21 | 浙江省测绘科学技术研究院 | Shale oil and gas well site classification method and shale oil and gas development activity monitoring method |
Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6029080A (en) | 1997-07-09 | 2000-02-22 | Reynnells; Richard D. | Method and apparatus for avian pre-hatch sex determination |
| US20080025591A1 (en) * | 2006-07-27 | 2008-01-31 | International Business Machines Corporation | Method and system for robust classification strategy for cancer detection from mass spectrometry data |
| DE102007013107A1 (en) | 2007-03-15 | 2008-09-18 | Friedrich-Schiller-Universität Jena | Bird sex determination involves testing DNA relevant cell material of bird with light, and measuring molecule oscillations, where spectrum of molecule oscillations resulting from light is detected, and is compared |
| DE102008040838A1 (en) * | 2007-07-30 | 2009-02-19 | Wild Gmbh | Dermal tissue state detecting method for e.g. human body, involves morphologically classifying spectrally classified results, determining evaluation results from morphologically classified results, and outputting evaluation results |
| WO2010150265A2 (en) | 2009-06-25 | 2010-12-29 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Hyperspectral identification of egg fertility and gender |
| DE102010006161B3 (en) | 2010-01-21 | 2011-01-13 | Technische Universität Dresden | Method and device for determining the sex of fertilized and non-incubated bird eggs |
| EP2336751A1 (en) | 2009-12-16 | 2011-06-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for determining the gender of bird eggs |
| US20120321174A1 (en) | 2011-06-15 | 2012-12-20 | Siemens Aktiengesellschaft | Image Processing Using Random Forest Classifiers |
| WO2014021715A2 (en) | 2012-07-30 | 2014-02-06 | Bruins Wouter Sebastiaan | Gender, viability and/or developmental stage determination of avian embryos in ovo |
| WO2016000678A1 (en) | 2014-07-04 | 2016-01-07 | Technische Universität Dresden | Method and device for the raman spectroscopic, in ovo sex determination of fertilised and hatched birds' eggs |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7620674B2 (en) * | 2003-03-07 | 2009-11-17 | Sensys Medical, Inc. | Method and apparatus for enhanced estimation of an analyte property through multiple region transformation |
| US20050286772A1 (en) * | 2004-06-24 | 2005-12-29 | Lockheed Martin Corporation | Multiple classifier system with voting arbitration |
| US20080005081A1 (en) * | 2006-06-28 | 2008-01-03 | Sun Microsystems, Inc. | Method and apparatus for searching and resource discovery in a distributed enterprise system |
| WO2010048678A1 (en) * | 2008-10-31 | 2010-05-06 | The University Of Sydney | Classification of biological samples using spectroscopic analysis |
| WO2011060237A2 (en) * | 2009-11-13 | 2011-05-19 | The Government Of The United States Of Americas, As Represented By The Secretary, Dept. Of Health And Human Services | System for magnetic resonance spectroscopy of brain tissue for pattern-based diagnostics |
| JP2016028229A (en) * | 2014-07-08 | 2016-02-25 | キヤノン株式会社 | Data processing apparatus, data display system having the same, sample information acquisition system, data processing method, program, and storage medium |
| EP4345769A3 (en) * | 2015-02-17 | 2024-05-29 | Matrixspec Solutions Inc. | Systems, devices, and methods for detecting fertility and gender of unhatched eggs |
-
2016
- 2016-09-16 DE DE102016011348.0A patent/DE102016011348A1/en active Pending
-
2017
- 2017-09-15 US US16/333,734 patent/US11879778B2/en active Active
- 2017-09-15 CA CA3047337A patent/CA3047337A1/en active Pending
- 2017-09-15 EP EP17777502.0A patent/EP3513355A1/en active Pending
- 2017-09-15 WO PCT/EP2017/073236 patent/WO2018050802A1/en not_active Ceased
-
2019
- 2019-03-11 ZA ZA2019/01496A patent/ZA201901496B/en unknown
Patent Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6029080A (en) | 1997-07-09 | 2000-02-22 | Reynnells; Richard D. | Method and apparatus for avian pre-hatch sex determination |
| US20080025591A1 (en) * | 2006-07-27 | 2008-01-31 | International Business Machines Corporation | Method and system for robust classification strategy for cancer detection from mass spectrometry data |
| DE102007013107A1 (en) | 2007-03-15 | 2008-09-18 | Friedrich-Schiller-Universität Jena | Bird sex determination involves testing DNA relevant cell material of bird with light, and measuring molecule oscillations, where spectrum of molecule oscillations resulting from light is detected, and is compared |
| DE102008040838A1 (en) * | 2007-07-30 | 2009-02-19 | Wild Gmbh | Dermal tissue state detecting method for e.g. human body, involves morphologically classifying spectrally classified results, determining evaluation results from morphologically classified results, and outputting evaluation results |
| WO2010150265A2 (en) | 2009-06-25 | 2010-12-29 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Hyperspectral identification of egg fertility and gender |
| EP2336751A1 (en) | 2009-12-16 | 2011-06-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for determining the gender of bird eggs |
| DE102010006161B3 (en) | 2010-01-21 | 2011-01-13 | Technische Universität Dresden | Method and device for determining the sex of fertilized and non-incubated bird eggs |
| US20120321174A1 (en) | 2011-06-15 | 2012-12-20 | Siemens Aktiengesellschaft | Image Processing Using Random Forest Classifiers |
| WO2014021715A2 (en) | 2012-07-30 | 2014-02-06 | Bruins Wouter Sebastiaan | Gender, viability and/or developmental stage determination of avian embryos in ovo |
| WO2016000678A1 (en) | 2014-07-04 | 2016-01-07 | Technische Universität Dresden | Method and device for the raman spectroscopic, in ovo sex determination of fertilised and hatched birds' eggs |
| DE102014010150A1 (en) | 2014-07-04 | 2016-01-07 | Technische Universität Dresden | Method and apparatus for Raman spectroscopic in ovo sexing of fertilized and incubated bird eggs |
Non-Patent Citations (4)
| Title |
|---|
| DRUCKSCHRIFT A. E. NIKULIN; B. DOLENKO, T.; BEZABEH, R. L.: "Somorjai: Near-optimal region selection for feature space reduction: novel preprocessing methods for classifying MR spectra", NMR BIOMED., vol. 11, no. 4-5, 1998, pages 209 - 216 |
| DRUCKSCHRIFT B. K. LAVINE; C. E. DAVIDSON; A. J. MOORES: "Genetic algorithms for spectral pattern recognition", VIBRATIONAL SPECTROSCOPY, vol. 28, no. 1, 2002, pages 83 - 95, XP007901315, DOI: doi:10.1016/S0924-2031(01)00147-3 |
| G. STEINER; S. KUCHLER; A. HERRMANN; E. KOCH; R. SALZER; G. SCHACKERT; M. KIRSCH, CYTOMETRY, 2008, pages 1158 - 1164 |
| J. JACQUES; C. BOUVEYRON; S. GIRARD; O. DEVOS; L. DUPONCHEL; C. RUCKEBUSCH: "Gaussian mixture models for the classification of high-dimensional vibrational spectroscopy data", JOURNAL OF CHEMOMETRICS, vol. 24, no. 11-12, pages 719 - 727 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3513355A1 (en) | 2019-07-24 |
| ZA201901496B (en) | 2021-01-27 |
| US20210248429A1 (en) | 2021-08-12 |
| DE102016011348A1 (en) | 2018-03-22 |
| US11879778B2 (en) | 2024-01-23 |
| CA3047337A1 (en) | 2018-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2018050802A1 (en) | Method for classifying spectra of objects having complex information content | |
| DE112020001105T5 (en) | DETECTING A GENETIC MUTATION USING DEEP LEARNING | |
| WO2019166361A1 (en) | Method for splitting one or more images of a sample into image data split according to dyes, computer program product, computer-readable medium storing the computer program product and system for splitting one or more images of a sample into image data split according to dyes | |
| DE102012205686B3 (en) | Method for identifying substance in sample, involves providing nuclear magnetic resonance spectrum of sample, which contains substance and converting nuclear magnetic resonance spectrum into discrete spectral values | |
| EP3435295A1 (en) | Preprocessing for a classification algorithm | |
| EP3707496B1 (en) | Identification of one or more spectral features in a spectrum of a sample for a constituent analysis | |
| DE112022003311T5 (en) | INFORMATION PROCESSING DEVICE, SYSTEM FOR OBSERVING BIOLOGICAL SAMPLES AND IMAGE FORMATION METHOD | |
| DE10250100A1 (en) | Microscope system and method for the analysis and evaluation of multiple staining of a microscopic object | |
| EP3619618A1 (en) | Method for the computer-assisted configuration of a data-driven model on the basis of training data | |
| DE102021127696B3 (en) | Method and arrangement for in ovo sexing of avian eggs | |
| DE102022130044A1 (en) | Technical design of an analysis device for spectral analysis | |
| DE202024103925U1 (en) | An interpretable leaf disease detection device (I-LDD) | |
| WO2024104731A1 (en) | Technical design of an analysis device for spectral analysis, and machine learning system | |
| DE102014224916B4 (en) | Method for the computer-aided analysis of one or more tissue sections of the human or animal body | |
| DE112022001991T5 (en) | TUMOR CELE ISOLINES | |
| DE102023122800B3 (en) | Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample | |
| DE102024114348A1 (en) | Method for assigning a sample to one of several possible classes based on experimental data of the sample | |
| DE102014009154A1 (en) | Method for classifying a substance mixture | |
| EP1219919B1 (en) | Method, arrangement and system for the determination of process magnitudes | |
| DE102014105994A1 (en) | Method for detecting signal patterns in spectroscopically generated data sets | |
| WO2018059662A1 (en) | Wavelength selection in tissue classification by means of hyperspectral imaging | |
| EP1687756B9 (en) | Method for classifying measured values in medical and biochemical analysis | |
| DE102023128935A1 (en) | Detection device and method for object classification using a white-box model | |
| DE102022131451A1 (en) | Method and device for determining a signal composition of signal sequences of an image sequence | |
| DE10012145C2 (en) | Method and device for the acoustic detection of disease-related physical changes in the voice image apparatus |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17777502 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| ENP | Entry into the national phase |
Ref document number: 2017777502 Country of ref document: EP Effective date: 20190416 |
|
| ENP | Entry into the national phase |
Ref document number: 3047337 Country of ref document: CA |