DE102023122800B3 - Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample - Google Patents
Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample Download PDFInfo
- Publication number
- DE102023122800B3 DE102023122800B3 DE102023122800.5A DE102023122800A DE102023122800B3 DE 102023122800 B3 DE102023122800 B3 DE 102023122800B3 DE 102023122800 A DE102023122800 A DE 102023122800A DE 102023122800 B3 DE102023122800 B3 DE 102023122800B3
- Authority
- DE
- Germany
- Prior art keywords
- data
- sample
- features
- determining
- time dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6486—Measuring fluorescence of biological material, e.g. DNA, RNA, cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6408—Fluorescence; Phosphorescence with measurement of decay time, time resolved fluorescence
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/02—Food
- G01N33/08—Eggs, e.g. by candling
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Food Science & Technology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
Die Erfindung betrifft ein computerimplementiertes Verfahren zum Ermitteln eines binären Klassifikators, wobei der Klassifikator dazu eingerichtet ist, auf Basis von spektroskopischen Daten einer Probe diese Probe einer von zwei möglichen Klassen (P1, P2) zuzuordnen, mit den Schritten:
- Empfangen von zweidimensionalen spektroskopischen Daten der Probe, wobei die Daten diskrete Werte in einer Wellenlängendimension (12) und einer Zeitdimension (14) umfassen,
- Bestimmen von entlang der Zeitdimension (14) der Daten gebildeten Merkmale F1 bis F5 für mehrere Wellenlängen und/oder für mehrere Wellenlängenbereiche (16),
- Ermitteln von Linearkombinationen der Merkmale F1 bis F5 für die mehreren Wellenlängen und/oder für die mehreren Wellenlängenbereiche (16) durch Analysieren der Merkmale im Hinblick auf ihre Trennstärke für die zwei Klassen (P1, P2), und
- Ermitteln von einer Untermenge der ermittelten Linearkombinationen durch Analysieren der Linearkombinationen im Hinblick auf ihre Trennstärke für die zwei Klassen (P1, P2).
Die Erfindung betrifft weiterhin ein computerimplementiertes Verfahren zum Zuordnen einer Probe auf Basis von spektroskopischen Daten der Probe in eine von zwei möglichen Klassen.
Zudem betrifft die Erfindung eine Vorrichtung zur Datenverarbeitung, ein Computerprogrammprodukt, und einen computerlesbaren Datenträger.
The invention relates to a computer-implemented method for determining a binary classifier, wherein the classifier is designed to assign a sample to one of two possible classes (P 1 , P 2 ) on the basis of spectroscopic data of this sample, comprising the steps:
- receiving two-dimensional spectroscopic data of the sample, the data comprising discrete values in a wavelength dimension (12) and a time dimension (14),
- determining features F1 to F5 formed along the time dimension (14) of the data for several wavelengths and/or for several wavelength ranges (16),
- determining linear combinations of the features F1 to F5 for the plurality of wavelengths and/or for the plurality of wavelength ranges (16) by analyzing the features with regard to their separation strength for the two classes (P 1 , P 2 ), and
- Determining a subset of the determined linear combinations by analyzing the linear combinations with regard to their discrimination power for the two classes (P 1 , P 2 ).
The invention further relates to a computer-implemented method for assigning a sample to one of two possible classes based on spectroscopic data of the sample.
The invention also relates to a device for data processing, a computer program product, and a computer-readable data carrier.
Description
Die Erfindung betrifft ein computerimplementiertes Verfahren zum Ermitteln eines binären Klassifikators.The invention relates to a computer-implemented method for determining a binary classifier.
Die Erfindung betrifft weiterhin ein computerimplementiertes Verfahren zum Zuordnen einer Probe auf Basis von spektroskopischen Daten der Probe in eine von zwei möglichen Klassen.The invention further relates to a computer-implemented method for assigning a sample to one of two possible classes based on spectroscopic data of the sample.
Zudem betrifft die Erfindung eine Vorrichtung zur Datenverarbeitung, ein Computerprogrammprodukt, und einen computerlesbaren Datenträger.The invention also relates to a device for data processing, a computer program product, and a computer-readable data carrier.
Derzeit gibt es das Bestreben das Geschlecht eines zukünftigen Kükens bereits beim befruchteten Hühnerei bestimmen zu können.There is currently an effort to be able to determine the sex of a future chick while the egg is still fertilized.
Im Vogelei entstehen im Verlauf der Entwicklung bei männlichen und weiblichen Küken unterschiedliche Fluorophore. Die entsprechenden Moleküle besitzen aufgrund ihrer komplexen Struktur ein nicht vorhersagbares Fluoreszenzvermögen. Bei der Fluoreszenz werden energetische Übergänge vom angeregten Zustand zum Grundzustand des Moleküls beobachtet. Dieser Vorgang ist zeitabhängig.In the course of development, different fluorophores are formed in male and female chicks in the bird egg. Due to their complex structure, the corresponding molecules have an unpredictable fluorescence capacity. During fluorescence, energetic transitions from the excited state to the ground state of the molecule are observed. This process is time-dependent.
Das Dokument
Das Dokument
Die Publikation von
Ausgehend davon ist es Aufgabe der Erfindung Mittel anzugeben, um die Treffsicherheit der in-ovo Geschlechtsbestimmung zu erhöhen und/oder die Robustheit des Verfahrens zu verbessern.Based on this, it is the object of the invention to provide means to increase the accuracy of in-ovo sex determination and/or to improve the robustness of the method.
Die Lösung der Aufgabe erfolgt erfindungsgemäß durch die Merkmale der unabhängigen Ansprüche. Bevorzugte Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben, die jeweils einzeln oder in Kombination einen Aspekt der Erfindung darstellen können.The object is achieved according to the invention by the features of the independent claims. Preferred embodiments of the invention are specified in the subclaims, which can each represent an aspect of the invention individually or in combination.
Erfindungsgemäß wird ein computerimplementiertes Verfahren zum Ermitteln eines binären Klassifikators bereitgestellt, wobei der Klassifikator dazu eingerichtet ist, auf Basis von spektroskopischen Daten einer Probe diese Probe einer von zwei möglichen Klassen zuzuordnen, mit den Schritten
- - Empfangen von zweidimensionalen spektroskopischen Daten der Probe, wobei die Daten diskrete Werte in einer Wellenlängendimension und einer Zeitdimension umfassen,
- - Bestimmen von entlang der Zeitdimension der Daten gebildeten Merkmale F1 bis F5 für mehrere Wellenlängen und/oder für mehrere Wellenlängenbereiche, wobei die Merkmale
- • F1: statistische Momente der 2. bis 4. Ordnung der Daten in der Zeitdimension,
- • F2: Koeffizienten einer Ausgleichsgerade der Daten in der Zeitdimension,
- • F3: Reelle Koeffizienten einer Fouriertransformation der Daten in der Zeitdimension,
- • F4: Koeffizienten einer Ausgleichsgerade durch die für Merkmal F3 bestimmten reellen Koeffizienten der Fouriertransformation, und
- • F5: Entropie der Daten in der Zeitdimension
- - Ermitteln von Linearkombinationen der Merkmale F1 bis F5 für die mehreren Wellenlängen und/oder für die mehreren Wellenlängenbereiche durch Analysieren der Merkmale im Hinblick auf ihre Trennstärke für die zwei Klassen, und
- - Ermitteln von einer Untermenge der ermittelten Linearkombinationen durch Analysieren der Linearkombinationen im Hinblick auf ihre Trennstärke für die zwei Klassen.
- - receiving two-dimensional spectroscopic data of the sample, the data comprising discrete values in a wavelength dimension and a time dimension,
- - Determining features F1 to F5 formed along the time dimension of the data for several wavelengths and/or for several wavelength ranges, wherein the features
- • F1: statistical moments of the 2nd to 4th order of the data in the time dimension,
- • F2: coefficients of a best fit line of the data in the time dimension,
- • F3: Real coefficients of a Fourier transform of the data in the time dimension,
- • F4: coefficients of a regression line through the real coefficients of the Fourier transform determined for feature F3, and
- • F5: Entropy of the data in the time dimension
- - determining linear combinations of the features F1 to F5 for the multiple wavelengths and/or for the multiple wavelength ranges by analyzing the features with regard to their discriminatory power for the two classes, and
- - Determining a subset of the determined linear combinations by analyzing the linear combinations with regard to their discrimination power for the two classes.
Weiterhin betrifft die Erfindung ein computerimplementiertes Verfahren zum Zuordnen einer Probe auf Basis von spektroskopischen Daten der Probe in eine von zwei möglichen Klassen, und insbesondere zum Zuordnen eines befruchteten Vogeleis zu einem von zwei möglichen Geschlechtern, mit den Schritten
- - Empfangen von zweidimensionalen spektroskopischen Daten der Probe, wobei die Daten diskrete Werte in einer Wellenlängendimension und einer Zeitdimension umfassen, und
- - Anwenden eines Klassifikators auf die empfangenen Daten, wobei der Klassifikator mit obigen Verfahren ermittelt wurde.
- - receiving two-dimensional spectroscopic data of the sample, the data comprising discrete values in a wavelength dimension and a time dimension, and
- - Applying a classifier to the received data, where the classifier was determined using the above methods.
Ferner betrifft die Erfindung eine Vorrichtung zur Datenverarbeitung umfassend Mittel zur Ausführung eines der beiden obigen Verfahren oder Mittel zur Ausführung beider Verfahren.Furthermore, the invention relates to a device for data processing comprising means for carrying out one of the two above methods or means for carrying out both methods.
Zudem betrifft die Erfindung ein Computerprogrammprodukt, umfassend Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlassen, eines der beiden obigen Verfahren oder beide obigen Verfahren auszuführen.Furthermore, the invention relates to a computer program product comprising instructions which, when the program is executed by a computer, cause the computer to carry out one of the two above methods or both of the above methods.
Ferner betrifft die Erfindung einen computerlesbaren Datenträger, auf dem das obige Computerprogrammprodukt gespeichert ist.Furthermore, the invention relates to a computer-readable data carrier on which the above computer program product is stored.
Ein Aspekt der Erfindung ist, dass festgestellt wurde, dass beim Zuordnen einer Probe auf Basis von spektroskopischen Daten der Probe in eine von zwei möglichen Klassen eine verbesserte Trefferquote erzielt wird, wenn zum Ermitteln des Klassifikators in der Trainingsphase nicht lediglich statistische Merkmale der spektroskopischen Daten betrachtet werden.One aspect of the invention is that it has been found that when assigning a sample to one of two possible classes based on spectroscopic data of the sample, an improved hit rate is achieved if not only statistical features of the spectroscopic data are considered to determine the classifier in the training phase.
Ein weiterer Aspekt der Erfindung ist, dass ein zweistufiges Verfahren zum Ermitteln des Klassifikators verwendet wird. Es wurde festgestellt, dass ein Klassifikator, der durch Ermitteln der Linearkombinationen der Merkmale F1 bis F5 für die mehreren Wellenlängen und/oder für die mehreren Wellenlängenbereiche durch Analysieren der Merkmale im Hinblick auf ihre Trennstärke für die zwei Klassen, und durch Ermitteln von einer Untermenge der ermittelten Linearkombinationen durch Analysieren der Linearkombinationen im Hinblick auf ihre Trennstärke für die zwei Klassen, eine höhere Trefferquote beim Zuordnen der Probe erzielt wird. In anderen Worten wird mittels der Trainingsdaten in einem zweistufigen Verfahren ein Modell aufgebaut.A further aspect of the invention is that a two-stage method is used to determine the classifier. It has been found that a classifier which is created by determining the linear combinations of the features F1 to F5 for the multiple wavelengths and/or for the multiple wavelength ranges by analyzing the features with regard to their discriminatory strength for the two classes, and by determining a subset of the determined linear combinations by analyzing the linear combinations with regard to their discriminatory strength for the two classes, achieves a higher hit rate when assigning the sample. In other words, a model is built using the training data in a two-stage method.
Zudem kann mit einem nach dem erfindungsgemäßen Verfahren ermittelten Klassifikator auch ein weitaus robusteres Verfahren zum Zuordnen bereitgestellt werden, bei dem Proben, deren spektroskopischen Daten nicht unter Idealbedingungen gemessen wurden und ein erhöhtes Signal zu Rausch Verhältnis aufweisen, trotzdem mit hoher Trefferquote den zwei möglichen Klassen zugeordnet werden können. Bevorzugt ist vorgesehen, dass der Klassifikator ein linearer Klassifikator ist. Ein linearer Klassifikator trennt die Klassen entlang einer linearen Hyperebene.In addition, a classifier determined according to the method according to the invention can also provide a far more robust method for assignment, in which samples whose spectroscopic data were not measured under ideal conditions and have an increased signal-to-noise ratio can still be assigned to the two possible classes with a high hit rate. It is preferably provided that the classifier is a linear classifier. A linear classifier separates the classes along a linear hyperplane.
Die zweidimensionalen spektroskopischen Daten der Probe liegen bevorzugt in einer zweidimensionalen Datenmatrix vor, wobei eine Zeile der Datenmatrix bevorzugt das Zeitverhalten und insbesondere die Abklingkurven für einzelne singuläre Wellenlängen oder ein gemitteltes Zeitverhalten und insbesondere gemittelte Abklingkurven für mehrere direkt benachbarte singuläre Wellenlängen umfasst. Im zweiten Fall entspricht eine Zeile der Datenmatrix also dem Zeitverhalten eines Wellenlängenbereiches. Der Wellenlängenbereich hat bevorzugt eine Bandbreite, die nicht mehr als 4 nm bevorzugt nicht mehr als 3 nm umfasst. Weiter bevorzugt ist vorgesehen, dass die Anzahl an benachbarten singulären Wellenlängen, die für den Wellenlängenbereich gemittelt werden, nicht mehr als acht singuläre Wellenlängen und bevorzugt nicht mehr als sechs singuläre Wellenlängen sind.The two-dimensional spectroscopic data of the sample are preferably present in a two-dimensional data matrix, with one row of the data matrix preferably comprising the time response and in particular the decay curves for individual singular wavelengths or an averaged time response and in particular averaged decay curves for several directly adjacent singular wavelengths. In the second case, one row of the data matrix corresponds to the time response of a wavelength range. The wavelength The wavelength range preferably has a bandwidth which comprises no more than 4 nm, preferably no more than 3 nm. It is further preferred that the number of adjacent singular wavelengths which are averaged for the wavelength range is no more than eight singular wavelengths and preferably no more than six singular wavelengths.
In der ersten Stufe des Verfahrens zum Ermitteln des binären Klassifikators werden zunächst die Merkmale F1 bis F5 für die Zeilen der Matrix bestimmt. Bevorzugt wird für jede Zeile der Matrix die Merkmale F1 bis F5 bestimmt. In anderen Worten werden also bevorzugt die Merkmale F1 bis F5 von singulären Wellenlängen und/oder von den Wellenlängenbereichen gebildet.In the first stage of the method for determining the binary classifier, the features F1 to F5 are first determined for the rows of the matrix. Preferably, the features F1 to F5 are determined for each row of the matrix. In other words, the features F1 to F5 are preferably formed from singular wavelengths and/or from the wavelength ranges.
In Bezug zum Merkmal F1 handelt es sich bei den statistischen Momente der 2. bis 4. Ordnung bevorzugt um die zentralen Momente, also um das zentrale Moment 2. Ordnung (Standardabweichung), das zentrale Moment 3. Ordnung (Schiefe/Skewness) und das zentrale Moment 4. Ordnung (Wölbung/Kurtosis).With regard to the feature F1, the statistical moments of the 2nd to 4th order are preferably the central moments, i.e. the central moment of the 2nd order (standard deviation), the central moment of the 3rd order (skewness) and the central moment of the 4th order (kurtosis).
In Bezug zum Merkmal F2 sind die Koeffizienten der Ausgleichsgerade bevorzugt die Koeffizienten einer Normalengleichung g(x) = ax + b durch die Daten in der Zeitdimension.With respect to feature F2, the coefficients of the best-fit line are preferably the coefficients of a normal equation g(x) = ax + b through the data in the time dimension.
In Bezug zum Merkmal F3 sind die reellen Koeffizienten bevorzugt die reellen Koeffizienten der Fast-Fourier Transformation der Daten in der Zeitdimension.With respect to feature F3, the real coefficients are preferably the real coefficients of the fast Fourier transform of the data in the time dimension.
Beim Merkmal F4 sind die Koeffizienten der Ausgleichsgerade bevorzugt die Koeffizienten einer Normalengleichung f(x) = sx + t durch die für Merkmal F3 bestimmten reellen Koeffizienten der Fast-Fouriertransformation.For feature F4, the coefficients of the best-fit line are preferably the coefficients of a normal equation f(x) = sx + t divided by the real coefficients of the fast Fourier transform determined for feature F3.
In Bezug zu Merkmal F5 ist die Entropie der Daten in der Zeitdimension bevorzugt die Shannon'sche Entropie gemäß E = - Σzpz log2 pz , mit pz als Wahrscheinlichkeit für den Messwert z.With respect to feature F5, the entropy of the data in the time dimension is preferably the Shannon entropy according to E = - Σ z p z log 2 p z , with p z as the probability for the measured value z.
Anschließend werden die Merkmale im Hinblick auf ihre Trennstärke analysiert, um bevorzugt Merkmale mit schwacher Trennstärke zu eliminieren. In anderen Worten werden aus den Merkmalen für jede Wellenlänge und/oder für jeden Wellenlängenbereich Linearkombinationen ermittelt, wobei die eliminierten Merkmale in der Linearkombination einen Koeffizienten von Null aufweisen und demnach nicht berücksichtigt werden. Nach diesem Schritt liegt also bevorzugt für jede Zeile der Datenmatrix eine für diese Zeile spezifische Linearkombination aus den Merkmalen F1 bis F5 vor.The features are then analyzed in terms of their discrimination strength in order to eliminate features with weak discrimination strength. In other words, linear combinations are determined from the features for each wavelength and/or for each wavelength range, whereby the eliminated features in the linear combination have a coefficient of zero and are therefore not taken into account. After this step, a linear combination of the features F1 to F5 specific to this row is therefore preferably available for each row of the data matrix.
Im anschließenden Schritt des Verfahrens werden in der zweiten Stufe aus den gebildeten Linearkombinationen eine Untermenge der Linearkombinationen ermittelt. Dies erfolgt, indem die Linearkombinationen im Hinblick auf ihre Trennstärke analysiert werden, um bevorzugt Linearkombinationen mit schwacher Trennstärke zu eliminieren. In anderen Worten werden also bevorzugt bestimmte Linearkombinationen identifiziert, die besonders hohe Trennstärken aufweisen.In the subsequent step of the method, in the second stage, a subset of the linear combinations is determined from the linear combinations formed. This is done by analyzing the linear combinations with regard to their separation strength in order to preferentially eliminate linear combinations with weak separation strength. In other words, certain linear combinations that have particularly high separation strengths are preferentially identified.
Bevorzugt ist also in anderen Worten vorgesehen, dass der Klassifikator mittels Merkmalselektion und/oder Selektion von Linearkombinationen auf Basis von Trainingsdaten ermittelt wird. Insbesondere hat sich gezeigt, dass durch das zweistufige Verfahren ein binärer Klassifikator ermittelt werden kann, der eine besonders hohe Trefferquote aufweist. Der Klassifikator ist zudem besonders robust, da er auch ermöglicht spektroskopische Daten der Probe mit einem hohen Signal zu Rausch Verhältnis verlässlich zu klassifizieren.In other words, it is preferred that the classifier is determined by means of feature selection and/or selection of linear combinations based on training data. In particular, it has been shown that the two-stage process can be used to determine a binary classifier that has a particularly high hit rate. The classifier is also particularly robust because it also enables spectroscopic data from the sample to be reliably classified with a high signal-to-noise ratio.
Gemäß einer bevorzugten Weiterbildung der Erfindung ist vorgesehen, dass die Probe ein befruchtetes Vogelei ist und die zwei Klassen ein männliches Geschlecht und ein weibliches Geschlecht des befruchteten Vogeleis repräsentieren. Das Verfahren zum Ermitteln des Klassifikators hat sich insbesondere zum Ermitteln eines Klassifikators zum Bestimmen des Geschlechtes des befruchteten Vogeleies als sehr geeignet erwiesen. Insbesondere konnten mit dem nach dem vorliegenden Verfahren ermittelten Klassifikator bei der Klassifikation des befruchteten Vogeleis Trefferquoten von 100 % erreicht werden.According to a preferred development of the invention, the sample is a fertilized bird's egg and the two classes represent a male sex and a female sex of the fertilized bird's egg. The method for determining the classifier has proven to be particularly suitable for determining a classifier for determining the sex of the fertilized bird's egg. In particular, hit rates of 100% were achieved with the classifier determined according to the present method when classifying the fertilized bird's egg.
Gemäß einer weiteren bevorzugten Weiterbildung der Erfindung ist vorgesehen, dass die empfangenen zweidimensionalen spektroskopischen Daten Eigenfluoreszenzdaten der Probe und insbesondere mittels zeitaufgelöster laserinduzierter Fluoreszenzspektroskopie (zLIF) und/oder mittels zeitkorrelierter Einzelphotonenzählung (TCSPC) erfasste Eigenfluoreszenzdaten der Probe, insbesondere des befruchteten Vogeleis, sind. In Bezug zum Ermitteln eines binären Klassifikator, der bevorzugt zur in-ovo Geschlechtsbestimmung bei einem befruchteten Vogelei verwendet wird, ist in anderen Worten also die Kenntnis der Lebensdauer und des Abklingprofils angeregter molekularer Zustände (Zeitdimension der zweidimensionalen Daten) neben der Energie der emittierten Photonen (Wellenlängendimension der zweidimensionalen Daten) für die Identifikation des Geschlechtes des befruchteten Vogeleis relevant.According to a further preferred development of the invention, it is provided that the received two-dimensional spectroscopic data are intrinsic fluorescence data of the sample and in particular intrinsic fluorescence data of the sample, in particular of the fertilized bird's egg, recorded by means of time-resolved laser-induced fluorescence spectroscopy (zLIF) and/or by means of time-correlated single photon counting (TCSPC). In other words, in relation to determining a binary classifier, which is preferably used for in-ovo sex determination in a fertilized bird's egg, knowledge of the lifetime and the decay profile of excited molecular states (time dimension of the two-dimensional data) in addition to the energy of the emitted photons (wavelength dimension of the two-dimensional data) are relevant for the identification of the sex of the fertilized bird egg.
Zwecks Detektion der Eigenfluoreszenzstrahlung können die spektroskopischen Daten mittels laserinduzierter Fluoreszenzverfahren erfasst werden. Dieses Verfahren beruht auf der Fluoreszenzanregung der Probe durch einen Anregungspuls einer Lichtquelle wie beispielsweise ein Laser oder eine LED. Die sich in der Probe und bevorzugt im Vogelei befindenden Fluorophore werden durch den Laser angeregt. Nach einiger Zeit, normalerweise in der Größenordnung von wenigen Nanosekunden bis Mikrosekunden, werden die angeregten Fluorophore ihre Anregung verlieren und Licht mit einer Wellenlänge emittieren, die länger als die Anregungswellenlänge ist. Dieses Fluoreszenzlicht wird typischerweise mit einem Photomultiplier (PMT) oder mittels eines als ICCD-Kamera ausgebildeten Mehrkanaldetektors aufgezeichnet.In order to detect the autofluorescence radiation, the spectroscopic data can be recorded using laser-induced fluorescence methods. This method is based on the fluorescence excitation of the sample by an excitation pulse from a light source such as a laser or an LED. The fluorophores in the sample and preferably in the bird's egg are excited by the laser. After some time, usually in the order of a few nanoseconds to microseconds, the excited fluorophores will lose their excitation and emit light with a wavelength that is longer than the excitation wavelength. This fluorescence light is typically recorded with a photomultiplier tube (PMT) or by means of a multi-channel detector designed as an ICCD camera.
In einigen Verfahren - auch als Boxcar Verfahren bezeichnet - werden jeweils zu unterschiedlichen Zeitpunkten nach einem Anregungspuls mittels einer ICCD-Kamera das komplette Spektrum aufgenommen.In some methods - also known as boxcar methods - the complete spectrum is recorded at different times after an excitation pulse using an ICCD camera.
Ebenfalls ist es möglich zum Erfassen der Eigenfluoreszenzstrahlung zeitkorrelierter Einzelphotonenzählung (TCSPC) zu verwenden. Bei der TCSPC wird nicht nach jedem Anregungspuls das komplette Spektrum aufgezeichnet. Stattdessen werden einzelne Photonen eines periodischen Lichtsignals - vorliegend die Eigenfluoreszenzstrahlung - detektiert und die jeweiligen Zeiten zwischen dem Anregungspuls der gepulsten Anregungsstrahlung und dem Eintreffen des Photons in der Detektionsvorrichtung bestimmt. In anderen Worten wird die Zeitmessung also durch den Anregungspuls gestartet und das beim Übergang vom angeregten Zustand in den Grundzustand emittierte Photon stoppt die Messung. Die Messung wird vielfach wiederholt und die einzelnen zeitlich korrelierten Photonen (in Bezug zum Anregungspuls) werden entsprechend ihrer gemessenen Zeit in ein so genanntes TCSPC-Histogramm einsortiert. Das TCSPC-Histogramm repräsentiert den zeitlichen Verlauf der Eigenfluoreszenzstrahlung nach der Anregung. Bevorzugt weist das mittels der Detektionsvorrichtung erzeugte TCSPC-Histogramm eine Klassenbreite, die auch Bin-Width oder Behälterbreite genannt wird, für die Histogrammklassen von 1 ps bis 50 ps, bevorzugt von 10 ps bis 20 ps auf. Bevorzugt lässt sich die Klassenbreite des TCSPC-Histogramms an die Vorrichtung und/oder zu untersuchende Probe anpassen. Weiter bevorzugt wird bei der Anpassung der Klassenbreite des TCSPC-Histogramms, eine zeitliche Auflösung der gesamten Vorrichtung - und besonders bevorzugt eine Halbwertsbreite (FWHM) der Instrument Response Function (IRF) berücksichtigt. Die FWHM der IRF ist im Wesentlichen von der Lichtquelle und einer von der Lichtquelle erzeugten Pulslänge und/oder von einem Detektorelement der Detektionsvorrichtung abhängig.It is also possible to use time-correlated single photon counting (TCSPC) to record the self-fluorescence radiation. With TCSPC, the complete spectrum is not recorded after each excitation pulse. Instead, individual photons of a periodic light signal - in this case the self-fluorescence radiation - are detected and the respective times between the excitation pulse of the pulsed excitation radiation and the arrival of the photon in the detection device are determined. In other words, the time measurement is started by the excitation pulse and the photon emitted during the transition from the excited state to the ground state stops the measurement. The measurement is repeated many times and the individual time-correlated photons (in relation to the excitation pulse) are sorted into a so-called TCSPC histogram according to their measured time. The TCSPC histogram represents the temporal progression of the self-fluorescence radiation after excitation. Preferably, the TCSPC histogram generated by means of the detection device has a class width, also called bin width or container width, for the histogram classes from 1 ps to 50 ps, preferably from 10 ps to 20 ps. Preferably, the class width of the TCSPC histogram can be adapted to the device and/or sample to be examined. Further preferably, when adapting the class width of the TCSPC histogram, a temporal resolution of the entire device - and particularly preferably a full width at half maximum (FWHM) of the instrument response function (IRF) - is taken into account. The FWHM of the IRF depends essentially on the light source and a pulse length generated by the light source and/or on a detector element of the detection device.
Gemäß einer bevorzugten Weiterbildung der Erfindung ist vorgesehen, dass zum Bestimmen der Merkmale F2 bis F5 die Daten in der Zeitdimension als normierte Daten vorliegen, derart dass ein Mittelwert der Daten in der Zeitdimension Null ist. Weiter bevorzugt kann vorgesehen sein, dass zum Bestimmen von einem oder mehreren der Merkmale F2 bis F5 die Daten zudem dahingehend normiert werden, dass eine Standardabweichung der Daten in der Zeitdimension Eins ist. Es hat sich gezeigt, dass bessere Ergebnisse für die Klassifikation erzielt werden, wenn zum Ermitteln der Merkmale F2 bis F5 nicht direkt die durch die Messung bereitgestellten Rohdaten verwendet werden. Stattdessen ist es vorteilhaft, wenn die Zeitdimension der Daten in normalisierter Form vorliegt, bei dem der Mittelwert µ = 0 ist und bevorzugt bei einigen oder allen Merkmalen F2 bis F5 zudem die Standardabweichung σ = 1 ist.According to a preferred development of the invention, it is provided that in order to determine the features F2 to F5, the data in the time dimension are present as normalized data, such that a mean value of the data in the time dimension is zero. It can also preferably be provided that in order to determine one or more of the features F2 to F5, the data are also normalized such that a standard deviation of the data in the time dimension is one. It has been shown that better results for classification are achieved if the raw data provided by the measurement are not used directly to determine the features F2 to F5. Instead, it is advantageous if the time dimension of the data is present in normalized form, in which the mean value µ = 0 and, preferably, for some or all of the features F2 to F5, the standard deviation σ = 1.
Hingegen ist in diesem Zusammenhang gemäß einer weiteren bevorzugten Weiterbildung der Erfindung ist vorgesehen, dass zum Bestimmen des Merkmales F1 die Daten in der Zeitdimension als nicht normierte Daten vorliegen. Zum Bestimmen der Standardabweichung, der Schiefe und der Wölbung werden in anderen Worten also bevorzugt die nicht normierten Rohdaten verwendet.In contrast, in this context, according to a further preferred development of the invention, it is provided that the data in the time dimension are available as non-standardized data for determining the feature F1. In other words, the non-standardized raw data are preferably used to determine the standard deviation, the skewness and the curvature.
In Zusammenhang mit den Merkmalen F3 und F4 ist gemäß einer weiteren Weiterbildung der Erfindung vorgesehen, dass die reellen Koeffizienten der Fouriertransformation der Daten in der Zeitdimension des Merkmals F3 aufsteigend geordnet sind und/oder dass die Koeffizienten der Ausgleichsgerade durch die für Merkmal F3 bestimmten reelle Koeffizienten der Fouriertransformation auf Basis von aufsteigend geordneten reellen Koeffizienten der Fouriertransformation bestimmt werden. In anderen Worten liegen für Merkmal F3 die reellen Koeffizienten der Fouriertransformation also sortiert vor - nämlich aufsteigend geordnet. Weiterhin wird in Zusammenhang mit dem Merkmal F4 die Ausgleichsgerade f(x) = sx + t bevorzugt durch die austeigend geordneten reellen Koeffizienten der Fouriertransformation gebildet.In connection with the features F3 and F4, according to a further development of the invention, it is provided that the real coefficients of the Fourier transformation of the data in the time dimension of the feature F3 are ordered in ascending order and/or that the coefficients of the best fit line are determined by the real coefficients of the Fourier transformation determined for feature F3 on the basis of real coefficients of the Fourier transformation ordered in ascending order. In other words, the real coefficients of the Fourier transformation for feature F3 are therefore sorted - namely ordered in ascending order. Furthermore, in connection with the feature F4, the best fit line f(x) = sx + t is preferably formed by the real coefficients of the Fourier transformation ordered in ascending order.
In Zusammenhang mit dem Ermitteln von Linearkombinationen ist gemäß einer weiteren Weiterbildung des Verfahrens vorgesehen, dass das Ermitteln von Linearkombinationen der Merkmale F1 bis F5 ein Bestimmen von Koeffizienten der Linearkombinationen umfasst. Bei den Linearkombinationen handelt es sich bevorzugt um Linearkombinationen gemäß
Gemäß einer weiteren bevorzugten Weiterbildung der Erfindung ist vorgesehen, dass der Schritt Ermitteln der Linearkombinationen der Merkmale F1 bis F5 für die mehreren Wellenlängen und/oder für die mehreren Wellenlängenbereiche durch Analysieren der Merkmale im Hinblick auf ihre Trennstärke für die zwei Klassen; und/oder dass der Schritt Ermitteln der Untermenge der ermittelten Linearkombinationen durch Analysieren der Linearkombinationen im Hinblick auf ihre Trennstärke für die zwei Klassen ein Analysieren mittels linearer Diskriminanzanalyse umfasst. In anderen Worten werden bevorzugt mittels Feature-Engineering die gemessenen spektroskopischen Daten zur Ermittlung des Klassifikators aufbereitet, wobei Merkmale und aus den Merkmalen gebildete Linearkombinationen mit schwachen Trennstärke eliminiert werden. Es hat sich gezeigt, dass ein Klassifikator, der ohne Eliminierung von Merkmalen und/oder ohne Eliminierung von Linearkombinationen ermittelt wurde, eine niedrigere Trefferquote aufweist als mit Eliminierung von Merkmalen und/oder Eliminierung von Linearkombinationen.According to a further preferred development of the invention, it is provided that the step of determining the linear combinations of the features F1 to F5 for the multiple wavelengths and/or for the multiple wavelength ranges by analyzing the features with regard to their separating strength for the two classes; and/or that the step of determining the subset of the determined linear combinations by analyzing the linear combinations with regard to their separating strength for the two classes comprises an analysis using linear discriminant analysis. In other words, the measured spectroscopic data are preferably processed using feature engineering to determine the classifier, with features and linear combinations formed from the features with weak separating strength being eliminated. It has been shown that a classifier that was determined without eliminating features and/or without eliminating linear combinations has a lower hit rate than with eliminating features and/or eliminating linear combinations.
In diesem Zusammenhang ist gemäß einer weiteren bevorzugten Weiterbildung vorgesehen, dass bei dem Analysieren als Metrik für die Trennstärke eine Diskriminanzfunktion und bevorzugt die Fishersche Diskriminanzfunktion und/oder eine Trefferquote des ermittelten Klassifikators verwendet werden.In this context, according to a further preferred development, a discriminant function and preferably the Fisher discriminant function and/or a hit rate of the determined classifier are used as a metric for the discrimination strength during the analysis.
Wie bereits erwähnt betrifft die Erfindung auch ein Verfahren zum Zuordnen einer Probe auf Basis von spektroskopischen Daten der Probe in eine von zwei möglichen Klassen, und insbesondere zum Zuordnen eines befruchteten Vogeleis zu einem von zwei möglichen Geschlechtern, mit den Schritten
- - Empfangen von zweidimensionalen spektroskopischen Daten der Probe, wobei die Daten diskrete Werte in einer Wellenlängendimension und einer Zeitdimension umfassen, und
- - Anwenden eines Klassifikators auf die empfangenen Daten, wobei der Klassifikator mit dem oben beschriebenen Verfahren ermittelt wurde.
- - receiving two-dimensional spectroscopic data of the sample, the data comprising discrete values in a wavelength dimension and a time dimension, and
- - Applying a classifier to the received data, where the classifier was determined using the method described above.
Bevorzugt ist vorgesehen, dass es sich bei der Probe um ein befruchtetes Vogelei handelt. In Bezug auf das Verfahren erfolgt die Geschlechtsbestimmung des Vogeleis also bevorzugt durch eine priorisierte Berücksichtigung spezifischer Linearkombinationen, wobei die Linearkombinationen aus den aus der Zeitdimension der Daten gebildete Merkmalen F1 bis F5 gebildet wurden.Preferably, the sample is a fertilized bird's egg. With regard to the method, the sex determination of the bird's egg is preferably carried out by prioritizing specific linear combinations, whereby the linear combinations were formed from the features F1 to F5 formed from the time dimension of the data.
Der Fachmann entnimmt weitere technische Aspekte und Vorteile des Verfahrens zum Zuordnen einer Probe auf Basis von spektroskopischen Daten der Probe in eine von zwei möglichen Klassen, aus der obigen Beschreibung des Verfahrens zum Ermitteln des binären Klassifikators.The person skilled in the art will derive further technical aspects and advantages of the method for assigning a sample to one of two possible classes based on spectroscopic data of the sample from the above description of the method for determining the binary classifier.
Nachfolgend wird die Erfindung unter Bezugnahme auf die anliegenden Zeichnungen anhand von bevorzugten Ausführungsbeispielen exemplarisch erläutert, wobei die nachfolgend dargestellten Merkmale sowohl jeweils einzeln als auch in Kombination einen Aspekt der Erfindung darstellen können. Es zeigen:
-
1 in a) eine schematische Darstellung von zweidimensionalen spektroskopischen Daten einer Probe, die im Rahmen eines Verfahrens zum Ermitteln eines binären Klassifikators gemäß einem bevorzugten Ausführungsbeispiel der Erfindung empfangen werden, sowie in b) eine schematische Darstellung einer Trennstärke von entlang der Zeitdimension der Daten gebildeten Merkmalen im Merkmalsraum, und -
2 eine schematische Darstellung einer linearen Diskriminanzfunktion, die im Rahmen eines Verfahrens zum Ermitteln eines binären Klassifikators gemäß einer bevorzugten Ausgestaltung der Erfindung, Linearkombinationen der entlang der Zeitdimension der Daten gebildeten Merkmalen voneinander in zwei Klassen trennt.
-
1 in a) a schematic representation of two-dimensional spectroscopic data of a sample received as part of a method for determining a binary classifier according to a preferred embodiment of the invention, and in b) a schematic representation of a separation strength of features formed along the time dimension of the data in the feature space, and -
2 a schematic representation of a linear discriminant function which, in the context of a method for determining a binary classifier according to a preferred embodiment of the invention, separates linear combinations of the features formed along the time dimension of the data into two classes.
Die gemessenen spektroskopischen Daten sind vorliegend zeitaufgelöste Fluoreszenz-Emissionen, die an Bruteiern am dritten Bebrütungstag gemessen wurden. Das Geschlecht der Bruteier wurde mittels PCR bestimmt.The measured spectroscopic data are time-resolved fluorescence emissions measured on hatching eggs on the third day of incubation. The sex of the hatching eggs was determined using PCR.
Die zeitaufgelösten Fluoreszenz-Emissionen wurden bei einer Fluoreszenzanregung von 266 nm mit folgenden Parametern mittels des Boxcar Messverfahrens aufgezeichnet:
- Emissionsparameter: τmin = 0 ns; τmax = 30 ns (Diskreditierung = 1 ns);
- λmin = 340,14 nm; λmax = 720,60 nm (Diskreditierung 0,5 nm).
- Emission parameters: τ min = 0 ns; τ max = 30 ns (discreditation = 1 ns);
- λ min = 340.14 nm; λ max = 720.60 nm (discreditation 0.5 nm).
Die zum Ermitteln des Klassifikators empfangenen zweidimensionalen spektroskopischen Daten der Probe liegen vorliegend in einer zweidimensionalen Datenmatrix A vor, wobei eine Zeile (aj1, ..., ajn), j = 1, ... ,m der Datenmatrix das Zeitverhalten und insbesondere die Abklingkurven 10a für einzelne singuläre Wellenlängen oder eine gemittelte Abklingkurven 10b für mehrere direkt benachbarte singuläre Wellenlängen umfasst.
Wenn die Datenmatrix A graphisch dargestellt wird, ergibt sich das in
In dem im folgenden beschriebenen bevorzugten Ausführungsbeispiel des Verfahrens zum Ermitteln des binären Klassifikators, werden - nachdem die zweidimensionalen Daten empfangen wurden - entlang der Zeitdimension der Daten gebildeten Merkmale F1 bis F5 für mehrere Wellenlängen und/oder für mehrere Wellenlängenbereiche bestimmt.In the preferred embodiment of the method for determining the binary classifier described below, after the two-dimensional data have been received, features F1 to F5 formed along the time dimension of the data are determined for several wavelengths and/or for several wavelength ranges.
Bei den Merkmalen F1 bis F5 handelt es sich um folgende Merkmale:
- • F1: statistische
Momente der 2. bis 4. Ordnung der Daten in der Zeitdimension, - • F2: Koeffizienten einer Ausgleichsgerade der Daten in der Zeitdimension,
- • F3: Reelle Koeffizienten einer Fouriertransformation der Daten in der Zeitdimension,
- • F4: Koeffizienten einer Ausgleichsgerade durch die für Merkmal F3 bestimmten reellen Koeffizienten der Fouriertransformation, und
- • F5: Entropie der Daten in der Zeitdimension
- • F1: statistical moments of the 2nd to 4th order of the data in the time dimension,
- • F2: coefficients of a best fit line of the data in the time dimension,
- • F3: Real coefficients of a Fourier transform of the data in the time dimension,
- • F4: coefficients of a regression line through the real coefficients of the Fourier transform determined for feature F3, and
- • F5: Entropy of the data in the time dimension
Da die Abklingkurven 10 eine Funktion der Zeit sind, werden sie im folgenden auch als S(τ) bezeichnet. Die Abklingkurven 10 werden in einer originalen nicht normierten Form empfangen.Since the decay curves 10 are a function of time, they are also referred to as S(τ) in the following. The decay curves 10 are received in an original non-normalized form.
Beim Merkmal F1 handelt es sich somit um Standardabweichung σ, Schiefe γ und Wölbung ω berechnet für S(τ).The feature F1 is thus the standard deviation σ, skewness γ and kurtosis ω calculated for S(τ).
Zum Bestimmen der Merkmale F2 bis F5 werden die Abklingkurven in eine normierten Form SN(τ) gebracht, bei der S(τ) den Mittelwert µ = 0 und die Standardabweichung σ = 1 aufweist.To determine the features F2 to F5, the decay curves are brought into a normalized form S N (τ), where S(τ) has the mean µ = 0 and the standard deviation σ = 1.
Beim Merkmal F2 handelt es sich um die Koeffizienten a, b der Normalengleichung g(x) = ax + b für SN(τ).The feature F2 is the coefficients a, b of the normal equation g(x) = ax + b for S N (τ).
Beim Merkmal F3 handelt es sich um die aufsteigend geordneten reellen Koeffizienten der Fast-Fouriertransformation FFT[SN(τ)].The feature F3 is the ascending ordered real coefficients of the fast Fourier transform FFT[S N (τ)].
Beim Merkmal F4 handelt es sich um die Koeffizienten s, t der Normalengleichung f(x) = sx + t für die aufsteigend geordneten reellen Koeffizienten der Fast-Fouriertransformation FFT[SN(τ)].The feature F4 is the coefficients s, t of the normal equation f(x) = sx + t for the ascending real coefficients of the fast Fourier transform FFT[S N (τ)].
Beim Merkmal F5 handelt es sich um die Entropie E [SN(τ)].The feature F5 is the entropy E [S N (τ)].
Anschließend werden Linearkombinationen der Merkmale F1 bis F5, die im folgenden auch als Profile pr bezeichnet werden, gemäß
Zum Bestimmen der Profile werden die Merkmale im Hinblick auf ihre Trennstärke für die zwei Klassen analysiert.
Im vorliegenden Ausführungsbeispiel werden Merkmalen, die eine Trennstärke unter einem vordefinierten Schwellwert aufweisen, in der Linearkombination als Wert für den Koeffizienten ci = 0 zugewiesen, so dass sie in anderen Worten eliminiert werden, während den anderen Merkmalen der Koeffizienten Wert ci = 1 zugewiesen wird.In the present embodiment, features that have a discrimination strength below a predefined threshold are assigned the value for the coefficient c i = 0 in the linear combination, so that in other words they are eliminated, while the other features are assigned the coefficient value c i = 1.
Dieses Vorgehen wird vorliegend für das Profil um 524,38 nm illustriert: Dafür wurden für das Profil um 524,38 nm einzelne Spektren zwischen 518,80 nm und 529,95 nm mit Methoden des maschinellen Lernens analysiert. Dabei stellt sich heraus, dass die Merkmale F1, F2 und F4 bei diesem Profil keine ausreichende Trennstärke aufweisen. Eine weitere Berücksichtigung dieser Merkmale würde die Trefferquote für die Klassifikation verschlechtern. Für die Merkmale F3 und F5 ergeben sich folgende in der Linearkombination zu berücksichtigende Werte:
- F3:
- - Vier Fourier-Transformation-Koeffizienten: f1, f2, f3, f4 bei 523.82 nm
- - Drei Fourier-Transformation-Koeffizienten: f5, f6, f7 bei 523.26 nm
- - Ein Fourier-Transformation-Koeffizient: f8 bei 524.38 nm
- F5:
- - Entropie E1 bei 518.80 nm
- - Entropie E2 bei 527.17 nm
- - Entropie E3 bei 529.95 nm
- - Entropie E4 bei 523.26 nm
- F3:
- - Four Fourier transform coefficients: f 1 , f 2 , f 3 , f 4 at 523.82 nm
- - Three Fourier transform coefficients: f 5 , f 6 , f 7 at 523.26 nm
- - A Fourier transform coefficient: f 8 at 524.38 nm
- F5:
- - Entropy E1 at 518.80 nm
- - Entropy E2 at 527.17 nm
- - Entropy E3 at 529.95 nm
- - Entropy E4 at 523.26 nm
Das Profil
Durch den Wert -3,5 wird zudem festgelegt, dass eine Klassifikations-Regel dahingehend lautet, dass >0 für die eine Klasse und <0 für die andere Klasse gilt.The value -3.5 also specifies that a classification rule is that >0 applies to one class and <0 to the other class.
Nach dieser ersten Stufe des Verfahrens lassen sich bei den folgenden exemplarisch gezeigten Profilen die nachfolgend gelisteten Klassifikationsergebnisse erzielen. Die Trefferquoten wurden an nicht zum Trainer des Klassifikators verwendeten zweidimensionalen spektroskopischen Daten von Bruteiern überprüft:
D bezeichnet den Wert der Diskriminanzfunktion für die Profile und A die Trefferquote (Accuracy) für die Profile. Die Bezeichnung für die Wellenlägen entspricht entweder der einzelnen singulären Wellenlänge des Profils oder dem Arithmetischen Mittel des Anfang- und Endwertes des Wellenlängenbereiches.D denotes the value of the discriminant function for the profiles and A denotes the accuracy of the profiles. The designation for the wavelengths corresponds either to the individual singular wavelength of the profile or to the arithmetic mean of the start and end values of the wavelength range.
Im nachfolgenden Schritt des Verfahrens werden aus den ermittelten Profilen eine Untermenge ausgewählt, indem die Profile im Hinblick auf ihre Trennstärke für die zwei Klassen analysiert werden. Dies erfolgt vorliegend mittels linearer Diskriminanzanalyse.
Unter Berücksichtigung dieser ermittelten Untermenge an Profilen, bei denen unter anderen auch das Profil bei 524,38 nm enthalten ist, werden in der 2. Stufe eine 100% Trefferquote erreicht.Taking into account this determined subset of profiles, which also includes the profile at 524.38 nm, a 100% hit rate is achieved in the second stage.
Bezugszeichenreference sign
- 10a10a
- Abklingkurve für singuläre Wellenlängedecay curve for singular wavelength
- 10b10b
- gemittelte Abklingkurve über Wellenlängenbereichaveraged decay curve over wavelength range
- 1212
- y-Achsey-axis
- 1414
- x-Achsex-axis
- 1616
- Wellenlängenbereichwavelength range
- 1818
- KreisCircle
- 2020
- Diskriminanzfunktiondiscriminant function
- P1, P2P1, P2
- Klassenclasses
Claims (13)
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102023122800.5A DE102023122800B3 (en) | 2023-08-24 | 2023-08-24 | Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample |
| PCT/EP2024/072776 WO2025040505A1 (en) | 2023-08-24 | 2024-08-13 | Method for determining a binary classifier and method for assigning a sample to one of two possible classes on the basis of spectroscopic data relating to the sample |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102023122800.5A DE102023122800B3 (en) | 2023-08-24 | 2023-08-24 | Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE102023122800B3 true DE102023122800B3 (en) | 2024-12-24 |
Family
ID=92458040
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102023122800.5A Active DE102023122800B3 (en) | 2023-08-24 | 2023-08-24 | Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample |
Country Status (2)
| Country | Link |
|---|---|
| DE (1) | DE102023122800B3 (en) |
| WO (1) | WO2025040505A1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN121140945A (en) * | 2025-11-19 | 2025-12-16 | 格物量子技术(合肥)有限公司 | A device and method for implementing a single-photon spectrometer |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021144420A1 (en) * | 2020-01-15 | 2021-07-22 | Technische Hochschule Ostwestfalen-Lippe University Of Applied Sciences And Arts | Device and method for in-ovo determination of the sex of a fertilised bird egg |
| WO2023161532A1 (en) * | 2022-02-28 | 2023-08-31 | Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência | Method and device for detecting and/or classifying particles of organic based compounds from a backscattered light fingerprint |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102016004051B3 (en) * | 2016-04-04 | 2017-07-27 | Technische Universität Dresden | Method and device for optical in-ovo sexing of fertilized and incubated bird eggs |
-
2023
- 2023-08-24 DE DE102023122800.5A patent/DE102023122800B3/en active Active
-
2024
- 2024-08-13 WO PCT/EP2024/072776 patent/WO2025040505A1/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021144420A1 (en) * | 2020-01-15 | 2021-07-22 | Technische Hochschule Ostwestfalen-Lippe University Of Applied Sciences And Arts | Device and method for in-ovo determination of the sex of a fertilised bird egg |
| WO2023161532A1 (en) * | 2022-02-28 | 2023-08-31 | Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência | Method and device for detecting and/or classifying particles of organic based compounds from a backscattered light fingerprint |
Non-Patent Citations (1)
| Title |
|---|
| RAJAPAKSHA, Nipuna [et al.]: Supervised machine learning algorithm selection for condition monitoring of induction motors. Proceedings : 2021 IEEE southern power electronics conference (SPEC), 06-09 December 2021. 10 S. - ISBN 978-1-6654-3623-6 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN121140945A (en) * | 2025-11-19 | 2025-12-16 | 格物量子技术(合肥)有限公司 | A device and method for implementing a single-photon spectrometer |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2025040505A1 (en) | 2025-02-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69601720T2 (en) | METHOD AND DEVICE FOR DETERMINING DNA SEQUENCE AND DETECTING MUTATIONS | |
| EP2336751B1 (en) | Method for determining the gender of bird eggs | |
| DE102018104616A1 (en) | A method of dividing one or more images of a sample into color-separated image data, computer program product, computer-readable medium on which the computer program product is stored, and a system for splitting one or more images of a sample into color-separated image data | |
| DE112011100038T5 (en) | Method for developing recognition algorithms for laser-induced plasma emission spectroscopy | |
| EP4016082B1 (en) | Method and device for detecting a presence of a fluorescence pattern type on an organ segment by means of immunofluorescence microscopy | |
| DE102023122800B3 (en) | Method for determining a binary classifier and method for assigning a sample to one of two possible classes based on spectroscopic data of the sample | |
| EP4090952A1 (en) | Device and method for in-ovo determination of the sex of a fertilised bird egg | |
| EP3430565B1 (en) | Method for testing distributed objects by segmenting an overview image | |
| DE102022107397B4 (en) | Device and method for determining the sex of a fertilized bird egg | |
| WO2018050802A1 (en) | Method for classifying spectra of objects having complex information content | |
| DE102023100439A1 (en) | Microscopy system and method for calculating a result image by an ordinal classification model | |
| EP3050032B1 (en) | Method of testing valubale documents of polymer material which has a transparent window and means to perform the method | |
| WO2025108894A1 (en) | Method for ascertaining a luminance noise level of a light-emitting semiconductor diode | |
| EP3872445A1 (en) | Coating thickness measurement through evaluation of the spectrum of fluorescence emission | |
| EP3155588B1 (en) | Whole-body image recording and image processing system and method for operating same | |
| EP2613139B1 (en) | Method for the analysis of samples and systems thereof | |
| DE102024114348A1 (en) | Method for assigning a sample to one of several possible classes based on experimental data of the sample | |
| DE102020116178A1 (en) | Method for recognizing an amplification phase in an amplification | |
| DE102012024203A1 (en) | Method for determining sequence of biopolymers e.g. single stranded DNA, involves comparing signals of polymer strand with experimental determined signals until unique sequence with least significant average deviation is determined | |
| DE102019216999A1 (en) | Device and method for monitoring a machine | |
| EP3809115A1 (en) | Method for classification of platelet aggregation | |
| DE112023005866T5 (en) | Dye data acquisition method, dye data acquisition device and dye data acquisition program | |
| WO2019068352A1 (en) | APPARATUS FOR AUTOMATIC SPECS ANALYSIS AND METHOD FOR THEIR IMPLEMENTATION | |
| DE102018221816B3 (en) | Method for checking an ignition spark of a spark plug and device | |
| DE102023208512A1 (en) | Prediction of final test sensor module data |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R012 | Request for examination validly filed | ||
| R016 | Response to examination communication | ||
| R018 | Grant decision by examination section/examining division | ||
| R020 | Patent grant now final |