WO2025068377A1 - Method for training a neural network intended for controlling a system for sorting objects - Google Patents
Method for training a neural network intended for controlling a system for sorting objects Download PDFInfo
- Publication number
- WO2025068377A1 WO2025068377A1 PCT/EP2024/077076 EP2024077076W WO2025068377A1 WO 2025068377 A1 WO2025068377 A1 WO 2025068377A1 EP 2024077076 W EP2024077076 W EP 2024077076W WO 2025068377 A1 WO2025068377 A1 WO 2025068377A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- processed
- objects
- simulated
- digital
- installation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B07—SEPARATING SOLIDS FROM SOLIDS; SORTING
- B07C—POSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
- B07C1/00—Measures preceding sorting according to destination
- B07C1/02—Forming articles into a stream; Arranging articles in a stream, e.g. spacing, orientating
- B07C1/04—Forming a stream from a bulk; Controlling the stream, e.g. spacing the articles
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1671—Programme controls characterised by programming, planning systems for manipulators characterised by simulation, either to verify existing program or to create and verify new program, CAD/CAM oriented, graphic oriented programming systems
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/41815—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the cooperation between machine tools, manipulators and conveyor or other workpiece supply system, workcell
- G05B19/4182—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the cooperation between machine tools, manipulators and conveyor or other workpiece supply system, workcell manipulators and conveyor only
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39102—Manipulator cooperating with conveyor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/40—Robotics, robotics mapping to robotics vision
- G05B2219/40078—Sort objects, workpieces
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/45—Nc applications
- G05B2219/45047—Sorting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Definitions
- the invention relates to a method for processing objects, such as a sorting method, the method including training a neural network intended to control an object processing system, said neural network being trained using images comprising objects to be processed each associated with a characteristic used as a processing criterion.
- Object handling systems such as baggage, parcel, postal or other object sorting systems use conveyors and/or gripper robots as handling means. These handling means are controlled using various types of sensors such as photoelectric cells, scales, force sensors, barcode readers or digital cameras connected to electronic and/or computer systems.
- the use of artificial neural networks is considered a very effective solution that can have high reliability, with a very low error rate.
- One example is the control of gripping robots using images captured by digital cameras.
- the neural network has the function of characterizing, possibly by identification, objects to be sorted found in the images captured by the cameras in order to control in return gripping robots whose function is to move these objects.
- so-called “deep learning” methods are developed to process complex stacks of items to be sorted, as described in the article "Visual Sorting of Express Parcels Based on Multi-Task Deep Learning” by Song Han et al., Sensors 2020, 20, 6785; doi:10.3390/s20236785.
- Neural networks are trained on sets of manually labeled images to adjust their internal parameters, such as the synaptic weights of each of the neurons constituting the network.
- Image labeling involves clipping the objects of interest by creating a mask excluding parts of the image other than these objects, and then annotating each of the objects.
- the training data should contain as many images as possible, with 100,000 images being considered a minimum.
- manually processing and labeling these images is time-consuming and prone to human error. It is therefore difficult and expensive to produce large sets of labeled data for training neural networks.
- patent document WO 2018/170512 A1 discloses a solution based on a sequence of images, in which an object is manually labeled in a first image of the sequence, and then this object is automatically tracked and labeled in subsequent images of the sequence, thus providing a large number of training images for limited human effort. It is also proposed to carry out automatic annotations of images, as for example in patent document EP 3 885 998 A1.
- An object of the invention is a method of object processing including the training of a neural network based on the use of automatically produced annotated images.
- a first aspect of the invention is a method for processing objects in an object processing installation comprising a computer configured to characterize, by means of a neural network, objects to be processed visible in digital images of objects to be processed located in the object processing installation, the method comprising: a step of generating digital training data representative of objects to be processed simulated within the object processing installation, these data being intended for training the neural network, generated by means of a digital twin of the object processing system, and associated with annotations indicating at least one characteristic of the simulated objects to be processed, the digital twin integrating a dynamic engine for simulating physical interactions between at least one object to be processed and at least one simulated element of the processing installation, so as to simulate movements of objects to be processed and interactions of these objects to be processed with the at least one simulated element of the processing installation; a step of training the neural network comprising providing digital training data as input to the neural network and during which the parameters of the neural network are adjusted on the basis of the digital training data; a step of acquiring digital images of a real scene of the
- This method benefits from the automatic, simple and economical production of a large number of annotated images adapted to the purpose of the method, which is the embodiment detailed below consisting of sorting articles arriving on an article sorting line.
- the training of the neural network based on a large number of annotated images without errors and generated in such a way as to correspond to the situation for which the neural network is used, is of high quality, and the use of this neural network after its training implies a high level of reliability of the sorting process to which it is applied.
- the simulations of movements of objects to be processed and the simulations of interactions of the at least one object to be processed with the at least one element of the processing installation may comprise a simulation of a physical interaction between the at least one object to be processed and at least one conveyor of the installation, so as to simulate a configuration of the at least one object to be processed in a work area of the sorting installation;
- the at least one simulated element may be a ginning device
- the movements of simulated objects to be processed and the interactions of the at least one simulated object to be processed with the at least one simulated element may include a simulation of unloading the objects to be processed in an unloading zone;
- the at least one characteristic of the simulated objects to be processed can be chosen from the position, geometry and orientation of the simulated objects to be processed;
- the digital training data may comprise at least one digital image of a simulated scene representing a working area of the object processing facility
- the at least one digital image can be generated so as to be substantially as if it were obtained from digital images acquired by a digital camera installed above the working area of the actual processing installation;
- the digital training data may further include a depth map of the simulated scene
- the depth map may be generated so as to be substantially as if it were obtained from digital images acquired by a digital camera installed above the working area of the actual processing facility;
- the digital twin integrates a dynamic engine for simulating physical interactions between simulated elements of the treatment installation, so as to reproduce movements and shocks between simulated objects to be treated and simulated elements of the treatment installation;
- the method may further comprise a step of projecting textures from digital images of real objects onto surfaces of the simulated objects to be processed;
- the digital twin of the object processing system can be configured so as to generate digital images of homogeneous batches of objects to be processed comprising more than 40%, preferably more than 50%, preferably more than 80%, preferably more than 90% or 100% of objects belonging to the same type of objects to be processed; and
- the type of objects can be defined by a texture mapped onto surfaces of simulated objects.
- the invention extends to a treatment installation comprising a computer configured to implement the method according to the invention.
- the computer can be configured to control the manipulator arm and (ii) the computer and the digital twin can be interfaced in such a way that at least one simulated element of the facility is controlled by the computer.
- Figures 1 to 3 illustrate a mode of implementation of a method for training a neural network, specialized in the analysis of digital images in order to identify items to be sorted within an item sorting line.
- the manipulator arm MA is equipped with a gripping head GH, and the conveyor belt CB moves the articles It unloaded from the bulk truck in the direction Dir represented by an arrow, to the inserter INS.
- the gripping head GH can be equipped with suction cups SC connected to a pumping system, each suction cup can be controlled individually so as to apply a vacuum to the surface of an article to be gripped.
- the articles arrive in bulk from the right of the figure, the manipulator arm being responsible for unpicking them, that is to say, gripping them one by one to place them in order on the conveyor belt CB towards the left of the figure.
- FIG. 1 There represents a diagram of the method 100 for handling articles according to the invention, including the generation of annotated images for training a neural network, the training of this network, then its use in controlling a robotic arm for picking articles to be sorted.
- the dynamic engine can consist of a software grouping configured to reproduce the laws of dynamic mechanics.
- the digital twin makes it possible to generate realistic configurations corresponding to actual processing of articles by the installation, in particular at the level of the WZ work zone.
- the dynamic engine allows for high realism and a wide variety of configurations, guaranteeing effective training of the neural network subsequently.
- the internal parameters of the neural network were adjusted to provide appropriate responses to the data provided as input to the network, and it can be used during the real item sorting process.
- the digital camera CAM acquires digital images of a real scene encompassing the working area WZ in the form of a color digital image and two images intended to form a depth map of the scene.
- the computer CALC generates the depth map.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mechanical Engineering (AREA)
- Robotics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- Automation & Control Theory (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
L'invention concerne un procédé de traitement d’objets, tel qu’un procédé de tri, le procédé incluant l’entraînement d’un réseau de neurones destiné au contrôle d’un système de traitement des objets, réseau de neurone entraîné au moyen d’images comprenant des objets à traiter chacun associés à une caractéristique employée comme critère de traitement.The invention relates to a method for processing objects, such as a sorting method, the method including training a neural network intended to control an object processing system, said neural network being trained using images comprising objects to be processed each associated with a characteristic used as a processing criterion.
Les systèmes de traitements d’objets tels que des systèmes de tri de bagages, de colis, d’objets postaux ou d’autres objets mettent en œuvre des convoyeurs et/ou des robots préhenseurs en tant que moyens de manipulation. Ces moyens de manipulation sont contrôlés au moyen de divers types de capteurs tels que des cellules photoélectriques, des balances, des capteurs de forces, des lecteurs de codes-barres ou encore des caméras numériques reliés à des systèmes électroniques et/ou informatiques.Object handling systems such as baggage, parcel, postal or other object sorting systems use conveyors and/or gripper robots as handling means. These handling means are controlled using various types of sensors such as photoelectric cells, scales, force sensors, barcode readers or digital cameras connected to electronic and/or computer systems.
Parmi les méthodes de contrôle de ces systèmes de tri, le recours à des réseaux de neurones artificiels est considéré comme une solution très efficace pouvant avoir une grande fiabilité, avec un taux d’erreurs très bas. On peut citer par exemple le contrôle de robots préhenseurs au moyen d’image capturées par des caméras numériques. Dans ce cas, le réseau de neurones a pour fonction de caractériser, éventuellement par identification, des objets à trier se trouvant dans les images capturées par les caméras afin de commander en retour des robots préhenseurs ayant pour fonction de déplacer ces objets. Ainsi, des méthodes dites de « deep learning » sont développées pour traiter des empilements complexes d’articles à trier, comme décrit dans l’article « Visual Sorting of Express Parcels Based on Multi-Task Deep Learning » par Song Han et al., Sensors 2020, 20, 6785 ; doi :10.3390/s20236785.Among the methods for controlling these sorting systems, the use of artificial neural networks is considered a very effective solution that can have high reliability, with a very low error rate. One example is the control of gripping robots using images captured by digital cameras. In this case, the neural network has the function of characterizing, possibly by identification, objects to be sorted found in the images captured by the cameras in order to control in return gripping robots whose function is to move these objects. Thus, so-called "deep learning" methods are developed to process complex stacks of items to be sorted, as described in the article "Visual Sorting of Express Parcels Based on Multi-Task Deep Learning" by Song Han et al., Sensors 2020, 20, 6785; doi:10.3390/s20236785.
Les réseaux de neurones sont entraînés sur des ensembles d'images étiquetées manuellement afin d’ajuster leurs paramètres internes, tels que les poids synaptiques de chacun des neurones constituant le réseau. L’étiquetage des images comprend le détourage des objets d’intérêt par réalisation d’un masque excluant les parties de l’image autres que ces objets, puis l’annotation de chacun des objets. Pour un entraînement de qualité, les données d'entraînement doivent compter un nombre d’images aussi grand que possible, 100000 images étant considéré comme un minimum. Cependant, le traitement et le marquage manuel de ces images prend du temps et est sujet à des erreurs humaines. Il est donc difficile et coûteux de produire de grands ensembles de données étiquetées pour l’entraînement des réseaux de neurones.Neural networks are trained on sets of manually labeled images to adjust their internal parameters, such as the synaptic weights of each of the neurons constituting the network. Image labeling involves clipping the objects of interest by creating a mask excluding parts of the image other than these objects, and then annotating each of the objects. For quality training, the training data should contain as many images as possible, with 100,000 images being considered a minimum. However, manually processing and labeling these images is time-consuming and prone to human error. It is therefore difficult and expensive to produce large sets of labeled data for training neural networks.
Au vu de ces difficultés, le document de brevet WO 2018/170512 Al divulgue une solution reposant sur une séquence d’images, dont un objet est étiqueté manuellement dans une première image de la séquence, puis cet objet est suivi et étiqueté automatiquement dans les images ultérieures de la séquence, fournissant ainsi un grand nombre d’images d’entraînement pour un effort humain limité. Il est aussi proposé de procéder à des annotations automatiques d’images, comme par exemple dans le document de brevet EP 3 885 998 A1.In view of these difficulties, patent document WO 2018/170512 A1 discloses a solution based on a sequence of images, in which an object is manually labeled in a first image of the sequence, and then this object is automatically tracked and labeled in subsequent images of the sequence, thus providing a large number of training images for limited human effort. It is also proposed to carry out automatic annotations of images, as for example in patent document EP 3 885 998 A1.
Cependant, une solution satisfaisante pour les applications de tri reste encore à mettre en place.However, a satisfactory solution for sorting applications has yet to be implemented.
Un objet de l’invention est un procédé de traitement d’objet incluant l’entraînement d’un réseau de neurones reposant sur l’utilisation d’images annotées produites automatiquement.An object of the invention is a method of object processing including the training of a neural network based on the use of automatically produced annotated images.
En vue de la réalisation de ce but, un premier aspect de l’invention est un procédé de traitement d’objets dans une installation de traitement d’objets comprenant un calculateur configuré pour caractériser, au moyen d’un réseau de neurones, des objets à traiter visibles dans des images numériques d’objets à traiter situés dans l’installation de traitement d’objets, le procédé comprenant : une étape de génération de données numériques d’entraînement représentatives d’objets à traiter simulés au sein de l’installation de traitement d’objets, ces données étant destinées à un entraînement du réseau de neurones, générées au moyen d’un jumeau numérique du système de traitement d’objets, et associées à des annotations indiquant au moins une caractéristique des objets à traiter simulés, le jumeau numérique intégrant un moteur dynamique de simulation d’interactions physiques entre au moins un objet à traiter et au moins un élément simulé de l’installation de traitement, de manière à simuler des déplacements d’objets à traiter et des interactions de ces objets à traiter avec l’au moins un élément simulé de l’installation de traitement ; une étape d’entraînement du réseau de neurones comprenant la fourniture des données numériques d’entraînement en entrée du réseau de neurones et au cours de laquelle les paramètres du réseau de neurones sont ajustés sur la base des données numériques d’entraînement ; une étape d’acquisition d’images numériques d’une scène réelle de l’installation de traitement d’objets comprenant au moins un objet réel à traiter ; une étape comprenant la fourniture de données générées à partir des images numériques de la scène réelle en entrée du réseau de neurones, le réseau de neurones fournissant en retour une donnée représentative d’une caractéristique de l’objet réel à traiter ; et une étape comprenant l’envoi d’un signal de commande à un dispositif de traitement d’objet sur la base de la donnée représentative de la caractéristique de l’au moins un objet réel à traiter.To achieve this aim, a first aspect of the invention is a method for processing objects in an object processing installation comprising a computer configured to characterize, by means of a neural network, objects to be processed visible in digital images of objects to be processed located in the object processing installation, the method comprising: a step of generating digital training data representative of objects to be processed simulated within the object processing installation, these data being intended for training the neural network, generated by means of a digital twin of the object processing system, and associated with annotations indicating at least one characteristic of the simulated objects to be processed, the digital twin integrating a dynamic engine for simulating physical interactions between at least one object to be processed and at least one simulated element of the processing installation, so as to simulate movements of objects to be processed and interactions of these objects to be processed with the at least one simulated element of the processing installation; a step of training the neural network comprising providing digital training data as input to the neural network and during which the parameters of the neural network are adjusted on the basis of the digital training data; a step of acquiring digital images of a real scene of the object processing installation comprising at least one real object to be processed; a step comprising providing data generated from the digital images of the real scene as input to the neural network, the neural network providing in return data representative of a characteristic of the real object to be processed; and a step comprising sending a control signal to an object processing device on the basis of the data representative of the characteristic of the at least one real object to be processed.
Ce procédé bénéficie de la production automatique, simple et économique d’un grand nombre d’images annotées adaptées au but du procédé, qui est de le mode de réalisation détaillé ci-dessous consistant à trier des d’articles arrivant sur une ligne de tri d’articles. Ainsi, l’entraînement du réseau de neurones, basé sur un grand nombre d’images annotées sans erreurs et générées de manière à correspondre à la situation pour laquelle le réseau de neurones est utilisé, est de haute qualité, et l’utilisation de ce réseau de neurones après son entraînement implique un haut niveau de fiabilité du procédé de tri auquel il est appliqué.This method benefits from the automatic, simple and economical production of a large number of annotated images adapted to the purpose of the method, which is the embodiment detailed below consisting of sorting articles arriving on an article sorting line. Thus, the training of the neural network, based on a large number of annotated images without errors and generated in such a way as to correspond to the situation for which the neural network is used, is of high quality, and the use of this neural network after its training implies a high level of reliability of the sorting process to which it is applied.
Selon des caractéristiques additionnelles non-limitative du premier aspect de l’invention, considérées individuellement ou selon toute combinaison techniquement réalisable :According to additional non-limiting characteristics of the first aspect of the invention, considered individually or in any technically feasible combination:
- les simulations de déplacements d’objets à traiter et les simulations d’interactions de l’au moins un objet à traiter avec l’au moins un élément de l’installation de traitement peuvent comprendre une simulation d’une interaction physique entre l’au moins un objet à traiter et au moins un convoyeur de l’installation, de manière à simuler une configuration de l’au moins un objet à traiter dans une zone de travail de l’installation de tri ;- the simulations of movements of objects to be processed and the simulations of interactions of the at least one object to be processed with the at least one element of the processing installation may comprise a simulation of a physical interaction between the at least one object to be processed and at least one conveyor of the installation, so as to simulate a configuration of the at least one object to be processed in a work area of the sorting installation;
- l’au moins un élément simulé peut être un dispositif d’égrenage ;- the at least one simulated element may be a ginning device;
- les déplacements d’objets à traiter simulés et les interactions de l’au moins un objet à traiter simulé avec l’au moins un élément simulé peuvent comprendre une simulation d’un déchargement des objets à traiter dans une zone de déchargement ;- the movements of simulated objects to be processed and the interactions of the at least one simulated object to be processed with the at least one simulated element may include a simulation of unloading the objects to be processed in an unloading zone;
- la au moins une caractéristique des objets à traiter simulés peut être choisie parmi la position, la géométrie et l’orientation des objets à traiter simulés ;- the at least one characteristic of the simulated objects to be processed can be chosen from the position, geometry and orientation of the simulated objects to be processed;
- les données numériques d’entraînement peuvent comprendre au moins une image numérique d’une scène simulée représentant une zone de travail de l’installation de traitement d’objets ;- the digital training data may comprise at least one digital image of a simulated scene representing a working area of the object processing facility;
- la au moins une image numérique peut être générée de manière à être sensiblement telle que si elle était obtenue à partir d’images numériques acquises par un appareil de prise de vue numérique installé au-dessus de la zone de travail de l’installation de traitement réelle ;- the at least one digital image can be generated so as to be substantially as if it were obtained from digital images acquired by a digital camera installed above the working area of the actual processing installation;
- les données numériques d’entraînement peuvent comporter en outre une carte de profondeur de la scène simulée ;- the digital training data may further include a depth map of the simulated scene;
- la carte de profondeur peut être générée de manière à être sensiblement telle que si elle était obtenue à partir d’images numériques acquises par un appareil de prise de vue numérique installé au-dessus de la zone de travail de l’installation de traitement réelle ;- the depth map may be generated so as to be substantially as if it were obtained from digital images acquired by a digital camera installed above the working area of the actual processing facility;
- le jumeau numérique intègre un moteur dynamique de simulation d’interactions physiques entre des éléments simulés de l’installation de traitement, de manière à reproduire des déplacements et des chocs entre des objets à traiter simulés et des éléments simulés de l’installation de traitement ;- the digital twin integrates a dynamic engine for simulating physical interactions between simulated elements of the treatment installation, so as to reproduce movements and shocks between simulated objects to be treated and simulated elements of the treatment installation;
- le procédé peut en outre comprendre une étape de projection de textures issue d’images numériques d’objets réels sur des surfaces des objets à traiter simulés ;- the method may further comprise a step of projecting textures from digital images of real objects onto surfaces of the simulated objects to be processed;
- le jumeau numérique du système de traitement d’objets peut être paramétré de manière à générer des images numériques de lots homogènes d’objets à traiter comprenant plus de 40%, préférentiellement plus de 50%, préférentiellement plus de 80%, préférentiellement plus de 90% ou 100% d’objets appartenant à un même type d’objets à traiter ; et- the digital twin of the object processing system can be configured so as to generate digital images of homogeneous batches of objects to be processed comprising more than 40%, preferably more than 50%, preferably more than 80%, preferably more than 90% or 100% of objects belonging to the same type of objects to be processed; and
- le type d’objets peut être défini par une texture plaquée sur des surfaces d’objets simulés.- the type of objects can be defined by a texture mapped onto surfaces of simulated objects.
L’invention s’étend à installation de traitement comprenant un calculateur configuré pour mettre en œuvre le procédé selon l’invention.The invention extends to a treatment installation comprising a computer configured to implement the method according to the invention.
Dans l’installation de traitement, (i) le calculateur peut être configuré pour piloter le bras manipulateur et (ii) le calculateur et le jumeau numérique peuvent être interfacés de manière telle que l’au moins un élément simulé de l’installation soient contrôlé par le calculateurIn the treatment facility, (i) the computer can be configured to control the manipulator arm and (ii) the computer and the digital twin can be interfaced in such a way that at least one simulated element of the facility is controlled by the computer.
D’autres caractéristiques et avantages de l’invention ressortiront de la description détaillée de l’invention qui va suivre en référence aux figures annexées sur lesquels :Other characteristics and advantages of the invention will emerge from the detailed description of the invention which follows with reference to the appended figures in which:
Les figures 1 à 3 illustrent un mode de mise en œuvre d’un procédé d’entraînement d’un réseau de neurones, spécialisé dans l’analyse d’images numériques afin d’identifier des articles à trier au sein d’une ligne de tri d’articles.Figures 1 to 3 illustrate a mode of implementation of a method for training a neural network, specialized in the analysis of digital images in order to identify items to be sorted within an item sorting line.
Un contexte dans lequel l’invention peut être appliquée est illustré à l’aide de l’exemple des figures 1 et 2, qui représentent une portion schématisée d’une installation FAC de traitement d’articles comprenant une ligne de tri SL équipée d’un système SYS de pilotage de la ligne de tri. Les flèches droites indiquent les chemins suivis par des articles à trier et en cours de tri au sein de l’installation.A context in which the invention can be applied is illustrated using the example of Figures 1 and 2, which represent a schematic portion of a FAC installation for processing articles comprising an SL sorting line equipped with a SYS system for controlling the sorting line. The straight arrows indicate the paths followed by articles to be sorted and being sorted within the installation.
La
La
Nous allons nous intéresser au processus d’identification des articles au niveau de la zone de travail en vue de leur dévracage par le bras manipulateur.We will focus on the process of identifying items in the work area for picking by the manipulator arm.
A ce niveau, les articles sont manipulés un à un de manière à les ordonner en vue des opérations de tri ultérieures, ici l’insertion des articles à intervalles réguliers sur la bande de convoyage circulaire. Cette manipulation individualisée des articles doit se faire aussi rapidement que possible, tout en assurant une bonne qualité de saisie des articles par le bras robotisé. A cette fin, le système doit fournir au système de commande du bras robotisé les caractéristiques, positions, orientations, et géométries, de chacun des articles. Ces caractéristiques sont obtenues à partir d’images numériques de la zone de travail, traitées par le calculateur CALC au moyen d’un réseau de neurones NN entraînés grâce à des images annotées.At this level, the articles are handled one by one in order to order them for subsequent sorting operations, in this case the insertion of the articles at regular intervals on the circular conveyor belt. This individual handling of the articles must be done as quickly as possible, while ensuring good quality of capture of the articles by the robotic arm. To this end, the system must provide the robotic arm control system with the characteristics, positions, orientations, and geometries of each of the articles. These characteristics are obtained from digital images of the work area, processed by the CALC computer using a NN neural network trained using annotated images.
Conventionnellement, ces images sont annotées manuellement, ou, au mieux, avec des systèmes d’annotation semi-automatisés, comme mentionné dans la section Arrière-plan technologique. La solution proposée ici repose sur l’utilisation d’un jumeau numérique de l’installation de tri pour générer par calcul des images numériques et des cartes de profondeur représentatives de scènes englobant la zone de travail.Conventionally, these images are annotated manually, or at best, with semi-automated annotation systems, as mentioned in the Technological Background section. The solution proposed here is based on the use of a digital twin of the sorting facility to computationally generate digital images and depth maps representative of scenes encompassing the work area.
L’utilisation d’un jumeau numérique est particulièrement pertinente dans une situation où il est difficile de procéder à une annotation manuelle d’image d’entraînement. Lorsqu’il s’agit d’associer une annotation de contenu binaire à des images, telle que « présence ou absence d’un bloc d’adresse oui/non », alors un opérateur humain peut être efficace en termes de temps, de fiabilité et de coût pour procéder à l’annotation. En revanche, lorsque l’annotation requise consiste par exemple à déterminer et indiquer une position, une géométrie ou des dimensions d’articles présents dans une image, alors le temps, la fiabilité et le coût d’un opérateur humain sont très défavorables. Dans de telles situations, il est particulièrement intéressant de mettre en œuvre une génération d’images d’entraînement annotées automatiquement, qui sera plus rapide, fiable et/ou économique que si elle était réalisée par un opérateur humain.The use of a digital twin is particularly relevant in a situation where it is difficult to carry out manual annotation of training images. When it comes to associating a binary content annotation with images, such as “presence or absence of a yes/no address block”, then a human operator can be efficient in terms of time, reliability and cost to carry out the annotation. On the other hand, when the required annotation is for example to determine and indicate a position, geometry or dimensions of items present in an image, then the time, reliability and cost of a human operator are very unfavorable. In such situations, it is particularly interesting to implement an automatically annotated training image generation, which will be faster, more reliable and/or more economical than if it were carried out by a human operator.
La
A une étape 110A, on collecte les données DAT de l’installation FAC de traitement d’articles, ce qui inclut les caractéristiques géométriques et fonctionnelles du matériel employé (trieurs, convoyeurs, dispositif d’égrenage ou de diversion des articles…) et l’implantation de ce matériel, les interactions entre ces différents éléments.At a step 110A, the DAT data from the FAC article processing installation are collected, which includes the geometric and functional characteristics of the equipment used (sorters, conveyors, device for sorting or diverting articles, etc.) and the installation of this equipment, the interactions between these different elements.
A une étape 120, sur la base des données DAT collectées, on élabore un jumeau numérique NUM.TWIN de l’installation de tri, stocké au sein d’une mémoire informatique du calculateur CALC. Ce jumeau numérique intègre un moteur dynamique configuré pour reproduire les interactions physiques des éléments simulés de l’installation de tri (i) entre eux et (ii) avec les articles que cette installation traite, ainsi que les interactions physiques des objets à trier (i) entre eux et (ii) avec les éléments simulés de l’installation de tri. Comme déjà mentionné, les éléments simulés de l’installation de tri sont par exemple des convoyeurs, des dispositifs d’égrenage ou de diversion des objets à trier, des sous-systèmes de tri faisant partie de l’installation, ou tout simplement des éléments physiques tels que des plaques supportant les articles ou des barrières bloquant leur passage. De cette manière, le trajet, les déplacements, les chocs et plus généralement les interactions des objets simulés entre eux et avec les éléments constituant leur environnement, et spécifiquement les éléments de l’installation, sont fidèlement reproduits par le jumeau numérique.In a step 120, based on the collected DAT data, a digital twin NUM.TWIN of the sorting installation is developed, stored in a computer memory of the CALC computer. This digital twin integrates a dynamic engine configured to reproduce the physical interactions of the simulated elements of the sorting installation (i) with each other and (ii) with the articles that this installation processes, as well as the physical interactions of the objects to be sorted (i) with each other and (ii) with the simulated elements of the sorting installation. As already mentioned, the simulated elements of the sorting installation are, for example, conveyors, devices for sorting or diverting the objects to be sorted, sorting subsystems forming part of the installation, or quite simply physical elements such as plates supporting the articles or barriers blocking their passage. In this way, the path, movements, shocks and more generally the interactions of the simulated objects between themselves and with the elements constituting their environment, and specifically the elements of the installation, are faithfully reproduced by the digital twin.
Le moteur dynamique peut être constitué d’un regroupement logiciel configuré pour reproduire les lois de la mécanique dynamique. En combinaison avec un automatisme reproduisant le système de commande des éléments de l’installation, le jumeau numérique permet de générer des configurations réalistes correspondant à un traitement réel des articles par l’installation au niveau, en particulier, de la zone de travail WZ. Le moteur dynamique permet un fort réalisme et une grande diversité de configurations, gage d’un entraînement efficace du réseau de neurones par la suite.The dynamic engine can consist of a software grouping configured to reproduce the laws of dynamic mechanics. In combination with an automation reproducing the control system of the installation elements, the digital twin makes it possible to generate realistic configurations corresponding to actual processing of articles by the installation, in particular at the level of the WZ work zone. The dynamic engine allows for high realism and a wide variety of configurations, guaranteeing effective training of the neural network subsequently.
A une étape 130, le jumeau numérique génère des scènes simulées de l’installation de tri comportant en particulier des configurations d’articles simulés à trier S.IT dans la zone de travail WZ. Les scènes simulées résultent d’une simulation physiquement réaliste des interactions entre les articles et les dispositifs de l’installation FAC de traitement, depuis le point d’entrée des articles dans l’installation simulée jusqu’à la zone de travail WZ où il seront saisis individuellement par un bras manipulateur MA. Cette simulation exhaustive du traitement des articles au sein de l’installation FAC permet de générer des scènes extrêmement proches de celles qui seraient obtenues au sein de l’installation réelle, comme expliqué à l’aide de l’exemple de la
La
Un objectif de l’égrenage est de faciliter le traitement individuel des articles au niveau de la zone de travail WZ. A des fins d’optimisation de la manipulation des articles par le bras MA, on peut jouer sur les inclinaisons et le pilotage des moteurs, dont les variations amènent à des configurations différentes des articles au niveau de la zone de travail, facilitant plus ou moins le travail du bras manipulateur MA. Il s’agit ici essentiellement des aspects spatiaux, géométriques, des configuration que prennent les articles dans la zone WZ. Plus généralement, ces configurations pouvant être caractérisées par une ou plusieurs caractéristiques telles que des positions, orientations, et géométries de chacun des articles d’une configuration donnée, ainsi que par des textures plaquées sur des volumes représentant chacun des objets, textures pouvant comprendre des logos, motifs, blocs d’adresses, ou autres éléments visuels distinguant un article ou un type d’article d’un autre article ou d’un autre type d’article. Bien entendu, la génération d’articles des scènes simulées peut être contrôlée selon des moyens conventionnels tels que des paramètres de simulation, de manière à reproduire les situations envisagées par le praticien en ce qui concerne par exemple les formes, dimensions ou encore textures des articles, la densité, le nombre ou la répartition autres différents types de ceux-ci.One objective of seeding is to facilitate the individual processing of articles in the working area WZ. In order to optimize the handling of articles by the arm MA, it is possible to play on the inclinations and the control of the motors, the variations of which lead to different configurations of the articles in the working area, facilitating more or less the work of the manipulator arm MA. This essentially concerns the spatial and geometric aspects of the configurations that the articles take in the WZ zone. More generally, these configurations can be characterized by one or more characteristics such as positions, orientations, and geometries of each of the articles in a given configuration, as well as by textures applied to volumes representing each of the objects, textures which can include logos, patterns, address blocks, or other visual elements distinguishing an article or a type of article from another article or another type of article. Of course, the generation of articles of the simulated scenes can be controlled according to conventional means such as simulation parameters, so as to reproduce the situations envisaged by the practitioner with regard to, for example, the shapes, dimensions or even textures of the articles, the density, the number or the distribution of other different types of these.
Cependant, l’avantage de la simulation exhaustive du traitement des articles réside dans la possibilité qu’elle donne d’obtenir des configurations d’objets qui sont représentatives, d’une part de la nature et de l’arrangement des éléments formant la chaîne de tri, et d’autre part de leurs réglages et de leurs algorithmes de pilotage. Dans l’exemple présent, on peut ajuster les vitesses des moteurs M1, M2 et M3 des convoyeurs C1, C2 et C3, ce qui conditionnera sur la qualité de l’égrenage et donc la configuration des articles au niveau de la zone WZ, en sortie du dispositif d’égrenage DE. Aux fins de simulation, la zone de travail WZ et la zone de déversement DZ peuvent être considérées comme des plaques rigides horizontales avec lesquelles les objets à traiter interagissent physiquement.However, the advantage of exhaustive simulation of the processing of articles lies in the possibility it gives to obtain configurations of objects which are representative, on the one hand of the nature and arrangement of the elements forming the sorting chain, and on the other hand of their settings and their control algorithms. In the present example, the speeds of the motors M1, M2 and M3 of the conveyors C1, C2 and C3 can be adjusted, which will condition the quality of the ginning and therefore the configuration of the articles at the level of the zone WZ, at the exit of the ginning device DE. For the purposes of simulation, the working zone WZ and the discharge zone DZ can be considered as rigid horizontal plates with which the objects to be processed physically interact.
En outre, le jumeau numérique peut être interfacé directement avec le système SYS de pilotage de la véritable installation FAC, qui est simulée par le jumeau numérique, de manière telle que les éléments de l’installation FAC simulée sont également contrôlés par le système SYS. On peut parler de mise en service virtuelle de l’installation FAC de traitement d’articles. De cette manière, et en tenant compte des enseignements du paragraphe précédent, on rapproche encore les scènes générées par simulation des scènes qui seraient effectivement obtenues dans l’installation réelle, les dispositifs de la simulation étant pilotés de la même façon que les dispositifs réels.Furthermore, the digital twin can be interfaced directly with the SYS control system of the real FAC installation, which is simulated by the digital twin, in such a way that the elements of the simulated FAC installation are also controlled by the SYS system. This can be referred to as virtual commissioning of the FAC installation for processing articles. In this way, and taking into account the lessons learned in the previous paragraph, the scenes generated by simulation are brought even closer to the scenes that would actually be obtained in the real installation, the devices in the simulation being controlled in the same way as the real devices.
D’une manière générale, il sera avantageux de générer une scène par simulation des interactions des objets à traiter avec l’équipement de l’installation de tri depuis leurs introductions respectives dans l’installation, jusqu’à la zone de travail. Cette démarche permet en effet d’obtenir des scènes simulées aussi proche que possible des scènes qui seraient obtenues dans les mêmes conditions (caractéristiques des objets, de l’équipement, des algorithmes de pilotage) dans le système réel.Generally speaking, it will be advantageous to generate a scene by simulating the interactions of the objects to be processed with the sorting facility equipment from their respective introductions into the facility to the work area. This approach makes it possible to obtain simulated scenes as close as possible to the scenes that would be obtained under the same conditions (characteristics of the objects, the equipment, the control algorithms) in the real system.
A une étape 110B, des images numériques R.IMG d’articles réels représentatifs des articles destinés à être triés par l’installation FAC sont collectées et stockées sur un support de stockage informatique. Cette opération peut, par exemple, consister en la prise de photos numériques de chacune des surfaces d’articles postaux ou d’emballages de colis tels que ceux qui sont amenés à être triés, par échantillonnage dans l’installation de tri d’articles déjà triés ou bien chez des fournisseurs d’emballage d’articles.In a step 110B, digital images R.IMG of real articles representative of the articles intended to be sorted by the FAC installation are collected and stored on a computer storage medium. This operation may, for example, consist of taking digital photos of each of the surfaces of postal articles or parcel packaging such as those which are to be sorted, by sampling in the sorting installation of already sorted articles or at article packaging suppliers.
A une étape 140, le calculateur CALC projette des textures issues des images numériques R.IMG sur les surfaces des articles simulés S.IT, permettant ainsi par la suite d’obtenir des points de vue photoréalistes de la scène simulée. A une étape 150, le calculateur CALC génère une image numérique et une carte de profondeur de la scène. Cette image numérique et cette carte de profondeur constituent des données d’entraînement T.DAT annotées, les annotations indiquant les caractéristiques respectives des articles de la scène : position, géométrie, orientation, par exemple. L’image numérique peut être générée de manière à comprendre des masques en tenant compte de l’occlusion de chacun des articles.At a step 140, the CALC computer projects textures from the digital images R.IMG onto the surfaces of the simulated articles S.IT, thus subsequently making it possible to obtain photorealistic viewpoints of the simulated scene. At a step 150, the CALC computer generates a digital image and a depth map of the scene. This digital image and this depth map constitute annotated T.DAT training data, the annotations indicating the respective characteristics of the articles in the scene: position, geometry, orientation, for example. The digital image can be generated so as to include masks taking into account the occlusion of each of the articles.
L’image numérique et la carte de profondeur de la scène sont de préférence générées de manière à être sensiblement telles que si elles étaient obtenues à partir d’images numériques acquises par l’appareil de prise de vue numérique CAM dans l’installation de tri réelle. On entend par là que l’angle de vue de la scène simulée retenu pour générer l’image numérique et la carte de profondeur correspond à l’angle de vue sous lequel l’appareil de prise de vue numérique CAM observe de la scène réelle. L’objectif est d’entraîner le réseau de neurones avec des données aussi proches que possible des données obtenues de de prises de vues réelles qu’il aura à traiter à la suite de sa période d’entraînement. L’entraînement peut se faire sans la carte de profondeur, qui n’est qu’optionnelle, mais peut améliorer la qualité de l’entraînement. The digital image and the depth map of the scene are preferably generated in such a way as to be substantially as if they were obtained from digital images acquired by the digital camera CAM in the real sorting facility. This means that the viewing angle of the simulated scene chosen to generate the digital image and the depth map corresponds to the viewing angle from which the digital camera CAM observes the real scene. The objective is to train the neural network with data as close as possible to the data obtained from real shots that it will have to process following its training period. The training can be done without the depth map, which is only optional, but can improve the quality of the training.
Un avantage important de ces données d’entraînement est que, étant entièrement générées automatiquement par calcul, les caractéristiques de des articles de la scène, générées lors de la simulation de la scène, sont parfaitement connues et les annotations, automatiques elles aussi, sont immédiatement disponibles et nécessairement justes, ce qui donne à ce procédé un avantage déterminant sur les procédés conventionnels de production d’images annotées.An important advantage of this training data is that, being entirely automatically generated by calculation, the characteristics of the items in the scene, generated during the simulation of the scene, are perfectly known and the annotations, also automatic, are immediately available and necessarily accurate, which gives this process a decisive advantage over conventional processes for producing annotated images.
Un avantage supplémentaire de la méthode décrite dans le présent document est que l’opérateur peut choisir de simuler des scènes attendues, afin d’anticiper une situation éventuellement problématique.An additional advantage of the method described in this paper is that the operator can choose to simulate expected scenes, in order to anticipate a potentially problematic situation.
Un exemple est celui de l’arrivée d’un nouveau type d’emballage des articles à trier, par exemple par l’arrivée d’un nouvel acteur économique produisant des articles à trier présentant un nouveau design, comme un ensemble de motifs particuliers sur l’emballage. Dans ce cas de figure, ce design, connu, peut être intégré à l’avance dans les données d’entraînement afin de préparer le réseau de neurones au tri de ce nouveau type d’emballage.An example is the arrival of a new type of packaging for items to be sorted, for example through the arrival of a new economic actor producing items to be sorted with a new design, such as a set of particular patterns on the packaging. In this case, this known design can be integrated in advance into the training data in order to prepare the neural network for sorting this new type of packaging.
Un autre exemple est celui de l’arrivée massive d’un type d’articles à trier, formant alors des lots homogènes d’articles à trier. Un type d’article peut être défini par une forme (cylindrique, parallélépipédique, hexagonale), une texture (motif qui sera plaqué sur le volume d’un article simulé), un logo, une couleur spécifique etc… ou une combinaison d’un nombre quelconque de ces caractéristiques. Un type d’article peut comprendre des sous-types : dans le cas d’un type défini par une forme parallélépipédique, des rapports spécifiques entre une longueur, une largeur et une profondeur peuvent former un sous-type. Des articles d’un même type peuvent par exemple provenir d’un même acteur économique et présenter une même identité visuelle, caractérisée par le type auquel appartiennent les articles, comme une texture des emballages utilisés par cette entité économique.Another example is the massive arrival of a type of items to be sorted, thus forming homogeneous batches of items to be sorted. An item type can be defined by a shape (cylindrical, parallelepiped, hexagonal), a texture (pattern that will be applied to the volume of a simulated item), a logo, a specific color, etc., or a combination of any number of these characteristics. An item type can include subtypes: in the case of a type defined by a parallelepiped shape, specific ratios between a length, a width, and a depth can form a subtype. Items of the same type can, for example, come from the same economic actor and have the same visual identity, characterized by the type to which the items belong, such as a texture of the packaging used by this economic entity.
Hors de ce contexte de l’arrivée massive d’articles d’un même type, une situation habituelle pourrait être celle de lots hétérogènes d’articles à trier, c’est-à-dire de lots constitués d’articles de différents types. Dans cette situation habituelle, les articles peuvent alors être distingués relativement aisément les uns des autres. En revanche, Dans le cas de l’arrivée d’un lot homogène d’articles, c’est-à-dire d’un lot d’articles se ressemblant, en particulier parce qu’ils appartiennent à un même type d’article, ces articles peuvent être difficile à distinguer les uns des autres dans les images employées pour le tri. Une telle situation peut être anticipée en générant des images d’entraînement comprenant des lots homogènes d’articles afin d’entraîner le réseau de neurones à gérer cette situation spécifique. On entend par « images comprenant des lots homogènes d’articles » des images générées par le jumeau numérique configuré pour générer des images avec des articles d’un même type. L’opérateur peut ainsi choisir de générer des images numériques d’entraînement de lots homogènes d’articles comprenant plus de 40%, plus de 50%, plus de 80%, plus de 90% ou 100% d’articles appartenant à un même type, selon des méthodes conventionnelles d’ajustement des paramètres de simulation. Entraîné sur la base de ces images, le réseau de neurones sera mieux préparé à traiter des images réelles Outside of this context of the massive arrival of articles of the same type, a usual situation could be that of heterogeneous batches of articles to be sorted, that is to say batches made up of articles of different types. In this usual situation, the articles can then be distinguished relatively easily from each other. On the other hand, in the case of the arrival of a homogeneous batch of articles, that is to say a batch of articles resembling each other, in particular because they belong to the same type of article, these articles can be difficult to distinguish from each other in the images used for sorting. Such a situation can be anticipated by generating training images comprising homogeneous batches of articles in order to train the neural network to manage this specific situation. By "images comprising homogeneous batches of articles" we mean images generated by the digital twin configured to generate images with articles of the same type. The operator can thus choose to generate digital training images of homogeneous batches of articles comprising more than 40%, more than 50%, more than 80%, more than 90% or 100% of articles belonging to the same type, according to conventional methods of adjusting the simulation parameters. Trained on the basis of these images, the neural network will be better prepared to process real images.
Les étapes 130 à 150 sont répétées de manière à obtenir un nombre d’images considéré comme suffisant par l’opérateur du système pour l’entraînement du réseau de neurones.Steps 130 to 150 are repeated so as to obtain a number of images considered sufficient by the system operator for training the neural network.
A une étape 160 d’entraînement du réseau de neurones, les données d’entraînement annotées sont fournies par le calculateur CALC en entrée du réseau de neurones NN au cours de sa phase d’entraînement. Durant cette phase d’entraînement les paramètres internes Pi du réseau, qui caractérisent ses poids synaptiques et donc sa réponse à des données fournies en entrée, convergent vers des valeurs permettant une fiabilité jugée suffisante du traitement de ces données, fiabilité estimée par exemple par un taux de réussite du réseau dans la traitement des données et devant dépasser un seuil donné pour être considérée comme suffisante. Ce taux traduit le niveau d’adéquation des réponses du réseau aux données fournies par rapport aux réponses attendues, correspondant aux annotations.At a step 160 of training the neural network, the annotated training data are provided by the CALC calculator as input to the neural network NN during its training phase. During this training phase, the internal parameters P i of the network, which characterize its synaptic weights and therefore its response to data provided as input, converge towards values allowing a reliability deemed sufficient for the processing of these data, reliability estimated for example by a success rate of the network in processing the data and which must exceed a given threshold to be considered sufficient. This rate reflects the level of adequacy of the network's responses to the data provided compared to the expected responses, corresponding to the annotations.
Au cours de la phase d’entraînement achevée, les paramètres internes du réseau de neurones ont été ajustés de manière à fournir des réponse appropriées aux données fournies en entrée du réseau, et celui-ci peut être employé au cours du procédé de tri d’articles réels.During the completed training phase, the internal parameters of the neural network were adjusted to provide appropriate responses to the data provided as input to the network, and it can be used during the real item sorting process.
A une étape 170, l’appareil de prise de vue numérique CAM acquiert des images numériques d’une scène réelle englobant la zone de travail WZ sous la forme d’une image numériques en couleur et deux images destinées à former une carte de profondeur de la scène. Le calculateur CALC génère la carte de profondeur.In a step 170, the digital camera CAM acquires digital images of a real scene encompassing the working area WZ in the form of a color digital image and two images intended to form a depth map of the scene. The computer CALC generates the depth map.
A une étape 180, les données résultantes R.DAT (non annotées) de l’étape 170 comprenant l’image en couleurs et la carte de profondeur d’une scène réelle sont fournies au réseau de neurones NN. Le réseau de neurones, entraîné pour cette tâche, identifie alors les positions, géométries et orientations P.G.O des articles de la scène. D’une manière générale, le réseau de neurones pourrait être conçu et entraîné pour identifier toute autre caractéristique de l’article : une adresse de destination ou de provenance ou une identification sous une forme textuelle ou de code numérique tel qu’un code barre ou un QR code, un logo, une catégorie telle qu’une type d’emballage (polybag, carton, enveloppe…). En outre, ce principe peut s’appliquer à toute sorte d’objet tel qu’un article, un colis, une boîte, une lettre, un paquet ou produit naturel ou un produit manufacturé.At a step 180, the resulting data R.DAT (unannotated) from step 170 comprising the color image and the depth map of a real scene are provided to the neural network NN. The neural network, trained for this task, then identifies the positions, geometries and orientations P.G.O of the articles in the scene. Generally speaking, the neural network could be designed and trained to identify any other characteristic of the article: a destination or origin address or an identification in a textual form or a digital code such as a bar code or a QR code, a logo, a category such as a type of packaging (polybag, cardboard, envelope, etc.). Furthermore, this principle can be applied to any kind of object such as an article, a parcel, a box, a letter, a package or natural product or a manufactured product.
A une étape 190, sur la base des positions, géométries et orientations P.G.O des articles identifiées par le réseau de neurones, le calculateur CALC du système SYS de pilotage de la ligne de tri envoie un signal de commande au bras manipulateur MA robotisé de manière à dévraquer les articles en les manipulant individuellement selon au moins l’une de leurs position, géométries et orientations respectives, selon des méthodes conventionnelles.At a step 190, on the basis of the positions, geometries and orientations P.G.O of the articles identified by the neural network, the computer CALC of the system SYS for controlling the sorting line sends a control signal to the robotic manipulator arm MA so as to unpick the articles by handling them individually according to at least one of their respective positions, geometries and orientations, according to conventional methods.
Les étapes 170 à 190 sont répétées de manière à traiter l’ensemble des articles se présentant dans la zone de travail WZ.Steps 170 to 190 are repeated so as to process all the items appearing in the work area WZ.
Dans le mode de mise en œuvre décrit ci-dessus, un calculateur CALC est utilisé pour l’ensemble des phases de génération des données d’entraînement, d’entraînement du réseau de neurones, et au cours du procédé de tri des articles. Il n’est pas nécessaire qu’un même calculateur soit employé pour ces différentes tâches : chacune pourrait être effectuée par un calculateur dédiée, et le réseau de neurones pourrait être transmis de l’un à l’autre de ces calculateurs.In the implementation described above, a CALC calculator is used for all phases of generating training data, training the neural network, and during the item sorting process. It is not necessary for the same calculator to be used for these different tasks: each could be performed by a dedicated calculator, and the neural network could be transmitted from one to the other of these calculators.
Dans ce document, les figures ne sont pas nécessairement à l'échelle. Certaines caractéristiques et certains composants peuvent être représentés exagérés par rapport à d’autres composants ou sous une forme quelque peu schématique, et certains détails d'éléments conventionnels peuvent ne pas être représentés dans l'intérêt de la clarté et de la concision.The figures in this document are not necessarily to scale. Some features and components may be shown exaggerated in relation to other components or in a somewhat schematic form, and some details of conventional items may not be shown in the interest of clarity and conciseness.
Bien entendu l'invention n'est pas limitée au mode de mise en œuvre décrit et on peut y apporter des variantes de réalisation sans sortir du cadre de l'invention tel que défini par les revendications.
Of course, the invention is not limited to the method of implementation described and variant embodiments can be made without departing from the scope of the invention as defined by the claims.
Claims (15)
- une étape (150) de génération de données numériques d’entraînement (T.DAT) représentatives d’objets à traiter simulés (S.IT) au sein de l’installation (FAC) de traitement d’objets, ces données étant destinées à un entraînement du réseau de neurones, générées au moyen d’un jumeau numérique (NUM.TWIN) de l’installation de traitement d’objets, et associées à des annotations (ANN) indiquant au moins une caractéristique des objets à traiter simulés (S.IT), le jumeau numérique intégrant un moteur dynamique de simulation d’interactions physiques entre au moins un objet (IT) à traiter et au moins un élément (C1, C2, C3, M1, M2, M3, DZ, MZ) de l’installation (FAC) de traitement, de manière à simuler des déplacements d’objets à traiter et des interactions de ces objets à traiter avec l’au moins un élément simulé de l’installation de traitement ;
- une étape (160) d’entraînement du réseau de neurones comprenant la fourniture des données numériques d’entraînement (T.DAT) en entrée du réseau de neurones (NN) et au cours de laquelle les paramètres du réseau de neurones sont ajustés sur la base des données numériques d’entraînement ;
- une étape (170) d’acquisition d’images numériques d’une scène réelle de l’installation (FAC) de traitement d’objets comprenant au moins un objet (IT) réel à traiter ;
- une étape (180) comprenant la fourniture de données (R.DAT) générées à partir des images numériques de la scène réelle en entrée du réseau de neurones (NN), le réseau de neurones fournissant en retour une donnée représentative d’une caractéristique (P.G.O) de l’objet (IT) réel à traiter ; et
- une étape (190) comprenant l’envoi d’un signal de commande à un dispositif (MA) de traitement d’objet sur la base de la donnée représentative de la caractéristique de l’au moins un objet (IT) réel à traiter. Method (100) for processing objects in an object processing installation (FAC) comprising a computer configured to characterize, by means of a neural network (NN), objects to be processed visible in digital images of objects to be processed located in the object processing installation (FAC), the method comprising:
- a step (150) of generating digital training data (T.DAT) representative of simulated objects to be processed (S.IT) within the object processing installation (FAC), these data being intended for training the neural network, generated by means of a digital twin (NUM.TWIN) of the object processing installation, and associated with annotations (ANN) indicating at least one characteristic of the simulated objects to be processed (S.IT), the digital twin integrating a dynamic engine for simulating physical interactions between at least one object (IT) to be processed and at least one element (C1, C2, C3, M1, M2, M3, DZ, MZ) of the processing installation (FAC), so as to simulate movements of objects to be processed and interactions of these objects to be processed with the at least one simulated element of the processing installation;
- a step (160) of training the neural network comprising the provision of digital training data (T.DAT) as input to the neural network (NN) and during which the parameters of the neural network are adjusted on the basis of the digital training data;
- a step (170) of acquiring digital images of a real scene of the object processing installation (FAC) comprising at least one real object (IT) to be processed;
- a step (180) comprising the provision of data (R.DAT) generated from the digital images of the real scene as input to the neural network (NN), the neural network providing in return data representative of a characteristic (PGO) of the real object (IT) to be processed; and
- a step (190) comprising sending a control signal to an object processing device (MA) on the basis of the data representative of the characteristic of the at least one real object (IT) to be processed.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR2310269A FR3153444A1 (en) | 2023-09-27 | 2023-09-27 | TRAINING METHOD FOR A NEURAL NETWORK FOR CONTROLLING AN OBJECT SORTING SYSTEM |
| FRFR2310269 | 2023-09-27 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025068377A1 true WO2025068377A1 (en) | 2025-04-03 |
Family
ID=89474513
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/EP2024/077076 Pending WO2025068377A1 (en) | 2023-09-27 | 2024-09-26 | Method for training a neural network intended for controlling a system for sorting objects |
Country Status (2)
| Country | Link |
|---|---|
| FR (1) | FR3153444A1 (en) |
| WO (1) | WO2025068377A1 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018170512A1 (en) | 2017-03-17 | 2018-09-20 | Neurala, Inc. | Online, incremental real-time learning for tagging and labeling data streams for deep neural networks and neural network applications |
| EP3885998A1 (en) | 2020-03-26 | 2021-09-29 | Stradvision, Inc. | Method for training deep learning network based on artificial intelligence and learning device using the same |
| US20210354926A1 (en) * | 2020-05-14 | 2021-11-18 | Intelligrated Headquarters, Llc | Reinforcement learning based conveyoring control |
-
2023
- 2023-09-27 FR FR2310269A patent/FR3153444A1/en active Pending
-
2024
- 2024-09-26 WO PCT/EP2024/077076 patent/WO2025068377A1/en active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018170512A1 (en) | 2017-03-17 | 2018-09-20 | Neurala, Inc. | Online, incremental real-time learning for tagging and labeling data streams for deep neural networks and neural network applications |
| EP3885998A1 (en) | 2020-03-26 | 2021-09-29 | Stradvision, Inc. | Method for training deep learning network based on artificial intelligence and learning device using the same |
| US20210354926A1 (en) * | 2020-05-14 | 2021-11-18 | Intelligrated Headquarters, Llc | Reinforcement learning based conveyoring control |
Non-Patent Citations (3)
| Title |
|---|
| LI XIANZHI ET AL: "A Sim-to-Real Object Recognition and Localization Framework for Industrial Robotic Bin Picking", vol. 7, no. 2, 1 April 2022 (2022-04-01), pages 3961 - 3968, XP093049564, Retrieved from the Internet <URL:https://ieeexplore.ieee.org/stampPDF/getPDF.jsp?tp=&arnumber=9706346&ref=aHR0cHM6Ly9pZWVleHBsb3JlLmllZWUub3JnL2Fic3RyYWN0L2RvY3VtZW50Lzk3MDYzNDY=> DOI: 10.1109/LRA.2022.3149026 * |
| SONG HAN ET AL.: "Visual Sorting of Express Parcels Based on Multi-Task Deep Learning", SENSORS, vol. 20, 2020, pages 6785 |
| TSAI CHENG-HAN ET AL: "RoboTwin Metaverse Platform for Robotic Random Bin Picking", APPLIED SCIENCES, vol. 13, no. 15, 29 July 2023 (2023-07-29), pages 8779, XP093130489, ISSN: 2076-3417, DOI: 10.3390/app13158779 * |
Also Published As
| Publication number | Publication date |
|---|---|
| FR3153444A1 (en) | 2025-03-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP3256267B1 (en) | Device for separating and individualising postal objects with laser-based vision system | |
| EP3256268B1 (en) | Postal sorting machine having a feeding entry with a robotic arm and an inclined flat conveyor | |
| EP2835784B1 (en) | Conveyor system comprising image and virtual sensor based conveyed object tracking | |
| WO2016102821A1 (en) | Postal sorting machine with a feed inlet comprising a robotic arm and a vertically mobile magazine | |
| EP3448589B1 (en) | Method and apparatus for orienting a fruit with an umbilicus in particular for the packaging thereof | |
| EP2387533A2 (en) | Method and equipment for dispensing products for packaging same | |
| EP3519306A1 (en) | Method for the automated filling of a crate with objects by means of a robot hand | |
| WO2025068377A1 (en) | Method for training a neural network intended for controlling a system for sorting objects | |
| Pasanisi et al. | On domain randomization for object detection in real industrial scenarios using synthetic images | |
| EP2791866B1 (en) | Method of processing postal items with generation of numerical models of mailshots on an interactive station | |
| CN108230391A (en) | Intelligent identification method | |
| WO2025131368A1 (en) | Reinforced learning method for a system for individually handling items | |
| EP2450834A1 (en) | Method and machine for processing moving mail with matrix accumulators | |
| EP1775241A1 (en) | Method and device for the automatic palletizing of parcels, in particular for commissioning | |
| EP1736250B1 (en) | Process of merging letters and large or non-machine-treatable postal items into a single postman's walk | |
| FR2868971A1 (en) | Object or product identifying and sorting out method for supermarket, involves comparing individual identification code with objects individual identification code, and controlling guiding unit based on comparison result | |
| WO2025119525A1 (en) | System for individually handling articles that is capable of dealing with instances of multiple articles being picked up at once, and associated method | |
| EP4673921A1 (en) | Method for discriminating between containers in a sorting line, and associated installation | |
| EP1778415B1 (en) | Device for sorting and grouping objects, containers and the similar | |
| Mainali | Design of an Automatic Fish Processing Line Using Machine Learning | |
| WO2024246318A1 (en) | Method for picking on a sorting line and associated facility | |
| EP4678543A2 (en) | Apparatus and method for detecting flaws in chocolate packaging | |
| FR2883494A1 (en) | METHOD FOR PROCESSING POSTAL SHIPMENTS INCLUDING TANK CONTROL | |
| WO2024161094A1 (en) | Methods and devices for grouping and tracing objects | |
| WO2025056208A1 (en) | System for individually handling articles that is capable of dealing with instances of multiple articles being picked up at once, and associated method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 24782266 Country of ref document: EP Kind code of ref document: A1 |