FR2860618A1 - Digital information unit e.g. electronic mail, processing method for enterprise, involves numbering data blocks in ascending order, allocating XML markup to each block, and obtaining processed information unit in XML format - Google Patents
Digital information unit e.g. electronic mail, processing method for enterprise, involves numbering data blocks in ascending order, allocating XML markup to each block, and obtaining processed information unit in XML format Download PDFInfo
- Publication number
- FR2860618A1 FR2860618A1 FR0311563A FR0311563A FR2860618A1 FR 2860618 A1 FR2860618 A1 FR 2860618A1 FR 0311563 A FR0311563 A FR 0311563A FR 0311563 A FR0311563 A FR 0311563A FR 2860618 A1 FR2860618 A1 FR 2860618A1
- Authority
- FR
- France
- Prior art keywords
- data
- block
- information
- xml
- broadcast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
PROCEDE DE TRAITEMENT D'ELEMENTS D'INFORMATIONMETHOD FOR PROCESSING INFORMATION ELEMENTS
NUMERIQUES COLLECTES, SYSTEME ET PROGRAMME POUR LA MISE DIGITAL COLLECTIONS, SYSTEM AND PROGRAM FOR IMPLEMENTATION
EN OEUVRE DU PROCEDEIN THE PROCESS
La présente invention concerne le domaine du traitement d'éléments d'information numériques collectés, pour effectuer ensuite la diffusion de données déterminées à partir de ces éléments d'information. The present invention relates to the field of the processing of digital information elements collected, to then perform the dissemination of data determined from these information elements.
Une préoccupation majeure de nombreuses entreprises est de pouvoir utiliser de façon efficace et automatisée les informations dont elles disposent. Ces informations sont généralement disponibles sous des formes hétérogènes. En effet, ces informations peuvent faire partie de bases de données, ou encore être disponibles sur un site Web, ou sur des réseaux Intranet ou Extranet. Elles peuvent également figurer dans des documents sous des formats variés, tels des messages électroniques (email, SMS), des documents PDF, Word, Quark, etc. La diffusion de ces informations nécessite généralement au préalable un traitement de ces divers éléments. Le traitement peut comprendre des opérations relatives à une extraction de contenus, à une homogénéisation de la présentation des différents contenus indépendamment de leur provenance et enfin à la détermination du contenu de données d'information à envoyer. Ces données sont ensuite diffusées, en fonction de règles de diffusion définies, à des personnes désignées, qui en assureront l'exploitation. Ces personnes peuvent être par exemple des employés de l'entreprise d'où émane l'information, ou encore des abonnés d'un service basé sur des informations fournies par cette entreprise. A major concern of many companies is to be able to efficiently and automatically use the information they have. This information is generally available in heterogeneous forms. Indeed, this information can be part of databases, or be available on a website, or on Intranet or Extranet. They can also be included in documents in various formats, such as electronic messages (email, SMS), PDF documents, Word, Quark, etc. The dissemination of this information generally requires prior treatment of these various elements. The processing may include operations relating to a content extraction, a homogenization of the presentation of the different contents regardless of their source and finally to the determination of the content of information data to be sent. These data are then disseminated, according to defined dissemination rules, to designated persons, who will operate them. These people may be for example employees of the company from which the information emanates, or subscribers of a service based on information provided by this company.
II existe des solutions permettant le traitement automatisé d'éléments d'information de nature et d'origine diverses collectés depuis les différentes sources possibles. There are solutions allowing the automated processing of information elements of various nature and origin collected from the different possible sources.
Certaines de ces solutions, quand elles reçoivent un nouvel élément d'information numérique, en déterminent le format, puis les transforment en un élément d'information associé dans un format rationalisé. Elles élaborent ensuite le contenu d'une ou plusieurs données d'information, lesquelles sont délivrées à un ou plusieurs destinataires dans des conditions de fréquence, de format, de fourniture déterminées. Some of these solutions, when they receive a new piece of digital information, determine its format and then transform it into an associated piece of information in a streamlined format. They then elaborate the content of one or more information data, which are delivered to one or more recipients under specified frequency, format, and delivery conditions.
Le format rationalisé peut être par exemple de type XML ("Extensible Markup Language"). The streamlined format may for example be of the Extensible Markup Language (XML) type.
Selon ces solutions, lorsqu'un document est reçu, le type de document (par exemple, Quark marque de la société Quark, Inc.) est reconnu parmi une liste de types prédéfinie (par exemple, Quark, PDF et Word marque de la société Microsoft Corporation). Puis pour chaque partie d'information du document associée à un jeu de balises propre au type du document et définissant la mise en forme de cette partie, on effectue une transformation en XML. Cette transformation XML est réalisée en affectant à la partie d'information considérée un jeu de balises XML définissant une mise en forme correspondante de la partie d'information. Le jeu de balises XML est déterminé à l'aide d'une table de correspondance de style prédéfinie, fournissant pour chaque balise du type du document reçu, dans le cas présent pour chaque balise de Quark, une balise XML correspondante. According to these solutions, when a document is received, the type of document (for example, Quark trademark of Quark, Inc.) is recognized from a predefined list of types (eg, Quark, PDF, and Word branded company). Microsoft Corporation). Then for each piece of information in the document associated with a set of tags specific to the type of the document and defining the formatting of this part, a transformation into XML is performed. This XML transformation is performed by assigning to the part of information considered a set of XML tags defining a corresponding formatting of the information part. The set of XML tags is determined using a predefined style map table, providing for each tag of the type of the document received, in this case for each tag of Quark, a corresponding XML tag.
A titre d'exemple, on considère un document comprenant un paragraphe de la forme: <Q-TITRE><Times Romain Italic><Times Romain Bold> "XXXXXXX" <Q/TITRE></Times Romain Italic></Times Romain Bold>, avec la présence du jeu de balises <Q-TITRE> autour de la partie d'information comprenant le texte " XXXXXXX" et les deux feuilles de style "italiques" et "bold" associées, signifiant que le texte est en italiques et gras. Ce jeu de balises signifie que la partie d'information telle qu'elle apparaît dans le document de type Q présente les caractéristiques d'un titre tel que défini pour un document de type Q, Q faisant partie de la liste de type prédéfinie (par exemple, ces caractéristiques sont: écriture en majuscules, encadré, centré sur la feuille). For example, consider a document with a paragraph of the form: <Q-TITLE> <Times Roman Italic> <Times Roman Bold> "XXXXXXX" <Q / TITLE> </ Times Roman Italic> </ Times Roman Bold>, with the presence of the <Q-TITRE> tag set around the information part including the text "XXXXXXX" and the two associated "italic" and "bold" style sheets, meaning that the text is italicized and fat. This set of tags means that the information part as it appears in the Q type document has the characteristics of a title as defined for a document of type Q, Q being part of the predefined type list (for example for example, these characteristics are: writing in upper case, boxed, centered on the sheet).
La table de correspondance de style associe par exemple à un jeu de balises <Q-TITRE>, du type Q, un jeu de balises XML <titre>, signifiant que dans le document XML, la partie d'information associée sera un titre, et sera par exemple en gras, majuscule et souligné. The style mapping table for example associates with a set of <Q-TITER> tags, of type Q, a set of <title> XML tags, meaning that in the XML document, the associated information part will be a title, and will for example be bold, capitalized and underlined.
Cette table de correspondance de style prédéfinie peut être fixe, ou au contraire être personnalisée en fonction des choix de l'entité utilisant la solution. This predefined style lookup table can be fixed, or conversely, be customized based on the choices of the entity using the solution.
2860618 3 Ces solutions requièrent préalablement, pour chaque type d'éléments d'information traité, d'établir une table de correspondance de style. These solutions require beforehand, for each type of piece of information processed, to establish a style mapping table.
D'autre part, pour un type d'éléments d'information donné (ici Quark), la liste doit permettre la correspondance XML pour toutes les balises existantes utilisées dans les documents de type Quark. On the other hand, for a given type of information element (here Quark), the list must allow XML matching for all existing tags used in Quark-type documents.
Ces solutions requièrent donc un travail important de configuration pour la prise en compte de chaque nouveau format. These solutions therefore require a lot of configuration work to take into account each new format.
Les solutions existantes présentent l'inconvénient de ne pouvoir traiter de façon satisfaisante, voire de rejeter, les éléments d'information collectés dont le contenu ne se présente pas sous la forme d'une succession de parties d'information, chacune associée à un jeu de balises propre au type du document et définissant la mise en forme de la partie d'information considérée, avec chaque jeu de balises connu dans la table de correspondance de style associée, ce qui peut se produire dans plusieurs cas de figure. The existing solutions have the disadvantage of not being able to satisfactorily deal with, or even reject, the collected pieces of information whose contents do not appear in the form of a succession of pieces of information, each associated with a game. type-specific tags defining the formatting of the piece of information considered, with each set of tags known in the associated style mapping table, which can occur in several cases.
Un premier cas correspond à la présence d'erreurs, soit dans les jeux de balises figurant dans l'élément d'information que l'on traite, soit dans la table de correspondance de style. A first case corresponds to the presence of errors, either in the set of tags contained in the information element that is being processed, or in the style mapping table.
Un second cas correspond à une non-exhaustivité des tables de correspondance, se traduisant par le fait qu'à une balise d'un élément d'information reçu n'est affectée aucune balise XML. Ce cas peut se produire notamment lors de mises en services de nouvelles versions de types d'éléments d'information. A second case corresponds to a non-exhaustive list of correspondence tables, resulting in the fact that a tag of a received information element is not assigned any XML tag. This case can occur especially when new versions of information element types are put into service.
Un troisième cas correspond à la présence de parties d'information non associées à des balises en définissant la mise en forme. Or ce cas se rencontre de plus en plus fréquemment, les auteurs des éléments d'informations collectés se contentant de fournir des informations sous une forme brute. A third case corresponds to the presence of pieces of information not associated with tags by defining the formatting. However, this case is encountered more and more frequently, the authors of the pieces of information collected being content to provide information in a raw form.
L'invention vise une solution de traitement d'informations qui soit moins affectée que les solutions de l'art antérieur, par les limitations citées ci-dessus. The invention aims at an information processing solution which is less affected than the solutions of the prior art, by the limitations mentioned above.
Ainsi suivant un premier aspect, l'invention propose un procédé de traitement d'éléments d'information numériques collectés, pour la diffusion de données déterminées à partir de ces éléments d'information, comprenant les étapes suivantes: - on extrait successivement d'une représentation binaire d'un élément d'information collecté, des blocs de données, dans leur ordre d'apparition dans ladite représentation binaire; - on numérote ces blocs de façon croissante; - on affecte un balisage XML à chaque bloc, le balisage XML d'au moins un bloc étant déterminé à partir d'une table de correspondance de blocs prédéfinie fournissant un balisage XML en fonction d'au moins le numéro dudit bloc; - on obtient l'élément d'information traité sous format XML. Thus according to a first aspect, the invention proposes a method of processing digital information elements collected, for the dissemination of data determined from these information elements, comprising the following steps: - successively extracting a binary representation of a collected piece of information, blocks of data, in their order of appearance in said binary representation; these numbers are increasingly numbered; assigning XML markup to each block, the XML markup of at least one block being determined from a predefined block mapping table providing XML markup according to at least the number of said block; - the piece of information processed in XML format is obtained.
î 0 Le procédé selon l'invention permet ainsi la transforn?àtion en XML d'un élément d'information reçu dont le contenu ne se présente pas nécessairement sous une forme délimitée par des balises propres au type du document pour définir la mise en forme de parties du document, chaque jeu de balises étant répertorié dans une table de correspondance de style associée. The method according to the invention thus makes it possible to transform into XML a received information element whose content does not necessarily appear in a form delimited by tags specific to the type of document in order to define the formatting. parts of the document, each set of tags being listed in an associated style mapping table.
Un tel procédé est beaucoup moins sensible aux problèmes créés, par des balises erronées, absentes ou inconnues dans les solutions de l'art antérieur. Such a method is much less sensitive to the problems created, by erroneous tags, absent or unknown in the solutions of the prior art.
Par ailleurs, les solutions de l'art antérieur réalisent préalablement une étape d'identification du type d'un nouvel élément d'information collecté. Cette identification se base généralement sur l'extension, telle que ".doc" ou ".pdf', associée à l'élément d'information collecté. La correspondance entre balises du type de l'élément collecté et balises XML ne peut avoir lieu qu'une fois le type identifié. Or lorsque cette extension manque ou est erronée, le type ne peut être déterminé et l'élément d'information ne peut être traité. Moreover, the solutions of the prior art previously perform a step of identifying the type of a new piece of information collected. This identification is usually based on the extension, such as ".doc" or ".pdf", associated with the piece of information collected, and it is not possible to match tags of the type of the item being collected with XML tags. Once the type has been identified, when the extension is missing or erroneous, the type can not be determined and the information element can not be processed.
Avantageusement le procédé selon l'invention comporte une étape d'identification. Cette étape d'identification comprend la recherche, dans la représentation binaire de l'élément d'information, d'une séquence binaire parmi un ensemble de séquences binaires préétablies associées respectivement aux types figurant dans une liste de types pré-établie, qui sont les types d'éléments d'information traités selon le procédé de l'invention. Advantageously, the method according to the invention comprises an identification step. This identification step comprises searching, in the binary representation of the information element, for a binary sequence among a set of pre-established binary sequences respectively associated with the types appearing in a list of pre-established types, which are the types of information elements processed according to the method of the invention.
Une telle identification permet de reconnaître le type d'un élément d'information, même avec une extension manquante ou erronée. Such identification makes it possible to recognize the type of an information element, even with a missing or erroneous extension.
Suivant un second aspect, l'invention propose un procédé pour fournir des données d'information à une pluralité de destinataires, à partir d'éléments d'information numériques collectés, et selon lequel: - on transforme un élément d'information traité sous format XML en au moins une donnée à diffuser en fonction de règles de diffusion définissant au moins un format de sortie, un support de diffusion, un contenu de diffusion extrait de l'élément d'information traité sous format XML et au moins un destinataire associés; - et on diffuse la donnée à diffuser en fonction desdites règles de diffusion. According to a second aspect, the invention proposes a method for providing information data to a plurality of recipients, based on digital information elements collected, and according to which: a processed information element is transformed into a format XML in at least one piece of data to be broadcast according to broadcast rules defining at least one output format, a broadcast medium, broadcast content extracted from the piece of information processed in XML format and at least one associated recipient; and broadcasting the data to be broadcast according to said broadcasting rules.
Suivant un troisième aspect, l'invention propose un système de traitement d'éléments d'information numériques collectés pour la diffusion de données déterminées à partir de ces éléments d'information, comprenant des moyens pour mettre en oeuvre un procédé suivant le premier aspect de l'invention. According to a third aspect, the invention proposes a system for processing digital information elements collected for the dissemination of data determined from these information elements, comprising means for implementing a method according to the first aspect of FIG. the invention.
Suivant un quatrième aspect, l'invention propose un système pour fournir des données d'information à une pluralité de destinataires, à partir d'éléments d'information numériques collectés, comportant des moyens pour mettre en oeuvre un procédé suivant le deuxième aspect de l'invention. According to a fourth aspect, the invention proposes a system for providing information data to a plurality of recipients, based on collected digital information elements, comprising means for implementing a method according to the second aspect of the invention. 'invention.
Suivant un cinquième aspect, l'invention propose un programme d'ordinateur à installer dans un dispositif informatique pour le traitement d'éléments d'information numériques collectés pour la diffusion de données déterminées à partir de ces éléments d'information, comprenant des instructions pour mettre en oeuvre un procédé suivant le premier aspect de l'invention. According to a fifth aspect, the invention proposes a computer program to be installed in a computing device for the processing of digital information elements collected for the dissemination of data determined from these information elements, comprising instructions for implement a method according to the first aspect of the invention.
Suivant un sixième aspect, l'invention propose un programme d'ordinateur à installer dans un dispositif informatique pour la fourniture de données d'information à une pluralité de destinataires, à partir d'éléments d'information numériques collectés, comportant des instructions pour mettre en oeuvre un procédé selon le deuxième aspect de l'invention. According to a sixth aspect, the invention provides a computer program to be installed in a computing device for providing information data to a plurality of recipients, from collected digital information elements, including instructions for setting a method according to the second aspect of the invention.
D'autres particularités et avantages de la présente invention apparaîtront dans la description ci-après d'exemples de réalisation non limitatifs en référence à la figure unique représentant une plateforme de fourniture d'éléments d'information mettant en oeuvre un procédé selon l'invention. Other features and advantages of the present invention will become apparent in the following description of nonlimiting exemplary embodiments with reference to the single figure representing a platform for providing information elements implementing a method according to the invention. .
La figure unique représente une plateforme 1 de fourniture d'éléments d'information à des destinataires respectifs désignés. The single figure represents a platform 1 for providing information items to respective designated recipients.
Sur la plateforme 1 sont collectés des éléments d'information numériques El provenant de plusieurs sources SI, S2, ..., SN. Des éléments El peuvent avoir été mis à disposition, par les sources respectives, de la plate-forme 1, qui dispose alors de moyens pour les récupérer. D'autres éléments El peuvent également être envoyés à la plate-forme 1 par ces sources. On the platform 1 are collected digital information elements El from several sources SI, S2, ..., SN. Elements El may have been made available by the respective sources of the platform 1, which then has means to recover them. Other elements El can also be sent to the platform 1 by these sources.
Ces sources sont associées à des clients utilisateurs de la plateforme 1. Par exemple, certaines des sources peuvent être des entreprises, d'autres peuvent être des départements distincts d'une même entreprise utilisatrice de la plateforme 1. These sources are associated with platform 1 user clients. For example, some of the sources may be companies, others may be separate departments of the same company using the platform 1.
Ainsi, par exemple une des entités utilisatrices du service de fourniture d'éléments d'information rendu par la plateforme 1 est une entreprise E. A cette entreprise E, les sources SI, S2 et S3, qui sont des départements respectifs de l'entreprise E sont associées, dans le cas représenté sur la figure unique. Thus, for example, one of the user entities of the information element supply service rendered by the platform 1 is an enterprise E. At this enterprise E, the sources S1, S2 and S3, which are respective departments of the enterprise E are associated, in the case shown in the single figure.
Les éléments d'information collectés El et pouvant être traités par la plate-forme 1 peuvent être de types variés. Il peut s'agir de messages électroniques de formats divers, par exemple email ou SMS ("Short Message Service") de fichiers Word, Excel (marque de la société Microsoft Corporation), Quark ou autres, d'extraits de bases de données etc. Suivant les configurations de plate-forme, la provenance des éléments d'information peut être retrouvée à partir de l'élément d'information luimême, ce qui permet de réaliser un traitement différencié des éléments E1, ou ne peut pas être retrouvée. Dans ce dernier cas, le traitement des éléments El sera indépendant de sa provenance. The information elements collected E1 that can be processed by the platform 1 can be of various types. These may be electronic messages of various formats, for example email or SMS ("Short Message Service") of Word files, Excel (trademark of Microsoft Corporation), Quark or others, extracts from databases etc. . Depending on the platform configurations, the source of the information elements can be found from the information element itself, which makes it possible to perform a differentiated treatment of the elements E1, or can not be found. In the latter case, the treatment of elements El will be independent of its source.
L'ensemble des types Ti d'information gérés par la plateforme 1 est identifié par une liste de types préétablis Li. A chaque type Ti de la liste LI, est associée une séquence binaire unique identifiant le type. The set of information types Ti managed by the platform 1 is identified by a list of pre-established types Li. Each type Ti of the list LI is associated with a unique binary sequence identifying the type.
La plateforme 1 comprend un module de réception 3 qui collecte les éléments d'information El destinés à la plateforme 1, et leur associe respectivement leur représentation binaire. The platform 1 comprises a reception module 3 which collects the information elements El intended for the platform 1, and associates them respectively their binary representation.
Un module d'identification 4 recherche dans la représentation binaire d'un nouvel élément d'information collecté El, la présence ou non, d'une des séquences binaires associées aux types Ti figurant dans la liste Li. An identification module 4 searches in the binary representation of a new piece of information collected El, the presence or not, of one of the binary sequences associated with types Ti in the list Li.
Au cas où aucune de ces séquences n'est détectée, le nouvel élément El est identifié comme ne correspondant pas à un type de la liste LI et n'est pas traité ou est traité comme un élément d'information constitué uniquement de blocs de nature de texte ou d'image, comme décrit ci- dessous. In the case where none of these sequences is detected, the new element El is identified as not corresponding to a type of the list LI and is not treated or is treated as an element of information consisting only of blocks of nature text or image, as described below.
Si une séquence est détectée, le type du nouvel élément E; est le type Tk associé à cette séquence binaire détectée. If a sequence is detected, the type of the new element E; is the Tk type associated with this detected binary sequence.
Une fois le type d'élément identifié, un module de transformation 5 extrait de la représentation binaire de l'élément d'information El, différents blocs de données de fond, dans leur ordre d'apparition. Once the element type has been identified, a transformation module 5 extracts from the binary representation of the information element El, different blocks of background data, in their order of appearance.
Les blocs de données de fond sont extraits de l'élément d'information, et la nature de chaque bloc est définie par exemple, de la façon suivante: un ensemble de données binaires successives encadrées par un jeu de balises de style définissant la mise en forme de l'ensemble de données binaires, et tel que le jeu de balises figure dans une table de correspondance de style LS, qui pour le type Ti de l'élément d'information considéré, fournit la correspondance entre les balises standard de Ti et les balises XML, est un bloc, dit balisé; - un ensemble de données binaires successives correspondant à des données alphanumériques est un bloc, dit de texte (la correspondance est établie, à partir d'un dictionnaire des données alphanumériques comportant la conversion en représentation binaire de ces données) ; - un ensemble de données binaires successives correspondant à des données non alphanumériques est un bloc, dit d'image. The blocks of background data are extracted from the information element, and the nature of each block is defined for example, as follows: a set of successive binary data framed by a set of style tags defining the implementation form of the binary data set, and such that the set of tags is in an LS style lookup table, which for the type Ti of the information element under consideration provides the correspondence between the standard tags of Ti and XML tags, is a block, so-called tagged; a set of successive binary data corresponding to alphanumeric data is a block, called a text block (the correspondence is established, from a dictionary of alphanumeric data including the conversion into a binary representation of these data); a set of successive binary data corresponding to non-alphanumeric data is a block, referred to as an image block.
Puis le module de transformation 5 numérote de façon croissante en partant de 1, chaque bloc, pris dans l'ordre d'apparition des blocs dans l'élément d'information. Then the transformation module 5 numbers increasing from 1, each block, taken in the order of appearance of the blocks in the information element.
La plate-forme 1 dispose en outre d'une table de correspondance de blocs Lb, qui définit une balise XML en fonction d'un numéro de bloc. Cette balise XML représente un élément de la DTD ("Document Type Description") standard, et affecte ainsi au bloc une position dans la structure hiérarchique XML de document retenue. The platform 1 also has a block mapping table Lb, which defines an XML tag according to a block number. This XML tag represents an element of the standard Document Type Description (DTD), and thus assigns the block a position in the XML document structure of the selected document.
Dans un mode de réalisation, cette table de correspondance de blocs Lb peut fournir une balise XML en fonction du numéro de blocs et d'autres paramètres tels que la nature du bloc (texte, image), la nature du bloc précédent etc. La table de correspondance de blocs Lb peut être unique, ou au contraire varier en fonction des choix des entreprises utilisatrices de la plateforme 1. Dans ce dernier cas, il peut y avoir autant de tables que de choix différents et la table de correspondance retenue pour un élément d'information El sera déterminée en fonction de la source de cet élément d'information, ou du groupe dont fait partie cette source (dans le cas d'une entreprise avec plusieurs sources). In one embodiment, this block correspondence table Lb can provide an XML tag according to the block number and other parameters such as the nature of the block (text, image), the nature of the previous block, and so on. The block correspondence table Lb can be unique, or on the contrary vary according to the choices of the companies using the platform 1. In the latter case, there can be as many tables as there are different choices and the correspondence table selected for an information element El will be determined according to the source of this information element, or the group to which this source belongs (in the case of an enterprise with several sources).
Le module de transformation 5 affecte un jeu de balises XML à chaque bloc de données de fond extrait. Ce balisage XML est effectué à partir de la table de correspondance de style Ls pour un bloc balisé, à partir de la table de correspondance de blocs Lb pour un bloc de nature texte ou image. The transformation module 5 assigns one set of XML tags to each extracted background data block. This XML markup is performed from the Ls style correspondence table for a tagged block, from the block correspondence table Lb for a block of text or image nature.
Le document XML E2 ainsi obtenu est ensuite enregistré dans une base 6 d'enregistrement des messages normalisés. The XML document E2 thus obtained is then recorded in a base 6 for recording the standardized messages.
Par ailleurs, lorsqu'un nouveau type d'éléments d'information Ti+1 est ajouté à la liste LI, une phase d'apprentissage est réalisée sur une pluralité d'éléments d'information de ce nouveau type, afin de déterminer la séquence binaire de taille minimum figurant dans tous ces éléments d'information. Cette séquence est ensuite comparée à celles figurant déjà dans la liste Li. Si elle n'est semblable à aucune de celles-ci, la séquence nouvellement déterminée est la séquence associée au type Tj+1 dans la liste LI et permet ainsi son identification. Moreover, when a new type of information elements Ti + 1 is added to the list LI, a learning phase is performed on a plurality of information elements of this new type, in order to determine the sequence binary minimum size contained in all these pieces of information. This sequence is then compared with those already in the list Li. If it is not similar to any of these, the newly determined sequence is the sequence associated with the type Tj + 1 in the LI list and thus allows its identification.
Sinon, le processus de détermination d'une séquence minimum et unique est renouvelé pour le nouveau Ti+1, et pour le type associé à la séquence semblable dans la liste Li. Otherwise, the process of determining a minimum and unique sequence is repeated for the new Ti + 1, and for the type associated with the similar sequence in the Li list.
Chaque entité utilisatrice de la plateforme 1 a préalablement défini l'utilisation devant être faite des informations contenues dans les documents XML la concernant. Les règles d'utilisation associées sont stockées dans une base d'abonnement 8 de la plateforme 1. Each user entity of the platform 1 has previously defined the use to be made of the information contained in the XML documents concerning it. The associated usage rules are stored in a subscription base 8 of the platform 1.
Ces règles définissent en fonction de la source, ou du groupe de sources appartenant à une même entreprise, en fonction éventuellement du type de l'élément d'information collecté E1 dont est issu un document XML E2, et en fonction d'autres critères (heure d'arrivée, taille de l'élément d'information collecté, etc.), un contenu d'une donnée à diffuser E3, défini par des balises XML choisies. Le contenu d'une donnée à diffuser E3 sera constitué de certains des blocs associés à ces balises XML choisies du document XML E2. These rules define according to the source, or the group of sources belonging to the same company, possibly according to the type of the collected information element E1 from which an XML document E2 is derived, and according to other criteria ( arrival time, size of the piece of information collected, etc.), content of a data to be broadcast E3, defined by selected XML tags. The content of a data item to be broadcast E3 will consist of some of the blocks associated with these chosen XML tags of the XML document E2.
Les règles d'utilisation définissent également un voire plusieurs formats de diffusion et un voire plusieurs supports de diffusion sur lesquels sera transmise la donnée E3 ainsi définie, ainsi qu'un ou plusieurs destinataires. The usage rules also define one or more broadcast formats and one or more broadcast media on which the data E3 thus defined will be transmitted, as well as one or more recipients.
Un module de constitution des données à diffuser 7 génère ainsi à partir d'un document XML E2 issu d'un élément collecté E1, la ou les données à diffuser E3, avec un contenu et un format respectifs conformes aux règles de diffusion s'appliquant. A module for constituting the data to be broadcast 7 thus generates, from an XML document E2 resulting from a collected element E1, the data or data to be broadcast E3, with a content and a respective format that comply with the broadcasting rules applying. .
Les données à diffuser ainsi constituées E3 sont ensuite transmises par un module d'émission 9 aux destinataires respectifs définis, en appliquant éventuellement des règles de diffusion supplémentaires, par exemple relatives à une heure d'envoi, etc. Ainsi, à titre d'exemple un élément d'information E1 provenant d'un centre de traitement d'incidents d'une entreprise, pourra donner lieu à : - un document XML structuré E2 sous la forme titre/sous-titre/corps de texte stocké dans la base 6; - l'envoi immédiat d'un SMS E31 à une équipe dirigeante de l'entreprise, comportant le titre; - l'envoi d'un e-mail E32 comportant le titre et le sous-titre à un 30 éventail de personnes désignées; - l'envoi au gestionnaire du site d'un document HTML E33 comportant le titre, le sous-titre et le corps de texte, pour mise en place sur Intranet lors d'une prochaine mise à jour. The data to be broadcast thus constituted E3 are then transmitted by a transmission module 9 to the respective recipients defined, possibly applying additional broadcast rules, for example relating to a sending time, etc. Thus, for example, an information element E1 originating from an incident processing center of an enterprise may give rise to: a structured XML document E2 in the form of title / sub-title / body of text stored in the base 6; - the immediate sending of an SMS E31 to a management team of the company, including the title; sending an E32 e-mail containing the title and subtitle to a range of designated persons; - sending to the site manager an E33 HTML document including the title, the subtitle and the body of text, for implementation on the Intranet during a future update.
On notera qu'un même document XML E2 pourra donner lieu en fonction des règles définies par l'entité concernée, à plusieurs types de données à diffuser (E31, ..., E3p), associés à p profils de diffusion définis par des contenus, supports de diffusion et destinataires (et éventuellement autres modalités de diffusion) respectifs. It will be noted that the same XML document E2 may give rise, depending on the rules defined by the entity concerned, to several types of data to be broadcast (E31, ..., E3p), associated with p content-defined distribution profiles. , broadcast media and recipients (and possibly other dissemination methods) respective.
On notera que le module de constitution des données à diffuser 7 peut également constituer des données à diffuser automatiquement à des destinataires suite à la réception d'un élément d'information (mode PUSH), mais peut également envoyer une donnée à diffuser en réponse à une requête (mode PULL) portant sur l'envoi d'une telle donnée. It will be noted that the module for constituting the data to be broadcast 7 may also constitute data to be automatically broadcast to recipients following the reception of an information element (PUSH mode), but may also send data to be broadcast in response to a request (PULL mode) concerning the sending of such data.
Par exemple, un commercial souhaitant connaître la quantité d'un produit en stock par site de stockage en temps réel pourra envoyer le numéro de série du produit par SMS, soit au système d'information de son entreprise, soit à la plateforme 1, suivant la configuration des systèmes respectifs. Ceci suscitera la collecte au niveau de la plateforme 1 d'un élément d'information correspondant El par site (obtenu par requête de la plateforme, ou encore par l'envoi par chaque site selon la configuration retenue). For example, a sales representative wishing to know the quantity of a product in stock per site of storage in real time can send the serial number of the product by SMS, either to the information system of his company, or to platform 1, following the configuration of the respective systems. This will trigger the collection at platform level 1 of a corresponding El information element per site (obtained by request from the platform, or by sending by each site according to the configuration chosen).
Si les règles de diffusion le permettent, le commercial pourra alors recevoir par un ou plusieurs SMS, par exemple, les données demandées. If the distribution rules allow, the commercial will then receive by one or more SMS, for example, the requested data.
Ainsi, une plateforme selon l'invention permet un traitement automatisé fiable des informations en provenance de diverses sources et disponibles sous divers formats, d'une entreprise, en minimisant le risque de non traitement d'éléments d'information collectés en raison de tâches de préconfiguration incomplètes ou du fait de la réception d'éléments d'information sous forme brute, non balisée. Thus, a platform according to the invention allows a reliable automated processing of information from various sources and available in various formats, a company, minimizing the risk of non-processing of information items collected due to tasks of preconfiguration incomplete or due to receipt of raw, untagged information.
Elle permet en outre de prendre aisément en compte de nouveaux types d'éléments d'information collectés, ainsi que de nouvelles règles de diffusion portant sur l'apport d'un nouveau format ou support de diffusion. It also makes it easy to take into account new types of information elements collected, as well as new dissemination rules for providing a new format or medium for dissemination.
Claims (16)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0311563A FR2860618A1 (en) | 2003-10-02 | 2003-10-02 | Digital information unit e.g. electronic mail, processing method for enterprise, involves numbering data blocks in ascending order, allocating XML markup to each block, and obtaining processed information unit in XML format |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0311563A FR2860618A1 (en) | 2003-10-02 | 2003-10-02 | Digital information unit e.g. electronic mail, processing method for enterprise, involves numbering data blocks in ascending order, allocating XML markup to each block, and obtaining processed information unit in XML format |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| FR2860618A1 true FR2860618A1 (en) | 2005-04-08 |
Family
ID=34307367
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FR0311563A Withdrawn FR2860618A1 (en) | 2003-10-02 | 2003-10-02 | Digital information unit e.g. electronic mail, processing method for enterprise, involves numbering data blocks in ascending order, allocating XML markup to each block, and obtaining processed information unit in XML format |
Country Status (1)
| Country | Link |
|---|---|
| FR (1) | FR2860618A1 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000046694A1 (en) * | 1999-02-03 | 2000-08-10 | Quark, Inc. | System and process for creating a structured tag representation of a document |
| EP1280075A2 (en) * | 2001-07-25 | 2003-01-29 | Hewlett-Packard Company | System and method for formatting content to be published |
-
2003
- 2003-10-02 FR FR0311563A patent/FR2860618A1/en not_active Withdrawn
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000046694A1 (en) * | 1999-02-03 | 2000-08-10 | Quark, Inc. | System and process for creating a structured tag representation of a document |
| EP1280075A2 (en) * | 2001-07-25 | 2003-01-29 | Hewlett-Packard Company | System and method for formatting content to be published |
Non-Patent Citations (3)
| Title |
|---|
| FILE FORMAT - WIKIPEDIA, THE FREE ENCYCLOPEDIA, 24 September 2003 (2003-09-24), pages 1 - 2, XP002292452, Retrieved from the Internet <URL:http://en.wikipedia.org/w/wiki.phtml?title=File_format&oldid=1541753> [retrieved on 20040813] * |
| FRAMEMAKER AND XML. WHAT CAN I DO NOW, 2000, pages 1 - 10, XP002292451, Retrieved from the Internet <URL:http://www.groupwellesley.com/talks/FrameUsers2000/FrameMaker+XML.pdf> [retrieved on 20040812] * |
| WHAT IS THIS THING CALLED STRUCTURE, 2001, pages 1 - 4, XP002292450, Retrieved from the Internet <URL:http://12.108.175.91/ebookweb/stories/storyReader$380> [retrieved on 20040813] * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7200556B2 (en) | Methods and apparatus for accessing and processing multimedia messages stored in a unified multimedia mailbox | |
| US10963513B2 (en) | Data system and method | |
| US8423347B2 (en) | Natural language personal information management | |
| US20150032829A1 (en) | Identifying relevant content in email | |
| US7260607B2 (en) | Methods and apparatus for performing media/device sensitive processing of messages stored in unified multimedia and plain text mailboxes | |
| US20150187353A1 (en) | Audio tagging | |
| US8296324B2 (en) | Systems and methods for analyzing, integrating and updating media contact and content data | |
| US20060248039A1 (en) | Sharing of full text index entries across application boundaries | |
| JP2012514938A5 (en) | ||
| US20080301137A1 (en) | Collection bin for data management and transformation | |
| CN106021393B (en) | Mobile equipment-oriented power grid equipment standard information retrieval method and system | |
| US20070136328A1 (en) | System and method for managing files to be attached to and detached from an electronic document | |
| US20130332170A1 (en) | Method and system for processing content | |
| US20060248067A1 (en) | Method and system for providing a shared search index in a peer to peer network | |
| FR2860618A1 (en) | Digital information unit e.g. electronic mail, processing method for enterprise, involves numbering data blocks in ascending order, allocating XML markup to each block, and obtaining processed information unit in XML format | |
| CN113221031B (en) | Method for automatically identifying website catalog page | |
| FR3060798A1 (en) | METHOD FOR EDITING AN ELECTRONIC MESSAGE WITH REMOVAL OF REDUNDANT ELEMENTS | |
| CN114662465A (en) | Document processing method, device, equipment and system | |
| US20200065332A1 (en) | Method and System for Retrieving Data from Different Sources that Relates to a Single Entity | |
| US12493802B2 (en) | System and method for cross-platform personalized information management | |
| US20250284979A1 (en) | System and Method for Cross-Platform Personalized Information Management | |
| CN120561342B (en) | Management method of multi-mode enterprise knowledge base system | |
| WO2007073097A1 (en) | Method and system for sorting/searching file and record media therefor | |
| US11188706B2 (en) | System and method for regionalized resolution of a network path | |
| FR3159454A1 (en) | METHOD FOR AUTOMATICALLY GENERATING A RESPONSE TO A REQUEST CONTAINED IN AN ELECTRONIC MESSAGE |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| ST | Notification of lapse |
Effective date: 20060630 |
|
| RN | Application for restoration | ||
| IC | Decision of the director general to declare irreceivable or to reject an appeal |