WO2018172669A1 - Procédé et dispositif de gestion du stockage de documents numériques - Google Patents
Procédé et dispositif de gestion du stockage de documents numériques Download PDFInfo
- Publication number
- WO2018172669A1 WO2018172669A1 PCT/FR2018/050634 FR2018050634W WO2018172669A1 WO 2018172669 A1 WO2018172669 A1 WO 2018172669A1 FR 2018050634 W FR2018050634 W FR 2018050634W WO 2018172669 A1 WO2018172669 A1 WO 2018172669A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- storage
- digital document
- type
- digital
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Definitions
- the invention relates to the field of digital document storage and more particularly the management of a distributed storage of fragments of a digital document.
- a digital document is usually stored as one or more files stored in one place, such as a hard disk, a database, a memory of a server of a communication network, etc. ..
- digital document here means any type of document capable of being stored on a computer memory, such as an email (also called “e-mail” in English), an office application document (for example type Microsoft Office ⁇ Word, Excel, Powerpoint, etc.), a multimedia document (for example image file, videos, etc.).
- email also called "e-mail” in English
- office application document for example type Microsoft Office ⁇ Word, Excel, Powerpoint, etc.
- multimedia document for example image file, videos, etc.
- an email includes:
- a header including data relating to the date of dispatch, the sender, the subject of the message, etc.
- BODY a body (called "BODY” in English), generally comprising the text of the message
- binary data which may themselves be digital documents, and require the use of a separate application for their use.
- An e-mail application makes it possible to offer a user a search function on the data included in the header, for example in order to find a target e-mail, or a keyword-based search function applied to the text of the e-mail. body of the message.
- a search function on the data included in the header, for example in order to find a target e-mail, or a keyword-based search function applied to the text of the e-mail. body of the message.
- some elements of an email (header, body) requires quick access to provide a powerful search service.
- the search functionality is not implemented in the same way depending on whether it applies to a field of the header or the body of the email.
- the invention improves the state of the art. It relates to a process for managing the storage of a digital document, implemented by a processor, comprising the following steps implemented on receipt of a command for storing the digital document in a storage space, coming from a client application:
- a storage model comprising at least one storage rule associated with at least one element of said structure
- the method according to the invention thus makes it possible to store the different elements of a digital document according to storage rules specific to each element relating to the structure of the digital document.
- a service provider can define the storage rules for each element of the structure of a digital document based on the use the service makes of that element.
- the method according to the invention makes it possible to improve the performance of the functionalities offered by the storage service (search in digital documents, access to documents, etc.).
- Structured documents means digital documents having a structure making it possible to arrange elements representative of the content of the digital document in the digital document.
- emails have a structure including a header and a body.
- a Microsoft Office ⁇ Powerpoint presentation document has a structure that includes an xml file (for "Extensible Markup Language” in English) and a set of hierarchical directories.
- a document is said to be “semi-structured” when certain elements of the digital document correspond to binary data that can not be directly interpreted by the application using the digital document.
- another application is necessary to read these elements, for example a "viewer” application (viewer in French) to read an image.
- the storage rules may be different depending on the type of digital document, for example different rules may be associated with the same element depending on the type of document to which the element belongs.
- the body of an email can be stored differently from the body of an SMS.
- the storage rule comprises information representative of a type of storage.
- the storage rule associated with a digital document element specifies the type of storage used to store the element in question.
- the type of storage may be a database, a location on a hard drive or a remote server, indexing by a search engine, etc.
- the storage type may also include information relating to the security of the servers. stored data, for example if data encryption mechanisms must be implemented to store the element, or information on the storage robustness of the stored data, for example if the storage medium used is robust to losses , etc.
- the step of storing an element comprises the following steps:
- the storage rule makes it possible to identify the storage device (database, search engine, hard disk, etc.) on which the element is stored.
- the management method further comprises transmitting to a publication interface at least one notification relating to the storage of the digital document.
- the progress and / or the end of the storage process of the digital document can thus be published to listening client applications on the publication interface.
- the storage model is further obtained according to a quality of service associated with a user of said digital document.
- the storage model obtained, and therefore the storage rules associated with the elements of the digital document depends on the quality of service provided to a user of the digital document.
- a storage service provider can provide a storage service with several qualities of service, varying for example depending on the cost of the service that the user wants to pay.
- the storage of the elements of a digital document is optimized according to the quality of service subscribed by the user.
- the structure is defined according to a standard of normalization relating to said type of digital document.
- advantage is advantageously taken of digital document structures already defined in standards, for example RFC ("Requests For Comments") standards define the format of e-mails. The method according to the invention is thus easier to implement.
- the invention also relates to a method for accessing at least one element of a stored digital document, implemented by a processor, comprising the following steps implemented on receiving a command for reading the document element.
- obtaining a storage file comprising a structure of the digital document and at least one storage address associated with an element of the digital document included in said structure
- the access method thus provides access to an element of a digital document that has been stored in an optimized manner based on the use of each element of the digital document.
- the invention also relates to a storage management device of a digital document comprising:
- extraction means in said digital document, of at least one element representative of the content of the digital document, from a predefined structure of the digital document, said structure defining a list of elements relating to a type of document digital,
- a storage model comprising at least one storage rule associated with at least one element of said structure, means for storing at least one extracted element, as a function of the storage rule associated with said corresponding element of the structure included in the storage model,
- the management device furthermore comprises:
- reception means coming from the storage device of said at least one memorized element.
- the invention also relates to a system for managing the storage of a digital document comprising a storage device according to any one of the particular embodiments described above and a publication interface adapted to publish according to a subscription / notification mechanism. , notifications received from the storage device, to at least one client application using the digital document.
- the invention also relates to a computer program comprising instructions for implementing the management method and / or the access method according to any one of the particular embodiments described above, when said program is executed by a user. processor.
- a program can use any programming language. It can be downloaded from a communication network and / or saved on a computer-readable medium.
- the management method and the access method according to the invention can be implemented in various ways, in particular in hard-wired form or in software form.
- FIG. 1 schematically illustrates an implementation environment of the invention according to a particular embodiment of the invention
- FIG. 2 illustrates steps of the storage management method of a digital document according to a particular embodiment of the invention
- FIG. 3 illustrates steps of the method of access to an element of a digital document according to a particular embodiment of the invention
- FIG. 4 illustrates a device adapted for implementing storage management and access to an element of a digital document method according to a particular embodiment of the invention. 5. Description of an embodiment of the invention
- the general principle of the invention is to allow the storage of digital documents in an optimized manner according to the use that can be made of each element of a digital document by a service.
- a storage model is used, defining for each element of a digital document a storage mode, for example database, hard disk, secure storage, etc.
- different storage models can be defined depending on the service.
- several storage models can be defined for the same type of document.
- Figure 1 schematically illustrates an implementation environment of the invention according to a particular embodiment of the invention.
- An infrastructure (15) of a service provider provides an optimized digital document storage service based on a quality of service to which a client application (10) is subscribed.
- the client application (10) is an e-mail application of the e-mail type. Such an application requires the storage of e-mails sent and received by the users of the e-mail application. It must for example be able to quickly display a user an email that the user wants to view, quickly display the user a preview of all emails received or issued.
- the client application (10) can also offer search functions for emails, for example based on keywords present in particular fields of an email, such as the name of a recipient, a subject of the email, or a message. date, etc.
- the client application (10) must therefore be able to access different elements of an email according to the functionality requested by the user. For example, to preview received emails, the client application (10) needs to quickly access the stub elements of the received emails. When viewing an email, the client application (10) must quickly access the body of the email to be read, the access time to attachments being less critical, access to attachments can be done after display of the body of the email. When searching for e-mails, for example on the basis of a "sender" field of received e-mails, the client application (10) must quickly access the e-mail headers to identify the target e-mails.
- the storage infrastructure (15) comprises:
- an extraction module (14) adapted to extract from a digital document (1) elements or fragments (2) of the digital document (1) from a description model describing the structure of the digital document (1) ,
- a management module (12) adapted to store the fragments extracted from the digital document according to a storage model (3) obtained as a function of the service subscribed by the client application (10),
- a set (13) of storage modules comprising at least one database (130) in which storage schemes associated with digital documents are stored, and one or more storage memories (131, 132, 133) on which fragments of the digital documents are stored.
- the database (130) is for example a server comprising a NoSQL database (for "Not Only Structured Query Language") of the MongoDB® type.
- a storage scheme is generated from the storage model used for the digital document to be stored.
- Such a storage scheme is stored in such a database.
- the storage scheme stored on this database (130) comprises for each fragment of the digital document, a storage address to which the fragment is accessible.
- the storage model makes it possible to identify for each fragment of a digital document the storage mode of the fragment and in particular the storage memory (131, 132, 133) on which to store the fragment.
- the storage memory (131) is a search engine adapted to index and memorize the fragments of digital documents transmitted to it.
- the storage memory (132) is for example a SQL database (Structured Query Language in English) adapted to store so-called structured fragments of digital documents. These are all types of document fragments whose content can be represented as a "field: value" data list.
- the storage memory (133) is for example a conventional storage server, or a database adapted to store unstructured data, such as images, videos, sounds, etc.
- the management module (12) is configured to communicate with the extraction module (14) and all the storage memories (130, 131, 132, 133).
- a publication interface (1 1) is for example a message bus type REDIS®.
- FIG. 2 illustrates steps of the storage management method of a digital document according to a particular embodiment of the invention.
- the client application (10) of FIG. 1 wishes to store a digital document (1) in a storage space of the infrastructure (15), during a step E20, it sends a storage command, also called a command of the digital document (1), via the publication interface (1 1).
- a storage command also called a command of the digital document (1)
- the write command comprises either the digital document (1) to be stored, or an address, for example a URL, indicating the location where the client application (10) has temporarily stored the digital document (1).
- the management module (12) being listened to the publication interface (1 1) of commands for writing digital documents, during step E20, it receives the write command of the client application (10).
- the management module (12) retrieves the digital document (1) and transmits the digital document (1) to the extraction module (14).
- the extraction module (14) identifies the type of the digital document (1), for example an email.
- the extraction module (14) then obtains a structure relating to the type of the digital document (1), here an e-mail structure.
- a structure describes a list of elements relating to the type of the digital document (1). It therefore describes an arrangement of the different elements that the digital document (1) is likely to understand.
- the structure includes a list of elements indicating that a first element corresponds to a header, a second element corresponds to a body and the other elements correspond, if present, to attachments represented here as binary data.
- Such a structure has been previously defined and stored in a memory of the infrastructure (15) for each type of digital document that the infrastructure (15) is likely to manage.
- a structure is defined for Microsoft Office documents ⁇ Word, Excel, Powerpoint, for documents of type HTML, XML, JSON, etc.
- the structure of a digital document corresponds here to a representation of the components of the digital document.
- the structure corresponds to a list of elements of the "key: values" type for which for each key, one or more values are associated. This type of representation is adapted to describe simple contents.
- the structure corresponds to a list of elements of type "key: values" for which the value associated with a key itself corresponds to a list of elements of type " key: values ".
- This type of representation is suitable for describing more complex contents, for example contents for which the elements comprise sub-elements.
- an email can be defined by the following structure:
- the value corresponds to the text of the email
- the structure of a digital document is defined according to a standard of standardization relating to the type of the digital document.
- the structure is defined according to the service provided by the client application (10).
- different structures for the same type of digital document can be defined according to the client applications.
- Such a particular embodiment of the invention makes it possible to adapt the division of the digital document into elements more or less fine according to the use of the elements that is made by the client application.
- the key "body” can be defined more precisely, for example by specifying a key-value list in the body of the email built by detecting in the body of the email the different parts inserted: message text, shipping header, transfer header, receipt header, signature of the issuer, etc.
- the structure is dynamic, i.e. the structure is intrinsic to the type of the digital document.
- the structure is constructed from the digital document itself, by detection. tags in the digital document.
- the extraction module extracts in the digital document (1), the fragments (2) of the digital document (1) from the structure.
- the digital document (1) is here cut into fragments according to the structure.
- a fragment of a digital document, also called element of the digital document, corresponds to a piece of the digital document and includes a part of the data, ie of the content, of the digital document. For example, using the example of the email above, three fragments are extracted:
- the management module (12) obtains a storage model (3) according to the type of the digital document (1).
- the storage model (3) includes storage rules associated with the elements of the structure defined for the type of the digital document.
- a storage model storage rule includes information representative of a storage type for the element with which it is associated.
- the information representative of the storage type indicates the database on which the item is to be stored.
- Information representative of the type of storage may also include information relating to the security of the stored data, for example if data encryption mechanisms must be implemented to store the element and which, or information relating to the storage robustness of the stored data, for example if the element must be stored on several storage media.
- the storage model is also obtained according to a quality of service associated with the client application (10) user of the digital document (1).
- a quality of service associated with the client application (10) user of the digital document (1).
- several storage models can be defined depending for example on a type of client.
- the customer can choose a premium quality service, for example offering quick access to e-mail attachments, security of stored data , a guaranteed robustness to errors, such a service being provided at a cost more expensive than a service offering simple access to attachments.
- the management module (12) then stores each fragment (2) extracted from the digital document in the storage space (13) according to the storage rule associated with the corresponding fragment in the structure.
- the management module (12) identifies a storage device (131, 132, 133), from the storage rule associated with the fragment. corresponding in the storage model.
- the storage rule associated with a fragment corresponding to the email header indicates that the fragment of the header must be stored on the structured database (132).
- the storage rule associated with a fragment corresponding to the body of the email indicates that the body fragment must be stored on the search engine (131) and the storage rule associated with a fragment corresponding to the attachments of the email indicates that the fragment of attachments must be stored on the unstructured data base (133).
- step E24 for each fragment (2) of the digital document, the management module (12) transmits to the storage device identified fragments to be stored on this storage device. In step E24, each storage device stores the fragments that are transmitted to it.
- the management module (12) During a step E25, the management module (12) generates a storage file, also called a storage scheme, comprising the structure used to split the digital document into fragments and, for each fragment extracted, a storage address indicating the where the fragment is stored. For example, such a storage address is a URL (for "Uniform Resource Locator").
- a storage address is a URL (for "Uniform Resource Locator").
- the management module (12) transmits the storage scheme to the database (130) which stores it.
- the management module (12) publishes the completion of the process of storing the digital document (1) with the publication interface (1 1).
- the publication notification may for example include identifiers relating to extracted fragments to facilitate access to fragments of the digital document later.
- FIG. 3 illustrates steps of the method of accessing a fragment of a digital document stored in an optimized manner according to a particular embodiment of the storage management method described with reference to FIG. 2.
- the client application (10) When the client application (10) wishes to access part of a digital document, during a step E30, it sends to the publication interface (1 1) a read command of the digital document, comprising, for example an identifier of the digital document and an identifier of the fragment that it wishes to access in the document.
- the management module (12) receives a notification from the publication interface (1 1) indicating that the client application (10) wishes to access a fragment of the digital document.
- the management module (12) communicates with the database (130) in order to obtain the storage scheme relating to the digital document.
- step E32 the management module (12) reads in the storage scheme the storage address corresponding to the desired fragment.
- step E33 the management module (12) communicates with the storage device (131, 132 or 133) on which the desired fragment is stored to obtain the fragment and transmits it to the client application (10), for example via the publication interface (1 1) when the fragment is not too large, or via another communication channel.
- step E33 when the client application is configured to communicate with the storage space (13), the management module (12) can transmit to the client application (10) via the interface of publication (1 1) the storage address of the fragment. According to this variant, the client application obtains directly from the storage device the desired fragment.
- the management module (2) is also configured to provide the client application (10) with the digital document in its entirety, and no longer by fragment, when the client application ( 10) sends such a request.
- the management module (12) retrieves all the fragments relating to the digital document, by communicating with the storage devices on which the fragments are stored. The management module (12) then composes the digital document from all the recovered fragments and transmits the recomposed digital document to the client application (10).
- FIG. 4 illustrates a device adapted for implementing the methods of managing the storage and access to a fragment of a digital document according to a particular embodiment of the invention described above.
- the device corresponds for example to the management module (12) of the infrastructure (15).
- the management device (12) comprises in particular a memory MEM, a processing unit UT, equipped for example with a processor PROC, and driven by the computer program PG stored in memory MEM.
- the computer program PG includes instructions for implementing the steps of the management method and the access method as described above, when the program is executed by the processor PROC.
- the code instructions of the computer program PG are for example loaded into a RAM before being executed by the processor PROC.
- the processor PROC of the processing unit UT implements, in particular, the steps of the management method described with reference to FIG. 2 and / or the steps of the access method described with reference to FIG. 3, according to the instructions of the program PG computer.
- the management device (12) comprises a communication interface COM1 adapted to send or receive notifications to or from the publication interface (1 1), according to the instructions of the PG computer program.
- the publication interface (1 1) can be included in the management device (12).
- the management device (12) also includes a communication interface COM2 adapted to communicate with the storage devices (130, 131, 132, 133).
- the management device (12) comprises a communication interface (not shown), such as an Ethernet, WIFI or other interface, allowing the management device (12) to connect to a communication network.
- a communication interface such as an Ethernet, WIFI or other interface
- the management device (12) comprises the extraction module (14).
- the storage infrastructure comprises several extraction modules and several management modules in order to efficiently manage the number of documents to be stored and to provide to the different client applications. All of these extraction and management modules are interconnected with the database (130) storing the storage schemes and with synchronized publishing interfaces.
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
L'invention concerne un procédé et un dispositif de gestion (12) du stockage d'un document numérique. Des éléments sont extraits (E21) du document numérique à stocker à partir d'une structure prédéfinie du document numérique, ladite structure définissant une liste d'éléments relatifs à un type du document numérique. Un modèle de stockage est obtenu (E22) en fonction du type du document numérique, le modèle de stockage comprenant au moins une règle de stockage associée à au moins un élément de ladite structure. Au moins un élément extrait est stocké (E24) en fonction de la règle de stockage associée audit élément correspondant de la structure, et un fichier de stockage est mémorisé (E25), le fichier de stockage comprenant ladite structure du document numérique et une adresse de stockage dudit élément extrait.
Description
Procédé et dispositif de gestion du stockage de documents numériques
1 . Domaine de l'invention
L'invention concerne le domaine du stockage de documents numériques et plus particulièrement la gestion d'un stockage distribué de fragments d'un document numérique.
2. Art Antérieur
Un document numérique est généralement stocké sous la forme d'un ou plusieurs fichiers mémorisé(s) en un même emplacement, tel qu'un disque dur, une base de données, une mémoire d'un serveur d'un réseau de communication, etc..
Par document numérique, on entend ici tout type de document apte à être stocké sur une mémoire d'ordinateur, tel qu'un courriel (aussi appelé "e-mail" en anglais), un document d'application bureautique (par exemple de type Microsoft Office© Word, Excel, Powerpoint, etc.), un document multimédia (par exemple fichier d'images, de vidéos, etc.).
Ces types de documents numériques présentent en général différents éléments sur lesquels un utilisateur ou une application peut interagir pour réaliser certaines fonctions: affichage d'un élément, recherche d'information dans un champ de l'élément, mise à jour d'un champ d'un élément, .... De telles interactions peuvent être mises en œuvre différemment selon l'élément du document numérique sur lequel elles s'appliquent.
Par exemple, un courriel comprend:
- un entête comprenant notamment des données relatives à la date d'envoi, à l'émetteur, au sujet du message, etc.,
- un corps (appelé "BODY" en anglais), comprenant en général le texte du message,
- et éventuellement des pièces jointes, en général des données dites binaires, qui peuvent elles-mêmes être des documents numériques, et nécessitent l'utilisation d'une application distincte pour leur utilisation.
Une application de courrier électronique permet d'offrir à un utilisateur une fonctionnalité de recherche sur les données comprises dans l'entête par exemple afin de retrouver un courriel cible, ou encore une fonctionnalité de recherche basée sur des mots-clés appliquée sur le texte du corps du message. Selon cet exemple, il apparaît que certains éléments d'un courriel (entête, corps) nécessite un accès rapide afin d'offrir un service de recherche performant. On notera également que la fonctionnalité de recherche n'est pas mise en œuvre de la même manière selon qu'elle s'applique à un champ de l'entête ou au corps du courriel.
Au contraire, d'autres éléments, tels que les pièces jointes par exemple, ne nécessite pas forcément un accès rapide.
La représentation d'un document numérique, l'emplacement de stockage du document utilisé par un service, ou encore la technique d'accès au document stocké utilisée par le service, ont un impact sur les performances du service pour accéder aux documents numériques une fois que ces documents numériques sont stockés par le service. De plus, la qualité de service d'accès à un document stocké est la même quel que soit l'élément du document auquel une application ou un utilisateur souhaite accéder.
3. Exposé de l'invention
L'invention vient améliorer l'état de la technique. Elle concerne un procédé de gestion du stockage d'un document numérique, mis en œuvre par un processeur, comprenant les étapes suivantes mises en œuvre sur réception d'une commande de mémorisation du document numérique dans un espace de stockage, en provenance d'une application cliente:
- extraction, dans ledit document numérique, d'au moins un élément représentatif du contenu du document numérique, à partir d'une structure prédéfinie du document numérique, ladite structure définissant une liste d'éléments relatifs à un type du document numérique,
- obtention, en fonction du type du document numérique, d'un modèle de stockage comprenant au moins une règle de stockage associée à au moins un élément de ladite structure,
- stockage d'au moins un élément extrait, en fonction de la règle de stockage associée audit élément correspondant de la structure,
- mémorisation d'un fichier de stockage comprenant ladite structure du document numérique et une adresse de stockage dudit au moins un élément extrait.
Le procédé selon l'invention permet ainsi de stocker les différents éléments d'un document numérique en fonction de règles de stockage propres à chaque élément relatif à la structure du document numérique.
Ainsi, l'accès à chaque élément du document numérique peut être optimisé. Par exemple, un fournisseur de service peut définir les règles de stockage de chaque élément de la structure d'un document numérique en fonction de l'utilisation que le service fait de cet élément.
Le procédé selon l'invention permet d'améliorer les performances des fonctionnalités offertes par le service de stockage (recherche dans les documents numériques, accès aux documents, ...).
L'invention s'applique plus particulièrement aux documents numériques dits "structurés" ou "semi-structurés". On entend par "documents structurés" des documents numériques ayant une structure permettant d'agencer dans le document numérique des éléments représentatifs du contenu du document numérique. Par exemple, les courriels ont une structure comprenant un entête et un corps. Selon un autre exemple, un document de présentation Microsoft Office© Powerpoint présente une structure comprenant un fichier xml
(pour "extensible Markup Language" en anglais) et un ensemble de répertoires hiérarchisés. Un document est dit "semi-structurés" lorsque certains éléments du document numérique correspondent à des données binaires non interprétables directement par l'application utilisant le document numérique. En général, une autre application est nécessaire pour lire ces éléments, par exemple une application de type "viewer" (visionneuse en français) pour lire une image.
Avantageusement, selon l'invention, les règles de stockage peuvent être différentes en fonction du type de document numérique, par exemple des règles différentes peuvent être associées à un même élément selon le type du document auquel l'élément appartient. Par exemple, le corps d'un courriel peut être stocké différemment du corps d'un SMS.
Selon un mode particulier de réalisation de l'invention, la règle de stockage comprend une information représentative d'un type de stockage. Selon ce mode particulier de réalisation de l'invention, la règle de stockage associée à un élément de document numérique spécifie le type de stockage utilisé pour stocker l'élément en question. Par exemple, le type de stockage peut être une base de données, un emplacement sur un disque dur ou un serveur distant, une indexation par un moteur de recherche, etc.. Le type de stockage peut aussi comprendre des informations relatives à la sécurité des données stockées, par exemple si des mécanismes d'encryptions des données doivent être mis en œuvre pour stocker l'élément, ou encore des informations relatives à la robustesse de stockage des données stockées, par exemple si le support de stockage utilisé est robuste aux pertes, etc..
Selon un autre mode particulier de réalisation de l'invention, l'étape de stockage d'un élément comprend les étapes suivantes:
- identification d'un dispositif de stockage, à partir de la règle de stockage associée audit élément,
- transmission audit dispositif de stockage dudit élément de sorte que le dispositif de stockage mémorise ledit élément.
Avantageusement, la règle de stockage permet d'identifier le dispositif de stockage (base de données, moteur de recherche, disque dur, etc..) sur lequel l'élément est mémorisé.
Selon un autre mode particulier de réalisation de l'invention, le procédé de gestion comprend en outre la transmission à une interface de publication, d'au moins une notification relative au stockage du document numérique. Selon ce mode particulier de réalisation de l'invention, l'avancement et/ou la fin du processus de stockage du document numérique peut ainsi être publié vers des applications clientes en écoute sur l'interface de publication.
Selon un autre mode particulier de réalisation de l'invention, le modèle de stockage est en outre obtenu en fonction d'une qualité de service associée à un utilisateur dudit document numérique. Selon ce mode particulier de réalisation, le modèle de stockage obtenu, et donc
les règles de stockage associées aux éléments du document numérique, dépend de la qualité de service fournie à un utilisateur du document numérique. En effet, un fournisseur de service de stockage peut fournir un service de stockage avec plusieurs qualités de service, variant par exemple en fonction du coût du service que l'utilisateur souhaite payer. Ainsi, le stockage des éléments d'un document numérique est optimisé en fonction de la qualité de service souscrite par l'utilisateur.
Selon un autre mode particulier de réalisation de l'invention, la structure est définie selon un standard de normalisation relatif audit type du document numérique. Selon ce mode particulier de réalisation, on tire avantageusement partie des structures de documents numériques déjà définies dans des normes, par exemple des normes RFC ("Requests For Comments" en anglais) définissent le format des courriels. Le procédé selon l'invention est ainsi plus facile à mettre en œuvre.
L'invention concerne également un procédé d'accès à au moins un élément d'un document numérique stocké, mis en œuvre par un processeur, comprenant les étapes suivantes mises en œuvre sur réception d'une commande de lecture de l'élément du document numérique:
- obtention d'un fichier de stockage comprenant une structure du document numérique et au moins une adresse de stockage associée à un élément du document numérique compris dans ladite structure,
- lecture d'une adresse de stockage dudit élément à lire à partir du fichier de stockage,
- obtention dudit élément à lire à partir de l'adresse de stockage lue.
Le procédé d'accès permet ainsi d'accéder à un élément d'un document numérique qui a été stocké de manière optimisé en fonction de l'utilisation de chaque élément du document numérique.
L'invention concerne également un dispositif de gestion du stockage d'un document numérique comprenant:
- des moyens de réception d'une commande de mémorisation du document numérique dans un espace de stockage, en provenance d'une application cliente,
- des moyens d'extraction, dans ledit document numérique, d'au moins un élément représentatif du contenu du document numérique, à partir d'une structure prédéfinie du document numérique, ladite structure définissant une liste d'éléments relatifs à un type du document numérique,
- des moyens d'obtention, en fonction du type du document numérique, d'un modèle de stockage comprenant au moins une règle de stockage associée à au moins un élément de ladite structure,
- des moyens de stockage d'au moins un élément extrait, en fonction de la règle de stockage associée audit élément correspondant de la structure comprise dans le modèle de stockage,
- des moyens de mémorisation d'un fichier de stockage comprenant ladite structure du document numérique et une adresse de stockage dudit au moins un élément extrait.
Selon un mode particulier de réalisation de l'invention, le dispositif de gestion comprend en outre:
- des moyens d'accès à un dispositif de stockage sur lequel au moins un élément du document numérique est mémorisé,
- des moyens de réception en provenance du dispositif de stockage dudit au moins un élément mémorisé.
L'invention concerne également un système de gestion du stockage d'un document numérique comprenant un dispositif de stockage selon l'un quelconque des modes particuliers de réalisation décrits ci-dessus et une interface de publication adaptée pour publier selon un mécanisme de souscription/notification, des notifications reçues du dispositif de stockage, vers au moins une application cliente utilisatrice du document numérique.
L'invention concerne également un programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé de gestion et/ou du procédé d'accès selon l'un quelconque des modes particuliers de réalisation décrits précédemment, lorsque ledit programme est exécuté par un processeur. Un tel programme peut utiliser n'importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur.
Le procédé de gestion et le procédé d'accès selon l'invention peuvent être mis en œuvre de diverses manières, notamment sous forme câblée ou sous forme logicielle.
4. Liste des figures
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation particulier, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :
- la figure 1 illustre de façon schématique un environnement de mise en œuvre de l'invention selon un mode particulier de réalisation de l'invention,
- la figure 2 illustre des étapes du procédé de gestion du stockage d'un document numérique selon un mode particulier de réalisation de l'invention,
- la figure 3 illustre des étapes du procédé d'accès à un élément d'un document numérique selon un mode particulier de réalisation de l'invention,
- la figure 4 illustre un dispositif adapté pour la mise en œuvre des procédés de gestion du stockage et d'accès à un élément d'un document numérique selon un mode particulier de réalisation de l'invention. 5. Description d'un mode de réalisation de l'invention
5.1 Principe général
Le principe général de l'invention est de permettre le stockage des documents numériques de manière optimisée selon l'utilisation qui peut être faite de chaque élément d'un document numérique par un service. Pour cela, un modèle de stockage est utilisé, définissant pour chaque élément d'un document numérique un mode de stockage, par exemple base de données, disque dur, stockage sécurisé, etc..
De manière avantageuse, différents modèles de stockage peuvent être définis en fonction du service. Ainsi, plusieurs modèles de stockage peuvent être définis pour un même type de document.
5. 2 Exemples de mise en œuvre
La figure 1 illustre de façon schématique un environnement de mise en œuvre de l'invention selon un mode particulier de réalisation de l'invention. On considère une infrastructure (15) d'un fournisseur de service offrant un service de stockage optimisé de documents numériques en fonction d'une qualité de service à laquelle une application cliente (10) est abonnée.
Par exemple, l'application cliente (10) est une application de messagerie électronique de type courriels. Une telle application nécessite le stockage des courriels émis et reçus par les utilisateurs de l'application de messagerie. Elle doit par exemple pouvoir afficher rapidement à un utilisateur un courriel que l'utilisateur souhaite visualiser, afficher rapidement à l'utilisateur un aperçu de l'ensemble des courriels reçus ou émis. L'application cliente (10) peut également offrir des fonctionnalités de recherche de courriels par exemple basées sur des mots-clés présents dans des champs particuliers d'un courriel, tels que le nom d'un destinataire, un sujet du courriel, ou une date, etc..
L'application cliente (10) doit donc pouvoir accéder à différents éléments d'un courriel selon la fonctionnalité demandée par l'utilisateur. Par exemple, pour afficher un aperçu des courriels reçus, l'application cliente (10) doit accéder rapidement aux éléments d'entêtés des courriels reçus. Lors de l'affichage d'un courriel, l'application cliente (10) doit accéder rapidement au corps du courriel à lire, le temps d'accès aux pièces jointes étant moins critique, l'accès aux pièces jointes pouvant être fait après l'affichage du corps du courriel.
Lors d'une recherche de courriels, par exemple sur la base d'un champ "émetteur" des courriels reçus, l'application cliente (10) doit accéder rapidement aux entêtes des courriels pour identifier les courriels cibles.
L'infrastructure de stockage (15) comprend:
- un module d'extraction (14) adapté pour extraire d'un document numérique (1 ) des éléments ou fragments (2) du document numérique (1 ) à partir d'un modèle de description décrivant la structure du document numérique (1 ),
- un module de gestion (12) adapté pour stocker les fragments extraits du document numérique en fonction d'un modèle de stockage (3) obtenu en fonction du service souscrit par l'application cliente (10),
- un ensemble (13) de modules de stockage, comprenant au moins une base de données (130) dans laquelle des schémas de stockage associés à des documents numériques sont stockés, et une ou plusieurs mémoires de stockage (131 , 132, 133) sur lesquelles les fragments des documents numériques sont mémorisés.
La base de données (130) est par exemple un serveur comprenant une base de données NoSQL (pour "Not Only Structured Query Language" en anglais) de type MongoDB®. Selon l'invention, pour chaque document numérique stocké, un schéma de stockage est généré à partir du modèle de stockage utilisé pour le document numérique à stocker. Un tel schéma de stockage est mémorisé dans une telle base de données. Le schéma de stockage mémorisé sur cette base de données (130) comprend pour chaque fragment du document numérique, une adresse de stockage à laquelle le fragment est accessible.
Le modèle de stockage permet d'identifier pour chaque fragment d'un document numérique le mode de stockage du fragment et notamment la mémoire de stockage (131 , 132, 133) sur laquelle stocker le fragment. Par exemple, la mémoire de stockage (131 ) est un moteur de recherche adapté pour indexer et mémoriser les fragments de documents numériques qui lui sont transmis. La mémoire de stockage (132) est par exemple une base de données SQL (pour Structured Query Language en anglais) adaptée pour mémoriser des fragments dits structurés de documents numériques. Il s'agit ici de tous types de fragments de documents dont le contenu peut être représenté sous la forme d'une liste de données de type "champ: valeur".
La mémoire de stockage (133) est par exemple un serveur de stockage classique, ou une base de données adaptée pour stocker des données non structurées, telles que des images, vidéos, sons, ...
Le module de gestion (12) est configuré pour communiquer avec le module d'extraction (14) et l'ensemble des mémoires de stockage (130, 131 , 132, 133).
L'application cliente (10) et l'infrastructure de stockage (15) communiquent via un mécanisme de publications ("subscribe/publish" en anglais) dans lequel l'infrastructure de
stockage (15) publie des notifications sur un canal via une interface de publication (1 1 ), l'application cliente (10) étant en écoute des notifications du canal auprès de l'interface de publication (1 1 ). Une telle interface de publication (1 1 ) est par exemple un bus de messages de type REDIS®.
Le principe de l'invention est ici décrit dans le cas d'une application cliente (10) de messagerie, l'invention s'applique également pour d'autres types d'application cliente.
La figure 2 illustre des étapes du procédé de gestion du stockage d'un document numérique selon un mode particulier de réalisation de l'invention.
Lorsque l'application cliente (10) de la figure 1 souhaite stocker un document numérique (1 ) dans un espace de stockage de l'infrastructure (15), lors d'une étape E20, elle envoie une commande de mémorisation, également appelée commande d'écriture, du document numérique (1 ), via l'interface de publication (1 1 ). Par exemple, la commande d'écriture comprend soit le document numérique (1 ) à stocker, soit une adresse, par exemple une URL, indiquant l'emplacement auquel l'application cliente (10) a temporairement mémorisé le document numérique (1 ).
Le module de gestion (12) étant en écoute auprès de l'interface de publication (1 1 ), de commandes d'écritures de documents numériques, lors de l'étape E20, il reçoit la commande d'écriture de l'application cliente (10).
Le module de gestion (12) récupère le document numérique (1 ) et transmet le document numérique (1 ) au module d'extraction (14).
Lors d'une étape E21 , le module d'extraction (14) identifie le type du document numérique (1 ), par exemple un courriel. Le module d'extraction (14) obtient alors une structure relative au type du document numérique (1 ), ici une structure relative aux courriels. Une telle structure décrit une liste d'éléments relatifs au type du document numérique (1 ). Elle décrit donc un agencement des différents éléments que le document numérique (1 ) est susceptible de comprendre.
Par exemple, dans le cas d'un courriel, la structure comprend une liste d'éléments indiquant qu'un premier élément correspond à un entête, un deuxième élément correspond à un corps et les autres éléments correspondent, s'ils sont présents, à des pièces jointes représentées ici comme des données binaires.
Une telle structure a au préalable été définie et mémorisée dans une mémoire de l'infrastructure (15) pour chaque type de document numérique que l'infrastructure (15) est susceptible de gérer. Par exemple, une structure est définie pour des documents de type Microsoft Office ©Word, Excel, Powerpoint, pour des documents de type HTML, XML, JSON, etc.. La structure d'un document numérique correspond ici à une représentation des composants du document numérique.
Selon un mode particulier de réalisation de l'invention, la structure correspond à une liste d'éléments de type "clé: valeurs" pour lesquels pour chaque clé, une ou plusieurs valeurs sont associées. Ce type de représentation est adapté pour décrire des contenus simples. Selon un autre mode particulier de réalisation de l'invention, la structure correspond à une liste d'éléments de type "clé: valeurs" pour lesquels, la valeur associée à une clé correspond elle-même à une liste d'éléments de type "clé: valeurs". Ce type de représentation est adapté pour décrire des contenus comprenant plus complexes, par exemple des contenus pour lesquels les éléments comprennent des sous-éléments.
Par exemple, un courriel peut être défini par la structure suivante:
- une liste de clés: entête, corps, pièce jointe, les valeurs associées à chacune de ces clés sont:
- pour la clé "entête", une liste de clés: sujet, émetteur, date, avec les valeurs associées à chaque clé,
- pour la clé "corps", la valeur correspond au texte du courriel,
- pour la clé "pièce jointe", une liste de valeurs correspondant aux différentes pièces jointes attachées au courriel.
Selon un autre mode particulier de réalisation de l'invention, la structure d'un document numérique est définie selon un standard de normalisation relatif au type du document numérique.
Selon un autre mode particulier de réalisation de l'invention, la structure est définie en fonction du service fournie par l'application cliente (10). Ainsi, selon ce mode particulier de réalisation de l'invention, différentes structures pour un même type de document numérique peuvent être définies selon les applications clientes. Un tel mode particulier de réalisation de l'invention permet d'adapter le découpage du document numérique en éléments de manière plus ou moins fine selon l'utilisation des éléments qui est faite par l'application cliente.
Par exemple, en reprenant l'exemple du courriel ci-dessus, la clé "corps" peut être définie de manière plus précise, en spécifiant par exemple une liste de clé-valeur dans le corps du courriel construite en détectant dans le corps du courriel les différentes parties insérées: texte du message, entête d'expédition, entête de transfert, entête de réception, signature de l'émetteur, etc..
Selon encore un autre mode particulier de réalisation de l'invention, la structure est dynamique, i.e. la structure est intrinsèque au type du document numérique. Par exemple, pour les documents numériques structurés dont la mise en œuvre est basée sur l'utilisation de balises (par exemple HTML, XML, JSON, ...), la structure est construite à partir du document numérique lui-même, par détection des balises dans le document numérique.
Lors de l'étape E21 , le module d'extraction extrait dans le document numérique (1 ), les fragments (2) du document numérique (1 ) à partir de la structure. Le document numérique
(1 ) est ici découpé en fragments en fonction de la structure. Un fragment d'un document numérique, aussi appelé élément du document numérique, correspond à un morceau du document numérique et comprend une partie des données, i.e. du contenu, du document numérique. Par exemple en reprenant l'exemple du courriel ci-dessus, trois fragments sont extraits:
- un premier fragment correspondant aux données de l'entête du courriel,
- un deuxième fragment correspondant aux données du corps du courriel,
- un troisième fragment correspondant aux données des pièces jointes du courriel.
Lors d'une étape E22, le module de gestion (12) obtient un modèle de stockage (3) en fonction du type du document numérique (1 ). Le modèle de stockage (3) comprend des règles de stockage associées aux éléments de la structure définie pour le type du document numérique. Une règle de stockage du modèle de stockage comprend une information représentative d'un type de stockage pour l'élément auquel elle est associée. Par exemple, l'information représentative du type de stockage indique la base de données sur laquelle l'élément doit être stocké. L'information représentative du type de stockage peut aussi comprendre des informations relatives à la sécurité des données stockées, par exemple si des mécanismes d'encryptions des données doivent être mis en œuvre pour stocker l'élément et lesquels, ou encore des informations relatives à la robustesse de stockage des données stockées, par exemple si l'élément doit être stocké sur plusieurs supports de stockage.
Selon un mode particulier de réalisation de l'invention, le modèle de stockage est en outre obtenu en fonction d'une qualité de service associée à l'application cliente (10) utilisatrice du document numérique (1 ). Selon ce mode particulier de réalisation de l'invention, plusieurs modèles de stockage peuvent être définis en fonction par exemple d'un type de client. Lors de la souscription d'un contrat de stockage auprès du fournisseur de l'infrastructure de stockage (15), le client peut choisir un service de qualité premium, offrant par exemple un accès rapide aux pièces jointes des courriels, une sécurité des données stockées, une robustesse garantie aux erreurs, un tel service étant fourni pour un coût plus onéreux qu'un service offrant un accès simple aux pièces jointes.
Le module de gestion (12) stocke ensuite chaque fragment (2) extrait du document numérique dans l'espace de stockage (13) en fonction de la règle de stockage associée au fragment correspondant dans la structure.
Pour cela, lors de l'étape E23, pour chaque fragment (2) du document numérique, le module de gestion (12) identifie un dispositif de stockage (131 , 132, 133), à partir de la règle de stockage associée au fragment correspondant dans le modèle de stockage.
Par exemple, en reprenant l'exemple du courriel déjà décrit ci-dessus, la règle de stockage associée à un fragment correspondant à l'entête du courriel indique que le fragment de
l'entête doit être stocké sur la base de données structurées (132). La règle de stockage associée à un fragment correspondant au corps du courriel indique que le fragment du corps doit être stocké sur le moteur de recherche (131 ) et la règle de stockage associée à un fragment correspondant aux pièces jointes du courriel indique que le fragment des pièces jointes doit être stocké sur la base de données non structurées (133).
Lors de l'étape E24, pour chaque fragment (2) du document numérique, le module de gestion (12) transmet au dispositif de stockage identifié les fragments devant être mémorisés sur ce dispositif de stockage. Lors de l'étape E24, chaque dispositif de stockage mémorise les fragments qui lui sont transmis.
Lors d'une étape E25, le module de gestion (12) génère un fichier de stockage, aussi appelé schéma de stockage, comprenant la structure utilisée pour découper le document numérique en fragments et, pour chaque fragment extrait, une adresse de stockage indiquant l'emplacement auquel le fragment est mémorisé. Par exemple, une telle adresse de stockage est une URL (pour "Uniform Resource Locator" en anglais). Lors de l'étape E25, le module de gestion (12) transmet le schéma de stockage à la base de données (130) qui le mémorise.
Lors d'une étape E26, le module de gestion (12) publie l'achèvement du processus de stockage du document numérique (1 ) auprès de l'interface de publication (1 1 ). Ainsi, l'application cliente (10) est informée de la fin du traitement de stockage. La notification de publication peut par exemple comprendre des identifiants relatifs aux fragments extraits afin de faciliter l'accès aux fragments du document numérique ultérieurement.
La figure 3 illustre des étapes du procédé d'accès à un fragment d'un document numérique stocké de manière optimisé selon un mode particulier de réalisation du procédé de gestion de stockage décrit en relation avec la figure 2.
Lorsque l'application cliente (10) souhaite accéder à une partie d'un document numérique, lors d'une étape E30, elle émet vers l'interface de publication (1 1 ), une commande de lecture du document numérique, comprenant par exemple un identifiant du document numérique et un identifiant du fragment auquel elle souhaite accéder dans le document. Lors de l'étape E30, le module de gestion (12) reçoit une notification de l'interface de publication (1 1 ) indiquant que l'application cliente (10) souhaite accéder à un fragment du document numérique.
Lors d'une étape E31 , le module de gestion (12) communique avec la base de données (130) afin d'obtenir le schéma de stockage relatif au document numérique.
Lors de l'étape E32, le module de gestion (12) lit dans le schéma de stockage l'adresse de stockage correspondant au fragment souhaité.
Lors de l'étape E33, le module de gestion (12) communique avec le dispositif de stockage (131 , 132 ou 133) sur lequel le fragment souhaité est mémorisé pour obtenir le fragment et le transmet à l'application cliente (10), par exemple via l'interface de publication (1 1 ) lorsque le fragment n'est pas trop volumineux, ou bien via un autre canal de communication.
En variante, lors de l'étape E33, lorsque l'application cliente est configurée pour communiquer avec l'espace de stockage (13), le module de gestion (12) peut transmettre à l'application cliente (10) via l'interface de publication (1 1 ) l'adresse de stockage du fragment. Selon cette variante, l'application cliente obtient directement depuis le dispositif de stockage le fragment souhaité.
Selon un autre mode particulier de réalisation de l'invention, le module de gestion (2) est également configuré pour fournir à l'application cliente (10) le document numérique en entier, et non plus par fragment, lorsque l'application cliente (10) envoie une telle requête.
Pour cela, à partir du schéma de stockage obtenu depuis la base de données (130), le module de gestion (12) récupère tous les fragments relatifs au document numérique, en communiquant avec les dispositifs de stockage sur lesquels les fragments sont mémorisés. Le module de gestion (12) compose alors le document numérique à partir de tous les fragments récupérés et transmet le document numérique recomposé à l'application cliente (10).
La figure 4 illustre un dispositif adapté pour la mise en œuvre des procédés de gestion du stockage et d'accès à un fragment d'un document numérique selon un mode particulier de réalisation de l'invention décrit ci-dessus. Le dispositif correspond par exemple au module de gestion (12) de l'infrastructure (15).
Le dispositif de gestion (12) comprend notamment une mémoire MEM, une unité de traitement UT, équipée par exemple d'un processeur PROC, et pilotée par le programme d'ordinateur PG stocké en mémoire MEM. Le programme d'ordinateur PG comprend des instructions pour mettre en œuvre les étapes du procédé de gestion et du procédé d'accès tels que décrits précédemment, lorsque le programme est exécuté par le processeur PROC. A l'initialisation, les instructions de code du programme d'ordinateur PG sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur PROC. Le processeur PROC de l'unité de traitement UT met notamment en œuvre les étapes du procédé de gestion décrit en relation avec la figure 2 et/ou les étapes du procédé d'accès décrit en relation avec la figure 3, selon les instructions du programme d'ordinateur PG. Pour cela, le dispositif de gestion (12) comprend une interface de communication COM1 adaptée à émettre ou recevoir des notifications vers ou depuis l'interface de publication (1 1 ),
selon les instructions du programme d'ordinateur PG. En variante, l'interface de publication (1 1 ) peut être comprise dans le dispositif de gestion (12).
Le dispositif de gestion (12) comprend également une interface de communication COM2 adaptée pour communiquer avec les dispositifs de stockage (130, 131 , 132, 133).
Selon un mode particulier de réalisation de l'invention, le dispositif de gestion (12) comprend une interface de communication (non représentée), telle qu'une interface Ethernet, WIFI ou autre, permettant au dispositif de gestion (12) de se connecter à un réseau de communication.
Selon un mode particulier de réalisation de l'invention, le dispositif de gestion (12) comprend le module d'extraction (14).
L'invention a été décrite ci-dessus dans le cas d'une infrastructure de stockage (15) ne comprenant qu'un module d'extraction et un module de gestion. En pratique, l'infrastructure de stockage (15) comprend plusieurs modules d'extraction et plusieurs modules de gestion afin de gérer efficacement le nombre de documents à stocker et à fournir aux différentes applications clientes. Tous ces modules d'extraction et de gestions sont interconnectés avec la base de données (130) stockant les schémas de stockage et avec des interfaces de publication synchronisées.
Claims
Revendications 1 . Procédé de gestion du stockage d'un document numérique (1 ), mis en œuvre par un processeur, comprenant les étapes suivantes mises en œuvre sur réception (E20) d'une commande de mémorisation du document numérique dans un espace de stockage, en provenance d'une application cliente (10) :
- extraction (E21 ), dans ledit document numérique, d'au moins un élément (2) représentatif du contenu du document numérique, à partir d'une structure prédéfinie du document numérique, ladite structure définissant une liste d'éléments relatifs à un type du document numérique,
- obtention (E22), en fonction du type du document numérique, d'un modèle de stockage (3) comprenant au moins une règle de stockage associée à au moins un élément de ladite structure,
- stockage (E24) d'au moins un élément extrait, en fonction de la règle de stockage associée audit élément correspondant de la structure,
- mémorisation (E25) d'un fichier de stockage comprenant ladite structure du document numérique et une adresse de stockage dudit au moins un élément extrait.
2. Procédé de gestion selon la revendication 1 , dans lequel la règle de stockage comprend une information représentative d'un type de stockage.
3. Procédé de gestion selon la revendication 1 ou 2, dans lequel l'étape de stockage d'un élément comprend les étapes suivantes:
- identification d'un dispositif de stockage, à partir de la règle de stockage associée audit élément,
- transmission audit dispositif de stockage dudit élément de sorte que le dispositif de stockage mémorise ledit élément.
4. Procédé de gestion selon la revendication 3, comprenant en outre la transmission à une interface de publication, d'au moins une notification relative au stockage du document numérique.
5. Procédé de gestion selon l'une quelconque des revendications 1 à 4, dans lequel ledit modèle de stockage est en outre obtenu en fonction d'une qualité de service associée à un utilisateur dudit document numérique.
6. Procédé de gestion selon l'une quelconque des revendications 1 à 5, dans lequel la structure est définie selon un standard de normalisation relatif audit type du document numérique.
7. Procédé d'accès à au moins un élément d'un document numérique stocké, mis en œuvre par un processeur, comprenant les étapes suivantes mises en œuvre sur réception (E30) d'une commande de lecture de l'élément du document numérique:
- obtention (E31 ) d'un fichier de stockage comprenant une structure du document numérique et au moins une adresse de stockage associée à un élément du document numérique compris dans ladite structure,
- lecture (E32) d'une adresse de stockage dudit élément à lire à partir du fichier de stockage,
- obtention (E33) dudit élément à lire à partir de l'adresse de stockage lue.
8. Dispositif de gestion du stockage d'un document numérique comprenant:
- des moyens de réception (COM1 ) d'une commande de mémorisation du document numérique dans un espace de stockage, en provenance d'une application cliente,
- des moyens d'extraction (14), dans ledit document numérique, d'au moins un élément représentatif du contenu du document numérique, à partir d'une structure prédéfinie du document numérique, ladite structure définissant une liste d'éléments relatifs à un type du document numérique,
- des moyens d'obtention (PROC), en fonction du type du document numérique, d'un modèle de stockage comprenant au moins une règle de stockage associée à au moins un élément de ladite structure,
- des moyens de stockage (PROC, COM2) d'au moins un élément extrait, en fonction de la règle de stockage associée audit élément correspondant de la structure comprise dans le modèle de stockage,
- des moyens de mémorisation (PROC, COM2) d'un fichier de stockage comprenant ladite structure du document numérique et une adresse de stockage dudit au moins un élément extrait.
9. Dispositif de gestion du stockage selon la revendication 8, comprenant en outre:
- des moyens d'accès à un dispositif de stockage sur lequel au moins un élément du document numérique est mémorisé,
- des moyens de réception en provenance du dispositif de stockage dudit au moins un élément mémorisé.
10. Système de gestion du stockage d'un document numérique comprenant:
- un dispositif de stockage (12) selon l'une quelconque des revendications 8 ou 9,
- une interface de publication (1 1 ) adaptée pour publier selon un mécanisme de souscription/notification, des notifications reçues du dispositif de stockage, vers au moins une application cliente utilisatrice du document numérique.
1 1 . Programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé de gestion selon l'une quelconque des revendications 1 à 6, ou pour la mise en œuvre du procédé d'accès selon la revendication 7, lorsque ledit programme est exécuté par un processeur.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1752311A FR3064379B1 (fr) | 2017-03-21 | 2017-03-21 | Procede et dispositif de gestion du stockage de documents numeriques |
| FR1752311 | 2017-03-21 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2018172669A1 true WO2018172669A1 (fr) | 2018-09-27 |
Family
ID=58707869
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/FR2018/050634 Ceased WO2018172669A1 (fr) | 2017-03-21 | 2018-03-16 | Procédé et dispositif de gestion du stockage de documents numériques |
Country Status (2)
| Country | Link |
|---|---|
| FR (1) | FR3064379B1 (fr) |
| WO (1) | WO2018172669A1 (fr) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114564628A (zh) * | 2022-03-09 | 2022-05-31 | 云学堂信息科技(江苏)有限公司 | 基于企业培训的高效型知识库深度检索方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150200967A1 (en) * | 2007-01-05 | 2015-07-16 | Digital Doors, Inc. | Information Infrastructure Management Tools With Variable and Configurable Filters and Segmental Data Stores |
| US20150324454A1 (en) * | 2014-05-12 | 2015-11-12 | Diffeo, Inc. | Entity-centric knowledge discovery |
-
2017
- 2017-03-21 FR FR1752311A patent/FR3064379B1/fr active Active
-
2018
- 2018-03-16 WO PCT/FR2018/050634 patent/WO2018172669A1/fr not_active Ceased
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150200967A1 (en) * | 2007-01-05 | 2015-07-16 | Digital Doors, Inc. | Information Infrastructure Management Tools With Variable and Configurable Filters and Segmental Data Stores |
| US20150324454A1 (en) * | 2014-05-12 | 2015-11-12 | Diffeo, Inc. | Entity-centric knowledge discovery |
Non-Patent Citations (1)
| Title |
|---|
| HASHEM HADI ET AL: "Evaluating NoSQL Document Oriented Data Model", 2016 IEEE 4TH INTERNATIONAL CONFERENCE ON FUTURE INTERNET OF THINGS AND CLOUD WORKSHOPS (FICLOUDW), IEEE, 22 August 2016 (2016-08-22), pages 51 - 56, XP032978963, DOI: 10.1109/W-FICLOUD.2016.26 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114564628A (zh) * | 2022-03-09 | 2022-05-31 | 云学堂信息科技(江苏)有限公司 | 基于企业培训的高效型知识库深度检索方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| FR3064379B1 (fr) | 2021-12-03 |
| FR3064379A1 (fr) | 2018-09-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11095586B2 (en) | Detection of spam messages | |
| US20060294258A1 (en) | Advertisement refresh rules for network applications | |
| US8538921B2 (en) | File caching | |
| WO2011136822A1 (fr) | Techniques de fil d'actualités | |
| US20080177848A1 (en) | System and method of sharing and dissemination of electronic information | |
| WO2012021418A1 (fr) | Systèmes et procédés pour messagerie vidéo et confirmation | |
| US20170063969A1 (en) | Systems and methods for content distribution | |
| FR2975250A1 (fr) | Procede et systeme pour une gestion securisee de services de documents xml en ligne grace a un chiffrement asymetrique conservant la structure | |
| FR2863127A1 (fr) | Procedes et dispositifs pour la delivrance asynchrone de donnees numeriques | |
| FR2926176A1 (fr) | Reseau de communication de transfert d'informations entre un terminal mobile et des serveurs sources, ainsi que terminal et procede de gestion de transfert d'informations dans un tel reseau. | |
| US10721331B2 (en) | Using an integration service to facilitate interactions between software systems | |
| WO2018172669A1 (fr) | Procédé et dispositif de gestion du stockage de documents numériques | |
| EP2336967A1 (fr) | Messagerie personnalisée sur encarts Web. | |
| EP4241189B1 (fr) | Procédé de mise à jour automatique de données d'un utilisateur | |
| EP4606084A1 (fr) | Procédé de traitement d'une requête d'exécution d'un service dans un réseau de communication, procédé de validation de la requête, entité intermédiaire, entité de validation, système et programme d'ordinateur correspondants | |
| EP2674860A1 (fr) | Procédé de traitement de données par un module de navigation | |
| EP4158853A1 (fr) | Procédé de gestion de la transmission d'un message depuis un premier dispositif à destination d'un deuxième dispositif, procédé de gestion de la réception d'un tel message | |
| WO2024188822A1 (fr) | Procédé et dispositif de paiement confidentiel sur chaîne de blocs | |
| WO2007116169A1 (fr) | Module, procede et programme d'ordinateur de generation de messages | |
| FR3159454A1 (fr) | Procede pour generer automatiquement une reponse a une demande contenue dans un message electronique | |
| EP4099249A1 (fr) | Procédé et dispositif de transmission d'un identifiant d'un utilisateur lors d'un paiement électronique réalisépar l utilisateur | |
| Jin et al. | Enhancing Email Functionality using Late Bound Content | |
| CA2874207C (fr) | Procede de traitement de flux de donnees imap, serveurs de courriels et programmes d'ordinateur mettant en oeuvre de tels procedes | |
| FR3094539A1 (fr) | Procédé de commande anonymisé d’un produit ou d’un service à l’aide d’un terminal de communication | |
| WO2015036698A1 (fr) | Systeme collaboratif assurant l'archivage, la traçabilite et la valeur probatoire des donnees d'une organisation |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18714584 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 18714584 Country of ref document: EP Kind code of ref document: A1 |