DE102006008287A1 - Information investigation method involves storing information into two hierarchical classification structures, and every double stored information is deleted or marked as deleted - Google Patents
Information investigation method involves storing information into two hierarchical classification structures, and every double stored information is deleted or marked as deleted Download PDFInfo
- Publication number
- DE102006008287A1 DE102006008287A1 DE102006008287A DE102006008287A DE102006008287A1 DE 102006008287 A1 DE102006008287 A1 DE 102006008287A1 DE 102006008287 A DE102006008287 A DE 102006008287A DE 102006008287 A DE102006008287 A DE 102006008287A DE 102006008287 A1 DE102006008287 A1 DE 102006008287A1
- Authority
- DE
- Germany
- Prior art keywords
- node
- hierarchical
- classification tree
- adv
- core
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Verfahren für eine Recherche nach Informationen, die in zwei hierarchischen Klassifikationsstrukturen abgelegt sind, wobei alle doppelt abgelegten Informationen gelöscht oder als gelöscht markiert werden, so dass in einem Informationsspeicher die aus beiden Klassifikationsspeichern herausgezogenen Informationen nur 1-fach vorliegen.Method for searching for information stored in two hierarchical classification structures, wherein all doubly stored information is deleted or marked as deleted, so that in an information store the information extracted from both classification memories is present only once.
Description
ZusammenfassungSummary
Verfahren für eine Recherche nach Informationen, die in zwei hierarchischen Klassisfikationsstrukturen abgelegt sind, wobei alle doppelt abgelegten Informationen gelöscht oder als gelöscht markiert werden, so dass in einem Informationsspeicher die aus beiden Klassifikationspeichern herausgezogenen Informationen nur 1-fach vorliegen.method for one Search for information in two hierarchical classification structures are stored, with all doubly stored information deleted or as deleted be marked so that in an information store from both Classifications stored information only 1-fold available.
Beschreibungdescription
Eine bloße Existenz von Informationen verliert mit der zunehmenden Menge von Informationen sehr schnell Ihren Wert, wenn die Information nicht auf effektive Art auffindbar ist. Eine an sich bekannte Vorgehensweise um eine große Menge an Informationen so zu hinterlegen, daß eine gesuchte Information relativ schnell auffindbar ist, besteht darin, die Informationen nach einem Schema zu gliedern. Beispielsweise kann man die Informationen in einzelene Archive ablegen. Damit wird das gesamte Gebiet gewissermaßen in Teilgebiete aufgeteilt. Jede Information wird bei Ihrer Hinterlegung in einem Archiv wenigstens einem dieser Teilgebiete zugeordnet. Diese Suche nach einer Information läßt sich damit auf die einem Teilgebiet zugeordneten Informationen beschränken. Die Zuordnung zu Teilgebieten wird üblicherweise als Klassifikation bezeichnet, und die Teilgebiete werden als Klassifikatoren verstanden und können mit die Teilgebiete bezeichnenden Namen versehen werden.A nakedness Existence of information loses with the increasing amount of Information very quickly your value if the information is not on effective way is findable. A known procedure a big one Amount of information to deposit so that a requested information is relatively easy to find, is the information to organize according to a scheme. For example, you can see the information store in individual archives. Thus, the entire area is effectively in subareas divided up. Any information will be in your deposit at a Archive associated with at least one of these subregions. This search after an information can be restricting it to the information assigned to a sub-area. The Assignment to subdomains is usually referred to as classification, and the subdomains are called classifiers understood and can be provided with the subdomains designating name.
Neben einer Vielzahl von literarischen und dokumentarischen Dokumentationsschemata hat auf dem Gebiet der Technik die „Internationale Patentklassifikation (IPC)", eine herausragende Bedeutung. Die IPC untergliedert das Gebiet der Technik in eine Vielzahl von Teilgebieten. So kann von Patentbehörden jede Patentanmeldung in technischer Hinsicht analysiert und wenigstens einem Teilgebiet, einer sogenannten Patentklasse zugeordnet werden.Next a variety of literary and documentary documentation schemes has in the field of technology the "International Patent Classification (IPC), "a standout Importance. The IPC divides the field of technology into a multitude of subareas. Thus, by patent authorities, every patent application in from a technical point of view and at least one sub-area, be assigned to a so-called patent class.
Die IPC weist darüber hinaus eine mehrstufige hierarchisch aufgebaute weitere Untergliederung innerhalb der Teilgebiete auf, so daß damit ein Klassifikationsschema bereitgestellt ist, mit dem eine hoch präzise Zuordnung von Schutzrechten zu technischen Teilgebieten und damit das schnelle Auffinden von Schutzrechten innerhalb eines technischen Teilgebietes im Rahmen einer Recherche möglich wird.The IPC points above In addition, a multi-level hierarchically structured further subdivision within of the subdomains, so that with it a classification scheme is provided with which a high precise Assignment of property rights to technical sub-areas and thus the fast finding of protective rights within a technical sub-area in the context of a search becomes possible.
Der durch eine Vielzahl von Hierarchiestufen beabsichtigte hohe Detaillierungsgrad erfordert bei der Zuordnung vielfach eine intensive technische Analyse des zu klassifizierenden technischen Gegenstandes einer Patentanmeldung, was einen hohen Zeit-, Personal- und damit Kostenaufwand für eine Patentbehörde bedeuten kann.Of the High level of detail intended by a large number of hierarchical levels often requires an intensive technical analysis in the assignment of the technical subject to be classified of a patent application, which means a high time, personnel and thus costs for a patent authority can.
Um diesen Aufwand zu reduzieren, wurde von der WIPO (Word International Patent Organisation) eine ,duale' internationale Patenklassifikation vorgestellt, die zwei Klassifikationsschemata vorsieht, von denen eine erste gegenüber einer zweiten eine geringere Hierarchietiefe aufweist. Das erste Klassifikationsschema – auch Core Klassifikation genannt – findet sich als hierarchischer Oberbau identisch in dem zweiten Klassifikationsschema – auch Advanced Klassifikation genannt – wieder, wobei das zweite Klassifikationsschema noch eine weitergehende Untergliederung vorsieht. Diese zeigt sich an weiteren Patentunterklassen, die in der Core Klassifikation nicht vorhanden sind, und mit denen die in den untersten Hierarchieebenen der Core Klassifikation bezeichneten technischen Detailgebiete noch weiter untergliedert werden.Around To reduce this effort, WIPO (Word International Patent Organization) a 'dual' international Patenklassifikation presented, the two classification schemes provides, of which a first compared to a second one less Hierarchy depth has. The first classification scheme - also Core Called classification - finds as a hierarchical superstructure identical in the second classification scheme - also Advanced Called classification - again, the second classification scheme still a further subdivision provides. This can be seen in other patent subclasses published in the core classification does not exist, and with which the in the lowest hierarchy levels of the core classification technical detail areas are further subdivided.
Diese ,duale' Klassifizierung mit zwei Klassifikationschemata gibt die Auswahlmöglichkeit eine Patentanmeldung entweder nach dem einen oder dem anderen Schema zu klassifizieren. In regelmäßigen Zeitabständen wird darüber hinaus vom europäischen Patentamt eine Synchronisation vorgenommen, bei der die Core Klassifikation durch Zuordnungen von all denjenigen Patentanmeldungen ergänzt wird, die zwar in der Advanced Klas sifikation, jedoch noch nicht in der Core Klassifikation zugeordnet sind. Dabei werden die zu einem Klassifikator der Advanced Klassifikation, der wegen des geringeren Detailierungsgrades in der Core Klassifikation nicht existiert, zugeordneten Schutzrechte demjenigen Klassifikator in der Core-Klassifikation zugeordent, der dort an unterster Hierarchieebene das technische Detailgebiet umfaßt. Damit geht zwar Detailierungsinformation verloren, jedoch wird sichergestellt, daß der Core Klassifikation alle Schutzrechte zugeordnet sind.These 'dual' classification with two classification schemes gives the choice a patent application either according to one or the other scheme to classify. At regular intervals will be about that out of the European Patent Office made a synchronization in which the core classification complemented by assignments of all those patent applications, although in the Advanced Classification, but not yet in the Core classification are assigned. They become a classifier the Advanced classification, because of the lower degree of detail in the core classification does not exist, assigned property rights assigned to the classifier in the core classification, which there lowest hierarchical level includes the technical detail area. In order to Although detailing information is lost, it is ensured that that the core Classification all protective rights are assigned.
Sowohl die Core- als auch die Advanced stehen für Recherchen in der Patentliteratur zur Verfügung. Vom europäischen Patentamt wird als Vorgehen empfohlen, zunächst in der Advanced Klassifikation das technische Detailgebiet (d.h. den Suchklassifikator) auszuwählen, auf das sich das oder die gesuchten Schutzrechte beziehen. Das Suchergebnis besteht dann aus allen dem ausgewählten technischen Detailgebiet zugeordneten Schutzrechten in der Advanced Klassifikation. Für den Fall, daß das Suchergebnis keine befriedigenden Ergebnisse geliefert hat, wird vom europäischen Patentamt als zweiter Schritt empfohlen, für eine weitere Suche in der Core Klassifikation denjenigen Klassifikator zu ermitteln, der an unterster Hierarchiestufe das ausgewählte technische Detailgebiet umfaßt, und die diesem Klassifikator zugeordneten Schutzrechte als weiteres Suchergebnis anzusehen. Das weitere Suchergebnis enthält in der Regel eine weit größere Anzahl von Schutzrechten als das Suchergebnis aus dem ersten Schritt, wobei eine große Anzahl von Schutzrechten bereits im ersten Schritt ermittelt wurden.Both Core and Advanced are available for patent literature research. It is recommended by the European Patent Office to first select in the Advanced Classification the technical detail area (ie the search classifier) to which the property rights or rights sought relate. The search result then consists of all the protective rights assigned to the selected technical detail area in the Advanced Classification. In the event that the search result has not given satisfactory results, the European Patent Office recommends, as a second step, to determine for a further search in the core classification that classifier which includes the selected technical detail area at the lowest hierarchical level and which is assigned to this classifier To consider protective rights as another search result. The further Su As a rule, the result of a search contains a much larger number of protective rights than the search result from the first step, whereby a large number of protective rights were already determined in the first step.
Durch die doppelte Suche in den Core und Advanced Klassen muß deutlich mehr Speicher und CPU-Zeit zur Verfügung gestellt werden als wenn nur in einem Klassifikationsschema gesucht wird. Zur Zeit werden bei der IPC weniger als 1% nur der Core Klassifikation zugeordnet. Somit wird knapp doppelt soviel Speicherplatz für die redundante Suche in der Core und Advanced Klassifikation benötigt. Bei einem Datenvolumen von ca. 210 Millionen Zuordnungen zu beiden Patentklassen (Datenbestand IPC 8 Zuordnung des Europäischen Patentamtes) und einem Speicherbedarf von 4 Byte pro Zuordnung sowie jeweils 4 Byte für 70.000 Klassifikationen der Advanced- und 4 Byte für 17.000 Klassifikationen der Core- Klassen ergibt dies ein benötigtes Speichervolumen von ca 840 Mega Byte.By The double search in the Core and Advanced classes must be clear more memory and CPU time are made available than when only in a classification scheme is searched. Currently being in the case of the IPC less than 1% only assigned to the Core classification. Thus, almost twice as much space for the redundant search in the core and Advanced classification needed. With a data volume of approx. 210 million assignments to both Patent classes (database IPC 8 assignment of the European Patent Office) and a memory requirement of 4 bytes per allocation as well as each 4 bytes for 70,000 classifications of advanced and 4 bytes for 17,000 Classification of the core classes results in a required storage volume of about 840 megabytes.
Zusätzlich zu dem Speicheraufkommen müssen bei einer vollständigen Recherche beide Klassen (Core und Advanced) durchsucht werden was bedingt durch die redundanten Speicherzugriffe auch zu einer nahezu doppelten CPU Belastung führt.In addition to the memory need to at a complete Researching both classes (Core and Advanced) will be searched what due to the redundant memory accesses also to an almost double CPU load leads.
Um eine redundanzfreie Anzeige des Rechercheergebnisses zu gewährleisten muß zusätzlich das Ergebnis der Core und Advanced Recherche vereinheitlicht werden. Auch hier muß sowohl Speicher als auch CPU Leistung ausreichend zur Verfügung stehen.Around to ensure a redundancy-free display of the search result must additionally the Result of the core and advanced research will be unified. Again, both must Memory as well as CPU power are sufficiently available.
Wird die Recherche in einer Datenbank gleichzeitig von vielen Nutzern durchgeführt – etwa bei einer Onlinenutzung – so vervielfältig sich der Bedarf an Speicher und CPU-Zeit.Becomes the search in a database simultaneously by many users performed - for example an online use - so copied to or distributed the need for memory and CPU time.
Es ist Aufgabe der vorliegenden Erfindung Maßnahmen vorzusehen, durch eine geschickte Aufteilung und Nutzung eines zur Verfügung stehenden Speichers, einerseits den für die Recherche notwendigen Speicherbedarf und andererseits die für die Recherche benötigte CPU-Zeit deutlich zu reduzieren. Weiterhin wird durch die vorgestellte Vorgehensweise das Rechercheergebnis in Hinblick auf die Genauigkeit deutlich verbessert und Redundanzen im Suchergebnis weitestgehend unterbunden.It Object of the present invention to provide measures by a skillful division and use of an available memory, on the one hand the for the search required storage space and the other for the search needed Significantly reduce CPU time. Furthermore, by the presented Approach the search result in terms of accuracy significantly improved and redundancies in the search result as far as possible prevented.
Gelöst wird die Aufgabe erfindungsgemäß durch die Merkmale der – Patentansprüche.Is solved the task according to the invention the features of the - claims.
Vorteilhafte Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen angegeben.advantageous Further developments of the invention are specified in the dependent claims.
Zwei Ausführungsbeispiele der Erfindung werden im folgenden anhand der Zeichnung näher erläutert.Two embodiments The invention will be explained in more detail below with reference to the drawing.
Dabei zeigenthere demonstrate
Eine
Vielzahl von Rechercheuren R greifen über das Internet auf die Datenbank
des Datenbankinhabers A zu. Des weiteren ist an das Internet ein Datenbankverwalter
SIP angeschlossen, der ebenfalls eine Datenverarbeitungseinrichtung
mit einer Datenbank aufweist, in dem jedoch die erste und zweite
hierarchische Klassifikationsbaumstruktur in modifizierter Form
für Zugriffe
durch die Rechercheure R bereitgestellt werden. Ein Rechercheur
kann auf die Datenbank des Datenbankinhabers A zugreifen und mit
der von diesem empfohlenen Vorgehensweise zuerst in der Advanced
Klassifikation (ADV) und danach in der Core Klassifikation (CORE)
suchen. Zu diesem Zweck werden zuerst die Klassifikationsknoten
der Advanced Klasse ermittelt um die Informationselemente der Advanced
Klassen auslesen zu können.
Anschließend
werden die Klassifikationsknoten der Core Klasse ermittelt bzw.
vom Rechercheur ausgewählt
um wie derum die Informationselemente der Core Klasse auslesen zu
können.
Das Ergebnis enthält
redundante Daten, da gleiche Informationselemnte sowohl den Advanced
Klassen als auch den korrespondierenden, übergeordneten Core Klassen
zugeordnet sind.
Greift
hingegen der Rechercheur R auf die Datenbank der Fa. SIP zu, so
werden ebenfalls die Informationselemente der ausgewählten Advanced Klassen
ermittelt. Anschließend
wird mindestens ein korrespondierender, übergeordneter Knoten der Core
Klasse ermittelt und die diesem zugeordneten Informationselemente
aus der Core Klasse ausgelesen. Da die redundaten Informationselemente
bereits entfernt wurden, können
bei der Ermittlung der Informationselemente aus der Core Klasse
keine redundanten Informationselemente gefunden werden. Die Ermittlung
der Informationselemente ist wie in
In
Die Knoten d.h. Klassifikatoren der ersten hierarchischen Klassifikationsbaumstruktur CORE sind als hierarchischer Oberbau auch in der zweiten hierarchischen Klassifikationsbaumstruktur ADV enthalten. Zusätzlich hingegen wird das technische Teiluntergebiet H01B/00 durch drei weitere technische Teiluntergebiete, die jeweils die Hierarchiestufe –5 tragen, unterteilt. Dieses sind im Beispiel die Klassifikatoren d.h. Knoten mit den Bezeichnungen H01B/00/001, H01B/00/002 und H01B/00/003. Außerdem ist in der zweiten Klassifikationsbaumstruktur ADV das Teiluntergebiet H01C durch zwei weitere Teiluntergebiete H01C/00 und H01C/01, beide in der Hierarchiestufe –4, unterteilt.The Node i. Classifiers of the first hierarchical classification tree CORE are as hierarchical superstructure also in the second hierarchical Classification Tree ADV included. In addition, the technical Sub-area H01B / 00 through three further technical sub-areas, which each carry the hierarchy level -5, divided. This In the example, the classifiers i. Nodes named H01B / 00/001, H01B / 00/002 and H01B / 00/003. Furthermore in the second classification tree structure ADV is the sub-sub-area H01C through two further sub-areas H01C / 00 and H01C / 01, both in the hierarchy level -4, divided.
Bei der Zuordnung von Klassifikatoren zu Schutzrechten handelt es sich um eine wechselseitige Zuordnung, das heißt man kann auch von einer Zuordnung der Klassifikatoren zu Schutzrechten sprechen. Für eine vereinfachte Veranschaulichung der Zuordnung wird in der Zeichnung einem Klassifikator d.h. Knoten eine Blase zugeordnet, in der diejenigen Schutzrechte symbolisch mit #... bezeichnet sind, die diesem Knoten d.h. Klassifikator zugeordnet sind. In der ersten hierarchischen Klassifikationsbaumstruktur CORE sind im Beispiel dem Knoten H01B/00 die Schutzrechte mit den symbolischen Bezeichnungen #010, #001 #002, #003, #004, #005, #006, #009 zugeordnet. Dem Knoten H01C sind die Schutzrechte mit den symbolischen Bezeichnungen #022, #023, #025 zugeordnet.at The assignment of classifiers to IP rights is to a mutual assignment, that is one can also of an assignment classifiers on IP rights. For a simplified illustration of the Assignment in the drawing is a classifier, i. node associated with a bubble in which those property rights symbolic are denoted by #. Classifier are assigned. In the first hierarchical classification tree CORE are in the example the node H01B / 00 the protection rights with the symbolic ones # 010, # 001 # 002, # 003, # 004, # 005, # 006, # 009 assigned. The node H01C is protected by the symbolic designations # 022, # 023, # 025 assigned.
In der zweiten hierarchischen Klassifikationsbaumstruktur ADV findet sich dagegen in dem Knoten H01B/00 eine Zuordnung des Schutzrechtes mit der symbolischen Bezeichnung #010. In dem Knoten H01B/00/001 finden sich zugeordnet die Schutzrechte mit den symbolischen Bezeichnungen #001 #002 #003. In dem Knoten H01B/00/002 zugeordnet finden Sie die Schutzrechte mit den symbolischen Bezeichnungen #004 und #005. Zum Knoten H01B/00/003 findet sich die Zuordnung des Schutzrechts mit der symbolischen Bezeichnung #006. Des weiteren ist dem Knoten H01C/00 das Schutzrecht mit der symbolischen Bezeichnung #022 und dem Knoten H01C/01 das Schutzrecht mit der symbolischen Bezeichnung #023 zugeordnet.In the second hierarchical classification tree structure ADV, however, an assignment of the protection right with the symbolic name # 010 is found in the node H01B / 00. In the node H01B / 00/001 are assigned the protection rights with the symbolic designations # 001 # 002 # 003. In the node H01B / 00/002 you find the protection rights with the symbolic designations # 004 and # 005. For the node H01B / 00/003 you can find the assignment of the protection right with the symbolic designation # 006. Furthermore, the node H01C / 00 has the protection right with the symbolic name # 022 and the node H01C / 01 the protection right with the symboli associated with the name # 023.
In
In der ersten hierarchischen Klassifikationsbaumstruktur CORE werden die Zuordnungen zu denjenigen Knoten d.h. Klassifikatoren überprüft, die hierarchisch als Abschlußknoten anzusehen sind. Dies sind entweder Knoten d.h. Klassifikatoren, bei denen das von ihnen bezeichnete technische Teilgebiet keine weitere Untergliederung erfährt und/oder Knoten die als wichtige Zuordnungsknoten bestimmt werden. Am Beispiel sind als Abschlußknoten in der ersten hierarchischen Klassifikationsbaumstruktur CORE die Knoten H01A und H01C der Hierarchiestufe –3 sowie die Knoten H01B/00 und H01B/01 der Hierarchiestufe –4 anzusehen. Diese Knoten werden auch als hierarchische Abschlussknoten bezeichnet.In the first hierarchical classification tree CORE the assignments to those nodes i. Classifiers checked hierarchically as termination node to be considered. These are either nodes i. classifiers for which the technical sub-area designated by them does not exist further subdivision learns and / or nodes that are designated as important allocation nodes. The example is as a termination node in the first hierarchical classification tree CORE the Nodes H01A and H01C of hierarchy level -3 and nodes H01B / 00 and H01B / 01 of hierarchy level -4. These knots are also called hierarchical terminal nodes.
Gemäß dem ersten
Ausführungsbeispiel
der Erfindung werden die den hierarchischen Abschlußknoten
H01B/00; H01C zugeordneten Informationselemente (im Beispiel sind
dies die symbolischen Bezeichnungen der zugeordneten Schutzrechte)
dann gelöscht
oder als gelöscht
markiert, wenn sie in der zweiten hierarchischen Klassifikationsbaumstruktur ADV
dem gleichen Abschlussknoten H01B/00; H01C oder weiteren Knoten,
die sich in wenigstens einer Hierarchiestufe unter dem betreffenden
Abschlußknoten
befinden, zugeordnet sind. Damit wird Speicherplatz wie in
Basierend
auf dieser Modifizierung der ersten und zweiten Klassifikationsbaumstruktur
CORE; ADV kann eine datenverarbeitungstechnische Suche dann wie
folgt erfolgen. Ausgehend von dem von einem Rechercheur anhand eines
Suchklassifikators z.B. H01B/00/002, spezifizieren technischen Teiluntergebiet,
wird zunächst
in der zweiten hierarchischen Klassifikationsbaumstruktur ADV nach
dem Suchklassifikator, d.h. Knoten, gesucht und die diesem Knoten
zugeordneten Informationselemente, also im vorliegenden Fall die
symbolischen Bezeichnungen #004 und #005 als Suchergebnis ausgegeben.
Wie in
Für den Fall, daß das Suchergebnis nicht zufriedenstellend ist, wird in einem zweiten Schritt in der Hierarchie nach oben der nächste als Sammelknoten markierte Knoten und/oder Knoten die als wichtige Zuordnungsknoten bestimmt wurden – in dem vorliegenden Ausführungsbeispiel ist es H07B/00 – ermittelt und unter diesem ermittelten Sammelknoten in der ersten Klassifikationsbaumstruktur CORE nach Zuordnungen gesucht. Im Ausführungsbeispiel ist nur noch die Zuordnung zu dem Informationselement mit der symbolischen Bezeichnung #009 diesem Knoten gültig zugeordnet. Die symbolische Bezeichnung #009 wird dann als weiteres Suchergebnis zu den im ersten Schritt ermittelten symbolischen Bezeichnungen #004, #005 in einen Anzeigespeicher übertragen und an den Rechercheur als Ergebnis übermittelt.In the case, that this Search result is not satisfactory, will be in a second Step up in the hierarchy, the next one marked as the collection node Nodes and / or nodes that are designated as important mapping nodes were - in the present embodiment is it H07B / 00 - determined and below this determined collection node in the first classification tree CORE searched for assignments. In the embodiment is only the assignment to the information element with the symbolic name # 009 valid for this node assigned. The symbolic designation # 009 will then be another one Search result for the symbolic names determined in the first step # 004, # 005 transferred to a display memory and to the searcher transmitted as result.
Wie in diesem Beispiel dargestellt, ergibt sich durch dieses Verfahren eine Reduzierung der Datenmenge um mehr als 50%. Dies wird deshalb erreicht, da auch die Informationselemente aus den zu dem ausgewählten parallelen Knoten nicht angezeigt werden. In dem Beispiel sind das die Informationselemente zu den Knoten H01B 00/001 und H01B 00/003.As shown in this example results from this method a reduction of the data volume by more than 50%. This is why achieved, as well as the information elements from the parallel to the selected Nodes are not displayed. In the example, these are the information elements to nodes H01B 00/001 and H01B 00/003.
Da
es sich bei der IPC tatsächlich
zur Zeit um ca. 105.000.000 Zuordnungen zur Core und ca. 104.000.000
Zuordnungen zur Advanced Klassifikation handelt, ergibt dies einen
Speicherbedarf ohne der vorliegenden Erfindung, ausgehend von dem
in
Der
Speicherplatz ergäbe
wie in
Mit
der Erfindung ergibt sich, wie in
Der
Speicherplatz ergäbe,
wie in
Zusätzlich zur Speicherplatzersparnis und der damit verbundenen schnelleren Ermittlung der Informationselemente wird die CPU Belastung auch durch die redundanzfreie Ermittlung der Informationselemente reduziert. Diese Entlastung ergibt sich nicht nur durch das Auslesen der reduzierten Informationselemente. Auch der Aufwand für die Entfernung der Redundanzen entfällt und es müssen weniger Daten zum Rechercheur übertragen werden.In addition to Space savings and the associated faster detection Of the information elements, the CPU load is also due to the redundancy-free Determination of information elements reduced. This relief does not only result from reading the reduced information elements. Also the effort for the removal of the redundancies is eliminated and less is required Transfer data to the researcher become.
Mit diesem Verfahren wird die Datenmenge in der Datenbank des Datenbankverwalters SIP verringert. Zugleich laufen die Suchvorgänge beträchtlich schneller ab, d.h. es wird weniger CPU-Zeit benötigt. Die Auswertung des Suchergebnisses beim Rechercheur R im Hinblick auf redundante Informationselemente entfällt, wodurch auch der Bearbeitungsaufwand beim Rechercheur R geringer wird.With This procedure records the amount of data in the database of the database administrator SIP reduced. At the same time, the searches are considerably faster, i. it gets less CPU time needed. The evaluation of the search result by the researcher R with regard to redundant information elements are eliminated, which also reduces the processing effort the researcher R becomes smaller.
Das Suchverfahren läßt sich zudem noch in der Geschwindigkeit erhöhen, wenn die einem hierarchischen Abschlußknoten H01B/00, H01C der ersten hierarchischen Klassifikationsbaumstruktur CORE gültig zugeordneten Informationselemente (#009 für den Knoten H01/00 und #025 für den Knoten H01C) den jeweiligen als Sammelknoten markierten Knoten der zweiten hierarchischen Klassifikationsbaumstruktur ADV zugeordnet werden (#009 zu dem Knoten H01/00 und #025 zu dem Knoten H01C). Die auf diese Weise in die zweite hierarchischen Klassifikationsbaumstruktur ADV übertragenen Zuordnungen werden als übertragen markiert, um bei der Suche ein Unterscheidung vornehmen zu können, ob das Informationselement im ersten Suchschritt schon ermittelt und ausgegeben wurde. Die als übertragen markierten Informationselemente werden erst im zweiten Schritt als Suchergebnis ausgegeben.The Search method can be also increase in speed if the one hierarchical termination node H01B / 00, H01C of the first hierarchical classification tree CORE valid associated information elements (# 009 for node H01 / 00 and # 025 for the Node H01C) the respective nodes marked as collection nodes associated with the second hierarchical classification tree structure ADV (# 009 to node H01 / 00 and # 025 to node H01C). The in this way into the second hierarchical classification tree ADV transmitted Assignments are transferred as marked in order to make a distinction in the search whether the information element already determined in the first search step and was issued. The as transferred marked information elements are only in the second step as Search result output.
In
Damit
der aus der ersten Klassifikationsbaumstruktur CORE stammende Ursprung
der Informationselemente #025, #009 beim Suchen erkennbar ist, werden – wie bereits
erwähnt – die von
der ersten in die zweite Klassifikationsbaumstruktur CORE; ADV übertragenen
Zuordnungen #009, #025 als solche markiert siehe in
Im Falle einer Übertragung von Informationselementen von der ersten in die zweite Klassifikationsbaumstruktur ADV wird die erste Klassifikationsbaumstruktur CORE bei einer Suche nicht mehr genutzt. Sie muß im Grunde also auch nicht von dem Datenbankverwalter SIP zur Verfügung gestellt werden. Die Reduzierung des Speicherbedarfes durch den Wegfall des Spei cherbedarfs für die Core Klassifikationsbaumstruktur wird durch das Hinzufügen der Kennzeichnung an den Speicher für die Informationselemente ersetzt. Bei 105.000.000 Informationselementen erhöht sich der Speicherbedarf gegenüber dem 1. Verfahren der Erfindung um ca. 105.000.000 Byte (die Kennzeichnung benötigt maximal 1 Byte). Allerdings verringern sich die Zugriffe und somit die CPU Belastung bei der Ermittlung der zugeordneten Informationselemente für die Core und Advanced Klassifizierung, da jetzt nur noch eine Klassifikationsbaumstruktur durchlaufen werden muß.in the Case of a transmission of information elements from the first to the second classification tree ADV becomes the first classification tree CORE in a search not used anymore. She must be in So basically not made available by the database administrator SIP become. The reduction of the storage requirements by eliminating the Storage needs for the core classification tree is made by adding the label to the store for replaced the information elements. With 105,000,000 information elements elevated the memory requirement compared to the 1. Method of the invention by about 105,000,000 bytes (the label needed maximum 1 byte). However, the traffic decreases and thus the CPU load in the determination of the assigned information elements for the Core and Advanced classification, because now only one classification tree structure must be passed through.
Um eine Bearbeitung der ersten hierarchischen Klassifikationsbaumstruktur CORE durch Löschen oder durch Gelöscht-Markierungen zu vermeiden, kann im Rahmen eines zweiten Ausführungsbeispiels die erste hierarchische Klassifikationsbaumstruktur CORE unverändert belassen werden. In diesem Fall werden in der zweiten hierarchischen Klassifikationsbaumstruktur ADV an einen jeweiligen Sammelknoten H01b/00; H01c solche Zuordnungen angefügt, die an dem korrespondierenden Abschlußknoten H01b/00; H01c der ersten Klassifikationsbaumstruktur CORE vorhanden sind, jedoch in der zweiten Klassifikationsbaumstruktur ADV nicht bereits dem betreffenden Sammelknoten H01b/00; H01c oder hierarchisch unter diesem befindlichen weiteren Knoten H01b/00/001, H01b/00/002, H01b/00/003; H01c/00, H01c/01 zugeordnet sind.Around a processing of the first hierarchical classification tree structure CORE by deleting or by using deleted marks to avoid can in a second embodiment, the first hierarchical Classification tree CORE be left unchanged. In this Case will be in the second hierarchical classification tree ADV to a respective collection node H01b / 00; H01c added such mappings that at the corresponding termination node H01b / 00; H01c the first Classification tree CORE are present, but in the second Classification Tree ADV not already the respective collection node H01B / 00; H01c or hierarchically below this one Nodes H01b / 00/001, H01b / 00/002, H01b / 00/003; H01c / 00, H01c / 01 assigned are.
In
Claims (8)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102006008287A DE102006008287A1 (en) | 2006-02-22 | 2006-02-22 | Information investigation method involves storing information into two hierarchical classification structures, and every double stored information is deleted or marked as deleted |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102006008287A DE102006008287A1 (en) | 2006-02-22 | 2006-02-22 | Information investigation method involves storing information into two hierarchical classification structures, and every double stored information is deleted or marked as deleted |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE102006008287A1 true DE102006008287A1 (en) | 2007-08-30 |
Family
ID=38319753
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102006008287A Withdrawn DE102006008287A1 (en) | 2006-02-22 | 2006-02-22 | Information investigation method involves storing information into two hierarchical classification structures, and every double stored information is deleted or marked as deleted |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE102006008287A1 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030016466A1 (en) * | 2001-07-17 | 2003-01-23 | International Business Machines Corporation | Method and apparatus for performing position error signal conditioning of LTO media servo format written-in velocity variation |
| US6757678B2 (en) * | 2001-04-12 | 2004-06-29 | International Business Machines Corporation | Generalized method and system of merging and pruning of data trees |
| WO2004057491A1 (en) * | 2002-12-20 | 2004-07-08 | Redbank Manor Pty Ltd | Search engine result reporter |
-
2006
- 2006-02-22 DE DE102006008287A patent/DE102006008287A1/en not_active Withdrawn
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6757678B2 (en) * | 2001-04-12 | 2004-06-29 | International Business Machines Corporation | Generalized method and system of merging and pruning of data trees |
| US20030016466A1 (en) * | 2001-07-17 | 2003-01-23 | International Business Machines Corporation | Method and apparatus for performing position error signal conditioning of LTO media servo format written-in velocity variation |
| WO2004057491A1 (en) * | 2002-12-20 | 2004-07-08 | Redbank Manor Pty Ltd | Search engine result reporter |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69127011T2 (en) | Storage management method using a tree structure | |
| DE69430027T2 (en) | Efficient storage of an object in a file system | |
| DE69704085T2 (en) | OPTIMIZING ACCESS TO MULTIPLEXED DATA FLOWS | |
| DE69526751T2 (en) | Multiprocessor system for the local administration of address translation tables | |
| DE69737709T2 (en) | Method and device for information processing and memory allocation arrangement | |
| DE60000471T2 (en) | INTELLIGENT DATA STORAGE MANAGER | |
| DE2459006C2 (en) | Device for forming an absolute address in a data processing system | |
| DE19810843B4 (en) | Method and access device for determining the storage address of a data value in a storage device | |
| DE69033064T2 (en) | Procedure for assigning real pages to virtual pages with different page sizes | |
| DE69231113T2 (en) | Storage methods for bibliographical information about data from a finite text source, and in particular document entries for use in a search system for full-text documents | |
| EP1183690B1 (en) | Memory array with address scrambling | |
| DE2758829C2 (en) | Data processing system with several processors | |
| DE102007037646A1 (en) | System and method for indexing, searching and retrieving databases | |
| DE69123493T2 (en) | Processing method and device to create a file name from a logical to a correct name | |
| DE102005019842B4 (en) | System and method for sequentially writing data to a flash memory | |
| DE602004008240T2 (en) | Method for managing defective memory blocks in a non-volatile memory and non-volatile memory for carrying out the method | |
| DE112019000627T5 (en) | Storage structure-based coherency directory cache | |
| DE10120615B4 (en) | Dynamic memory management for objects of different sizes | |
| DE102006008287A1 (en) | Information investigation method involves storing information into two hierarchical classification structures, and every double stored information is deleted or marked as deleted | |
| EP0134822A1 (en) | Digital memory | |
| DE19718479C1 (en) | Chip card with memory access maximization and protocol | |
| DE69637329T2 (en) | STORAGE MANAGEMENT SYSTEM AND METHOD | |
| WO2008071733A1 (en) | Method for reading out data from a storage medium | |
| EP0912952A1 (en) | Database system and method of organizing an n-dimensional data stock | |
| DE69903496T2 (en) | Flexible deletion of objects in an environment with limited resources |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
| 8181 | Inventor (new situation) |
Inventor name: WAGNER, ALEXANDER, 83624 OTTERFING, DE |
|
| 8127 | New person/name/address of the applicant |
Owner name: SIP GMBH, 83607 HOLZKIRCHEN, DE |
|
| 8139 | Disposal/non-payment of the annual fee |