DE19635351A1 - Data conversion procedures - Google Patents
Data conversion proceduresInfo
- Publication number
- DE19635351A1 DE19635351A1 DE19635351A DE19635351A DE19635351A1 DE 19635351 A1 DE19635351 A1 DE 19635351A1 DE 19635351 A DE19635351 A DE 19635351A DE 19635351 A DE19635351 A DE 19635351A DE 19635351 A1 DE19635351 A1 DE 19635351A1
- Authority
- DE
- Germany
- Prior art keywords
- data
- application
- analysis
- file
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Die Erfindung betrifft ein Verfahren zum Konvertieren von Daten zwischen zwei Anwendungen beziehungsweise Softwarepaketen, die unterschiedliche Datenformate benutzen, nach dem Oberbegriff des Patentanspruches 1.The invention relates to a method for converting data between two applications or software packages that use different data formats, according to the generic term of claim 1.
Der Erfindung liegt das grundsätzliche Problem der Inkompatibi lität von Daten aus verschiedenen Anwendungen bzw. Softwarepa keten zugrunde. Viele Programme besitzen ein eigenes Datenfor mat für die interne Verarbeitung der Daten. Dieses ist aber nur selten von anderen Programmen zur Weiterverarbeitung einlesbar. Der Anwender steht vor dem Problem, beliebige Daten von Anwen dung A nach Anwendung B zu transportieren, wobei ihm im allge meinen die Datenformate der Anwendungen A und B nicht bekannt sind. Bei den zu transportierenden Daten handelt es sich meist um Datenbanken, es können aber auch im weitesten Sinne Anwen dungsdaten auftreten, wie zum Beispiel Textdateien, CAD-Daten, Sound-Formate, Kalkulationsprogramme und andere.The invention is the fundamental problem of incompatibility lity of data from different applications or software pa keten under. Many programs have their own data form mat for the internal processing of the data. But this is only rarely readable by other programs for further processing. The user faces the problem of any data from users to transport manure A to application B, with him generally mean the data formats of applications A and B are not known are. The data to be transported is mostly databases, but it can also be used in the broadest sense data, such as text files, CAD data, Sound formats, spreadsheets and others.
Um den vorstehend beschriebenen Datentransfer realisieren zu können, bieten moderne und flexible Programme die Möglichkeit, Daten der gängigsten Formate einzulesen und in ihrem eigenen Format weiterzuverarbeiten. Um einen Austausch zwischen ver schiedenen Anwendungen, beispielsweise auch von anderen Be triebssystemen, zu ermöglichen, ist bei einigen Softwarepaketen eine Im- und Exportfunktion im ASCII-Format oder einem anderen gängigen Format vorgesehen. To implement the data transfer described above modern and flexible programs offer the possibility Read data in the most common formats and in their own Format to process further. To exchange between ver different applications, for example from other Be drive systems is possible with some software packages an import and export function in ASCII format or another common format provided.
Darüber hinaus gibt es viele Hilfsprogramme, die Datenkonvertie rungen von einem Format A nach einem Format B erlauben. Diese haben einen fest vorgegebenen Konvertierungsalgorithmus imple mentiert, welcher der jeweiligen Anwendung entspricht. Der An wender kann nun wählen, zwischen welchen Datenformaten A und B das Programm eine Konvertierung durchführen soll. Diese Hilfs programme können teilweise die Art der Datei bzw. die Art der Anwendung A automatisch anhand von einfachen spezifischen Merk malen bei der Dateiform, wie zum Beispiel der Dateiform und fe sten Infostrukturen und Versionskennungen innerhalb der Datei, erkennen.In addition, there are many utilities that convert data Allow changes from format A to format B. This have a fixed conversion algorithm imple mented which corresponds to the respective application. The An wender can now choose between which data formats A and B the program should perform a conversion. This auxiliary programs can partially determine the type of file or the type of Application A automatically based on simple specific notes paint with the file form, such as the file form and fe most infostructures and version IDs within the file, detect.
Ein spezielles Verfahren zur Datenkonvertierung ist bereits aus der DE 41 28 940 A1 bekannt. Mit Hilfe dieses Verfahrens werden druckaufbereitete digitale Daten eines mit einer Text- und/oder Graphik-Software am Bildschirm einer Datenverarbeitungsanlage erstellten Dokumentes in faksimilespezifische Übertragungsdaten konvertiert. Dieses Verfahren ersetzt die umständliche, zeit aufwendige und fehlerbehaftete Methode, ein am Bildschirm einer Datenverarbeitungsanlage erstelltes Dokument an einem an der Datenverarbeitungsanlage angeschlossenen Drucker auszudrucken und anschließend das auf Papier gedruckte Dokument durch eine optoelektronische Einheit eines Faksimilegerätes abzutasten. Die Abtastdaten der optoelektronischen Einheit werden dann fak similespezifisch codiert und übertragen.A special procedure for data conversion is already out known from DE 41 28 940 A1. With the help of this procedure prepared digital data one with a text and / or Graphics software on the screen of a data processing system created document in facsimile-specific transmission data converted. This procedure replaces the cumbersome, time elaborate and error-prone method, one on the screen Data processing system created document on one at the Data processing system to print connected printer and then the document printed on paper by a to scan the optoelectronic unit of a facsimile device. The scan data of the optoelectronic unit are then fak coded and transmitted simile-specific.
Sowohl die in den Anwendungen integrierten Konvertierungspro gramme als auch die eigenständigen Hilfsprogramme zur Datenkon vertierung haben beide den Nachteil, daß nur eine begrenzte Auswahl an Datenformaten zur Verfügung gestellt wird, die mit den festen Algorithmen des Programmes konvertiert werden kön nen. Diese Konvertierungen berücksichtigen in der Regel nicht die Elementinhalte und deren Verknüpfungen, wie beispielsweise Zeicheninhalt und Zeichenlänge, sprachliche Aspekte, Existenz regeln, Elementumformungen, Sprachraum, Elementmuster und Ele mentinterpretation. Außerdem sind die meisten Datenformate nicht sehr gut standardisiert, und viele Anwendungen bringen ihre eigenen Datenstrukturen ein. Die Datenelemente sind für die Quellanwendung optimiert und können bei der Zielanwendung Fehler bei der Verarbeitung verursachen, die aufwendig vom An wender von Hand korrigiert werden müssen oder sogar eine Wei terverarbeitung der Daten unmöglich machen.Both the conversion pro programs as well as the independent auxiliary programs for data con Both have the disadvantage that only a limited number Selection of data formats is made available with the program's fixed algorithms can be converted nen. As a rule, these conversions do not take into account the element contents and their links, such as Character content and length, linguistic aspects, existence rules, element transformations, language space, element patterns and ele interpretation of the ment. Also, most of the data formats not very well standardized, and bring many applications their own data structures. The data elements are for The source application is optimized and can be used in the target application Processing errors cause time-consuming work need to be corrected by hand or even a white make processing of the data impossible.
Es ist Aufgabe der Erfindung, dem Anwender ein Verfahren zur Datenkonvertierung zur Verfügung zu stellen, das eine flexible Datenangleichung von verschiedenen Anwendungsprogrammen mit relativ einfachen Mitteln ermöglicht.It is an object of the invention to provide the user with a method for To provide data conversion that is flexible Data adjustment from different application programs with allows relatively simple means.
Diese Aufgabe ist erfindungsgemäß durch die Merkmale des Pa tentanspruchs 1 gelöst.This object is achieved by the features of Pa claim 1 solved.
Erfinderische Weiterbildungen und Ausgestaltungen der Erfindung sind in den Unteransprüchen beschrieben.Inventive developments and refinements of the invention are described in the subclaims.
Die erfindungsgemäße Konvertierungssoftware ist dabei in der Lage, Daten eines beliebigen Formates A in Daten eines beliebi gen Formates B halb- und auch vollautomatisch zu transferieren, wobei im Prinzip keine Einschränkung bezüglich der möglichen Datenformate auftritt. Da die Datenformate A und B von der er findungsgemäßen Konvertierungssoftware über die Grobstruktur der Daten hinaus sowohl halb- als auch vollautomatisch in deren Feinstruktur analysiert werden, ist die mögliche Fehlerquote beim Datentransfer von Anwendung A nach Anwendung B deutlich geringer als bei den üblichen Hilfsprogrammen. Zusätzlich sind Datenveränderungen und Datenanpassungen in diversen Ebenen, beispielsweise in der Datei-, Satz-, Elementebene und weitere, vorgesehen, um die Fehlerquote bei der Zielanwendung zu verrin gern.The conversion software according to the invention is in the Location, data of any format A in data of any to transfer formats B semi and fully automatically, in principle, no limitation regarding the possible Data formats occur. Since the data formats A and B from the he conversion software according to the invention via the rough structure of the data both semi and fully automatically in their Fine structure to be analyzed is the possible error rate when transferring data from application A to application B clearly less than with the usual aid programs. In addition are Data changes and data adjustments at various levels, for example in the file, record, element level and others, provided to reduce the error rate in the target application gladly.
Der Aufbau des erfindungsgemäßen Verfahrens zur Datenkonver tierung ist in der Zeichnung dargestellt und nachstehend er läutert. Darin zeigen: The structure of the method for data conversion according to the invention tion is shown in the drawing and below purifies. In it show:
Fig. 1 das Informationsablaufdiagramm des Verfahrens zum Datentransfer;1 shows the information flow diagram of the method for data transfer;
Fig. 2 ein Diagramm zur Strukturanalyse des Verfahrens mit detailliertem Strukturaufbau; Fig. 2 is a diagram for analyzing the structure of the process with detailed structural assembly;
Fig. 3 den Syntheseverlauf des Verfahrens für die Bil dung der Daten B aus den Daten A; Fig. 3 shows the course of the synthesis procedure for Bil dung of the data B from the data A;
Fig. 4 das Informationsablaufdiagramm gemäß Fig. 1 in detaillierterer Darstellung. FIG. 4 shows the information flow diagram according to FIG. 1 in a more detailed representation.
Die Fig. 1 zeigt in Form eines Informationsablaufdiagrammes den Ablauf eines Datentransfers mit Hilfe des erfindungsgemäßen Verfahrens bzw. der erfindungsgemäßen Konvertierungssoftware (1). Ein Anwender möchte beliebige Quelldaten Q (2), die von der Anwendung A (3) erzeugt und exportiert werden, zur Anwen dung B (4) transportieren, um sie dort weiterzuverarbeiten. Jede der Anwendungen A (3) und B (4) kann ihre Daten in einem für sie selbst verständlichen Format im- und exportieren; dies ist in den Anwendung (3) und (4) implementiert, um Daten zwi schen Anwendungen der gleichen Art auf verschiedenen Arbeits plätzen auszutauschen. Fig. 1 shows in the form of an information flow diagram the procedure of a data transfer by the method of the invention or the conversion software (1) according to the invention. A user would like to transport any source data Q ( 2 ), which are generated and exported by application A ( 3 ), to application B ( 4 ) in order to process them there. Each of the applications A ( 3 ) and B ( 4 ) can import and export their data in a format that they can understand; this is implemented in applications ( 3 ) and ( 4 ) to exchange data between applications of the same type in different workplaces.
Der Anwender kann nun jeweils einen Probeexport von beispiels weise etwa 500 Datensätzen aus dem Datenbestand der Anwendung A (3) und dem der Anwendung B (4) erzeugen. So entstehen das Vorlagefile VA (5) aus Anwendung A (3) und Vorlagefile VB (6) aus Anwendung B (4). Voraussetzung für das Funktionieren des Verfahrens zur Datenkonvertierung ist dabei, daß die Anwendung B (4) ihr eigenes, von ihr erzeugtes, exportiertes Vorlagefile VB (6) wieder importieren kann, was aber selbstverständlich funktionieren sollte. Jetzt können die Vorlagefiles VA (5) und VB (6) mittels der Konvertierungssoftware (1) analysiert werden (7).The user can now generate a sample export of, for example, approximately 500 data records from the database of application A ( 3 ) and that of application B ( 4 ). This creates template file VA ( 5 ) from application A ( 3 ) and template file VB ( 6 ) from application B ( 4 ). A prerequisite for the functioning of the data conversion method is that application B ( 4 ) can import its own exported template file VB ( 6 ), which it has produced and exported, which should of course work. Now the template files VA ( 5 ) and VB ( 6 ) can be analyzed ( 7 ) using the conversion software ( 1 ).
Es wäre grundsätzlich auch ein Datenaustausch von Anwendung A (3) zu Anwendung B (4) direkt möglich ohne den Weg über die Datei (zum Beispiel OLE, DDE und weitere) zu gehen. Hier wird dann also der Umweg über die Dateien gespart, während die Ana lyse- und Verknüpfungsprozesse natürlich wirksam bleiben sind.In principle, it would also be possible to exchange data directly from application A ( 3 ) to application B ( 4 ) without going through the file (for example OLE, DDE and others). This saves the detour through the files, while the analysis and linking processes remain effective, of course.
Da der Anwender im allgemeinen nichts über den Aufbau der Da tenstrukturen und über die Datenstrukturen der Anwendungen A (3) und B (4) weiß, und darüber auch nichts wissen möchte, sind für die Analyse komplexe Algorithmen erforderlich, um den An wender möglichst von Entscheidungen zu entlasten und den Analy se- und Verknüpfungsprozeß (8) zu automatisieren oder zumindest zum Teil zu automatisieren. Die implementierten Algorithmen können problemlos erweitert werden, um auch neue, in Zukunft auftretende Datenstrukturen analysieren zu können. Der Umfang der Analyse (8) der Strukturen wird weiter unten anhand von Fig. 2 näher erläutert. Nach dem Analyse- und Verknüpfungsprozeß (8) kennt die Konvertierungssoftware (1) die Datenstruktur der Vorlagefiles VA (5) und VB (6) und auch die notwendigen Ver knüpfungen zwischen den Elementen der Vorlagefiles VA (5) und VB (6). Dieses Konvertierungsmuster für die Übertragung der Daten von Anwendung A (3) nach Anwendung B (4) wird als Muster ablaufdatei M abgespeichert.Since the user generally does not know anything about the structure of the data structures and the data structures of applications A ( 3 ) and B ( 4 ), and does not want to know anything about them, complex algorithms are required for the analysis in order to avoid the user from Relieve decisions and automate the analysis and linking process ( 8 ) or at least partially automate. The implemented algorithms can be easily expanded to be able to analyze new, future data structures. The scope of the analysis ( 8 ) of the structures is explained in more detail below with reference to FIG. 2. After the analysis and linking process ( 8 ), the conversion software ( 1 ) knows the data structure of the template files VA ( 5 ) and VB ( 6 ) and also the necessary links between the elements of the template files VA ( 5 ) and VB ( 6 ). This conversion pattern for the transfer of the data from application A ( 3 ) to application B ( 4 ) is stored as a pattern process file M.
Will der Anwender zu einem späteren Zeitpunkt weitere Daten transfers zwischen denselben Anwendungen A (3) und B (4) wie oben erläutert durchführen, so ist es möglich, das eben ermit telte Konvertierungsmuster in Form von Musterablaufdaten M (9) abzuspeichern (10). Somit erübrigt sich für den Anwender beim nächsten Konvertierungsprozeß die Erzeugung der Vorlagefiles VA (5) und VB (6), und die Konvertierungssoftware (1) kann beim Datentransfer ohne Analyseprozeß (8) direkt auf die gesicherten Musterablaufdaten M (9) zurückgreifen und die Musterablaufdaten M (9) wieder einlesen (10).If the user wants to carry out further data transfers between the same applications A ( 3 ) and B ( 4 ) as explained above at a later point in time, it is possible to save the conversion pattern just determined in the form of pattern sequence data M ( 9 ) ( 10 ). Thus, the user does not need to generate template files VA ( 5 ) and VB ( 6 ) in the next conversion process, and the conversion software ( 1 ) can directly access the saved sample sequence data M ( 9 ) and the sample sequence data during data transfer without analysis process ( 8 ) Read M ( 9 ) again ( 10 ).
Wie dazu insbesondere Fig. 4 in Ergänzung zu Fig. 1 zeigt, unterteilt sich die Analysephase sowohl des Vorlagefiles VA (5) als auch des Vorlagefiles VB (6) in eine Grobanalyse, eine fol gende Feinanalyse, eine weitere folgende Subanalyse und so wei ter, um schließlich im Ergebnis zur Endanalyse zu gelangen. An die Analysephase schließt sich dann die Verknüpfungsphase an, in welcher die Analysen der Vorlagefiles verknüpft werden.As shown in particular in FIG. 4 in addition to FIG. 1, the analysis phase of both the template file VA ( 5 ) and the template file VB ( 6 ) is subdivided into a rough analysis, a subsequent fine analysis, a further subsequent sub-analysis and so on to finally arrive at the final analysis. The analysis phase is then followed by the linking phase, in which the analyzes of the template files are linked.
In der Synthesephase (11) wird mit Hilfe des ermittelten Analy se- und Verknüpfungsergebnisses eine Konvertierung der Quellda ten Q (2) in die Zieldaten Z (12) erreicht. Im letzten Schritt kann die Anwendung B (4) die Zieldaten Z (12) importieren, da sie in dem von der Anwendung B (4) im- und exportierbaren Da tenformat vorliegen, und weiterverarbeiten.In the synthesis phase ( 11 ), a conversion of the source data Q ( 2 ) into the target data Z ( 12 ) is achieved with the aid of the determined analysis and linking result. In the last step, application B ( 4 ) can import the target data Z ( 12 ), since they are in the data format that can be imported and exported by application B ( 4 ), and process them further.
Bei diesem erfindungsgemäßen Verfahren zur Datenkonvertierung ist es für den Benutzer zudem möglich, durch Verwendung von vom Benutzer definierten Sonderregeln bei der Synthese (11) der Quelldaten Q (2) in die Zieldaten Z (12) Datenveränderungen vorzunehmen. Als Beispiele, und keineswegs vollständig aufge zählt, seien hier nur der Ersatz von ä, ö, ü durch ae, oe, ue und die Umbildung der Elemente [Sehr geehrter] und [Herr xyz] in die Elemente [Sehr geehrter Herr] und [xyz] genannt. Es sind hierbei natürlich auch sehr komplexe Datenveränderungen mög lich, die am besten mit dem Begriff des "Morphing" aus der Bildverarbeitung verglichen werden können, der die Wandlung von einem Muster A nach Muster B ohne Informationsverluste be schreibt.With this method according to the invention for data conversion, it is also possible for the user to make data changes by using special rules defined by the user in the synthesis ( 11 ) of the source data Q ( 2 ) into the target data Z ( 12 ). As examples, and by no means fully listed, here are just the replacement of ä, ö, ü by ae, oe, ue and the transformation of the elements [Dear] and [Mr. xyz] into the elements [Dear Mr.] and [ xyz] called. Of course there are also very complex data changes possible, which can best be compared with the term "morphing" from image processing, which describes the change from pattern A to pattern B without loss of information.
Wie Fig. 1 zeigt, wird die zu exportierende Quelldatei (28) der Anwendung A (3) in die Quellanalyse (29) gegeben. Nach er folgter Analyse für automatische Regelbildung und Verknüpfungen im Block (8) wird die Zielanalyse (11) erstellt. Die konver tierten Daten werden sodann in die importierbare Zieldatei (30) gegeben. Bei dem Vorgang des Exportierens der Quelldatei (28) in die Zieldatei (11) mittels der Musterablaufdaten M ist eine Quell- oder Zielanalyse nicht mehr erforderlich. Auch die Re gelbildung und die Verknüpfungen wurden in diesem Fall bereits mit den Vorlagefiles VA (5) und VB (6) erzeugt. Bei der Synthe se wird die Quelldatei Q (2) gelesen und mit dem Datenfilter aus den Musterablaufdaten M bearbeitet. Die generierten Daten sätze werden in die Zieldatei geschrieben. Das Datenfilter kann sich externer Dateien zum Abgleich wie auch interner Dateien zum Suchen und Sortieren bedienen.As shown in FIG. 1, the source file ( 28 ) to be exported from application A ( 3 ) is placed in the source analysis ( 29 ). After he has carried out an analysis for automatic rule formation and links in block ( 8 ), the target analysis ( 11 ) is created. The converted data are then placed in the importable target file ( 30 ). In the process of exporting the source file ( 28 ) into the target file ( 11 ) by means of the pattern flow data M, a source or target analysis is no longer necessary. The rule formation and the links were already generated in this case with the template files VA ( 5 ) and VB ( 6 ). In the synthesis, the source file Q ( 2 ) is read and processed with the data filter from the sample sequence data M. The data records generated are written to the target file. The data filter can use external files for comparison as well as internal files for searching and sorting.
In Fig. 2 ist ein Diagramm dargestellt, welches den Struktur aufbau einer allgemeinen Datentransferdatei in detaillierter Form zeigt. Die Analyse (8) der Vorlagefiles VA (5) und VB (6) unterteilt sich in mehrere Phasen. Ausgehend von dem ersten Er kennen der Grobstruktur (13) wird die Dateiform wie bei bisher bekannten Konvertierungsprogrammen zunächst vorklassifiziert. Die intelligente Konvertierungssoftware stellt nun zusätzlich einen Satz von Algorithmen zur Verfügung, der in der Lage ist, automatisch die Feinstruktur (14) der vorliegenden Daten zu er kennen. Die Analyse (8) wird fortgeführt, um auch die Substruk turen (15) innerhalb der Datenelemente (17) zu erkennen.In Fig. 2 a diagram is shown, which construction the structure is a general data transfer file in detailed form. The analysis ( 8 ) of the template files VA ( 5 ) and VB ( 6 ) is divided into several phases. On the basis of the first knowledge of the rough structure ( 13 ), the file form is first pre-classified, as in the case of conversion programs known to date. The intelligent conversion software now also provides a set of algorithms that are able to automatically recognize the fine structure ( 14 ) of the data at hand. The analysis ( 8 ) is continued in order to recognize the substructures ( 15 ) within the data elements ( 17 ).
Wie auch gut erkennbar aus Fig. 3 hervorgeht, dient die Grob struktur (13) dem Erkennen der Filestruktur, der Trennzeichen, der Elementbezeichner, der Zeichenlänge usw. im Dateiraum und im Satzraum (16). In der Grobstruktur (13) werden Dateien nach ihrer Dateiform unterschieden. Die Unterschiede sind zum Bei spiel anhand von Dateiendungen oder Infostrukturen innerhalb der gesamten Datei zu erkennen.As can also be seen clearly from FIG. 3, the rough structure ( 13 ) serves to recognize the file structure, the separators, the element identifiers, the character length, etc. in the file space and in the sentence space ( 16 ). In the rough structure ( 13 ) files are differentiated according to their file form. The differences can be recognized, for example, from file extensions or information structures within the entire file.
Die Feinstruktur (14) dient dem Erkennen von Elementexistenz, Element-Zeicheninhalten, Elementzeichenlänge usw. wie Elemen traum (19) und Zeichenraum (20). Die Feinstruktur (14) bezieht sich auf die Satzebene, die den Aufbau eines einzelnen Daten satzes im sogenannten Satzraum (16) aus den Elementen (17), sowie die Verknüpfungen der Satzelemente (17) untereinander, den sogenannten Satzregelraum (18) beinhaltet. Bei der Merk malsfindung für den Datensatzaufbau und die Datensatzstruktur werden beispielsweise Feldnamen in einem Datensatz (16) analy siert, die Verwendung spezieller Trennsymbole für Elemente (17) und Datensätze (16), die Verwendung von Start- und Stopsymbolen für die Strukturierung innerhalb der Elemente (17) und die An zahl der Elemente (17) pro Datensatz (16) ermittelt.The fine structure ( 14 ) serves to recognize element existence, element character contents, element character length etc. such as element dream ( 19 ) and drawing space ( 20 ). The fine structure ( 14 ) relates to the sentence level, which contains the structure of a single data record in the so-called sentence space ( 16 ) from the elements ( 17 ), as well as the links between the sentence elements ( 17 ), the so-called sentence control space ( 18 ). When finding characteristics for the data record structure and the data record structure, field names in a data record ( 16 ) are analyzed, the use of special separators for elements ( 17 ) and data records ( 16 ), the use of start and stop symbols for structuring within the elements ( 17 ) and the number of elements ( 17 ) per record ( 16 ) determined.
Die Substruktur (15) dient dem Erkennen von Worten und Subele menten mit Sub-Trennern in den einzelnen Elementen, wie Elemen traum (19), Zeichenraum, Wortraum. Die Substruktur unterglie dert sich also nochmals in die Elementebene, dem Elementraum (19), und die Zeichenebene, dem Zeichenraum mit Zahlenraum (20). In der Elementebene (19) werden die Existenzmerkmale für ein Element (17) festgelegt.The substructure ( 15 ) serves to recognize words and sub-elements with sub-separators in the individual elements, such as element dream ( 19 ), drawing space, word space. The substructure is thus broken down again into the element level, the element space ( 19 ), and the drawing level, the drawing space with number space ( 20 ). In the element level ( 19 ) the existential characteristics for an element ( 17 ) are determined.
Als Existenzmerkmale treten zum Beispiel auf: minimale und maximale Datenelement-Zeichenlänge, Datenelement-Existenzvor gaben (muß, kann, darf), zulässige und vorkommende Zeichen in einem Datenelement (17), verwendeter Sprachraum, begrenzte Li stenstrukturen innerhalb von Datenelementen (17), Wortanalysen, etc. Die Zeichenebene (20) gibt die möglichen Auswahlräume für Zahlen, Buchstaben, Sonderzeichen, OEM-Zeichen und andere vor.For example, the following exist as characteristics: minimum and maximum data element character length, data element existence requirements (must, can, may), permissible and occurring characters in a data element ( 17 ), language space used, limited list structures within data elements ( 17 ), Word analysis, etc. The character level ( 20 ) specifies the possible selection spaces for numbers, letters, special characters, OEM characters and others.
So kann zum Beispiel das Element "Arb.Zeit" einenFor example, the "Working Time" element can be a
Demzufolge gibt es in dem Element "Arb.Zeit" offenbar Substruk turen, die durch das Zeichen "/" getrennt sind. Solche und ähn liche Substrukturen werden erkannt und bei der Analyse wie zu sätzliche Elemente mit Bezeichner, nämlich Meier, Müller, Graf, Kemper, und entsprechenden Inhalten behandelt.As a result, there is apparently a substructure in the "Working Time" element doors separated by the "/" character. Such and similar Substructures are recognized and how they are analyzed additional elements with identifiers, namely Meier, Müller, Graf, Kemper, and relevant content treated.
Wie oben an anderer Stelle bereits ausgeführt, enthält das Ele
ment "Anrede" mehrere Wörter:
1. Satz: "Sehr geehrter Herr",
2. Satz: "Sehr geehrte Frau",
3. Satz: "Hallo, Herr" und
4. Satz: "Sehr geehrter Herr Dipl.-Ing".
As already mentioned elsewhere above, the element "title" contains several words:
1st sentence: "Dear Sir",
2nd movement: "Dear Mrs.",
3rd sentence: "Hello, Lord" and
4th sentence: "Dear Mr. Dipl.-Ing".
Diese Substrukturen werden als Wörter in Wortlisten übernommen und gegebenenfalls einzeln weiter nach zusätzlichen Mustern und kegeln analysiert.These substructures are adopted as words in word lists and if necessary individually further according to additional patterns and bowling analyzed.
Zur Verdeutlichung dient ein weiteres Beispiel. Das Element
"Strasse" enthält die Muster
1. Satz: "Hofweg 13",
2. Satz: "Am langen Kant 77" und
3. Satz: "Bremer Strasse 19".Another example serves to illustrate this. The "Street" element contains the patterns
1st movement: "Hofweg 13",
2nd movement: "At the long Kant 77" and
3rd movement: "Bremer Strasse 19".
Diese Substrukturen (15) werden als Worte analysiert und nach Mustern untersucht. Es können so zum Beispiel Straßenname und Hausnummer gesplittet werden.These substructures ( 15 ) are analyzed as words and examined for patterns. For example, street names and house numbers can be split.
Von großer Wichtigkeit ist es, daß sich die Substrukturen (15) auf Objekte in einer Ebene unter den Satzelementen beziehen. Hier werden die Elementinhalte nach weiteren Mustern abgesucht.It is very important that the substructures ( 15 ) relate to objects in one level under the sentence elements. Here the element contents are searched for further patterns.
Bei der Musterstruktur werden mit den vorgenannten Analyse- Ergebnissen die Muster- und Verknüpfungsanalysen durchgeführt (Satzraum (16), Satzregelraum, Elementraum (19), Wortraum). Dabei werden übergreifende Muster und Regeln mittels fester Algorithmen und neuronaler sowie Fuzzy-Algorithmen bestimmt.In the pattern structure, the pattern and linkage analyzes are carried out with the aforementioned analysis results (sentence space ( 16 ), sentence rule space, element space ( 19 ), word space). Overarching patterns and rules are determined using fixed algorithms and neural as well as fuzzy algorithms.
Um die Mustererkennung bei der sprachlichen Analyse (8) von Feinstruktur (14) und Substruktur (15) möglichst automatisch ablaufen lassen zu können, ist bei den Algorithmen die Verwen dung moderner Techniken, wie neuronale Netze und Fuzzy-Logik neben festen Algorithmen, erforderlich. Läßt man solche Ansätze weg, so muß der Anwender eventuell einzelne Verknüpfungen von Hand durchführen.In order for the pattern recognition in the linguistic analysis ( 8 ) of fine structure ( 14 ) and substructure ( 15 ) to run as automatically as possible, the algorithms require the use of modern techniques such as neural networks and fuzzy logic in addition to fixed algorithms. If one omits such approaches, the user may have to make individual links manually.
Die Fig. 3 zeigt in Diagrammform nun den Syntheseverlauf (11) für die Bildung der Datenelemente (21) für die Anwendung B (4) aus den Datenelementen (22) der Anwendung A (3). Aus der oben beschriebenen Analyse (8) der Vorlagefiles VA (5) und VB (6) ergibt sich ein Datenfilter (23), der die zuvor ermittelten Verknüpfungsregeln (24) zwischen den Datenelementen (21) und (22) enthält. Schickt man die Datensätze (25) aus der Anwendung A (3) durch diesen Datenfilter (23), so erhält man neue Daten sätze (26) mit neuen Datenelementen (21), die in einem von der Anwendung B (4) im und exportierbaren Datenformat vorliegen. Die Anzahl der Datenelemente (22) der Datensätze (25) aus der Anwendung A (3) ist nicht unbedingt gleich der Anzahl der Da tenelemente (21) der Datensätze (26) für die Anwendung B (4), die Anzahl der Datensätze (25) und (26) ist im allgemeinen für beide Anwendungen A (3) und B (4) gleich. Fig. 3 shows, in diagram form, now the course of the synthesis (11) for the formation of the data elements (21) for the application B (4) from the data elements (22) of the application A (3). The analysis ( 8 ) of the template files VA ( 5 ) and VB ( 6 ) described above results in a data filter ( 23 ) which contains the previously determined linking rules ( 24 ) between the data elements ( 21 ) and ( 22 ). If you send the data records ( 25 ) from application A ( 3 ) through this data filter ( 23 ), you get new data records ( 26 ) with new data elements ( 21 ), which can be exported and exported by application B ( 4 ) Data format available. The number of data elements ( 22 ) of data records ( 25 ) from application A ( 3 ) is not necessarily the same as the number of data elements ( 21 ) of data records ( 26 ) for application B ( 4 ), the number of data records ( 25 ) and ( 26 ) is generally the same for both applications A ( 3 ) and B ( 4 ).
Zusätzlich zu dem aus der Analyse (8) der Vorlagefiles VA (5) und VB (6) entstandenen Datenfilter (23) für den Datentransfer von Anwendung A (3) nach Anwendung B (4) ist auch ein Abgleich der Datenelemente (21) und (22) mit einer externen Datenbank oder mehreren externen Datenbanken (27) möglich, beispielsweise auch die Mischung von mehreren Datenbanken, wie Kundendatei + Rechnungsdatei. Mit einem solchen externen Abgleich können zum Beispiel die Postleitzahlen der Datensätze (25) und (26) kon trolliert werden, indem man die Datenelemente (21) und (22) von Land, Stadt, Straße und Postleitzahl mit denen der externen Da tenbank (27) vergleicht.In addition to the data filter ( 23 ) for the data transfer from application A ( 3 ) to application B ( 4 ) resulting from the analysis ( 8 ) of the template files VA ( 5 ) and VB ( 6 ), there is also a comparison of the data elements ( 21 ) and ( 22 ) with an external database or several external databases ( 27 ), for example also the mixture of several databases, such as customer file + invoice file. With such an external comparison, for example, the postal codes of data records ( 25 ) and ( 26 ) can be checked by comparing the data elements ( 21 ) and ( 22 ) of country, city, street and postal code with those of the external database ( 27 ) compares.
Zusätzlich ist das Anlegen einer oder mehrerer interner Zwi schendatenbanken zum Suchen und Sortieren auf Dateiebene mög lich. Dies ist erforderlich, um ein schnelles Suchen und Sor tieren, beispielsweise nach dem Alphabet oder speziellen Merk malen, zu ermöglichen.In addition, one or more internal twos are created Possibility to search and sort on file level Lich. This is necessary for a quick search and sor animals, for example according to the alphabet or special notation paint, to enable.
Wenn die aus der Analyse gewonnenen Element-, Substruktur- und Dateibeschreibungen und gegebenenfalls auch externe Datenquel len, beispielsweise von Datenbanken, durch eine implementier bare prozeduale Script- oder Programmiersprache logisch ver knüpft, umgerechnet und allgemein verändert werden, dann wird dadurch die Möglichkeit geschaffen, mittels einer solchen Scriptsprache eine einfache Ablauf Steuerung für die Konver tierung vorzusehen. In einer solchen Sprache sollen Prozeduren, Funktionen und Schleifensteuerungen zur logischen Verknüpfung, Berechnung und Veränderung von ermittelten Analysedaten vorhan den sein, und es soll ferner eine Verknüpfung mit externen Datenbanken möglich sein.If the element, substructure and File descriptions and possibly also external data sources len, for example of databases, by an implemented bare procedural script or programming language logically ver ties, converted and generally changed, then will thereby created the possibility by means of such Script language a simple process control for the converters provision. In such a language, procedures, Functions and loop controls for logical linking, Calculation and change of determined analysis data available and there should also be a link to external ones Databases may be possible.
Es hat sich gezeigt, daß eine Scriptsprache schnell komplex werden kann, wenn von Elementweiten zu Recordweiten, Dateiwei ten und schließlich bis zu Dateiweiten der Funktionen von externen Datenbanken erweitert wird. Hier offenbart sich der Vorteil der in den Patentansprüchen 12 und 13 beschriebenen Merkmale.It has been shown that a scripting language quickly becomes complex can, if from element widths to record widths, file wise ten and finally up to file widths of the functions of external databases is expanded. Here the reveals itself Advantage of those described in claims 12 and 13 Features.
Die Scriptsprache oder Programmiersprache wird nachfolgend anhand von Beispielen näher erläutert. Es handelt sich bei den genannten Daten um Beispiele und eventuelle Übereinstimmungen mit lebenden Personen sind rein zufällig.The script language or programming language is below explained in more detail using examples. It is the mentioned data for examples and possible matches with living people are purely coincidental.
Bei einer Verknüpfung "Elementweit", beispielsweise mit Ver
änderung von Elementdaten, und einem Filter_PLZ(Pos) = Ort(Pos)
mit dem Subelement (2 von Ort(Pos)) ergibt sich dann für die
einzelnen Pos. 1, 2 und 3:
Ort(Pos) nach Filter_PLZ: Hagen Köln Huerth.With a link "Element-wide", for example with a change of element data, and a Filter_PLZ (Pos) = Ort (Pos) with the subelement (2 von Ort (Pos)), the following results for the individual Pos. 1, 2 and 3:
Location (Pos) after Filter_PLZ: Hagen Cologne Huerth.
Bei einer Verknüpfung von Funktionen "Satzweit", mit der Erzeu gung von neuen Zwischenelementen und den beispielhaften Daten:When linking functions "record-wide" with the generation creation of new intermediate elements and the exemplary data:
Gesamtumsatz (Pos) = Summe (Umsatz1(Pos) Umsatz2 (Pos))
Max. Bestellwert (Pos) = Max(Umsatz1(Pos) Umsatz2 (Pos))
Bestelltendenz (Pos) = wenn (Umsatz1(Pos) < Umsatz2 (Pos))Total sales (item) = total (sales1 (item) sales2 (item))
Max. Order value (item) = Max (sales1 (item) sales2 (item))
Order tendency (item) = if (sales1 (item) <sales2 (item))
dann ist die Bestelltendenz = 1
sonst:
wenn (Umsatz1(Pos) < Umsatz2(Pos))
dann ist die Bestelltendenz = -1
sonst ist die Bestelltendenz = 0then the order trend = 1
otherwise:
if (sales1 (item) <sales2 (item))
then the order trend = -1
otherwise the order trend = 0
ergibt sich logischerweise für die einzelnen Positionen folgen des:logically follows for the individual positions of:
Pos 1: Gesamtumsatz 350; max.Bestellwert 150; Tendenz 0
Pos 2: Gesamtumsatz 50; max.Bestellwert 50; Tendenz 0
Pos.3: Gesamtumsatz 300; max.Bestellwert 100; Tendenz 0.Pos 1: total sales 350; max.order value 150; Tendency 0
Pos 2: total sales 50; max.order value 50; Tendency 0
Item 3: total sales 300; max.order value 100; Tendency 0.
Diese Beispiele können in entsprechender Anwendung des oben Offenbarten fortgeführt werden, beispielsweise auch für den Umsatz. Hier könnte angenommen werden, daß der Umsatz für alle Pos. von 0 bis 20 oder von 20 bis 40 oder von 30 bis 40 liegt, usw.These examples can be applied accordingly to the above Disclosed are continued, for example for the Sales. Here it could be assumed that sales for everyone Pos. Is from 0 to 20 or from 20 to 40 or from 30 to 40, etc.
Schließlich seien noch die Funktionen "Dateiweit" für externe Datenbanken beispielhaft für die Frage "Existiert_PLZ(Pos) = wenn (Suche_Ort (Subelement (2 von Ort (Pos) und Subelement (1 von Ort(Pos) und Existiert_In_Ort)), dann Existiert_PLZ = WAHR; sonst FALSCH:" wie folgt dargestellt:Finally, the functions "file-wide" for external Databases exemplary for the question "Existiert_PLZ (Pos) = if (search_location (sub-element (2 of location (Pos) and sub-element (1 of Location (Pos) and Existiert_In_Ort)), then Existiert_PLZ = TRUE; otherwise FALSE: "as follows:
Pos. 1 Existiert_PLZ (Pos) = FALSCH
Pos. 2 Existiert_PLZ (Pos) = FALSCH
Pos. 3 Existiert_PLZ (Pos) = WAHR.Pos. 1 Existiert_PLZ (Pos) = FALSCH
Pos. 2 Existiert_PLZ (Pos) = FALSCH
Pos. 3 Existiert_PLZ (Pos) = TRUE.
Mit allen Zwischenelementen kann weitergerechnet werden wie mit den Original-Elementdaten. Es sei hervorgehoben, daß mit den Merkmalen im Patentanspruch 12 alle Arten der Verknüpfung unter Patentschutz gestellt sind, nämlich "Elementweit", "Satzweit", "Dateiweit" und "Dateiweit" mit externen Datenbanken.You can continue to calculate with all intermediate elements as with the original element data. It should be emphasized that with the Features in claim 12 all types of link under Patent protection are provided, namely "element wide", "sentence wide", "File-wide" and "File-wide" with external databases.
BezugszeichenlisteReference list
1 Konvertierungssoftware bzw. Verfahren
2 Quelldaten Q
3 Anwendung A
4 Anwendung B
5 Vorlagefile VA
6 Vorlagefile VB
7 Eingang Analysevorlagen
8 Analyse, Analyseprozeß
9 Musterablaufdaten M
10 Speichern der Musterablaufdaten
11 Synthese, Synthesephase
12 Zieldaten Z
13 Grobstruktur
14 Feinstruktur
15 Substruktur
16 Datensatz
17 (Daten-) Element
18 Satzregelraum
19 Elementebene
20 Zeichenebene
21 Datenelemente
22 Datenelemente
23 Datenfilter
24 Verknüpfungen, Verknüpfungsregeln
25 Datensätze
26 Datensätze
27 externe Datenbank
28 Quelldatei
29 Quellanalyse
30 Zieldatei 1 conversion software or process
2 source data Q
3 Application A
4 Application B
5 template file VA
6 template file VB
7 Incoming analysis templates
8 Analysis, analysis process
9 Sample expiry dates M
10 Save the pattern run data
11 Synthesis, synthesis phase
12 target dates Z
13 rough structure
14 fine structure
15 substructure
16 data set
17 (data) element
18 sentence control area
19 element level
20 drawing level
21 data elements
22 data elements
23 data filter
24 links, link rules
25 records
26 records
27 external database
28 Source file
29 Source analysis
30 target file
Claims (13)
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19635351A DE19635351C2 (en) | 1996-03-25 | 1996-08-31 | Format conversion procedure |
| EP97916371A EP0890154A1 (en) | 1996-03-25 | 1997-03-21 | Data-conversion method |
| PCT/EP1997/001442 WO1997036250A1 (en) | 1996-03-25 | 1997-03-21 | Data-conversion method |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19611672 | 1996-03-25 | ||
| DE19635351A DE19635351C2 (en) | 1996-03-25 | 1996-08-31 | Format conversion procedure |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE19635351A1 true DE19635351A1 (en) | 1997-10-02 |
| DE19635351C2 DE19635351C2 (en) | 1999-11-04 |
Family
ID=7789303
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19635351A Expired - Fee Related DE19635351C2 (en) | 1996-03-25 | 1996-08-31 | Format conversion procedure |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE19635351C2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10134095A1 (en) * | 2001-07-13 | 2003-01-30 | Siemens Ag | Provision of web page information to mobile phone and PDA users via a spoken interface by transcoding voice information into mark-up language so that a web page can be selected and returned to the mobile phone |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102012015885A1 (en) | 2012-08-13 | 2014-02-13 | EDV Service GmbH Putbus | Method for automated acquisition of data from source application in destination application with help of configuration application, involves exporting data of source application as data sets in form of data file |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5261080A (en) * | 1987-08-21 | 1993-11-09 | Wang Laboratories, Inc. | Matchmaker for assisting and executing the providing and conversion of data between objects in a data processing system storing data in typed objects having different data formats |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE4128940A1 (en) * | 1991-08-30 | 1993-03-11 | Siemens Ag | METHOD FOR CONVERTING DATA |
| US5497491A (en) * | 1993-01-26 | 1996-03-05 | International Business Machines Corporation | System and method for importing and exporting data between an object oriented computing environment and an external computing environment |
-
1996
- 1996-08-31 DE DE19635351A patent/DE19635351C2/en not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5261080A (en) * | 1987-08-21 | 1993-11-09 | Wang Laboratories, Inc. | Matchmaker for assisting and executing the providing and conversion of data between objects in a data processing system storing data in typed objects having different data formats |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10134095A1 (en) * | 2001-07-13 | 2003-01-30 | Siemens Ag | Provision of web page information to mobile phone and PDA users via a spoken interface by transcoding voice information into mark-up language so that a web page can be selected and returned to the mobile phone |
Also Published As
| Publication number | Publication date |
|---|---|
| DE19635351C2 (en) | 1999-11-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69721424T2 (en) | Apparatus and method for editing a graphical user interface | |
| EP1665132B1 (en) | Method and system for collecting data from a plurality of machine readable documents | |
| DE69520123T2 (en) | Handwriting recognition system | |
| DE69810048T2 (en) | Hypertext editing system | |
| DE10250842A1 (en) | Method, computer program product and device for processing a document data stream of an input format into an output format | |
| EP1669852B1 (en) | Method and computer program for converting an incoming document data stream comprising one or more documents into a structured data file | |
| DE10160607A1 (en) | Production of printed document such as newspaper, from multiple files containing page data, by creating cluster file from associated input files and storing in memory before transmission to printer | |
| DE10158419A1 (en) | Process for digital printing of compound documents | |
| EP1234686A2 (en) | Method for choosing between further processing and finishing for digital printing | |
| WO2008074477A1 (en) | Device, method and computer program for identifying characters in an image | |
| DE102014207870A1 (en) | Method for the automated creation of a data record characterizing two technical drawings | |
| EP2601594A1 (en) | Method and apparatus for automatically processing data in a cell format | |
| DE19635351C2 (en) | Format conversion procedure | |
| WO1999012337A9 (en) | Method and device for electronic archiving of a computer data flow | |
| EP1605368B1 (en) | Generation of electronical signature files | |
| EP0890154A1 (en) | Data-conversion method | |
| DE102004021269A1 (en) | Method, apparatus and computer program product for generating a page and / or area structured data stream from a row data stream | |
| EP0206214B1 (en) | Method for a uniform symbolic description of document patterns in the form of data structures in an automated apparatus | |
| DE69331035T2 (en) | Character recognition system | |
| Ralle | Maschinenlesbar-menschenlesbar. | |
| Loosveldt et al. | The effect of interviewer and respondent characteristics on refusals in a panel survey | |
| EP2682866B1 (en) | Methods for the implementation of data formats | |
| DE102009016588A1 (en) | Method for determination of text information from portable document format documents, involves reading portable document format document, and analyzing structure of portable document format document | |
| DE69421574T2 (en) | Procedure for defining multiple form definition records | |
| EP0563077B1 (en) | Method of detecting, by computing machine, identical data elements in two data sequences |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| D2 | Grant after examination | ||
| 8364 | No opposition during term of opposition | ||
| 8339 | Ceased/non-payment of the annual fee |