DE102024004449A1 - database system - Google Patents
database system Download PDFInfo
- Publication number
- DE102024004449A1 DE102024004449A1 DE102024004449.3A DE102024004449A DE102024004449A1 DE 102024004449 A1 DE102024004449 A1 DE 102024004449A1 DE 102024004449 A DE102024004449 A DE 102024004449A DE 102024004449 A1 DE102024004449 A1 DE 102024004449A1
- Authority
- DE
- Germany
- Prior art keywords
- metadata
- database
- user
- data
- database system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Beschrieben wird ein Datenbanksystem, mit wenigstens einer Datenbank, mindestens einer Benutzeroberfläche, ein Berechtigungssystem einem Erläuterungssystem zur Erläuterung der Metadatenfelder, wobei das Erläuterungssystem einen Agenten aufweist, der den wenigstens einen Benutzer bei der Eingabe von Datensätzen unterstützt, wobei der Agent ein großes Sprachmodell aufweist, das mit einer Richtliniendatenbank und einem Metadatenverzeichnis verbunden ist, wobei der Agent zur Unterbreitung von Vorschlägen für die Metadatenfelder auf der Basis der Richtliniendatenbank und des Metadatenverzeichnisses eingerichtet ist. A database system is described, with at least one database, at least one user interface, an authorization system and an explanation system for explaining the metadata fields, wherein the explanation system has an agent that supports the at least one user in entering data records, wherein the agent has a large language model that is connected to a policy database and a metadata directory, wherein the agent is configured to make suggestions for the metadata fields on the basis of the policy database and the metadata directory.
Description
Datenbanksystem der eingangs genannten Art sind im Stand der Technik bekannt.Database systems of the type mentioned above are known in the state of the art.
Große Datenbanksysteme in Unternehmen erfordern umfassende Mechanismen zur Sicherstellung der Konsistenz von Datensätzen, insbesondere in Bezug auf Metadaten. Dazu gehören klare Standards und Anweisungen, effektive Berechtigungssysteme sowie regelmäßige Schulungen der Nutzer. Gleichzeitig müssen diese Systeme flexibel genug bleiben, um sich an veränderte Anforderungen anzupassen, ohne die Datenqualität zu gefährden.Large corporate database systems require comprehensive mechanisms to ensure the consistency of data sets, especially with regard to metadata. This includes clear standards and instructions, effective authorization systems and regular user training. At the same time, these systems must remain flexible enough to adapt to changing requirements without compromising data quality.
Die Komplexität großer Datenbanksysteme in großen Unternehmen entsteht unter anderem durch die Vielzahl der beteiligten Akteure, die unterschiedlichen Datentypen und die hohen Anforderungen an Konsistenz und Verlässlichkeit der gespeicherten Informationen. Ein zentraler Aspekt dieser Komplexität ist die Eingabe von Datensätzen, insbesondere in Bezug auf Metadaten, die für die Organisation und Auffindbarkeit der Daten essenziell sind. Metadaten dienen als strukturierte Zusatzinformationen zu den eigentlichen Daten und helfen, diese zu klassifizieren, zu beschreiben und zu verknüpfen.The complexity of large database systems in large companies arises, among other things, from the large number of actors involved, the different data types and the high demands on consistency and reliability of the stored information. A central aspect of this complexity is the entry of data sets, especially with regard to metadata, which is essential for the organization and findability of the data. Metadata serves as structured additional information to the actual data and helps to classify, describe and link it.
In großen Organisationen variiert die Qualität und Einheitlichkeit der Metadateneingabe oft stark, da die Datensätze von unterschiedlichen Nutzern oder Systemen eingegeben werden. Unterschiedliche Abteilungen haben oft abweichende Begriffsdefinitionen oder Standards für die Nutzung von Metadatenfeldern. Dies kann dazu führen, dass Felder uneinheitlich oder unvollständig ausgefüllt werden, was die Suche und Analyse von Daten erheblich erschwert. Hinzu kommt, dass die Verwendung optionaler Metadatenfelder oder fehlende standardisierte Eingabeprozesse zu redundanten oder fehlerhaften Einträgen führen kann.In large organizations, the quality and consistency of metadata entry often varies greatly because records are entered by different users or systems. Different departments often have different definitions of terms or standards for using metadata fields. This can lead to fields being filled out inconsistently or incompletely, making it much more difficult to search and analyze data. In addition, the use of optional metadata fields or a lack of standardized entry processes can lead to redundant or incorrect entries.
Ein weiterer Komplexitätsfaktor liegt in den oft dynamischen und sich schnell verändernden Anforderungen großer Unternehmen. Neue Geschäftsprozesse, regulatorische Vorgaben oder technische Änderungen erfordern regelmäßig Anpassungen an die Datenbankstruktur und die Definition von Metadatenfeldern. Diese Änderungen müssen in den bestehenden Workflows und Benutzeranweisungen reflektiert werden, um die Konsistenz langfristig zu gewährleisten. Gleichzeitig besteht die Herausforderung, sicherzustellen, dass historische Daten weiterhin korrekt interpretiert werden können.Another complexity factor lies in the often dynamic and rapidly changing requirements of large companies. New business processes, regulatory requirements or technical changes regularly require adjustments to the database structure and the definition of metadata fields. These changes must be reflected in the existing workflows and user instructions in order to ensure long-term consistency. At the same time, there is the challenge of ensuring that historical data can still be interpreted correctly.
Schließlich spielen auch Berechtigungen und Zugriffsrechte eine wesentliche Rolle. Unterschiedliche Benutzergruppen haben oft unterschiedliche Berechtigungen zur Eingabe und Bearbeitung von Datensätzen. Dies kann die Konsistenz zusätzlich gefährden, wenn beispielsweise einige Nutzer keine Pflichtfelder ausfüllen können oder eingeschränkte Sicht auf bestimmte Felder haben. Um dem entgegenzuwirken, sind oft aufwändige Berechtigungssysteme und Nutzeranweisungen notwendig, die jedoch die Komplexität weiter erhöhen.Finally, authorizations and access rights also play an important role. Different user groups often have different authorizations to enter and edit data records. This can further jeopardize consistency if, for example, some users cannot fill in mandatory fields or have limited visibility of certain fields. To counteract this, complex authorization systems and user instructions are often necessary, which, however, only increase complexity.
Aus der
Inkonsistente oder qualitativ minderwertige (Meta-)Daten können die Funktionsfähigkeit eines Datenbanksystems erheblich beeinträchtigen. Uneinheitliche oder fehlende Metadaten erschweren die Auffindbarkeit und korrekte Interpretation von Datensätzen, was zu fehlerhaften Analysen und Entscheidungsgrundlagen führt. Zudem entstehen häufig redundante Datensätze durch unterschiedliche Schreibweisen oder Begriffsverwendungen, was den Speicherbedarf erhöht und die Konsolidierung der Daten erschwert. Prozesse, die auf automatisierten Algorithmen basieren, können aufgrund von Inkonsistenzen falsche Ergebnisse liefern oder ausfallen, was die Effizienz und Zuverlässigkeit der Datenverarbeitung erheblich mindert.Inconsistent or poor-quality (meta)data can significantly impair the functionality of a database system. Inconsistent or missing metadata make it difficult to find and correctly interpret data sets, which leads to incorrect analyses and decision-making. In addition, redundant data sets are often created due to different spellings or usage of terms, which increases storage requirements and makes data consolidation more difficult. Processes based on automated algorithms can produce incorrect results or fail due to inconsistencies, which significantly reduces the efficiency and reliability of data processing.
Darüber hinaus behindern solche Inkonsistenzen die Zusammenarbeit zwischen Abteilungen, da sich Teams oft auf widersprüchliche oder fehlerhafte Daten beziehen müssen. Dies führt zu zeitaufwändigen manuellen Korrekturen und Abstimmungen. In regulierten Branchen können unvollständige oder fehlerhafte Metadaten zudem zu Verstößen gegen gesetzliche Vorgaben führen, was finanzielle Strafen oder rechtliche Konsequenzen nach sich ziehen kann. Langfristig schaden solche Probleme der Akzeptanz des Systems: Nutzer verlieren das Vertrauen in die Zuverlässigkeit der Daten und weichen auf ineffiziente, manuelle Prozesse aus, wodurch die ursprünglichen Vorteile des Datenbanksystems untergraben werden.In addition, such inconsistencies hinder collaboration between departments, as teams often have to refer to conflicting or incorrect data. This leads to time-consuming manual corrections and reconciliations. In regulated industries, incomplete or incorrect metadata can also lead to regulatory violations, which can result in financial penalties or legal consequences. In the long term, such problems harm the acceptance of the system: users lose confidence in the reliability of the data and resort to inefficient, manual processes, thereby undermining the original benefits of the database system.
Somit stellt sich die Aufgabe, Datenbanksysteme der eingangs genannten Art dahingehend weiterzubilden, dass eine höhere Metadatenqualität sichergestellt werden kann.This raises the task of further developing database systems of the type mentioned above to ensure higher metadata quality.
Die Aufgabe wird gelöst durch ein Datenbanksystem gemäß Anspruch 1. Weiterführende Ausgestaltungen und Weiterbildungen sind Gegenstand der abhängigen Ansprüche.The object is achieved by a database system according to
Beschrieben wird ein Datenbanksystem, mit
- - wenigstens einer Datenbank, in der Datensätze und den Datensätzen zugeordnete Metadaten gespeichert sind, wobei pro Datensatz eine Mehrzahl an Metadatenfeldern vorgesehen ist,
- - mindestens einer Benutzeroberfläche zur Eingabe von Datensätzen einschließlich der Metadaten durch wenigstens einen Benutzer,
- - ein Berechtigungssystem, durch das Benutzern oder Benutzergruppen unterschiedliche Rollen sowie Zugriffsrechte und/oder Bearbeitungsrechte für die Datensätze und/oder Metadatenfelder zugewiesen sind, wobei Änderungen und Abfragen der wenigstens einen Datenbank nur auf dieser Basis erlaubt sind,
- - ein Erläuterungssystem zur Erläuterung der Metadatenfelder,
das Erläuterungssystem einen Agenten aufweist, der den wenigstens einen Benutzer bei der Eingabe von Datensätzen unterstützt, wobei der Agent ein großes Sprachmodell aufweist, das mit einer Richtliniendatenbank und einem Metadatenverzeichnis verbunden ist, wobei der Agent zur Unterbreitung von Vorschlägen für die Metadatenfelder auf der Basis der Richtliniendatenbank und des Metadatenverzeichnisses eingerichtet ist.A database system is described with
- - at least one database in which data records and metadata associated with the data records are stored, with a plurality of metadata fields being provided for each data record,
- - at least one user interface for the input of data records including metadata by at least one user,
- - an authorization system through which users or user groups are assigned different roles as well as access rights and/or editing rights for the data records and/or metadata fields, whereby changes and queries to the at least one database are only permitted on this basis,
- - an explanation system to explain the metadata fields,
the explanation system comprises an agent that assists the at least one user in entering data records, the agent comprising a large language model connected to a policy database and a metadata dictionary, the agent being configured to make suggestions for the metadata fields based on the policy database and the metadata dictionary.
Das große Sprachmodell dient als Grundlage für einen vernetzten automatischen Vorschlag für Metadateneinträge auf der Grundlage semantischer oder lexematischer Informationen, die der Benutzer entweder akzeptieren oder ablehnen kann.The large language model serves as the basis for a networked automatic suggestion of metadata entries based on semantic or lexematic information, which the user can either accept or reject.
Ein solches großes Sprachmodell wird häufig als Large Language Model (LLM) bezeichnet. Ein LLM ist ein künstliches neuronales Netzwerk, das darauf trainiert wurde, menschliche Sprache zu interpretieren, zu generieren und darauf basierend Aufgaben zu lösen. Es basiert auf der Architektur eines sogenannten Transformermodells, das durch parallele Verarbeitung großer Datenmengen besonders effizient arbeitet. Die Grundlage der Funktionsweise eines LLMs ist die Analyse und Verarbeitung von Text in Form von mathematischen Repräsentationen, sogenannten Vektoren.Such a large language model is often referred to as a Large Language Model (LLM). An LLM is an artificial neural network that has been trained to interpret and generate human language and to solve tasks based on it. It is based on the architecture of a so-called transformer model, which works particularly efficiently by processing large amounts of data in parallel. The basis of the functioning of an LLM is the analysis and processing of text in the form of mathematical representations, so-called vectors.
Das Modell wird zunächst mit sehr großen Mengen an Textdaten aus verschiedenen Quellen wie Büchern, Webseiten oder Artikeln vortrainiert. Dabei lernt es, Muster und Zusammenhänge in der Sprache zu erkennen, z. B. welche Wörter oft gemeinsam auftreten oder wie sich Satzstrukturen aufbauen. Dieser Lernprozess basiert auf der Technik des sog. „Self-Attention“-Mechanismus, mit dem das Modell relevante Teile eines Satzes oder Textes identifizieren und priorisieren kann. Dadurch versteht es den Kontext von Wörtern besser und kann präzisere Ergebnisse liefern.The model is first pre-trained with very large amounts of text data from various sources such as books, websites or articles. In the process, it learns to recognize patterns and relationships in language, e.g. which words often appear together or how sentence structures are constructed. This learning process is based on the technique of the so-called "self-attention" mechanism, with which the model can identify and prioritize relevant parts of a sentence or text. This enables it to better understand the context of words and deliver more precise results.
Während der Nutzung eines LLMs wird üblicherweise eine Eingabe, auch Prompt genannt, in das Modell eingegeben. Das Modell analysiert diese Eingabe und erzeugt eine Ausgabe basierend auf seinem Training. Es verwendet Wahrscheinlichkeiten, um vorherzusagen, welches Wort oder welche Zeichenfolge am besten zur Eingabe passt. Dies ermöglicht Aufgaben wie die Beantwortung von Fragen, das Schreiben von Texten oder die Übersetzung in andere Sprachen.When using an LLM, an input, also called a prompt, is typically fed into the model. The model analyzes this input and produces an output based on its training. It uses probabilities to predict which word or string best fits the input. This enables tasks such as answering questions, writing texts, or translating into other languages.
Ein zentrales Merkmal eines LLMs ist seine Fähigkeit zur Verallgemeinerung. Es kann auf Basis des gelernten Wissens auch Eingaben interpretieren, die es während des Trainings nicht gesehen hat.A key feature of an LLM is its ability to generalize. It can use the knowledge it has learned to interpret inputs that it did not see during training.
Das Datenbanksystem ist so konzipiert, dass es von Benutzern gefüllt werden kann, denen bestimmte Rollen zugewiesen sind, die jeweils für die Eingabe bestimmter Arten von Informationen verantwortlich sind.The database system is designed to be populated by users assigned specific roles, each responsible for entering specific types of information.
Das Berechtigungssystem stellt sicher, dass jeder Benutzer Informationen entsprechend seiner zugewiesenen Rolle und den relevanten Richtlinien eingibt.The authorization system ensures that each user enters information according to their assigned role and relevant policies.
Bei der Anmeldung am Datenbanksystem kann geprüft werden, ob der Benutzer zuvor an einer Schulung zur Verwendung des Datenbanksystems teilgenommen hat. Die Schulung dient dazu, dem Benutzer das Datenbanksystem und entsprechende Prozesse zu erklären und ihn mit den verschiedenen Funktionen, Funktionalitäten, Prozessen und Verantwortlichkeiten vertraut zu machen. Fällt die Prüfung negativ aus, kann eine Schulung empfohlen oder automatisch gestartet werden, bevor der Benutzer das System nutzen kann. Wenn eine Schulung durchgeführt wurde, erhält der Benutzer Zugriff und seiner Rolle entsprechende Bearbeitungsrechte. Diese Prüfung kann auf einer E-Mail-Adresse als Kennung zusammen mit einem Passwort basieren, bevor die eigentliche Benutzeroberfläche angezeigt werden kann. Auf diese Weise kann überprüft werden, ob ein Benutzer registriert wurde, und registriert werden, ob ein Benutzer vor diesem Anmeldevorgang an einer Schulung teilgenommen hat, um ihn, ggf. automatisch, zur Schulung umzuleiten oder Zugriff auf die Schnittstelle zu gewähren.When logging into the database system, it can be checked whether the user has previously attended training on how to use the database system. The training is intended to explain the database system and related processes to the user and to familiarize them with the various functions, functionalities, processes and responsibilities. If the check is negative, training can be recommended or started automatically before the user can use the system. If training has been completed, the user is given access and editing rights appropriate to their role. This check can be based on an email address as an identifier together with a password before the actual user interface can be displayed. In this way, it can be checked whether a user has been registered and it can be registered whether a user has attended training before this login process. to redirect him, if necessary automatically, to training or to grant access to the interface.
In einer ersten weiterführenden Ausgestaltung ist vorgesehen, dass das Berechtigungssystem zur Prüfung eines Systemtrainingsstatus des wenigstens eines Benutzers und zur Durchsetzung eines Systemtrainings für den wenigstens einen Benutzer ausgebildet ist.In a first further embodiment, it is provided that the authorization system is designed to check a system training status of the at least one user and to enforce a system training for the at least one user.
Der integrierte Agent unterstützt den Benutzer beim Hinzufügen von Metadaten über die Benutzeroberfläche. Innerhalb eines bestimmten Feldes, das zum Beispiel neben den Metadatenfeldern angezeigt werden kann, kann der Benutzer die Möglichkeit haben, seine Fragen zu den angeforderten Metadaten einzugeben, was sein Verständnis und die Eingabe korrekter Metadaten fördert.The integrated agent assists the user in adding metadata through the user interface. Within a specific field, which can be displayed for example next to the metadata fields, the user can have the opportunity to enter their questions about the requested metadata, which promotes their understanding and the entry of correct metadata.
Durch die Verbindung des Agenten mit Richtliniendatenbank, in der spezifische Regeln gespeichert sind, die mit den verschiedenen Arten von Metadaten verbunden sind (z. B. Datenbestände, verantwortliche Benutzer, zugehörige IT-Systeme), können spezifische Erklärungen abgeleitet werden, warum welche Metadaten hinzugefügt, bearbeitet werden müssen etc.By connecting the agent to the policy database, which stores specific rules associated with the different types of metadata (e.g. data sets, responsible users, associated IT systems), specific explanations can be derived as to why certain metadata needs to be added, edited, etc.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass der Agent ein Chatbot ist.In a further refinement, the agent is planned to be a chatbot.
Der Chatbot ist mit Richtlinien trainiert und unterstützt die Benutzer, indem er während des Dateneingabeprozesses Anleitungen und Empfehlungen gibt. Darüber hinaus wird der Chatbot regelmäßig mit metadatenbezogenen Richtlinien aktualisiert, so dass er aktuelle Ratschläge geben kann. Es ist auch in der Lage, widersprüchliche oder falsche Informationen zu erkennen und automatisch korrigierte Daten vorzuschlagen, wodurch die Genauigkeit und Zuverlässigkeit der Datenbank verbessert wird.The chatbot is trained with guidelines and assists users by providing guidance and recommendations during the data entry process. In addition, the chatbot is regularly updated with metadata-related guidelines so that it can provide up-to-date advice. It is also able to detect conflicting or incorrect information and automatically suggest corrected data, improving the accuracy and reliability of the database.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass ein Metadatenanalysesystem zur Prüfung einer Richtlinienkonformität der Metadaten an das Metadatenverzeichnis angeschlossen ist.In a further refinement, it is planned that a metadata analysis system is connected to the metadata directory to check whether the metadata conforms to the guidelines.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass das große Sprachmodell mittels Fine-Tuning, Prompt-Engineering und/oder Retrieval-Augmented Generation auf die Daten der Richtliniendatenbank und dem Metadatenverzeichnis fokussiert ist.In a further refinement, it is planned that the large language model is focused on the data of the policy database and the metadata directory by means of fine-tuning, prompt engineering and/or retrieval-augmented generation.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass ein Berichtsmodul zur Erstellung von Berichten zu den Datensätzen, Metadaten und/oder Analysen dazu vorgesehen ist.In a further refinement, a reporting module is provided for the creation of reports on the data sets, metadata and/or analyses.
Die Beziehung zwischen verschiedenen Metadaten-Entitäten (z.B. IT-Systeme, Datendomänen, Daten, Geschäftsobjekte oder andere) kann in diesem Falle zum Beispiel automatisch in unterschiedlich erstellten Berichten dargestellt werden, die die semantische Beziehung in Form eines semantischen Netzwerks zwischen allen verwandten Objekten abbilden und darüber hinaus in bestimmten Ausführungsformen eine weiterführende Darstellung (Drilldown) von einer Entität (z.B. Domänenebene) zu allen verwandten Entitäten (z.B. Datenbestände, Anwendungsfälle etc.) erlauben.In this case, the relationship between different metadata entities (e.g. IT systems, data domains, data, business objects or others) can, for example, be automatically presented in different reports that depict the semantic relationship in the form of a semantic network between all related objects and, in certain embodiments, also allow a further representation (drilldown) from one entity (e.g. domain level) to all related entities (e.g. data sets, use cases, etc.).
Wenn neue Geschäftsanforderungen aufkommen, kann ermöglicht werden, die Berichte zu bearbeiten, um zusätzlich automatisch erstellte Berichte im System hinzuzufügen und nicht mehr benötigte zu entfernen.As new business requirements arise, reports can be edited to add additional automatically generated reports to the system and remove those that are no longer needed.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass die Benutzeroberfläche zur Anzeige von unterschiedlichen Benutzeroberflächen abhängig von der Rolle, den Zugriffsrechten und/oder Bearbeitungsrechten ausgebildet ist, wobei wenigstens eine erste Benutzeroberfläche für dateneingebende Benutzer und wenigstens eine zweite Benutzeroberfläche für Administratoren vorgesehen ist.In a further further embodiment, it is provided that the user interface is designed to display different user interfaces depending on the role, the access rights and/or editing rights, wherein at least a first user interface is provided for data-entering users and at least a second user interface is provided for administrators.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass das große Sprachmodell dazu eingerichtet ist, Administratoren Metadatenvorschläge zu unterbreiten.In a further refinement, the large language model is designed to provide metadata suggestions to administrators.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass ein Arbeitsablaufmodul vorgesehen ist, das dazu eingerichtet ist, einer Mehrzahl von Benutzern Aufgaben zur Eingabe von Datensätzen und/oder Metadaten zuzuweisen.In a further further embodiment, it is provided that a workflow module is provided which is configured to assign tasks for entering data records and/or metadata to a plurality of users.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass das Arbeitsablaufmodul mit dem Metadatenverzeichnis verbunden ist, wobei das Arbeitsablaufmodul dazu eingerichtet ist, Metadaten an das Metadatenverzeichnis zu senden.In a further refinement, it is provided that the workflow module is connected to the metadata directory, wherein the workflow module is configured to send metadata to the metadata directory.
Weitere Vorteile, Merkmale und Einzelheiten ergeben sich aus der nachfolgenden Beschreibung, in der - gegebenenfalls unter Bezug auf die Zeichnung - zumindest ein Ausführungsbeispiel im Einzelnen beschrieben ist. Gleiche, ähnliche und/oder funktionsgleiche Teile sind mit gleichen Bezugszeichen versehen.Further advantages, features and details emerge from the following description, in which - if necessary with reference to the drawing - at least one embodiment is described in detail. Identical, similar and/or functionally identical parts are provided with the same reference symbols.
Es zeigen schematisch:
-
1 ein Datenbanksystem mit einer Datenbank, -
2 die Struktur eines Datensatzes, sowie -
3 ein Ablaufdiagramm eines Verfahrens.
-
1 a database system with a database, -
2 the structure of a data set, as well as -
3 a flow chart of a procedure.
In der Datenbank 4 können eine Vielzahl von Daten zusammen mit zugehörigen Metadaten (siehe
Das Datenbanksystem 2 weist Benutzeroberflächen 6 und 8 auf, mit Hilfe dessen Benutzer B und Administratoren A auf die Datenbank 4 zugreifen können.The
Wenn sich der Benutzer B am Datenbanksystem 2 über die Benutzeroberfläche 6 anmelden will, wird zunächst geprüft, ob bereits ein entsprechender Zugang besteht und ob der Benutzer B alle notwendigen Trainingsanforderungen erfüllt hat. Diese können zyklisch wiederholt werden, um sicherzustellen, dass der Benutzer B regelmäßig auf Stand bleibt. Ist dies nicht der Fall, wird eine entsprechende Schulung 10 durchgeführt, die abhängig von der entsprechenden Rolle des Benutzers B sein kann. Wenn diese Prüfung erfolgreich war, kann der Benutzer B auf die Datenbank 4 gemäß des entsprechenden zugewiesenen Benutzerprofils und der entsprechenden Rolle zugreifen und Daten sowie Metadaten eintragen oder abfragen.If user B wants to log in to the
Entsprechende Benutzereingaben, die der Benutzer B in der Datenbank 4 vornimmt, werden an einen Chatbot 12 weitergeleitet, der die Aufgabe hat, die Benutzereingabe zu interpretieren und zu prüfen, um festzustellen, ob die Eingaben des Benutzers B richtigen und konform sind. Der Chatbot 12 kann daraufhin entsprechende Vorschläge unterbreiten, die dem Benutzer B helfen, die Metadaten korrekt einzutragen. Der Chatbot 12 kann auf einem Large Language Model basieren.Corresponding user inputs that user B makes in the
Die entsprechenden Vorschläge bezieht der Chatbot 12 von einem weiteren Large Language Model 14, das mit der Datenbank 4 verbunden ist und das in der Datenbank 4 Zugriff auf ein Metadatenverzeichnis 16 hat. Das LLM 14 wird von einer Benutzergruppe BG1 mit Metadaten versorgt, wobei die Benutzergruppe BG1 dafür zuständig ist, die betreffenden Metadaten, die in der Datenbank 4 abgelegt werden dürfen, zu definieren. Diese definierten Metadaten werden dann im Metadatenverzeichnis 16 abgespeichert. The
Der Chatbot 12 ist des Weiteren mit einer Richtliniendatenbank 18 verbunden, in der im Unternehmen gültige Richtlinien abgespeichert sind, um sicherzustellen, dass die Vorschläge des Chatbots 12 an den Benutzer B richtlinienkonform sind.The
Sollte der Benutzer B keine für seinen Bedarf passende Auswahl an Metadaten vorfinden, können über das LLM 14 über einen Verteiler 20 Metadatenvorschläge des Benutzers B an eine zweite Benutzergruppe BG2 gesendet werden, die die Aufgabe haben, die Metadatenvorschläge des Benutzers B zu prüfen und gegebenenfalls freizugeben. Hierzu können automatisierte Informations- und Bestätigungsprozesse sicherstellen, dass hinzugefügte verantwortliche Metadatenanbieter alle Informationen, die in Verbindung mit ihnen hinzugefügt werden, bearbeiten, bestätigen oder ablehnen können, wenn diese Informationen geändert oder ursprünglich gespeichert werden. Eine Änderung durch einen Benutzer B kann automatisch eine Benachrichtigung an ihn auslösen. Die zweite Benutzergruppe BG2 kann teilweise oder vollständig mit der ersten Benutzergruppe BG1 überlappen.If user B cannot find a selection of metadata that meets his needs, metadata suggestions from user B can be sent via the
Über die Benutzeroberfläche 8 kann ein Administrator A auf die Datenbank 4 zugreifen und kann an der Datenbank 4 sowie an den Richtlinien Änderungen vornehmen, die erforderlich sind, um die entsprechende Datenqualität, insbesondere im Hinblick auf die entsprechenden Metadaten, sicherzustellen. Dazu wird ein Metadatenanalysesystem 22 verwendet, sodass der Administrator A schneller Erkenntnisse über die verwendeten Metadaten und mögliche Richtlinienverstöße erhält.Via the
Ein Berichtsmodul 24 dient dazu, aus den Daten sowie den Metadaten der Datenbank 4 entsprechende Berichte zu generieren, wobei die Berichte anpassbar sind, um neue Geschäftsanforderungen abzubilden.A reporting
Die Datenbank 4 kann mit weiteren Datenbanken 26 verknüpft sein, um ein z.B. unternehmensweites Netz von verschiedenen Datenbanken abbilden und verknüpfen zu können. Diese Datenbanken 26 sind mit dem Metadatenverzeichnis 16 verbunden, um die automatische Synchronisierung von Metadaten zwischen den Systemen zu ermöglichen. Z. B. kann ein System Informationen über die Datendomäne und den Geschäftsinhaber eines Datenbestands enthalten, ein anderes die ontologische Position und die zugehörigen IT-Systeme für ein Geschäftsobjekt mit seiner ID als eindeutiger Identifikator.The
Der Datensatz DS enthält grundsätzlich Daten D und Metadaten MD. Die Metadaten MD enthalten eine Mehrzahl an Metadatenfeldern MDF1 bis MDF4, von denen jedes Metadatenfeld MDF1 bis MDF4 bestimmte Funktionen hat, mit bestimmten Datentypen, z.B. Wörtern, Zeichen oder Statuszuständen, gefüllt werden darf. Die Metadatenfelder MDF1 bis MDF4 können nur mit einer definierten Anzahl und Art von Metadaten gefüllt sein, die in dem Metadatenverzeichnis 16 abgelegt sind und die über die Richtliniendatenbank 18 definiert werden.The data set DS basically contains data D and metadata MD. The metadata MD contains a number of metadata fields MDF1 to MDF4, of which each metadata field MDF1 to MDF4 has certain functions and can be filled with certain data types, e.g. words, characters or status states. The metadata fields MDF1 to MDF4 can only be filled with a defined number and type of metadata, which are stored in the
Dabei unterscheidet sich die Benutzeroberfläche 6 von der Benutzeroberfläche 8. Die Benutzeroberfläche 6 umfasst eine Auswahl von Metadatenfeldern, die für die betrachteten Entitäten, z.B. verschiedene Datenobjekte und Datenbestände durchsuchbar sind. Sobald eine gesuchte Entität in diesem Metadatenfeld ausgewählt wurde, werden alle zugehörigen Informationen auf der betrachteten Ebene, z.B. zugeordnete Datenbestände, Datendomänen, IT-Systeme und andere, in einem automatisch erstellten Bericht und zusätzlich in einem semantischen Netzwerk angezeigt, in dem alle Beziehungen sichtbar werden.The
Die Benutzeroberfläche 8 ist der Benutzeroberfläche 6 in dieser Hinsicht ähnlich, ermöglicht aber für Administratoren A, die vom Datenbanksystem 2 als solche gekennzeichnet sind, zusätzliche Rechte, die die Bearbeitung von verschiedenen Feldern in den Datensätzen DS ermöglicht. Bei einer Änderung von Einträgen wird eine Nachricht an die entsprechenden Verantwortlichen der Benutzergruppe BG2 zugesandt, die eine entsprechende Änderung bestätigen müssen oder ablehnen können. Eine Ablehnung kann einen Änderungsprozess auslösen, bei dem der Administrator innerhalb eines bestimmten Zeitrahmens alternative Eingaben vornehmen bzw. vorschlagen muss. Sofern diese Fristen von der Benutzergruppe BG2 nicht eingehalten werden, können entsprechende Warnungsnachrichten an die Benutzergruppe BG2 ergehen.The
Auch der Administrator A kann Vorschläge von dem Large Language Model 14 und dem Chatbot 12 erhalten. Dabei kann auf der Grundlage der Analyse von verbundenen Metadaten MD und der Durchführung von semantischen und lexematischen Analysen aller Metadaten im Metadatenverzeichnis 16 geeignete Metadateninformationen oder verantwortliche Benutzer vorgeschlagen werden, die dem betrachtenden Metadatenfeld MDF1 bis MDF4 hinzugefügt werden sollen.The administrator A can also receive suggestions from the
Auch der allgemeine Benutzer B profitiert von dieser Funktion. Dem Benutzer B werden automatisch Beziehungen zwischen gesuchten Informationen und potenziell hilfreichen verwandten Entitäten im semantischen Netzwerk vorgeschlagen. Diese Vorschläge resultieren aus einer statischen Analyse der Korrektheit auf Basis der Trennungs- und Korrelationsgrade der Metadaten dieser Entität sowie einer linguistischen (semantischen und lexematischen) Analyse der Entität als solcher mit Hilfe eines LLMs.The general user B also benefits from this feature. User B is automatically suggested relationships between the information he is looking for and potentially useful related entities in the semantic network. These suggestions result from a static analysis of correctness based on the degrees of separation and correlation of the metadata of this entity, as well as a linguistic (semantic and lexematic) analysis of the entity itself using an LLM.
Dabei wird von verschiedenen Benutzern ausgegangen, die Editierrechte am Datenbanksystem 2, für ihre jeweiligen Domänen aufweisen aber nur Leserechte für das Gesamtsystem. Der Administrator A hat zusätzliche Rechte, um Referenzen zwischen Datenentitäten anzupassen, die in dem Ablaufdiagramm nicht dargestellt sind.This assumes that there are different users who have editing rights on
In einem ersten Schritt VS1 wird ein erster Benutzer, der verantwortlich ist Metadaten MD bereitzustellen, mit der Aufgabe beauftragt, Metadaten in die Datenbank 4 einzutragen. Zuvor muss jedoch der Trainingsprozess durchlaufen werden.In a first step VS1, a first user who is responsible for providing metadata MD is assigned the task of entering metadata into
In einem zweiten Schritt VS2 führt der erste Benutzer das entsprechende Training durch und wird von dem Datenbanksystem 2 für die Benutzung des Datenbanksystems 2 freigeschaltet. Der erste Benutzer öffnet das Datenbanksystem 2 über die Benutzeroberfläche 6 und prüft Metadaten, die über ihn in dem System gespeichert sind. Wenn die Metadaten korrekt sind, kann der erste Benutzer die Anpassung der über ihn gespeicherten Metadaten beauftragen. Sollte der erste Benutzer Fragen haben, kann er diese über den entsprechenden Chatbot 12 stellen.In a second step VS2, the first user completes the corresponding training and is authorized by the
In den Schritten VS4 bis VS7 werden die Schritte VS1 bis VS3 für einen zweiten Benutzer und einen dritten Benutzer wiederholt.In steps VS4 to VS7, steps VS1 to VS3 are repeated for a second user and a third user.
In dem Schritt VS8 füllt der dritte Benutzer einen Fragebogen aus, der über Schwellwerte spezifiziert ist und der prüft, ob es notwendig ist, weitere Metadaten einzutragen. Die entsprechenden Schwellwerte sind in dem Metadatenanalysesystem 22 abgelegt.In step VS8, the third user fills out a questionnaire that is specified using threshold values and checks whether it is necessary to enter further metadata. The corresponding threshold values are stored in the
In einem weiteren Schritt VS9 überprüft der dritte Benutzer, ob die Metadatenvorschläge des Chatbots 12 korrekt sind, wobei der Chatbot 12 den dritten Benutzer dabei unterstützt, die richtigen Metadaten auszuwählen. Wenn die vorläufige Prüfung negativ ausfällt, müssen die entsprechenden Metadaten gemäß dem Schritt VS10 nicht mehr eingegeben werden.In a further step VS9, the third user checks whether the metadata suggestions of the
Fällt die Prüfung positiv aus, erhalten weitere Benutzer in einem Schritt VS11 eine Nachricht, die von dem Datenbanksystem 2 ausgelöst wird, mit der Aufforderung, ein entsprechendes Training abzuschließen, wobei diese weiteren Benutzer dann nach dem erfolgten Training freigeschaltet werden. Die weiteren Benutzer ergänzen dann im Datenbanksystem 2 die Metadaten, die noch ausgefüllt werden müssen. Im Falle von weiteren Fragen können diese mittels des Chatbots 12 beantwortet werden.If the test is positive, other users receive a message in a step VS11, which is triggered by the
In einem darauffolgenden Schritt VS12 werden, sobald alle Benutzer ihre Aufgabe erledigt haben, wenigstens ein Administrator bzw. ein Workflow-Beauftragter darüber informiert, dass die entsprechenden Metadaten eingesammelt wurden und dass der Prozess abgeschlossen werden kann.In a subsequent step VS12, as soon as all users have completed their task, at least one administrator or workflow representative is informed that the relevant metadata has been collected and that the process can be completed.
In einem darauffolgenden Schritt VS13 wird die Liste der aufgezeichneten Metadaten in dem Metadatenverzeichnis 16 aktualisiert und ist für Berichte mittels des Berichtsmoduls 24 verfügbar. Die entsprechenden Berichte können automatisch erstellt werden.In a subsequent step VS13, the list of recorded metadata is updated in the
In einem darauffolgenden Schritt VS14 kann geprüft werden, ob die entsprechenden Metadaten MD in dem System in dem Metadatenverzeichnis 16 aktualisiert wurden.In a subsequent step VS14, it can be checked whether the corresponding metadata MD in the system has been updated in the
Gemäß des letzten Schritts VS14 kann bei der nächsten Iteration des aufgeführten Prozesses nach den Prozessschritten VS1 bis VS11 eine Datenbestandsbewertung initiiert werden. Änderungen in den Metadatendaten, Berichten, der hierarchischen Struktur und dergleichen können automatisch übernommen werden.According to the last step VS14, a data asset assessment can be initiated at the next iteration of the listed process after the process steps VS1 to VS11. Changes in the metadata data, reports, hierarchical structure and the like can be adopted automatically.
Obwohl die Erfindung im Detail durch bevorzugte Ausführungsbeispiele näher illustriert und erläutert wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und andere Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen. Es ist daher klar, dass eine Vielzahl von Variationsmöglichkeiten existiert. Es ist ebenfalls klar, dass beispielhaft genannte Ausführungsformen wirklich nur Beispiele darstellen, die nicht in irgendeiner Weise als Begrenzung etwa des Schutzbereichs, der Anwendungsmöglichkeiten oder der Konfiguration der Erfindung aufzufassen sind. Vielmehr versetzen die vorhergehende Beschreibung und die Figurenbeschreibung den Fachmann in die Lage, die beispielhaften Ausführungsformen konkret umzusetzen, wobei der Fachmann in Kenntnis des offenbarten Erfindungsgedankens vielfältige Änderungen, beispielsweise hinsichtlich der Funktion oder der Anordnung einzelner, in einer beispielhaften Ausführungsform genannter Elemente, vornehmen kann, ohne den Schutzbereich zu verlassen, der durch die Ansprüche und deren rechtliche Entsprechungen, wie etwa einer weitergehenden Erläuterung in der Beschreibung, definiert wird.Although the invention has been illustrated and explained in detail by preferred embodiments, the invention is not limited by the disclosed examples and other variations can be derived therefrom by the person skilled in the art without departing from the scope of the invention. It is therefore clear that a multitude of possible variations exist. It is also clear that embodiments mentioned by way of example really only represent examples that are not to be understood in any way as a limitation of the scope of protection, the possible applications or the configuration of the invention. Rather, the preceding description and the description of the figures enable the person skilled in the art to implement the exemplary embodiments in concrete terms, whereby the person skilled in the art, with knowledge of the disclosed inventive concept, can make a variety of changes, for example with regard to the function or the arrangement of individual elements mentioned in an exemplary embodiment, without departing from the scope of protection defined by the claims and their legal equivalents, such as a further explanation in the description.
Bezugszeichenlistelist of reference symbols
- 22
- Datenbanksystemdatabase system
- 44
- Datenbankdatabase
- 6, 86, 8
- Benutzeroberflächeuser interface
- 1010
- Schulungtraining
- 1212
- Chatbotchatbot
- 1414
- LLMLLM
- 1616
- Metadatenverzeichnismetadata directory
- 1818
- Richtliniendatenbankpolicy database
- 2020
- Verteilerdistributor
- 2222
- Metadatenanalysesystemmetadata analysis system
- 2424
- Berichtsmodulreporting module
- 2626
- weiteren Datenbankenother databases
- AA
- AdministratorAdministrator
- BB
- Benutzeruser
- BG1, BG2BG1, BG2
- Benutzergruppeuser group
- DD
- DatenData
- DSDS
- Datensatzdata set
- MDMD
- Metadatenmetadata
- MDF1 - MDF4MDF1 - MDF4
- Metadatenfeldmetadata field
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA accepts no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- US 2019/0057147 A1 [0007]US 2019/0057147 A1 [0007]
Claims (10)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024004449.3A DE102024004449A1 (en) | 2024-12-19 | 2024-12-19 | database system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024004449.3A DE102024004449A1 (en) | 2024-12-19 | 2024-12-19 | database system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE102024004449A1 true DE102024004449A1 (en) | 2025-02-20 |
Family
ID=94390925
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102024004449.3A Pending DE102024004449A1 (en) | 2024-12-19 | 2024-12-19 | database system |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE102024004449A1 (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190057147A1 (en) | 2017-08-17 | 2019-02-21 | Target Brands, Inc. | Data portal |
-
2024
- 2024-12-19 DE DE102024004449.3A patent/DE102024004449A1/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190057147A1 (en) | 2017-08-17 | 2019-02-21 | Target Brands, Inc. | Data portal |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69626948T2 (en) | Diagnostic expert system | |
| DE112009002000B4 (en) | Adaptive method and device for converting messages between different data formats | |
| DE112020005268T5 (en) | AUTOMATICALLY GENERATE SCHEMA ANNOTATION FILES TO CONVERT NATURAL LANGUAGE QUERIES TO STRUCTURED QUERY LANGUAGE | |
| DE112017005638T5 (en) | Systems and methods for determining the relationship between data elements | |
| DE102021004157A1 (en) | Machine learning modeling to protect against online disclosure of sensitive data | |
| DE10240117A1 (en) | Server component for e.g. public Internet has report generation processor that obtains electronic dossiers from databases to process standardized risk related data included in electronic dossiers to generate electronic risk report | |
| DE112018005725T5 (en) | DATA DEIDENTIFICATION BASED ON DETECTION OF PERMITTED CONFIGURATIONS FOR DATA DEIDENTIFICATION PROCESSES | |
| DE202017007066U1 (en) | System and device for automatically categorizing and evaluating billing rates | |
| DE102014116369A1 (en) | MANAGEMENT OF LANGUAGE MARKERS IN INTERNATIONAL DATA STORAGE | |
| DE102015121509A1 (en) | Methodology and device for consistency check by comparison of ontology models | |
| DE19706419A1 (en) | Speech-controlled business process control method | |
| DE112020003767T5 (en) | GENERATION OF AN EXECUTABLE PROCEDURE FROM A TEXT DESCRIPTION WRITTEN IN A NATURAL LANGUAGE | |
| DE112020000004T5 (en) | Information delivery system and information delivery process | |
| DE102005046992A1 (en) | Procedure and system for risk management | |
| DE112020000003T5 (en) | Information delivery system and information delivery process | |
| EP1783633B1 (en) | Search engine for a location related search | |
| DE102019220056A1 (en) | DOMAIN KNOWLEDGE INJECTION IN SEMI-SWARMED UNSTRUCTURED DATA SUMMARY FOR DIAGNOSTICS AND REPAIR | |
| DE102012025350A1 (en) | Processing an electronic document | |
| WO2007022874A1 (en) | System method and computer programme product for workflow-based data processing | |
| DE102012025349B4 (en) | Determination of a similarity measure and processing of documents | |
| DE102024004449A1 (en) | database system | |
| DE29821970U1 (en) | Data structure for computer-aided management of developments | |
| DE202023105808U1 (en) | A business-centric, multi-tiered Big Data (DaaS) system for improved service delivery | |
| DE102019217595A1 (en) | DOMAIN-SPECIFIC PREDICTION OF PROCESS DIFFICULTY | |
| DE102007047613A1 (en) | Sign management system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R230 | Request for early publication |