DE102024004449A1

DE102024004449A1 - Datenbanksystem

Info

Publication number: DE102024004449A1
Application number: DE102024004449.3A
Authority: DE
Inventors: Robin John; Michael Scherer; Stefan Kopestenski; Krishnan Jothi Ramalingam; Fabian Oliver Flohr
Original assignee: Mercedes Benz Group AG
Current assignee: Mercedes Benz Group AG
Priority date: 2024-12-19
Filing date: 2024-12-19
Publication date: 2025-02-20

Abstract

Beschrieben wird ein Datenbanksystem, mit wenigstens einer Datenbank, mindestens einer Benutzeroberfläche, ein Berechtigungssystem einem Erläuterungssystem zur Erläuterung der Metadatenfelder, wobei das Erläuterungssystem einen Agenten aufweist, der den wenigstens einen Benutzer bei der Eingabe von Datensätzen unterstützt, wobei der Agent ein großes Sprachmodell aufweist, das mit einer Richtliniendatenbank und einem Metadatenverzeichnis verbunden ist, wobei der Agent zur Unterbreitung von Vorschlägen für die Metadatenfelder auf der Basis der Richtliniendatenbank und des Metadatenverzeichnisses eingerichtet ist.

Description

Datenbanksystem der eingangs genannten Art sind im Stand der Technik bekannt.
Große Datenbanksysteme in Unternehmen erfordern umfassende Mechanismen zur Sicherstellung der Konsistenz von Datensätzen, insbesondere in Bezug auf Metadaten. Dazu gehören klare Standards und Anweisungen, effektive Berechtigungssysteme sowie regelmäßige Schulungen der Nutzer. Gleichzeitig müssen diese Systeme flexibel genug bleiben, um sich an veränderte Anforderungen anzupassen, ohne die Datenqualität zu gefährden.
Die Komplexität großer Datenbanksysteme in großen Unternehmen entsteht unter anderem durch die Vielzahl der beteiligten Akteure, die unterschiedlichen Datentypen und die hohen Anforderungen an Konsistenz und Verlässlichkeit der gespeicherten Informationen. Ein zentraler Aspekt dieser Komplexität ist die Eingabe von Datensätzen, insbesondere in Bezug auf Metadaten, die für die Organisation und Auffindbarkeit der Daten essenziell sind. Metadaten dienen als strukturierte Zusatzinformationen zu den eigentlichen Daten und helfen, diese zu klassifizieren, zu beschreiben und zu verknüpfen.
In großen Organisationen variiert die Qualität und Einheitlichkeit der Metadateneingabe oft stark, da die Datensätze von unterschiedlichen Nutzern oder Systemen eingegeben werden. Unterschiedliche Abteilungen haben oft abweichende Begriffsdefinitionen oder Standards für die Nutzung von Metadatenfeldern. Dies kann dazu führen, dass Felder uneinheitlich oder unvollständig ausgefüllt werden, was die Suche und Analyse von Daten erheblich erschwert. Hinzu kommt, dass die Verwendung optionaler Metadatenfelder oder fehlende standardisierte Eingabeprozesse zu redundanten oder fehlerhaften Einträgen führen kann.
Ein weiterer Komplexitätsfaktor liegt in den oft dynamischen und sich schnell verändernden Anforderungen großer Unternehmen. Neue Geschäftsprozesse, regulatorische Vorgaben oder technische Änderungen erfordern regelmäßig Anpassungen an die Datenbankstruktur und die Definition von Metadatenfeldern. Diese Änderungen müssen in den bestehenden Workflows und Benutzeranweisungen reflektiert werden, um die Konsistenz langfristig zu gewährleisten. Gleichzeitig besteht die Herausforderung, sicherzustellen, dass historische Daten weiterhin korrekt interpretiert werden können.
Schließlich spielen auch Berechtigungen und Zugriffsrechte eine wesentliche Rolle. Unterschiedliche Benutzergruppen haben oft unterschiedliche Berechtigungen zur Eingabe und Bearbeitung von Datensätzen. Dies kann die Konsistenz zusätzlich gefährden, wenn beispielsweise einige Nutzer keine Pflichtfelder ausfüllen können oder eingeschränkte Sicht auf bestimmte Felder haben. Um dem entgegenzuwirken, sind oft aufwändige Berechtigungssysteme und Nutzeranweisungen notwendig, die jedoch die Komplexität weiter erhöhen.
Aus der US 2019/0057147 A1 ist eine Softwareplattform bekannt, die Daten aus einer Vielzahl von Datenquellen aufnimmt, verarbeitet und für die Suche zur Verfügung stellt. Darüber hinaus wird ein Datenportal beschrieben, über das Benutzer schnell Informationen finden und Metadaten verbessern können, um die Datenbestände des Unternehmens zu nutzen. Zu den verschiedenen Aspekten offengelegter Softwareplattformen gehören Technologien zum Abrufen von Metadaten, ohne die zugrunde liegenden Datenbestände zu berühren, Technologien zur Verwendung der Tabellen- oder Datenbankherkunft als Faktor bei der Bestimmung der Dokumentrelevanz, Prozesse zum Empfangen von Daten, die von Datenquellen übertragen werden, und Prozesse zum Offenlegen, was ein Benutzer tun muss, um auf bestimmte Datenbestände zuzugreifen.
Inkonsistente oder qualitativ minderwertige (Meta-)Daten können die Funktionsfähigkeit eines Datenbanksystems erheblich beeinträchtigen. Uneinheitliche oder fehlende Metadaten erschweren die Auffindbarkeit und korrekte Interpretation von Datensätzen, was zu fehlerhaften Analysen und Entscheidungsgrundlagen führt. Zudem entstehen häufig redundante Datensätze durch unterschiedliche Schreibweisen oder Begriffsverwendungen, was den Speicherbedarf erhöht und die Konsolidierung der Daten erschwert. Prozesse, die auf automatisierten Algorithmen basieren, können aufgrund von Inkonsistenzen falsche Ergebnisse liefern oder ausfallen, was die Effizienz und Zuverlässigkeit der Datenverarbeitung erheblich mindert.
Darüber hinaus behindern solche Inkonsistenzen die Zusammenarbeit zwischen Abteilungen, da sich Teams oft auf widersprüchliche oder fehlerhafte Daten beziehen müssen. Dies führt zu zeitaufwändigen manuellen Korrekturen und Abstimmungen. In regulierten Branchen können unvollständige oder fehlerhafte Metadaten zudem zu Verstößen gegen gesetzliche Vorgaben führen, was finanzielle Strafen oder rechtliche Konsequenzen nach sich ziehen kann. Langfristig schaden solche Probleme der Akzeptanz des Systems: Nutzer verlieren das Vertrauen in die Zuverlässigkeit der Daten und weichen auf ineffiziente, manuelle Prozesse aus, wodurch die ursprünglichen Vorteile des Datenbanksystems untergraben werden.
Somit stellt sich die Aufgabe, Datenbanksysteme der eingangs genannten Art dahingehend weiterzubilden, dass eine höhere Metadatenqualität sichergestellt werden kann.
Die Aufgabe wird gelöst durch ein Datenbanksystem gemäß Anspruch 1. Weiterführende Ausgestaltungen und Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
Beschrieben wird ein Datenbanksystem, mit

- wenigstens einer Datenbank, in der Datensätze und den Datensätzen zugeordnete Metadaten gespeichert sind, wobei pro Datensatz eine Mehrzahl an Metadatenfeldern vorgesehen ist,
- mindestens einer Benutzeroberfläche zur Eingabe von Datensätzen einschließlich der Metadaten durch wenigstens einen Benutzer,
- ein Berechtigungssystem, durch das Benutzern oder Benutzergruppen unterschiedliche Rollen sowie Zugriffsrechte und/oder Bearbeitungsrechte für die Datensätze und/oder Metadatenfelder zugewiesen sind, wobei Änderungen und Abfragen der wenigstens einen Datenbank nur auf dieser Basis erlaubt sind,
- ein Erläuterungssystem zur Erläuterung der Metadatenfelder,

Das große Sprachmodell dient als Grundlage für einen vernetzten automatischen Vorschlag für Metadateneinträge auf der Grundlage semantischer oder lexematischer Informationen, die der Benutzer entweder akzeptieren oder ablehnen kann.
Ein solches großes Sprachmodell wird häufig als Large Language Model (LLM) bezeichnet. Ein LLM ist ein künstliches neuronales Netzwerk, das darauf trainiert wurde, menschliche Sprache zu interpretieren, zu generieren und darauf basierend Aufgaben zu lösen. Es basiert auf der Architektur eines sogenannten Transformermodells, das durch parallele Verarbeitung großer Datenmengen besonders effizient arbeitet. Die Grundlage der Funktionsweise eines LLMs ist die Analyse und Verarbeitung von Text in Form von mathematischen Repräsentationen, sogenannten Vektoren.
Das Modell wird zunächst mit sehr großen Mengen an Textdaten aus verschiedenen Quellen wie Büchern, Webseiten oder Artikeln vortrainiert. Dabei lernt es, Muster und Zusammenhänge in der Sprache zu erkennen, z. B. welche Wörter oft gemeinsam auftreten oder wie sich Satzstrukturen aufbauen. Dieser Lernprozess basiert auf der Technik des sog. „Self-Attention“-Mechanismus, mit dem das Modell relevante Teile eines Satzes oder Textes identifizieren und priorisieren kann. Dadurch versteht es den Kontext von Wörtern besser und kann präzisere Ergebnisse liefern.
Während der Nutzung eines LLMs wird üblicherweise eine Eingabe, auch Prompt genannt, in das Modell eingegeben. Das Modell analysiert diese Eingabe und erzeugt eine Ausgabe basierend auf seinem Training. Es verwendet Wahrscheinlichkeiten, um vorherzusagen, welches Wort oder welche Zeichenfolge am besten zur Eingabe passt. Dies ermöglicht Aufgaben wie die Beantwortung von Fragen, das Schreiben von Texten oder die Übersetzung in andere Sprachen.
Ein zentrales Merkmal eines LLMs ist seine Fähigkeit zur Verallgemeinerung. Es kann auf Basis des gelernten Wissens auch Eingaben interpretieren, die es während des Trainings nicht gesehen hat.
Das Datenbanksystem ist so konzipiert, dass es von Benutzern gefüllt werden kann, denen bestimmte Rollen zugewiesen sind, die jeweils für die Eingabe bestimmter Arten von Informationen verantwortlich sind.
Das Berechtigungssystem stellt sicher, dass jeder Benutzer Informationen entsprechend seiner zugewiesenen Rolle und den relevanten Richtlinien eingibt.
Bei der Anmeldung am Datenbanksystem kann geprüft werden, ob der Benutzer zuvor an einer Schulung zur Verwendung des Datenbanksystems teilgenommen hat. Die Schulung dient dazu, dem Benutzer das Datenbanksystem und entsprechende Prozesse zu erklären und ihn mit den verschiedenen Funktionen, Funktionalitäten, Prozessen und Verantwortlichkeiten vertraut zu machen. Fällt die Prüfung negativ aus, kann eine Schulung empfohlen oder automatisch gestartet werden, bevor der Benutzer das System nutzen kann. Wenn eine Schulung durchgeführt wurde, erhält der Benutzer Zugriff und seiner Rolle entsprechende Bearbeitungsrechte. Diese Prüfung kann auf einer E-Mail-Adresse als Kennung zusammen mit einem Passwort basieren, bevor die eigentliche Benutzeroberfläche angezeigt werden kann. Auf diese Weise kann überprüft werden, ob ein Benutzer registriert wurde, und registriert werden, ob ein Benutzer vor diesem Anmeldevorgang an einer Schulung teilgenommen hat, um ihn, ggf. automatisch, zur Schulung umzuleiten oder Zugriff auf die Schnittstelle zu gewähren.
In einer ersten weiterführenden Ausgestaltung ist vorgesehen, dass das Berechtigungssystem zur Prüfung eines Systemtrainingsstatus des wenigstens eines Benutzers und zur Durchsetzung eines Systemtrainings für den wenigstens einen Benutzer ausgebildet ist.
Der integrierte Agent unterstützt den Benutzer beim Hinzufügen von Metadaten über die Benutzeroberfläche. Innerhalb eines bestimmten Feldes, das zum Beispiel neben den Metadatenfeldern angezeigt werden kann, kann der Benutzer die Möglichkeit haben, seine Fragen zu den angeforderten Metadaten einzugeben, was sein Verständnis und die Eingabe korrekter Metadaten fördert.
Durch die Verbindung des Agenten mit Richtliniendatenbank, in der spezifische Regeln gespeichert sind, die mit den verschiedenen Arten von Metadaten verbunden sind (z. B. Datenbestände, verantwortliche Benutzer, zugehörige IT-Systeme), können spezifische Erklärungen abgeleitet werden, warum welche Metadaten hinzugefügt, bearbeitet werden müssen etc.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass der Agent ein Chatbot ist.
Der Chatbot ist mit Richtlinien trainiert und unterstützt die Benutzer, indem er während des Dateneingabeprozesses Anleitungen und Empfehlungen gibt. Darüber hinaus wird der Chatbot regelmäßig mit metadatenbezogenen Richtlinien aktualisiert, so dass er aktuelle Ratschläge geben kann. Es ist auch in der Lage, widersprüchliche oder falsche Informationen zu erkennen und automatisch korrigierte Daten vorzuschlagen, wodurch die Genauigkeit und Zuverlässigkeit der Datenbank verbessert wird.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass ein Metadatenanalysesystem zur Prüfung einer Richtlinienkonformität der Metadaten an das Metadatenverzeichnis angeschlossen ist.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass das große Sprachmodell mittels Fine-Tuning, Prompt-Engineering und/oder Retrieval-Augmented Generation auf die Daten der Richtliniendatenbank und dem Metadatenverzeichnis fokussiert ist.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass ein Berichtsmodul zur Erstellung von Berichten zu den Datensätzen, Metadaten und/oder Analysen dazu vorgesehen ist.
Die Beziehung zwischen verschiedenen Metadaten-Entitäten (z.B. IT-Systeme, Datendomänen, Daten, Geschäftsobjekte oder andere) kann in diesem Falle zum Beispiel automatisch in unterschiedlich erstellten Berichten dargestellt werden, die die semantische Beziehung in Form eines semantischen Netzwerks zwischen allen verwandten Objekten abbilden und darüber hinaus in bestimmten Ausführungsformen eine weiterführende Darstellung (Drilldown) von einer Entität (z.B. Domänenebene) zu allen verwandten Entitäten (z.B. Datenbestände, Anwendungsfälle etc.) erlauben.
Wenn neue Geschäftsanforderungen aufkommen, kann ermöglicht werden, die Berichte zu bearbeiten, um zusätzlich automatisch erstellte Berichte im System hinzuzufügen und nicht mehr benötigte zu entfernen.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass die Benutzeroberfläche zur Anzeige von unterschiedlichen Benutzeroberflächen abhängig von der Rolle, den Zugriffsrechten und/oder Bearbeitungsrechten ausgebildet ist, wobei wenigstens eine erste Benutzeroberfläche für dateneingebende Benutzer und wenigstens eine zweite Benutzeroberfläche für Administratoren vorgesehen ist.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass das große Sprachmodell dazu eingerichtet ist, Administratoren Metadatenvorschläge zu unterbreiten.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass ein Arbeitsablaufmodul vorgesehen ist, das dazu eingerichtet ist, einer Mehrzahl von Benutzern Aufgaben zur Eingabe von Datensätzen und/oder Metadaten zuzuweisen.
In einer weiteren weiterführenden Ausgestaltung ist vorgesehen, dass das Arbeitsablaufmodul mit dem Metadatenverzeichnis verbunden ist, wobei das Arbeitsablaufmodul dazu eingerichtet ist, Metadaten an das Metadatenverzeichnis zu senden.
Weitere Vorteile, Merkmale und Einzelheiten ergeben sich aus der nachfolgenden Beschreibung, in der - gegebenenfalls unter Bezug auf die Zeichnung - zumindest ein Ausführungsbeispiel im Einzelnen beschrieben ist. Gleiche, ähnliche und/oder funktionsgleiche Teile sind mit gleichen Bezugszeichen versehen.
Es zeigen schematisch:

1 ein Datenbanksystem mit einer Datenbank,
2 die Struktur eines Datensatzes, sowie
3 ein Ablaufdiagramm eines Verfahrens.

1 zeigt ein Datenbanksystem 2 mit einer Datenbank 4.
In der Datenbank 4 können eine Vielzahl von Daten zusammen mit zugehörigen Metadaten (siehe 2) abgelegt werden.
Das Datenbanksystem 2 weist Benutzeroberflächen 6 und 8 auf, mit Hilfe dessen Benutzer B und Administratoren A auf die Datenbank 4 zugreifen können.
Wenn sich der Benutzer B am Datenbanksystem 2 über die Benutzeroberfläche 6 anmelden will, wird zunächst geprüft, ob bereits ein entsprechender Zugang besteht und ob der Benutzer B alle notwendigen Trainingsanforderungen erfüllt hat. Diese können zyklisch wiederholt werden, um sicherzustellen, dass der Benutzer B regelmäßig auf Stand bleibt. Ist dies nicht der Fall, wird eine entsprechende Schulung 10 durchgeführt, die abhängig von der entsprechenden Rolle des Benutzers B sein kann. Wenn diese Prüfung erfolgreich war, kann der Benutzer B auf die Datenbank 4 gemäß des entsprechenden zugewiesenen Benutzerprofils und der entsprechenden Rolle zugreifen und Daten sowie Metadaten eintragen oder abfragen.
Entsprechende Benutzereingaben, die der Benutzer B in der Datenbank 4 vornimmt, werden an einen Chatbot 12 weitergeleitet, der die Aufgabe hat, die Benutzereingabe zu interpretieren und zu prüfen, um festzustellen, ob die Eingaben des Benutzers B richtigen und konform sind. Der Chatbot 12 kann daraufhin entsprechende Vorschläge unterbreiten, die dem Benutzer B helfen, die Metadaten korrekt einzutragen. Der Chatbot 12 kann auf einem Large Language Model basieren.
Die entsprechenden Vorschläge bezieht der Chatbot 12 von einem weiteren Large Language Model 14, das mit der Datenbank 4 verbunden ist und das in der Datenbank 4 Zugriff auf ein Metadatenverzeichnis 16 hat. Das LLM 14 wird von einer Benutzergruppe BG1 mit Metadaten versorgt, wobei die Benutzergruppe BG1 dafür zuständig ist, die betreffenden Metadaten, die in der Datenbank 4 abgelegt werden dürfen, zu definieren. Diese definierten Metadaten werden dann im Metadatenverzeichnis 16 abgespeichert.
Der Chatbot 12 ist des Weiteren mit einer Richtliniendatenbank 18 verbunden, in der im Unternehmen gültige Richtlinien abgespeichert sind, um sicherzustellen, dass die Vorschläge des Chatbots 12 an den Benutzer B richtlinienkonform sind.
Sollte der Benutzer B keine für seinen Bedarf passende Auswahl an Metadaten vorfinden, können über das LLM 14 über einen Verteiler 20 Metadatenvorschläge des Benutzers B an eine zweite Benutzergruppe BG2 gesendet werden, die die Aufgabe haben, die Metadatenvorschläge des Benutzers B zu prüfen und gegebenenfalls freizugeben. Hierzu können automatisierte Informations- und Bestätigungsprozesse sicherstellen, dass hinzugefügte verantwortliche Metadatenanbieter alle Informationen, die in Verbindung mit ihnen hinzugefügt werden, bearbeiten, bestätigen oder ablehnen können, wenn diese Informationen geändert oder ursprünglich gespeichert werden. Eine Änderung durch einen Benutzer B kann automatisch eine Benachrichtigung an ihn auslösen. Die zweite Benutzergruppe BG2 kann teilweise oder vollständig mit der ersten Benutzergruppe BG1 überlappen.
Über die Benutzeroberfläche 8 kann ein Administrator A auf die Datenbank 4 zugreifen und kann an der Datenbank 4 sowie an den Richtlinien Änderungen vornehmen, die erforderlich sind, um die entsprechende Datenqualität, insbesondere im Hinblick auf die entsprechenden Metadaten, sicherzustellen. Dazu wird ein Metadatenanalysesystem 22 verwendet, sodass der Administrator A schneller Erkenntnisse über die verwendeten Metadaten und mögliche Richtlinienverstöße erhält.
Ein Berichtsmodul 24 dient dazu, aus den Daten sowie den Metadaten der Datenbank 4 entsprechende Berichte zu generieren, wobei die Berichte anpassbar sind, um neue Geschäftsanforderungen abzubilden.
Die Datenbank 4 kann mit weiteren Datenbanken 26 verknüpft sein, um ein z.B. unternehmensweites Netz von verschiedenen Datenbanken abbilden und verknüpfen zu können. Diese Datenbanken 26 sind mit dem Metadatenverzeichnis 16 verbunden, um die automatische Synchronisierung von Metadaten zwischen den Systemen zu ermöglichen. Z. B. kann ein System Informationen über die Datendomäne und den Geschäftsinhaber eines Datenbestands enthalten, ein anderes die ontologische Position und die zugehörigen IT-Systeme für ein Geschäftsobjekt mit seiner ID als eindeutiger Identifikator.
2 zeigt den Aufbau eines Datensatzes DS.
Der Datensatz DS enthält grundsätzlich Daten D und Metadaten MD. Die Metadaten MD enthalten eine Mehrzahl an Metadatenfeldern MDF1 bis MDF4, von denen jedes Metadatenfeld MDF1 bis MDF4 bestimmte Funktionen hat, mit bestimmten Datentypen, z.B. Wörtern, Zeichen oder Statuszuständen, gefüllt werden darf. Die Metadatenfelder MDF1 bis MDF4 können nur mit einer definierten Anzahl und Art von Metadaten gefüllt sein, die in dem Metadatenverzeichnis 16 abgelegt sind und die über die Richtliniendatenbank 18 definiert werden.
Dabei unterscheidet sich die Benutzeroberfläche 6 von der Benutzeroberfläche 8. Die Benutzeroberfläche 6 umfasst eine Auswahl von Metadatenfeldern, die für die betrachteten Entitäten, z.B. verschiedene Datenobjekte und Datenbestände durchsuchbar sind. Sobald eine gesuchte Entität in diesem Metadatenfeld ausgewählt wurde, werden alle zugehörigen Informationen auf der betrachteten Ebene, z.B. zugeordnete Datenbestände, Datendomänen, IT-Systeme und andere, in einem automatisch erstellten Bericht und zusätzlich in einem semantischen Netzwerk angezeigt, in dem alle Beziehungen sichtbar werden.
Die Benutzeroberfläche 8 ist der Benutzeroberfläche 6 in dieser Hinsicht ähnlich, ermöglicht aber für Administratoren A, die vom Datenbanksystem 2 als solche gekennzeichnet sind, zusätzliche Rechte, die die Bearbeitung von verschiedenen Feldern in den Datensätzen DS ermöglicht. Bei einer Änderung von Einträgen wird eine Nachricht an die entsprechenden Verantwortlichen der Benutzergruppe BG2 zugesandt, die eine entsprechende Änderung bestätigen müssen oder ablehnen können. Eine Ablehnung kann einen Änderungsprozess auslösen, bei dem der Administrator innerhalb eines bestimmten Zeitrahmens alternative Eingaben vornehmen bzw. vorschlagen muss. Sofern diese Fristen von der Benutzergruppe BG2 nicht eingehalten werden, können entsprechende Warnungsnachrichten an die Benutzergruppe BG2 ergehen.
Auch der Administrator A kann Vorschläge von dem Large Language Model 14 und dem Chatbot 12 erhalten. Dabei kann auf der Grundlage der Analyse von verbundenen Metadaten MD und der Durchführung von semantischen und lexematischen Analysen aller Metadaten im Metadatenverzeichnis 16 geeignete Metadateninformationen oder verantwortliche Benutzer vorgeschlagen werden, die dem betrachtenden Metadatenfeld MDF1 bis MDF4 hinzugefügt werden sollen.
Auch der allgemeine Benutzer B profitiert von dieser Funktion. Dem Benutzer B werden automatisch Beziehungen zwischen gesuchten Informationen und potenziell hilfreichen verwandten Entitäten im semantischen Netzwerk vorgeschlagen. Diese Vorschläge resultieren aus einer statischen Analyse der Korrektheit auf Basis der Trennungs- und Korrelationsgrade der Metadaten dieser Entität sowie einer linguistischen (semantischen und lexematischen) Analyse der Entität als solcher mit Hilfe eines LLMs.
3 zeigt ein mögliches Ablaufdiagramm eines Verfahrens zur Benutzung des Datenbanksystems 2.
Dabei wird von verschiedenen Benutzern ausgegangen, die Editierrechte am Datenbanksystem 2, für ihre jeweiligen Domänen aufweisen aber nur Leserechte für das Gesamtsystem. Der Administrator A hat zusätzliche Rechte, um Referenzen zwischen Datenentitäten anzupassen, die in dem Ablaufdiagramm nicht dargestellt sind.
In einem ersten Schritt VS1 wird ein erster Benutzer, der verantwortlich ist Metadaten MD bereitzustellen, mit der Aufgabe beauftragt, Metadaten in die Datenbank 4 einzutragen. Zuvor muss jedoch der Trainingsprozess durchlaufen werden.
In einem zweiten Schritt VS2 führt der erste Benutzer das entsprechende Training durch und wird von dem Datenbanksystem 2 für die Benutzung des Datenbanksystems 2 freigeschaltet. Der erste Benutzer öffnet das Datenbanksystem 2 über die Benutzeroberfläche 6 und prüft Metadaten, die über ihn in dem System gespeichert sind. Wenn die Metadaten korrekt sind, kann der erste Benutzer die Anpassung der über ihn gespeicherten Metadaten beauftragen. Sollte der erste Benutzer Fragen haben, kann er diese über den entsprechenden Chatbot 12 stellen.
In den Schritten VS4 bis VS7 werden die Schritte VS1 bis VS3 für einen zweiten Benutzer und einen dritten Benutzer wiederholt.
In dem Schritt VS8 füllt der dritte Benutzer einen Fragebogen aus, der über Schwellwerte spezifiziert ist und der prüft, ob es notwendig ist, weitere Metadaten einzutragen. Die entsprechenden Schwellwerte sind in dem Metadatenanalysesystem 22 abgelegt.
In einem weiteren Schritt VS9 überprüft der dritte Benutzer, ob die Metadatenvorschläge des Chatbots 12 korrekt sind, wobei der Chatbot 12 den dritten Benutzer dabei unterstützt, die richtigen Metadaten auszuwählen. Wenn die vorläufige Prüfung negativ ausfällt, müssen die entsprechenden Metadaten gemäß dem Schritt VS10 nicht mehr eingegeben werden.
Fällt die Prüfung positiv aus, erhalten weitere Benutzer in einem Schritt VS11 eine Nachricht, die von dem Datenbanksystem 2 ausgelöst wird, mit der Aufforderung, ein entsprechendes Training abzuschließen, wobei diese weiteren Benutzer dann nach dem erfolgten Training freigeschaltet werden. Die weiteren Benutzer ergänzen dann im Datenbanksystem 2 die Metadaten, die noch ausgefüllt werden müssen. Im Falle von weiteren Fragen können diese mittels des Chatbots 12 beantwortet werden.
In einem darauffolgenden Schritt VS12 werden, sobald alle Benutzer ihre Aufgabe erledigt haben, wenigstens ein Administrator bzw. ein Workflow-Beauftragter darüber informiert, dass die entsprechenden Metadaten eingesammelt wurden und dass der Prozess abgeschlossen werden kann.
In einem darauffolgenden Schritt VS13 wird die Liste der aufgezeichneten Metadaten in dem Metadatenverzeichnis 16 aktualisiert und ist für Berichte mittels des Berichtsmoduls 24 verfügbar. Die entsprechenden Berichte können automatisch erstellt werden.
In einem darauffolgenden Schritt VS14 kann geprüft werden, ob die entsprechenden Metadaten MD in dem System in dem Metadatenverzeichnis 16 aktualisiert wurden.
Gemäß des letzten Schritts VS14 kann bei der nächsten Iteration des aufgeführten Prozesses nach den Prozessschritten VS1 bis VS11 eine Datenbestandsbewertung initiiert werden. Änderungen in den Metadatendaten, Berichten, der hierarchischen Struktur und dergleichen können automatisch übernommen werden.
Obwohl die Erfindung im Detail durch bevorzugte Ausführungsbeispiele näher illustriert und erläutert wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und andere Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen. Es ist daher klar, dass eine Vielzahl von Variationsmöglichkeiten existiert. Es ist ebenfalls klar, dass beispielhaft genannte Ausführungsformen wirklich nur Beispiele darstellen, die nicht in irgendeiner Weise als Begrenzung etwa des Schutzbereichs, der Anwendungsmöglichkeiten oder der Konfiguration der Erfindung aufzufassen sind. Vielmehr versetzen die vorhergehende Beschreibung und die Figurenbeschreibung den Fachmann in die Lage, die beispielhaften Ausführungsformen konkret umzusetzen, wobei der Fachmann in Kenntnis des offenbarten Erfindungsgedankens vielfältige Änderungen, beispielsweise hinsichtlich der Funktion oder der Anordnung einzelner, in einer beispielhaften Ausführungsform genannter Elemente, vornehmen kann, ohne den Schutzbereich zu verlassen, der durch die Ansprüche und deren rechtliche Entsprechungen, wie etwa einer weitergehenden Erläuterung in der Beschreibung, definiert wird.
Bezugszeichenliste

2: Datenbanksystem
4: Datenbank
6, 8: Benutzeroberfläche
10: Schulung
12: Chatbot
14: LLM
16: Metadatenverzeichnis
18: Richtliniendatenbank
20: Verteiler
22: Metadatenanalysesystem
24: Berichtsmodul
26: weiteren Datenbanken
A: Administrator
B: Benutzer
BG1, BG2: Benutzergruppe
D: Daten
DS: Datensatz
MD: Metadaten
MDF1 - MDF4: Metadatenfeld

ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

US 2019/0057147 A1 [0007]

Claims

Datenbanksystem (2), mit - wenigstens einer Datenbank (4), in der Datensätze (DS) und den Datensätzen (DS) zugeordnete Metadaten (MD) gespeichert sind, wobei pro Datensatz (DS) eine Mehrzahl an Metadatenfeldern (MDF1 - MDF4) vorgesehen ist, - mindestens einer Benutzeroberfläche (6, 8) zur Eingabe von Datensätzen (DS) einschließlich der Metadaten (MD) durch wenigstens einen Benutzer (B, A), - ein Berechtigungssystem (10), durch das Benutzern (B, A) oder Benutzergruppen (BG1, BG2) unterschiedliche Rollen sowie Zugriffsrechte und/oder Bearbeitungsrechte für die Datensätze (DS) und/oder Metadatenfelder (MDF1 - MDF4) zugewiesen sind, wobei Änderungen und Abfragen der wenigstens einen Datenbank (4) nur auf dieser Basis erlaubt sind, - ein Erläuterungssystem (12, 14) zur Erläuterung der Metadatenfelder (MDF1 - MDF4), dadurch gekennzeichnet, dass das Erläuterungssystem (12, 14) einen Agenten (12) aufweist, der den wenigstens einen Benutzer (B, A) bei der Eingabe von Datensätzen (DS) unterstützt, wobei der Agent (12) ein großes Sprachmodell (14) aufweist, das mit einer Richtliniendatenbank (4) und einem Metadatenverzeichnis (16) verbunden ist, wobei der Agent (12) zur Unterbreitung von Vorschlägen für die Metadatenfelder (MDF1 - MDF4) auf der Basis der Richtliniendatenbank (4) und des Metadatenverzeichnisses (16) eingerichtet ist.
Datenbanksystem (2) nach Anspruch 1, dadurch gekennzeichnet, dass das Berechtigungssystem (10) zur Prüfung eines Systemtrainingsstatus des wenigstens eines Benutzers (B, A) und zur Durchsetzung eines Systemtrainings für den wenigstens einen Benutzer (B, A) ausgebildet ist.
Datenbanksystem (2) nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Agent ein Chatbot (12) ist.
Datenbanksystem (2) nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass ein Metadatenanalysesystem (22) zur Prüfung einer Richtlinienkonformität der Metadaten (MD) an das Metadatenverzeichnis (16) angeschlossen ist.
Datenbanksystem (2) nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass das große Sprachmodell (14) mittels Fine-Tuning, Prompt-Engineering und/oder Retrieval-Augmented Generation auf die Daten der Richtliniendatenbank (4) und dem Metadatenverzeichnis (16) fokussiert ist.
Datenbanksystem (2) nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass ein Berichtsmodul (24) zur Erstellung von Berichten zu den Datensätzen (DS), Metadaten (MD) und/oder Analysen dazu vorgesehen ist.
Datenbanksystem (2) nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Benutzeroberfläche (6, 8) zur Anzeige von unterschiedlichen Benutzeroberfläche abhängig von der Rolle, den Zugriffsrechten und/oder Bearbeitungsrechten ausgebildet ist, wobei wenigstens eine erste Benutzeroberfläche (6) für dateneingebende Benutzer (B, A) und wenigstens eine zweite Benutzeroberfläche (8) für Administratoren (8) vorgesehen ist.
Datenbanksystem (2) nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass das große Sprachmodell (14) dazu eingerichtet ist, Administratoren (A) Metadatenvorschläge zu unterbreiten.
Datenbanksystem (2) nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass ein Arbeitsablaufmodul vorgesehen ist, das dazu eingerichtet ist, einer Mehrzahl von Benutzern (B) Aufgaben zur Eingabe von Datensätzen (DS) und/oder Metadaten (MD) zuzuweisen.
Datenbanksystem (2) nach Anspruch 9, dadurch gekennzeichnet, dass das Arbeitsablaufmodul mit dem Metadatenverzeichnis (16) verbunden ist, wobei das Arbeitsablaufmodul dazu eingerichtet ist, Metadaten (MD) an das Metadatenverzeichnis (16) zu senden.