DE102014201860A1 - Method for term clarification of dependent reference printout during natural language processing of e.g. treaty document, involves resolving instance such that information about complete printout is present at location of instance - Google Patents
Method for term clarification of dependent reference printout during natural language processing of e.g. treaty document, involves resolving instance such that information about complete printout is present at location of instance Download PDFInfo
- Publication number
- DE102014201860A1 DE102014201860A1 DE201410201860 DE102014201860A DE102014201860A1 DE 102014201860 A1 DE102014201860 A1 DE 102014201860A1 DE 201410201860 DE201410201860 DE 201410201860 DE 102014201860 A DE102014201860 A DE 102014201860A DE 102014201860 A1 DE102014201860 A1 DE 102014201860A1
- Authority
- DE
- Germany
- Prior art keywords
- instance
- expression
- sequence
- documents
- dependent reference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/131—Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
HINTERGRUNDBACKGROUND
1. Technisches Gebiet:1. Technical area:
Die vorliegende Erfindung betrifft allgemein ein Verfahren, ein System und ein Computerprogrammprodukt für die Verarbeitung von natürlicher Sprache von Dokumenten. Insbesondere betrifft die vorliegende Erfindung ein Verfahren, ein System und ein Computerprogrammprodukt zur Begriffsklärung von abhängigen Verweisausdrücken bei der Verarbeitung von natürlicher Sprache.The present invention relates generally to a method, system and computer program product for natural language processing of documents. More particularly, the present invention relates to a method, system, and computer program product for disambiguating dependent reference expressions in natural language processing.
2. Beschreibung der zugrunde liegenden Technik:2. Description of the underlying technique:
Dokumente enthalten Informationen in vielerlei Formen. Zum Beispiel vermitteln Textinformationen, die als Sätze und Absätze angeordnet sind, Informationen in einer erzählenden Form.Documents contain information in many forms. For example, textual information arranged as sentences and paragraphs convey information in a narrative form.
Bestimmte Typen von Informationen werden in einer Verweisform dargeboten. Zum Beispiel kann ein Dokument einen Namen, ein Wort, einen Ausdruck oder ein Textsegment enthalten, das in dem Dokument wiederholt vorkommt. Viele Dokumente bestimmen einen Ersetzungsausdruck oder -text, der stellvertretend für den Namen, das Wort, den Ausdruck oder das Textsegment steht, und verwenden den Ersetzungstext für jedes nachfolgende Vorkommen des Namens, des Wortes und des Ausdrucks oder Textsegments nach diesem ersten Vorkommen.Certain types of information are presented in a reference form. For example, a document may include a name, word, phrase, or text segment that occurs repeatedly in the document. Many documents determine a replacement expression or text representative of the name, word, phrase, or text segment, and use the replacement text for each subsequent occurrence of the name, word, and phrase or text segment after that first occurrence.
Der Name, ein Wort, ein Ausdruck oder Textsegment wird als vollständiger Ausdruck oder Komplettausdruck und die Ersetzungsausdrücke oder -texte werden als abhängige Verweisausdrücke bezeichnet. Der abhängige Verweisausdruck dient dazu, die Bedeutung des Komplettausdrucks zu übermitteln, für den der abhängige Verweisausdruck stellvertretend steht.The name, word, phrase, or text segment is called a full or full expression, and the replacement terms or texts are called dependent reference expressions. The dependent reference expression is used to convey the meaning of the full expression for which the dependent reference expression is representative.
Bei der Verarbeitung von natürlicher Sprache (Natural Language Processing, NLP) handelt es sich um eine Technik, die einen Austausch von Informationen zwischen Personen und Datenverarbeitungssystemen ermöglicht. Ein Zweig der NLP befasst sich zum Beispiel mit der Umformung eines bestimmten Inhalts in einer durch Personen nutzbaren Sprache oder Form in eine durch Computer nutzbare Form. NLP kann zum Beispiel ein Dokument entgegennehmen, dessen Inhalt in einer durch Menschen lesbaren Form abgefasst ist, und ein Dokument erstellen, dessen adäquater Inhalt in einer computerspezifischen Sprache oder Form abgefasst ist.Natural Language Processing (NLP) is a technique that allows information to be exchanged between people and data processing systems. For example, a branch of NLP deals with the transformation of a particular content in a human-readable language or form into a computer-usable form. For example, NLP may receive a document whose contents are in a human-readable form and produce a document whose adequate content is in a computer-specific language or form.
KURZDARSTELLUNGSUMMARY
Die anschaulichen Ausführungsformen stellen ein Verfahren, ein System und ein Computerprogrammprodukt zur Begriffsklärung von abhängigen Verweisausdrücken bei der Verarbeitung von natürlicher Sprache bereit. Bei mindestens einer Ausführungsform wird ein Abschnitt eines Dokuments aus einer Folge von Dokumenten ausgewählt, wobei der Abschnitt eine Folge von Instanzen abhängiger Verweisausdrücke enthält. Die Ausführungsform filtert den Abschnitt, um aus einer Folge von abhängigen Verweisausdrücken eine Instanz zu erkennen, indem eine linguistische Eigenschaft der Instanz verwendet wird und wobei die Instanz des abhängigen Verweisausdrucks auf einen Komplettausdruck verweist, der in der Folge von Dokumenten vorkommt. Die Ausführungsform macht den Komplettausdruck in einem Einzeldokument in der Folge von Dokumenten ausfindig, indem sie ausfindig macht, wo der abhängige Verweisausdruck als Stellvertreter für den Komplettausdruck definiert ist. Die Ausführungsform löst unter Verwendung eines Prozessors und eines Speichers die Instanz unter Verwendung des Komplettausdrucks auf, sodass eine Information über den Komplettausdruck an einer Adresse der Instanz verfügbar ist.The illustrative embodiments provide a method, system, and computer program product for disambiguating dependent reference expressions in natural language processing. In at least one embodiment, a portion of a document is selected from a sequence of documents, the portion including a sequence of instances of dependent reference expressions. The embodiment filters the section to recognize an instance from a sequence of dependent reference expressions by using a linguistic property of the instance and where the instance of the dependent reference expression references a complete expression occurring in the sequence of documents. The embodiment locates the complete expression in a single document in the sequence of documents by locating where the dependent reference expression is defined as a representative of the complete expression. The embodiment, using a processor and a memory, resolves the instance using the full expression so that information about the full expression is available at an address of the instance.
KURZBESCHREIBUNG DER VERSCHIEDENEN ZEICHNUNGSANSICHTENBRIEF DESCRIPTION OF THE VARIOUS DRAWING VIEWS
Die für die Erfindung als neuartig angesehenen Merkmale der Erfindung werden in den beiliegenden Ansprüchen dargelegt. Die Erfindung selbst jedoch sowie ein bevorzugter Anwendungsmodus, weitere ihrer Zielstellungen und Vorteile werden am besten unter Bezugnahme auf die folgende detaillierte Beschreibung einer anschaulichen Ausführungsform verständlich, wenn diese in Verbindung mit den beiliegenden Ansprüchen gelesen wird, wobei:The features of the invention believed to be novel to the invention are set forth in the appended claims. However, the invention itself, and a preferred mode of use, further of its objects and advantages, will best be understood by reference to the following detailed description of an illustrative embodiment when read in conjunction with the appended claims, wherein:
DETAILLIERTE BESCHREIBUNGDETAILED DESCRIPTION
Die anschaulichen Ausführungsformen gehen davon aus, dass Dokumente, die einer NLP unterzogen werden, üblicherweise abhängige Verweisausdrücke enthalten, d. h. Text, der stellvertretend für bestimmte Komplettausdrücke steht, die irgendwo in den Dokumenten vorkommen. Zum Beispiel gehen die anschaulichen Ausführungsformen davon aus, dass der Komplettausdruck in bestimmten Fällen eher am Anfang eines Dokuments vorkommen kann, während Instanzen des entsprechenden abhängigen Verweisausdrucks über das Dokument verstreut sind. Bei einem rückweisenden (anaphorischen) Ausdruck handelt es sich um einen Ausdruck, der erneut eine Einheit erwähnt, auf die zuvor durch einen vorhergehenden Ausdruck verwiesen wurde. Sowohl der rückweisende Ausdruck als auch der vorhergehende Ausdruck verweisen auf etwas außerhalb des Dokuments, das als Verweisobjekt dient.The illustrative embodiments assume that documents undergoing NLP typically contain dependent reference expressions, i. H. Text that is representative of certain complete expressions that appear anywhere in the documents. For example, the illustrative embodiments assume that in some cases the full expression may occur at the beginning of a document while instances of the corresponding dependent reference term are scattered throughout the document. A rejecting (anaphoric) expression is an expression that mentions another entity previously referenced by a previous expression. Both the rejecting expression and the previous expression refer to something outside the document that serves as a reference object.
Die anschaulichen Ausführungsformen gehen davon aus, dass in bestimmten anderen Fällen der Komplettausdruck eher am Ende eines Dokuments vorkommen kann, während Instanzen des entsprechenden abhängigen Verweisausdrucks über das Dokument verstreut sind. Bei einem vorausweisenden (cataphoric) Ausdruck handelt es sich um einen Ausdruck, der erneut eine Einheit erwähnt, auf die durch einen nachfolgenden Ausdruck verwiesen wird. Sowohl der vorausweisende Ausdruck als auch der nachfolgende Ausdruck verweisen auf etwas außerhalb des Dokuments, das als Bezugsobjekt dient.The illustrative embodiments assume that in certain other cases the full expression may occur at the end of a document while instances of the corresponding dependent reference term are scattered throughout the document. A cataphoric expression is an expression that mentions again a unit referenced by a subsequent expression. Both the predictive expression and the subsequent expression refer to something outside the document that serves as the reference object.
Die anschaulichen Ausführungsformen gehen auch davon aus, dass der Komplettausdruck und der abhängige Verweisausdruck möglicherweise nicht in ein und demselben Dokument vorkommen. Zum Beispiel kann bei einer Folge von einem oder mehreren Dokumenten wie beispielsweise bei einem Vertragsdokument mit einem oder mehreren Anhangsdokumenten das Vertragsdokument den Komplettausdruck enthalten, und das Vertragsdokument und die Anhangsdokumente können Instanzen des entsprechenden abhängigen Verweisausdrucks enthalten.The illustrative embodiments also assume that the complete expression and the dependent reference expression may not be in the same document. For example, in a sequence of one or more documents, such as a contract document with one or more attachment documents, the contract document may include the complete expression, and the contract document and attachment documents may include instances of the corresponding dependent reference expression.
Die anschaulichen Ausführungsformen gehen davon aus, dass ein beliebiger Umfang an Inhalt in einem bestimmten Dokument (Wortabstand) und eine beliebige Anzahl von Dokumenten in einer bestimmten Folge von Dokumenten (Dokumentenabstand) eine Instanz eines abhängigen Verweisausdrucks von dem entsprechenden Komplettausdruck trennen kann. Die zurzeit verfügbare NLP-Technologie ist beim Auflösen der Bedeutung einer Instanz des abhängigen Verweisausdrucks wirkungsarm oder fehleranfällig, wenn der entsprechende Komplettausdruck nicht in nächster Nähe zu der Instanz des abhängigen Verweisausdrucks vorkommt. Beispielsweise sind einige zurzeit verfügbare NLP-Technologien auf einige wenige Sätze oder Absätze beschränkt, innerhalb derer die Bedeutung des abhängigen Verweisausdrucks aufgelöst werden kann. Wenn der abhängige Verweisausdruck und der Komplettausdruck zum Beispiel durch mehr als sechs Zeilen oder einen Absatz voneinander getrennt sind, wenn sie in einem Dokument beispielsweise mehrere Seiten getrennt voneinander vorkommen, verwenden einige zurzeit verfügbare NLP-Technologien einfach den abhängigen Verweisausdruck, ohne den abhängigen Verweisausdruck zum entsprechenden Komplettausdruck aufzulösen.The illustrative embodiments assume that any amount of content in a particular document (word spacing) and any number of documents in a particular sequence of documents (document distance) can separate an instance of a dependent reference expression from the corresponding complete expression. The currently available NLP technology is weak or prone to error in resolving the meaning of an instance of the dependent reference expression if the corresponding complete expression does not occur in close proximity to the instance of the dependent reference expression. For example, some currently available NLP technologies are limited to a few sentences or paragraphs within which the meaning of the dependent reference expression may be resolved. For example, if the dependent reference expression and the complete expression are separated by more than six rows or a paragraph, for example, if they appear in a document separately from one another, some currently available NLP technologies simply use the dependent reference expression without the dependent reference expression corresponding complete expression dissolve.
Andere zurzeit verfügbare NLP-Technologien versuchen, den abhängigen Verweisausdruck möglicherweise aufzulösen, indem sie eine Instanz eines abhängigen Verweisausdrucks mit einer vorhergehenden Instanz des abhängigen Verweisausdrucks verknüpfen, um auf diese Weise eine koreferenzielle Kette zu bilden. Die anschaulichen Ausführungsformen gehen davon aus, dass selbst wenn einige verfügbare NLP-Techniken abhängige Verweisausdrücke auflösen können, die in größeren Abständen von einer anderen Erwähnung desselben Bezugsobjekts vorkommen, ein solches Auflösen aufgrund ihrer Abhängigkeit von Textsuchen, die zum Vorschlagen der richtigen vorhergehenden Instanz des abhängigen Verweisausdrucks üblicherweise Kombinationen von unzuverlässigen Suchkriterien verwenden, für Fehler oder Funktionsmängel anfällig ist.Other currently available NLP technologies may attempt to resolve the dependent reference expression by associating an instance of a dependent reference expression with a previous instance of the dependent reference expression, thus forming a coreferential chain. The illustrative embodiments assume that even if some available NLP techniques can resolve dependent reference expressions occurring at greater intervals from a different mention of the same reference object, such resolution will be due to their dependency on text searches used to propose the correct preceding instance of the dependent Reference expressions typically use combinations of unreliable search criteria that are prone to errors or malfunctioning.
Die anschaulichen Ausführungsformen gehen davon aus, dass diese sowie weitere gegenwärtige Einschränkungen beim Auflösen abhängiger Verweisausdrücke eine schwierige Verarbeitung von natürlicher Sprache verursachen. Hierfür soll der folgende Beispielsatz in einem Dokument – „The 2009 Series C Bonds will be issued under and subject to the terms and conditions contained in a resolution adopted by the County.” (Die 2009er Anleihen, Serie C, werden gemäß den allgemeinen Geschäftsbedingungen begeben, die in einem vom Bezirk gefassten Beschluss enthalten sind.) betrachtet werden. Der abhängige Verweisausdruck „the 2009 Series C Bonds” (die 2009er Anleihen, Serie C) bezieht sich auf ein bestimmtes festverzinsliches Wertpapier, und der abhängige Verweisausdruck „the County” (der Bezirk) bezieht sich auf einen bestimmten Bezirk (county). Das Subjekt „bond” (Anleihe) und das Subjekt „county” (Bezirk) sind nicht ohne zusätzliche Rückschlüsse kenntlich, beispielsweise durch Ermitteln einer Gleichheitsbeziehung zwischen diesen Ausdrücken und durch andere Informationen, die in einem anderen Abschnitt des Dokuments oder in einem anderen Dokument in einer bestimmten Folge von Dokumenten bereitgestellt werden.The illustrative embodiments assume that these and other current limitations in resolving dependent reference expressions cause difficult natural language processing. For this, the following example sentence in a document - "The 2009 Series C Bonds will be issued under and subject to (The 2009 Series C bonds are issued in accordance with the terms and conditions contained in a resolution adopted by the District.). The dependent reference term "the 2009 Series C Bonds" refers to a particular fixed income security and the dependent reference term "the county" refers to a particular county. The subject "bond" and the subject "county" are not identified without additional inference, for example, by establishing an equality relationship between these terms and other information contained in another section of the document or in another document in a specific sequence of documents.
Es werde angenommen, dass irgendwo in dem Dokument der folgende Satz vorkommt – ”The $60,000,000 General Obligation Public Improvement and School Bonds, 2009 Series B (the ”2009 Series B Bonds”) and the $60,000,000 General Obligation Public Improvement and School Bonds, 2009 Series C (Federally Taxable-Build America Bonds – Direct Payment) (the ”2009 Series C Bonds”) (collectively, the ”Bonds”) of Shelby County, Tennessee (the ”County”)...” ((Die 2009er Kommunalanleihen für öffentliche Aufgaben und Schulen, Serie B, in Höhe von 60.000.000 USD (die „2009er Anleihen, Serie B”) und die 2009er Kommunalanleihen für öffentliche Aufgaben und Schulen, Serie C, in Höhe von 60.000.000 USD (steuerpflichtige Build America Bonds – Direktzahlung) (die „2009er Anleihen, Serie C”) (kurz: die „Anleihen”) des Bezirks Shelby, Tennessee (der „Bezirk”))...”. Um die abhängigen Verweisausdrücke des obigen Satzes innerhalb des Kontextes des Dokuments richtig aufzulösen, muss die Beziehung der abhängigen Verweisausdrücke zu dem Komplettausdruck im letzteren Satz berechnet werden.Suppose that somewhere in the document the following sentence occurs - "The $ 60,000,000 General Obligation Public Improvement and School Bonds, 2009 Series B (the 2009 Series B Bonds") and the $ 60,000,000 General Obligation Public Improvement and School Bonds, 2009 Series C (Federally Taxable-Build America Bonds - Direct Payment) (the "2009 Series C Bonds") of Shelby County, Tennessee (the "County") ... "((The 2009 Municipal Bonds for Public Tasks and Schools, Series B, worth $ 60,000,000 (the "2009 B Series Series Bonds") and the 2009 Municipal Public Service and School C Series Public Bonds, $ 60,000,000 (Build America Bonds taxable - direct payment) (the "2009 Series C Series" bonds) (in short: the "Bonds") of the Shelby, Tennessee district (the "District")). "To add the dependent references to the above sentence within the context of the document right To resolve, the relationship of the dependent reference expressions to the complete expression in the latter sentence must be calculated.
Bei den anschaulichen Ausführungsformen wird davon ausgegangen, dass die zurzeit verfügbaren NLP-Technologien aus einer Kombination von Gründen beim Analysieren abhängiger Verweisausdrücke innerhalb des wahren Kontextes des Dokuments versagen. Einige NLP-Technologien versagen zum Beispiel aufgrund des Wortabstands oder des Dokumentabstands zwischen einer Instanz eines abhängigen Verweisausdrucks und einem entsprechenden Komplettausdruck. Selbst NLP-Technologien, die mit Werkzeugen zur rückweisenden Begriffsklärung ausgestattet sind, stoßen wegen Wort- und Dokumentabständen auf Grenzen.The illustrative embodiments assume that the currently available NLP technologies fail for a combination of reasons when analyzing dependent reference expressions within the true context of the document. For example, some NLP technologies fail between an instance of a dependent reference expression and a corresponding complete expression due to word spacing or document distance. Even NLP technologies, which are equipped with tools for rejecting the term, are limited by word and document spacing.
Einige andere NLP-Technologien versagen sogar beim Erkennen bestimmter Texte als Instanz eines abhängigen Verweisausdrucks. Wenn einige NLP-Technologien zum Beispiel eine linguistische Eigenschaft des abhängigen Verweisausdrucks wie beispielsweise eine Einzahlform zugrunde legen, wird eine Mehrzahlform des abhängigen Verweisausdrucks für die Auflösung nicht erkannt. In einem weiteren Beispiel werden bei einer rückweisenden Begriffsklärung vorausweisende abhängige Verweisausdrücke nicht erkannt, die weniger gebräuchlich sind als rückweisende Verweise. Wiederum andere NLP-Technologien sind möglicherweise von einer Kombination dieser und weiterer Nachteile betroffen, was dazu führen kann, dass bestimmte Instanzen abhängiger Verweisausdrücke aufgelöst werden, andere wiederum nicht.Some other NLP technologies even fail to recognize specific texts as an instance of a dependent reference expression. For example, if some NLP technologies use a linguistic property of the dependent reference expression, such as a singular form, a multiple form of the dependent reference expression is not recognized for the resolution. In another example, in a rejecting term explanation, predictive dependent reference expressions are not recognized that are less common than rejecting references. Still other NLP technologies may be affected by a combination of these and other disadvantages, which may cause certain instances of dependent reference expressions to be resolved, while others may not.
Die zum Beschreiben der Erfindung verwendeten anschaulichen Ausführungsformen behandeln und lösen allgemein die oben beschriebenen Probleme sowie andere mit den Einschränkungen zurzeit verfügbarer NLP-Technologien verbundener Probleme. Die anschaulichen Ausführungsformen stellen ein Verfahren, ein System und ein Computerprogrammprodukt zur Begriffsklärung von abhängigen Verweisausdrücken bei der Verarbeitung von natürlicher Sprache bereit.The illustrative embodiments used to describe the invention generally address and solve the problems described above, as well as other problems associated with the limitations of currently available NLP technologies. The illustrative embodiments provide a method, system, and computer program product for disambiguating dependent reference expressions in natural language processing.
Die anschaulichen Ausführungsformen suchen mittels eines Filterungsprozesses nach den Instanzen von abhängigen Verweisausdrücken in einem Dokument. Die anschaulichen Ausführungsformen machen den entsprechenden Komplettausdruck in einer bestimmten Folge von Dokumenten über einen unbegrenzten Wort- oder Dokumentabstand hinweg ausfindig. Die anschaulichen Ausführungsformen klären unter Verwendung des Komplettausdrucks jede Instanz des abhängigen Verweisausdrucks.The illustrative embodiments use a filtering process to search for the instances of dependent reference expressions in a document. The illustrative embodiments locate the corresponding complete expression in a particular sequence of documents over an unlimited word or document distance. The illustrative embodiments clarify each instance of the dependent reference expression using the full expression.
Eine Ausführungsform klärt eine Instanz des abhängigen Verweisausdrucks, indem sie den abhängigen Verweisausdruck in dem in natürlicher Sprache verarbeiteten Ausgabedokument durch den Komplettausdruck ersetzt. Bei einer anderen Ausführungsform wird eine Instanz des abhängigen Verweisausdrucks durch Ändern des abhängigen Verweisausdrucks in der Weise geklärt, dass der Komplettausdruck vom Standort der Instanz des abhängigen Verweisausdrucks in dem in natürlicher Sprache verarbeiteten Ausgabedokument verfügbar oder zugreifbar wird.One embodiment clarifies an instance of the dependent reference expression by replacing the dependent reference expression in the natural language processed output document with the complete expression. In another embodiment, an instance of the dependent reference expression is clarified by changing the dependent reference expression such that the complete expression becomes available or accessible from the location of the instance of the dependent reference expression in the natural language output document.
Eine Ausführungsform ersetzt zum Beispiel unter Verwendung der oben beschriebenen beispielhaften Sätze alle Instanzen von „the County” in dem Ausgabedokument durch „Shelby County, Tennessee”. Eine andere Ausführungsform veranlasst bestimmte Instanzen von „the County”, in dem Ausgabedokument einen von „Shelby County, Tennessee” abweichenden Text anzuzeigen. Eine weitere Ausführungsform veranlasst bestimmte Instanzen von „the County”, einen Hyperlink auf das Vorkommen des Ausdrucks „Shelby County, Tennessee” in dem Ausgabedokument zu enthalten. Eine weitere Ausführungsform veranlasst bestimmte Instanzen von „the County”, einen Hyperlinkt auf ein anderes Dokument in der vorliegenden Folge von Eingabedokumenten zu enthalten, die auf „Shelby County, Tennessee” in dem Ausgabedokument verweisen.For example, one embodiment replaces all instances of "the County" in the output document by "Shelby County, Tennessee" using the exemplary sentences described above. Another embodiment causes certain instances of "the county" to display a text other than "Shelby County, Tennessee" in the output document. Another embodiment causes certain instances of "the county" to hyperlink to the occurrence of the term "Shelby County, Tennessee" in the output document. Another embodiment causes certain instances of "the county" to include a hyperlink to another document in the present series of input documents that refer to "Shelby County, Tennessee" in the output document.
Diese beispielhaften Verfahrensweisen zum Auflösen eines abhängigen Verweisausdrucks in den entsprechenden Komplettausdruck sind nicht als Beschränkung auf die anschaulichen Ausführungsformen zu verstehen. Eine Ausführungsform kann innerhalb des Schutzumfangs der anschaulichen Ausführungsformen diese oder eine Kombination dieser und anderer Verfahrensweisen zum Auflösen abhängiger Verweisausdrücke umsetzen.These example procedures for resolving a dependent reference expression into the corresponding complete expression are not to be understood as limiting the illustrative embodiments. One embodiment may, within the scope of the illustrative embodiments, implement these or a combination of these and other methods of resolving dependent reference expressions.
Die anschaulichen Ausführungsformen werden nur anhand von Beispielen unter Bezugnahme auf bestimmte Typen von Dokumenten, Komplettausdrücken und abhängigen Verweisausdrücken beschrieben. Solche Typen von Dokumenten, Komplettausdrücken und abhängigen Verweisausdrücken oder deren beispielhafte Attribute sind nicht als Einschränkung der Erfindung zu verstehen.The illustrative embodiments will be described by way of example only with reference to certain types of documents, complete expressions, and dependent reference expressions. Such types of documents, complete expressions and dependent reference expressions or their exemplary attributes are not to be construed as limiting the invention.
Darüber hinaus können die anschaulichen Ausführungsformen in Bezug auf jeden beliebigen Typ von Daten, Datenquellen oder Zugriff auf eine Datenquelle über ein Datennetzwerk realisiert werden. Jeder beliebige Typ von Datenspeichereinheit kann die Daten für eine Ausführungsform der Erfindung innerhalb des Schutzumfangs der Erfindung entweder lokal an einem Datenverarbeitungssystem oder über ein Datennetzwerk bereitstellen.Moreover, the illustrative embodiments may be implemented over any data type, data sources, or access to a data source over a data network. Any type of data storage unit may provide the data for one embodiment of the invention within the scope of the invention either locally to a data processing system or over a data network.
Die anschaulichen Ausführungsformen werden unter Verwendung bestimmter Codes, Entwürfe, Architekturen, Protokolle, Layouts, Schemata und Tools lediglich anhand von Beispielen beschrieben und sollen nicht darauf beschränkt sein. Darüber hinaus werden die anschaulichen Ausführungsformen zur Verdeutlichung der Beschreibung in einigen Fällen unter Verwendung bestimmter Software, Tools und Datenverarbeitungsumgebungen lediglich anhand von Beispielen beschrieben. Die anschaulichen Ausführungsformen können in Verbindung mit anderen vergleichbaren oder ähnlich zweckbestimmten Strukturen, Systemen, Anwendungen oder Architekturen verwendet werden. Eine anschauliche Ausführungsform kann in Form von Hardware, Software oder einer Kombination derselben realisiert werden.The illustrative embodiments are described, and are not intended to be, by way of example only, using particular codes, designs, architectures, protocols, layouts, schemas, and tools. In addition, for clarity of description, the illustrative embodiments will be described in some instances using specific software, tools, and computing environments, by way of example only. The illustrative embodiments may be used in conjunction with other comparable or similar dedicated structures, systems, applications, or architectures. An illustrative embodiment may be implemented in the form of hardware, software, or a combination thereof.
Die Beispiele in dieser Offenbarung dienen nur zur Verdeutlichung der Beschreibung und sind nicht als Einschränkung der anschaulichen Ausführungsformen zu verstehen. Weitere Daten, Operationen, Aktionen, Tasks, Aktivitäten und Manipulationen werden aus dieser Offenbarung denkbar und sollen innerhalb des Schutzumfangs der anschaulichen Ausführungsformen enthalten sein.The examples in this disclosure are only to aid in the description and are not to be construed as limiting the illustrative embodiments. Other data, operations, actions, tasks, activities and manipulations will be conceivable from this disclosure and are intended to be included within the scope of the illustrative embodiments.
Alle hierin aufgeführten Vorteile stellen lediglich Beispiele dar und sind nicht als Beschränkung auf die anschaulichen Ausführungsformen zu verstehen. Weitere oder andere Vorteile können durch spezielle anschauliche Ausführungsformen erlangt werden. Darüber hinaus kann eine bestimmte anschauliche Ausführungsform einige, alle oder keine der oben aufgeführten Vorteile aufweisen.All advantages listed herein are merely examples and should not be construed as limiting the illustrative embodiments. Other or other advantages may be obtained by specific illustrative embodiments. In addition, one particular illustrative embodiment may have some, all, or none of the advantages listed above.
Unter Bezugnahme auf die Figuren und insbesondere unter Bezugnahme auf die
Außerdem sind auch noch Clients
Die Server
In dem gezeigten Beispiel kann der Server
In dem gezeigten Beispiel kann es sich bei der Datenverarbeitungsumgebung
Die Datenverarbeitungsumgebung
In dem gezeigten Beispiel nutzt das Datenverarbeitungssystem
In dem gezeigten Beispiel ist ein lokaler Netzwerk-(LAN-)Adapter
Speicher wie beispielsweise der Hauptspeicher
Ein Betriebssystem wird auf der Verarbeitungseinheit
Anweisungen für das Betriebssystem, das objektorientierte Programmiersystem und Anwendungen oder Programme wie beispielsweise die Anwendung
Die Hardware in den
Gemäß einigen anschaulichen Beispielen kann es sich bei dem Datenverarbeitungssystem
Eine Datenübertragungseinheit kann eine oder mehrere Einheiten beinhalten, die zum Senden und Empfangen von Daten verwendet werden, beispielsweise einen Modem oder einen Netzwerkadapter. Bei einem Speicher kann es sich zum Beispiel um den Hauptspeicher
Die gezeigten Beispiele in den
Zurzeit verfügbare NLP-Technologien wie beispielsweise die NLP-Steuerkomponente
Bei dem Dokument
Bei den Dokumenten
Die Anwendung
Gemäß einer anderen Ausführungsform filtert die Komponente
Die Komponente
Die Komponente
Gemäß einer anderen beispielhaften Ausführungsform verändert die Komponente
Die Anwendung
Bei dem Komplettausdruck
Gemäß einer Ausführungsform löst eine Anwendung wie beispielsweise die Anwendung
Bei dem Dokument
Bei dem Komplettausdruck
Gemäß einer Ausführungsform löst eine Anwendung, beispielsweise die Anwendung
Eine solche Ausführungsform erzeugt oder verändert einen Abschnitt
Gemäß einer Ausführungsform sind die Instanzen
Der Prozess
Der Prozess
Durch den Prozess
Wenn noch weitere Abschnitte oder Dokumente geklärt werden sollen („Ja”-Zweig von Schritt
Der Prozess
Der Prozess
Die Ablaufpläne und die Blockschaubilder in den Figuren veranschaulichen die Architektur, die Funktionalität und die Arbeitsweise möglicher Implementierungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. Demgemäß kann jeder Block in den Ablaufplänen oder in den Blockschaubildern ein Modul, ein Segment oder einen Abschnitt eines Codes darstellen, der eine oder mehrere ausführbare Anweisungen zum Umsetzen der angegebenen Logikfunktion(en) aufweist. Zu beachten ist, dass bei einigen alternativen Implementierungen die in dem Block angegebenen Funktionen in einer von den Figuren abweichenden Reihenfolge vorkommen können. Zum Beispiel können zwei nacheinander gezeigte Blöcke je nach vorgesehener Funktionalität in Wirklichkeit im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können mitunter in der umgekehrten Reihenfolge ausgeführt werden. Ferner ist zu beachten, dass jeder Block in den Blockschaubildern und/oder in den Ablaufplänen und Kombinationen von Blöcken in den Blockschaubildern und/oder in den Ablaufplänen durch spezielle Hardware-Systeme oder Kombinationen von Spezial-Hardware und Computer-Anweisungen umgesetzt werden können, die die angegebenen Funktionen oder Aktionen ausführen.The flowcharts and block diagrams in the figures illustrate the architecture, functionality, and operation of possible implementations of systems, methods, and computer program products according to various embodiments of the present invention. Accordingly, each block in the flowcharts or block diagrams may represent a module, segment or portion of code having one or more executable instructions for implementing the specified logic function (s). It should be noted that in some alternative implementations, the functions specified in the block may occur in a different order from the figures. For example, two blocks shown one after the other may in fact be executed substantially simultaneously, depending on the intended functionality, or the blocks may sometimes be executed in the reverse order. It should also be noted that each block in the block diagrams and / or schedules and combinations of blocks in the block diagrams and / or schedules may be implemented by special hardware systems or combinations of specialized hardware and computer instructions perform the specified functions or actions.
Somit werden in den anschaulichen Ausführungsformen ein computergestütztes Verfahren, System und Computerprogrammprodukt zur Begriffsklärung von abhängigen Verweisausdrücken bei der Verarbeitung von natürlicher Sprache bereitgestellt. Eine Ausführungsform löst Instanzen eines abhängigen Verweisausdrucks in ihren entsprechenden Komplettausdruck derart auf, dass jede Instanz des abhängigen Verweisausdrucks in einem Ausgabedokument einer Ausführungsform so verändert wird, dass sie den Komplettausdruck anzeigt, auf den sie sich in einem Eingabedokument bezieht. Eine Ausführungsform kann Instanzen eines abhängigen Verweisausdrucks über eine Folge einer beliebigen Anzahl von Dokumenten hinweg klären, wenn die Bearbeitung von natürlicher Sprache des gesamten Inhalts der Folge von Dokumenten durchgeführt werden soll, nachdem eine Ausführungsform auf die Folge von Dokumenten eingewirkt hat. Nicht enthalten in der als Eingabe für eine Ausführungsform dienenden Folge von Dokumenten sind ein Lexikon, eine Ontologie, eine Wissensdatenbank oder eine Datenablage, die im Allgemeinen zum Übersetzen von Dokumenten dienen.Thus, in the illustrative embodiments, a computer-aided method, system, and computer program product are provided for disambiguating dependent reference expressions in natural language processing. One embodiment resolves instances of a dependent reference expression to its corresponding full expression such that each instance of the dependent reference expression in an output document of an embodiment is changed to display the complete expression to which it refers in an input document. An embodiment may resolve instances of a dependent reference expression over a sequence of any number of documents if natural language editing of the entire content of the sequence of documents is to be performed after one embodiment has acted on the sequence of documents. Not included in the input for one embodiment A consequence of documents is a lexicon, an ontology, a knowledge database or a data store, which are generally used for translating documents.
Durch Begriffsklärung von abhängigen Verweisausdrücken unter Verwendung einer Ausführungsform kann eine nachgeschaltete Komponente zur Verarbeitung von Dokumenten wie beispielsweise eine NLP-Steuerkomponente den Komplettausdruck verwenden, ohne davon Kenntnis haben zu müssen, wie Instanzen des abhängigen Verweisausdrucks verwendet oder aufgelöst werden müssen. Eine Ausführungsform verbessert die Brauchbarkeit des geklärten Dokuments für verschiedene Tasks zur Verarbeitung des Dokuments. Zum Beispiel beruhen viele Tasks zum Abrufen und Zusammenfassen von Informationen auf Worthäufigkeitszahlen. Eine Ausführungsform erzeugt ein Dokument, in dem die Anzahl der Erwähnungen des Komplettausdrucks, z. B. Shelby County, Tennessee, zunimmt, was quantitativ den Eindruck unterstreicht, dass es in dem Dokument „um” den Bezirk Shelby County im Staat Tennessee „geht”, wodurch die Genauigkeit von Anwendungen erhöht wird, die auf Worthäufigkeiten beruhen. Zum Beispiel führt die Berechnung des Ausgabedokuments einer Ausführungsform dazu, dass es auf eine Abfrage, die den Begriff „Shelby County” enthält, mit höherer Wahrscheinlichkeit zutrifft als das Eingabedokument für eine Ausführungsform, das mit dem Ausdruck „the County” (der Bezirk) auf den Begriff „Shelby County” verweist.By conceptualizing dependent reference expressions using one embodiment, a downstream document processing component such as an NLP engine can use the full expression without having to know how to use or resolve instances of the dependent reference expression. One embodiment improves the usefulness of the clarified document for various tasks for processing the document. For example, many tasks for retrieving and summarizing information are based on word frequency numbers. One embodiment creates a document in which the number of mentions of the complete expression, e.g. Shelby County, Tennessee, for example, quantitatively underlines the impression that the "um" document is "going" to Shelby County, Tennessee, thereby increasing the accuracy of applications based on word frequencies. For example, computing the output document of an embodiment makes it more likely that a query including the term "Shelby County" would be more accurate than the input document for an embodiment labeled "the county" The term "Shelby County" refers.
Beispielsweise wird bei vielen Tasks zur Sprachverarbeitung zwischen Alltagswörtern und Fachbegriffen unterschieden, die stärker zur Unterscheidung von Dokumenten untereinander beitragen. Eine Ausführungsform zur Begriffsklärung kann typische Begriffe, z. B. „The Bonds” (die Anleihen) durch entsprechende weniger typische und aussagekräftigere Begriffe ersetzen, wodurch die Fähigkeit eines Systems verbessert wird, den semantischen Inhalt des Ausgabedokuments besser als den des Eingabedokuments zu kennzeichnen.For example, many speech-processing tasks distinguish between everyday words and technical terms that are more conducive to distinguishing documents from one another. An embodiment of the term clarification may include typical terms, e.g. For example, replace "The Bonds" with corresponding less typical and more meaningful terms, thereby improving the ability of a system to better characterize the semantic content of the output document than that of the input document.
Ein weiteres Beispiel besagt, dass Tasks der Sprachverarbeitung, beispielsweise zum Abrufen von Absätzen, Text eines Dokuments mit der Abfrage eines Benutzers vergleichen und dann dem Benutzer ein Fenster fest vorgegebener Größe mit Wörtern aus dem Dokument anzeigen, sodass der Benutzer entscheiden kann, ob das Dokument tatsächlich die gewünschten Informationen enthält. Wenn, wie bei einem beispielhaften Ausgabedokument einer Ausführungsform, ein genauerer Text als der mehrdeutige Text „the County”, z. B. „Shelby County, Tennessee”, in einem Eingabedokument einer Ausführungsform angezeigt wird, legt das Textfenster den Inhalt des Dokuments besser offen und ist daher für den Benutzer von größerem Nutzen.As another example, speech-processing tasks, such as retrieving paragraphs, compare text of a document to a user's query, and then display the user with a fixed-size window of words from the document, so that the user can decide whether to have the document actually contains the desired information. If, as in an exemplary output document of an embodiment, a more accurate text than the ambiguous text "the County", e.g. "Shelby County, Tennessee" is displayed in an input document of an embodiment, the text window better exposes the contents of the document and is therefore more useful to the user.
Dem Fachmann ist einsichtig, dass Aspekte der vorliegenden Erfindung als System, Verfahren oder Computerprogrammprodukt umgesetzt werden können. Demgemäß können Aspekte der vorliegenden Erfindung die Form einer kompletten Hardware-Umgebung, einer kompletten Software-Umgebung (darunter Firmware, residente Software, Mikrocode usw.) oder einer Ausführungsform annehmen, die Software- und Hardware-Aspekte in sich vereint, die hierin sämtlich allgemein als „Schaltung”, „Modul” oder „System” bezeichnet werden können. Darüber hinaus können Aspekte der vorliegenden Erfindung die Form eines Computerprogrammprodukts annehmen, das in einer oder mehreren computerlesbaren Speichereinheiten oder einem computerlesbaren Medium mit einem darauf gespeicherten computerlesbaren Programmcode verkörpert ist.It will be understood by those skilled in the art that aspects of the present invention may be implemented as a system, method, or computer program product. Accordingly, aspects of the present invention may take the form of a complete hardware environment, a complete software environment (including firmware, resident software, microcode, etc.), or an embodiment that incorporates software and hardware aspects, all of which are generic herein can be referred to as a "circuit", "module" or "system". In addition, aspects of the present invention may take the form of a computer program product embodied in one or more computer readable storage devices or a computer readable medium having computer readable program code stored thereon.
Es kann eine beliebige Komponente von einer oder mehreren computerlesbaren Speichereinheiten verwendet werden. Bei dem computerlesbaren Medium kann es sich um ein computerlesbares Signalmedium oder um ein computerlesbares Speichermedium handeln. Bei einer computerlesbaren Speichereinheit kann es sich zum Beispiel, ohne darauf beschränkt zu sein, um ein elektronisches, magnetisches, optisches, elektromagnetisches, Infrarot- oder Halbleitersystem, eine entsprechende Vorrichtung oder Einheit oder um eine beliebige geeignete Kombination derselben handeln. Zu konkreteren Beispielen (eine nicht erschöpfende Aufzählung) der computerlesbaren Speichereinheit können folgende gehören: eine elektrische Verbindung mit einer oder mehreren Leitungen, eine tragbare Computer-Diskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer programmierbarer Nur-Lese-Speicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein tragbarer Compact Disc-Nur-Lese-Speicher (CD-ROM), eine optische Speichereinheit, eine magnetische Speichereinheit oder eine beliebige geeignete Kombination derselben. In Verbindung mit diesem Dokument kann es sich bei einer computerlesbaren Speichereinheit um eine beliebige materielle Einheit oder ein Medium handeln, das ein Programm zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder Einheit zum Ausführen von Anweisungen enthalten oder speichern kann.Any component of one or more computer-readable storage devices may be used. The computer readable medium may be a computer readable signal medium or a computer readable storage medium. For example, a computer-readable storage device may be, but is not limited to, an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system, device, or device, or any suitable combination thereof. More concrete examples (non-exhaustive list) of the computer-readable storage device may include: an electrical connection to one or more lines, a portable computer disk, a hard disk, random access memory (RAM), read-only memory (ROM), an erasable programmable read only memory (EPROM or flash memory), an optical fiber, a portable compact disc read only memory (CD-ROM), an optical storage unit, a magnetic storage unit, or any suitable combination thereof. In connection with this document, a computer-readable storage device may be any physical entity or medium that may contain or store a program for use by or in connection with a system, device, or device for executing instructions.
Ein auf einer computerlesbaren Speichereinheit oder einem computerlesbaren Medium verkörperter Programmcode kann unter Verwendung eines beliebigen geeigneten Mediums, darunter, ohne darauf beschränkt zu sein, drahtlos, leitungsgebunden, Lichtwellenleiter, HF usw. oder eine beliebige geeignete Kombination derselben, übertragen werden.A program code embodied on a computer readable storage device or computer readable medium may be transmitted using any suitable medium including, but not limited to, wireless, wireline, fiber optic, RF, etc., or any suitable combination thereof.
Ein Programmcode zum Ausführen von Operationen für Aspekte der vorliegenden Erfindung kann in einer beliebigen Kombination von einer oder mehreren Programmiersprachen geschrieben sein, darunter eine objektorientierte Programmiersprache wie beispielsweise Java, Smalltalk, C++ oder dergleichen und herkömmliche prozedurale Programmiersprachen wie beispielsweise die Programmiersprache „C” oder ähnliche Programmiersprachen. Der Programmcode kann komplett auf dem Computer eines Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Softwarepaket, teilweise auf dem Computer des Benutzers und teilweise auf einem fernen Computer oder komplett auf dem fernen Computer oder Server ausgeführt werden. In dem letzteren Szenario kann der ferne Computer mit dem Computer des Benutzers durch einen beliebigen Typ von Netzwerk verbunden sein, darunter ein lokales Netzwerk (LAN) oder ein Weitverkehrsnetzwerk (WAN), oder die Verbindung kann (zum Beispiel durch das Internet unter Verwendung eines Internet-Dienstanbieters) zu einem externen Computer hergestellt werden.Program code for performing operations for aspects of the present invention may be in any combination of one or more several programming languages, including an object-oriented programming language such as Java, Smalltalk, C ++ or the like, and conventional procedural programming languages such as the "C" programming language or similar programming languages. The program code may be executed entirely on a user's computer, partly on the user's computer, as a standalone software package, partly on the user's computer and partly on a remote computer or entirely on the remote computer or server. In the latter scenario, the remote computer may be connected to the user's computer through any type of network, including a local area network (LAN) or wide area network (WAN), or the connection may be (for example, through the Internet using an Internet Service provider) to an external computer.
Aspekte der vorliegenden Erfindung werden hierin unter Bezugnahme auf Ablaufpläne und/oder Blockschaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es ist klar, dass jeder Block in den Ablaufplänen und/oder Blockschaubildern und Kombinationen von Blöcken in den Ablaufplänen und/oder Blockschaubildern durch Computer-Programmanweisungen umgesetzt werden können. Diese Computer-Programmanweisungen können einem oder mehreren Prozessoren eines oder mehrerer Universalcomputer, Spezialcomputer oder anderer programmierbarer Datenverarbeitungsvorrichtungen zugeführt werden, um eine Maschine derart zu erzeugen, dass die durch den einen oder die mehreren Prozessoren der Computer oder der anderen programmierbaren Datenverarbeitungsvorrichtungen ausgeführten Anweisungen ein Mittel zum Umsetzen der in dem Block oder den Blöcken der Ablaufpläne und/oder Blockschaubilder angegebenen Funktionen/Aktionen erzeugen.Aspects of the present invention are described herein with reference to flowcharts and / or block diagrams of methods, apparatus (systems) and computer program products according to embodiments of the invention. It is understood that each block in the flowcharts and / or block diagrams, and combinations of blocks in the flowcharts and / or block diagrams, can be implemented by computer program instructions. These computer program instructions may be supplied to one or more processors of one or more general purpose computers, special purpose computers, or other programmable data processing devices to generate a machine such that the instructions executed by the one or more processors of the computer or other programmable data processing devices comprise means for Generate the functions / actions specified in the block or blocks of the flowcharts and / or block diagrams.
Diese Computer-Programmanweisungen können auch in einer oder mehreren computerlesbaren Speichereinheiten oder computerlesbaren Medien gespeichert sein, die einen oder mehrere Computer, eine oder mehrere programmierbare Datenverarbeitungsvorrichtungen oder eine oder mehrere andere Einheiten veranlassen können, in einer bestimmten Weise so zu funktionieren, dass die in der einen oder den mehreren computerlesbaren Speichereinheiten oder in dem computerlesbaren Medium gespeicherten Anweisungen einen Herstellungsgegenstand erzeugen, der Anweisungen enthält, die die in dem Block oder in den Blöcken in den Ablaufplänen und/oder Blockschaubildern angegebenen Funktionen/Aktionen umsetzen.These computer program instructions may also be stored in one or more computer-readable storage devices or computer-readable media that may cause one or more computers, one or more programmable computing devices, or one or more other devices to function in a particular manner such that those described in U.S. Pat generating an article of manufacture containing instructions implementing the functions / actions specified in the block or blocks in the flowcharts and / or block diagrams, one or more computer readable storage units or instructions stored in the computer readable medium.
Die Computer-Programmanweisungen können auch auf einen oder mehrere Computer, eine oder mehrere andere programmierbare Datenverarbeitungsvorrichtungen oder eine oder mehrere andere Einheiten geladen werden, um eine Folge von Arbeitsschritten zu veranlassen, die auf dem einen oder den mehreren Computern, der einen oder den mehreren programmierbaren Datenverarbeitungsvorrichtungen oder einer oder mehreren anderen Einheiten ausgeführt werden sollen, um einen computergestützten Prozess derart zu erzeugen, dass die auf dem einen oder den mehreren Computern, der einen oder den mehreren anderen programmierbaren Datenverarbeitungsvorrichtungen oder einer oder mehreren anderen Einheiten ausgeführten Anweisungen Prozesse zum Umsetzen der in dem Block oder in den Blöcken in den Ablaufplänen und/oder Blockschaubildern angegebenen Funktionen/Aktionen bereitstellen.The computer program instructions may also be loaded on one or more computers, one or more other programmable data processing devices, or one or more other devices to effect a sequence of operations performed on the one or more computers having one or more programmable ones Data processing devices or one or more other units are to be executed in order to generate a computer-aided process such that the instructions executed on the one or more computers, one or more other programmable data processing devices or one or more other devices include processes for translating the data into provide functions / actions specified in the block or in the blocks in the flowcharts and / or block diagrams.
Die hierin gebrauchten Begriffe dienen nur zur Beschreibung einzelner Ausführungsformen und sind nicht als Einschränkung der Erfindung zu verstehen. Die hierin gebrauchten Einzahlformen „ein”, „eine” und „der, die, das” sollten gleichermaßen die Mehrzahlformen beinhalten, sofern aus dem Zusammenhang nichts anderes hervorgeht. Ferner ist klar, dass die Begriffe „weist auf” und/oder „aufweisend” bei Verwendung in dieser Beschreibung das Vorhandensein angegebener Merkmale, Ganzzahlen, Schritte, Operationen, Elemente und/oder Komponenten bezeichnen, jedoch nicht das Vorhandensein oder Hinzukommen eines oder mehrerer weiterer Merkmale, Ganzzahlen, Schritte, Operationen, Elemente, Komponenten und/oder deren Gruppen ausschließen.The terms used herein are for the purpose of describing particular embodiments only and are not intended to limit the invention. As used herein, the singular forms "a," "an," and "the" should equally include the plural forms unless the context dictates otherwise. Further, it is understood that the terms "pointing to" and / or "having" as used in this specification refer to the presence of specified features, integers, steps, operations, elements, and / or components, but not the presence or addition of one or more others Exclude features, integers, steps, operations, elements, components, and / or their groups.
Die entsprechenden Strukturen, Materialien, Aktionen und Entsprechungen aller Mittel zuzüglich Funktionselemente in den folgenden Ansprüchen sollen alle Strukturen, Materialien oder Aktionen zum Ausführen der Funktion in Kombination mit anderen ausdrücklich beanspruchten Elementen beinhalten. Die Beschreibung der vorliegenden Erfindung ist zur Veranschaulichung und Beschreibung vorgelegt worden, erhebt jedoch nicht den Anspruch der Vollständigkeit oder der Beschränkung auf die Erfindung in der offenbarten Form. Dem Fachmann sind viele Modifikationen und Varianten offenkundig, ohne vom Schutzumfang und vom Wesensgehalt der Erfindung abzuweichen. Die Ausführungsformen wurden gewählt und beschrieben, um die Grundgedanken der Erfindung und der praktischen Anwendung bestmöglich zu erläutern und anderen Fachleuten das Verständnis für verschiedene Ausführungsformen mit verschiedenen Modifikationen zu ermöglichen, die für die jeweils vorgesehene Verwendung geeignet sind.The corresponding structures, materials, acts and equivalents of all means plus functional elements in the following claims are intended to include any structures, materials or acts for performing the function in combination with other elements expressly claimed. The description of the present invention has been presented for purposes of illustration and description, but does not claim to be exhaustive or limited to the invention in the form disclosed. Many modifications and variations will be apparent to those skilled in the art without departing from the scope and spirit of the invention. The embodiments have been chosen and described in order to best explain the principles of the invention and the practical application and to enable others skilled in the art to appreciate various embodiments with various modifications suitable for the particular use contemplated.
Claims (11)
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US13/768,136 US9286291B2 (en) | 2013-02-15 | 2013-02-15 | Disambiguation of dependent referring expression in natural language processing |
| US13/768,136 | 2013-02-15 | ||
| US14/090,152 US20140237355A1 (en) | 2013-02-15 | 2013-11-26 | Disambiguation of dependent referring expression in natural language processing |
| US14/090,152 | 2013-11-26 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE102014201860A1 true DE102014201860A1 (en) | 2014-08-21 |
Family
ID=51264086
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE201410201860 Ceased DE102014201860A1 (en) | 2013-02-15 | 2014-02-03 | Method for term clarification of dependent reference printout during natural language processing of e.g. treaty document, involves resolving instance such that information about complete printout is present at location of instance |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE102014201860A1 (en) |
-
2014
- 2014-02-03 DE DE201410201860 patent/DE102014201860A1/en not_active Ceased
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE112020005268T5 (en) | AUTOMATICALLY GENERATE SCHEMA ANNOTATION FILES TO CONVERT NATURAL LANGUAGE QUERIES TO STRUCTURED QUERY LANGUAGE | |
| DE112012005037B4 (en) | Manage redundant immutable files using deduplications in storage clouds | |
| DE112019001533T5 (en) | EXTENSION OF TRAINING DATA FOR THE CLASSIFICATION OF NATURAL LANGUAGE | |
| DE112016003626T5 (en) | Natural language interface to databases | |
| DE202012013462U1 (en) | Data processing in a Mapreduce framework | |
| DE102019000294A1 (en) | Create company-specific knowledge graphs | |
| DE112018006345T5 (en) | GET SUPPORTING EVIDENCE FOR COMPLEX ANSWERS | |
| DE112017005638T5 (en) | Systems and methods for determining the relationship between data elements | |
| DE102014108191A1 (en) | Error correction in tables using detected functional dependencies | |
| EP3100174A1 (en) | Method for automatically detecting meaning and measuring the clearness of text | |
| DE112012001750T5 (en) | Automated self-service user support based on ontology analysis | |
| DE112018006131T5 (en) | SEMANTIC NORMALIZATION WHEN DIGITIZING DOCUMENTS | |
| DE102018007165A1 (en) | FORECASTING STYLES WITHIN A TEXT CONTENT | |
| DE102013205737A1 (en) | Method for automatically extracting and organizing information from data sources in e.g. web pages, involves producing combined representation of the equivalence classes in which the order for displayable representation is displayed | |
| DE112018005418T5 (en) | COGNITIVE DOCUMENT IMAGE DIGITALIZATION | |
| DE102021004157A1 (en) | Machine learning modeling to protect against online disclosure of sensitive data | |
| DE102014103281A1 (en) | ASSOCIATING DIFFERENT TYPE-WING COMPONENTS TO ASSESS A LATENT TYPE | |
| DE112016005443T5 (en) | System and method for automatic validation | |
| DE112012005177T5 (en) | Generating a natural language processing model for an information area | |
| DE102014116369A1 (en) | MANAGEMENT OF LANGUAGE MARKERS IN INTERNATIONAL DATA STORAGE | |
| DE112018005272T5 (en) | SEARCHING MULTI-LANGUAGE DOCUMENTS BASED ON AN EXTRACTION OF THE DOCUMENT STRUCTURE | |
| JP2017514257A (en) | Ontology browser and grouping method and apparatus | |
| RU2544739C1 (en) | Method to transform structured data array | |
| DE102015121509A1 (en) | Methodology and device for consistency check by comparison of ontology models | |
| DE102018007024A1 (en) | DOCUMENT BROKEN BY GRAMMATIC UNITS |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R012 | Request for examination validly filed | ||
| R016 | Response to examination communication | ||
| R002 | Refusal decision in examination/registration proceedings | ||
| R003 | Refusal decision now final |