[go: up one dir, main page]

RU2003104608A - METHOD FOR AUTOMATED PROCESSING OF INFORMATION TEXT MATERIALS - Google Patents

METHOD FOR AUTOMATED PROCESSING OF INFORMATION TEXT MATERIALS

Info

Publication number
RU2003104608A
RU2003104608A RU2003104608/09A RU2003104608A RU2003104608A RU 2003104608 A RU2003104608 A RU 2003104608A RU 2003104608/09 A RU2003104608/09 A RU 2003104608/09A RU 2003104608 A RU2003104608 A RU 2003104608A RU 2003104608 A RU2003104608 A RU 2003104608A
Authority
RU
Russia
Prior art keywords
objects
information text
examples
materials according
automated processing
Prior art date
Application number
RU2003104608/09A
Other languages
Russian (ru)
Other versions
RU2242048C2 (en
Inventor
Владимир Фёдорович Хорошевский
Виктор Петрович Клинцов
Original Assignee
Онтос Аг
Filing date
Publication date
Application filed by Онтос Аг filed Critical Онтос Аг
Priority to RU2003104608/09A priority Critical patent/RU2242048C2/en
Priority claimed from RU2003104608/09A external-priority patent/RU2242048C2/en
Publication of RU2003104608A publication Critical patent/RU2003104608A/en
Application granted granted Critical
Publication of RU2242048C2 publication Critical patent/RU2242048C2/en

Links

Claims (29)

1. Способ автоматизированной обработки информационных текстовых материалов, при котором выявляют наличие в обрабатываемых информационных текстовых материалах сведений, могущих быть описанными с точки зрения их содержания элементами характеристики информационной потребности пользователя, фиксируют факт наличия таких сведений и соответствующие им элементы характеристики информационной потребности пользователя и используют эти элементы и их сочетания при графическом представлении пользователю содержания обрабатываемых материалов, при этом обработку информационного текстового материала ведут в интерактивном режиме, формируют образ структуры графического представления информационного текстового материала, представляющей собой граф с вершинами и связями, по окончании обработки информационного текстового материала формируют когнитивную карту последнего, отличающийся тем, что предварительно в виде ориентированного графа формируют информационные потребности пользователя по определенной тематике, при этом в вершинах графа располагают типы интересующих пользователя объектов, а на дугах - интересующие его типовые отношения между этими типами объектов, и для каждой вершины построенного графа и каждой дуги, связывающей пары вершин, строят отдельное множество логических конструкций, каждая из которых содержит в левой части шаблон поиска примеров типов объектов и/или примеров типовых отношений между ними, а в правой части - операторы фиксации в тексте найденных по шаблону примеров типов объектов и/или примеров типовых отношений между ними, а процесс обработки текстового информационного материала ведут путем последовательного осуществления фазы препроцессии, включающей этап морфологического анализа обрабатываемого информационного текстового материала с фиксацией морфологической пометы, присвоенной каждому его слову по результатам морфологического анализа, этап поиска устойчивых словосочетаний в обрабатываемом информационном текстовом материале с фиксацией семантической пометы, присвоенной каждому словосочетанию по результатам поиска, и этап сегментации обрабатываемого информационного текстового материала на предложения, состоящий в выделении знаков препинания, соответствующих концам предложения с фиксацией пометы конца предложения, фазы процессии, включающей этап выделения примеров типовых отношений, состоящий в поиске глагольных групп в обрабатываемом информационном текстовом материале путем сравнения слов, имеющих морфологическую помету, соответствующую глагольным группам, с шаблонами левых частей множества логических конструкций и фиксации фрагмента обрабатываемого информационного текстового материала, содержащего совпадающую с шаблоном глагольную группу, с помощью операторов, заданных в правой части соответствующей шаблону логической конструкции, сравнения совпадающих с шаблонами найденных глагольных групп с названиями дуг графа образа структуры информационной потребности пользователя, и фиксации их в виде списка примеров типовых отношений при обнаружении дуг, названия которых соответствуют найденным глагольным группам, а в случае отсутствия дуг, названия которых соответствуют глагольным группам обрабатываемого информационного текстового материала, дальнейшую обработку последнего прекращают и этап выделения примеров объектов, который осуществляют путем поиска в обрабатываемом информационном текстовом материале примеров, соответствующих объектам тех вершин графа, которые соединены дугами, названия которых идентичны найденным глагольным группам, с последующей фиксацией в списке примеров объектов данного типа с одновременной фиксацией тех типов объектов, к которым они относятся, а в случае отсутствия в обрабатываемом информационном текстовом материале примеров типов объектов, соответствующих шаблонам, дальнейшую обработку информационного текстового материала прекращают, и фазы постпроцессии, которую выполняют как последовательность этапа формирования из списка примеров типовых отношений и списка примеров типов объектов элементарных графов, каждый из которых имеет структуру вида “вершина - дуга - вершина”, в вершинах которого располагают примеры соответствующих типов объектов, а на дуге - пример соответствующего типового отношения, связывающего выбранные вершины, с фиксацией списка элементарных графов и этапа слияния элементарных графов в когнитивную карту обработанного информационного текстового материала.1. A method for the automated processing of information text materials in which the presence of information in the processed information text materials that can be described in terms of their content by elements of the characteristics of the user's information needs is recorded, the fact of the availability of such information and the corresponding elements of the characteristics of the user's information needs are recorded and used elements and their combinations in graphical representation to the user of the content of processed materials wherein, the processing of informational text material is carried out in an interactive mode, form the image structure of the graphical representation of the informational textual material, which is a graph with vertices and connections, upon completion of the processing of informational textual material form a cognitive map of the latter, characterized in that it is preliminarily formed in the form of an oriented graph information needs of the user on a certain topic, while at the top of the graph are the types of interesting users objects, and on arcs - the typical relations between these types of objects that interest him, and for each vertex of the constructed graph and each arc connecting pairs of vertices, a separate set of logical constructions is constructed, each of which contains in the left part a search template for examples of types of objects and / or examples of typical relations between them, and on the right side there are operators of fixation in the text of examples of types of objects and / or examples of typical relations between them found from the template, and the process of processing textual information material lead through the sequential implementation of the preprocessing phase, which includes the stage of morphological analysis of the processed information text material with fixing the morphological tag assigned to each of his words according to the results of morphological analysis, the stage of searching for stable phrases in the processed information text material with fixing the semantic tag assigned to each phrase according to the search results, and the segmentation stage of the processed information text material on the proposal This consists in highlighting punctuation marks corresponding to the ends of the sentence with fixing the mark of the end of the sentence, the procession phase, which includes the step of highlighting examples of typical relations, consisting in searching for verb groups in the processed information text material by comparing words with a morphological mark corresponding to verb groups, with patterns of the left parts of the set of logical constructions and fixing a fragment of the processed information text material containing the same as the template verb group, using the operators specified in the right part of the corresponding logical structure template, comparing the matching verb groups with the names of the arcs of the graph image of the user’s information need structure image, and fixing them in the form of a list of examples of typical relations when detecting arcs whose names correspond to those found verb groups, and in the absence of arcs, the names of which correspond to the verb groups of the processed information text material, further processing of the latter is also stopped by the stage of selecting examples of objects, which is carried out by searching in the processed information textual material for examples corresponding to objects of those vertices of the graph that are connected by arcs whose names are identical to the found verb groups, followed by fixing in the list of examples of objects of this type with simultaneous fixing of those types of objects to which they relate, and if there are no examples of types of objects in the processed information text material, I correspond templates, the further processing of informational textual material is stopped, and the postprocessing phase, which is performed as a sequence of the stage of forming from the list of examples of typical relations and the list of examples of types of objects of elementary graphs, each of which has a structure of the form “vertex – arc – vertex”, at the vertices of which they have examples of the corresponding types of objects, and on the arc - an example of the corresponding type relation connecting the selected vertices with fixing the list of elementary graphs and the merge stage I have elementary graphs in a cognitive map of processed informational textual material. 2. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что образ структуры графического представления информационных потребностей пользователя по заданной теме формируют люди-эксперты, трансформируя в ориентированный граф информационную потребность пользователя по определенной тематике путем отбора и фиксации существенных для данной темы типов объектов и типовых отношений между ними.2. The method of automated processing of informational textual materials according to claim 1, characterized in that the image of the structure of the graphical representation of the user's informational needs on a given topic is formed by expert people, transforming the user's informational need on a specific topic into a oriented graph by selecting and fixing material for this topic types of objects and typical relationships between them. 3. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что типовые отношения между типами объектов делят на общие и специализированные.3. The method of automated processing of information text materials according to claim 1, characterized in that the typical relations between the types of objects are divided into general and specialized. 4. Способ автоматизированной обработки информационных текстовых материалов по п.3, отличающийся тем, что перечень общих отношений для конкретной темы фиксирован и постоянен, а перечень специализированных отношений является открытым для пополнения и изменения.4. The method of automated processing of information text materials according to claim 3, characterized in that the list of general relations for a particular topic is fixed and constant, and the list of specialized relations is open for replenishment and change. 5. Способ автоматизированной обработки информационных текстовых материалов по п.4, отличающийся тем, что к общим типовым отношениям относят отношения, фиксирующие иерархию типов объектов “потомок-предок”.5. The method of automated processing of informational textual materials according to claim 4, characterized in that the relations typical of the descendant-ancestor type hierarchy are referred to general model relations. 6. Способ автоматизированной обработки информационных текстовых материалов по п.5, отличающийся тем, что к общим типовым отношениям относят отношение “быть примером”.6. The method of automated processing of informational textual materials according to claim 5, characterized in that the relation “to be an example” is referred to general model relations. 7. Способ автоматизированной обработки информационных текстовых материалов по п.3, отличающийся тем, что к специализированным типовым отношениям относят отношения, специфичные для выбранной темы.7. The method of automated processing of informational textual materials according to claim 3, characterized in that the relations specific to the selected topic are referred to specialized model relations. 8. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что каждое из множеств логических конструкций используют в качестве правил поиска в тексте примеров типов объектов или примеров типовых отношений между объектами.8. The method of automated processing of information text materials according to claim 1, characterized in that each of the sets of logical structures is used as a search rule in the text for examples of types of objects or examples of typical relations between objects. 9. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что в качестве общего словаря используют словари русского языка, а в качестве специализированных словарей используют составленные и пополняемые пользователями словари.9. The method of automated processing of information text materials according to claim 1, characterized in that dictionaries of the Russian language are used as a general dictionary, and dictionaries compiled and updated by users are used as specialized dictionaries. 10. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что в качестве отдельных единиц выделяют слова, как последовательности букв от пробела до пробела, и/или знаки препинания, и/или специальные символы, и/или даты, и/или числа.10. The method of automated processing of informational textual materials according to claim 1, characterized in that words are distinguished as individual units, as sequences of letters from space to space, and / or punctuation marks, and / or special characters, and / or dates, and / or numbers. 11. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап морфологического анализа обрабатываемого текста осуществляют путем выделения окончания каждого слова обрабатываемого текста, сравнения оставшейся части слова с соответствующими словами общего словаря, после чего приводят слово из обрабатываемого текста к нормальной форме с одновременным приписыванием ее морфологических признаков, причем приведением существительного к нормальной форме признают фиксацию слова в соответствующем роде, именительном падеже и в единственном числе, приведением глаголов к нормальной форме - фиксацию глагола в неопределенной форме.11. The method of automated processing of information text materials according to claim 1, characterized in that the step of morphological analysis of the processed text is carried out by highlighting the end of each word of the processed text, comparing the remaining part of the word with the corresponding words in the general dictionary, after which the word from the processed text is brought back to normal form with the simultaneous attribution of its morphological features, and by bringing the noun to normal form, the fixation of the word is recognized in accordance genus, nominative and singular, reduction of verbs to normal form - fixation of the verb in undefined form. 12. Способ автоматизированной обработки информационных текстовых материалов по пп.1 и 11, отличающийся тем, что в качестве морфологических признаков для существительного используют род, число, падеж, а для глаголов - вид, лицо и время.12. A method for the automated processing of information text materials according to claims 1 and 11, characterized in that the genus, number, case are used as morphological signs for a noun, and the form, person and time for verbs. 13. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап поиска устойчивых словосочетаний в обрабатываемом информационном текстовом материале осуществляют после этапа морфологического анализа.13. The method of automated processing of information text materials according to claim 1, characterized in that the step of searching for stable phrases in the processed information text material is carried out after the stage of morphological analysis. 14. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что в качестве устойчивых словосочетаний используют словарные статьи специальных словарей, подготавливаемых и пополняемых пользователями.14. The method of automated processing of information text materials according to claim 1, characterized in that as stable phrases use dictionary entries of special dictionaries prepared and updated by users. 15. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап поиска устойчивых словосочетаний в обрабатываемом информационном текстовом материале осуществляют путем поиска в обрабатываемом информационном текстовом материале слов и словосочетаний, которые представлены в специализированных словарях, и фиксации для каждого найденного слова и словосочетания семантической пометы из соответствующего словаря.15. The method for automated processing of information text materials according to claim 1, characterized in that the step of searching for stable phrases in the processed information text material is carried out by searching in the processed information text material of words and phrases that are presented in specialized dictionaries, and fixing for each word found and phrases of semantic litter from the corresponding dictionary. 16. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап сегментации обрабатываемого информационного текстового материала осуществляют путем выявления его части, начинающейся либо с большой буквы, либо начинающейся после одной и более пустых строк и заканчивающейся каким-либо знаком препинания, которому присвоена помета “конец-предл”.16. The method of automated processing of information text materials according to claim 1, characterized in that the step of segmenting the processed information text material is carried out by identifying a part of it starting either with a capital letter or starting after one or more blank lines and ending with some punctuation mark to which the “end-offer” mark is assigned. 17. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что при поиске глагольных групп на этапе выделения примеров типовых отношений выделяют слова или словосочетания, имеющих морфологическую помету “глагол”, или помету “причастие”, или помету “отглагольное существительное”.17. The method of automated processing of informational textual materials according to claim 1, characterized in that when searching for verb groups at the stage of identifying examples of typical relations, words or phrases having the morphological mark “verb”, or the mark “participle”, or the mark “verbal noun” are distinguished " 18. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что на этапе выделения примеров объектов по найденным дугам находят типы объектов, расположенные в вершинах графа, соединенных этими дугами, и фиксируют найденные типы объектов в виде списка, затем для каждого зафиксированного типа объектов выбирают соответствующее ему множество логических конструкций, каждую из которых используют для выделения в информационном текстовом материале примеров соответствующего типа объектов путем сравнения слов или словосочетаний из обрабатываемого текста с шаблоном из левой части соответствующей логической конструкции и при положительном результате такого сравнения найденный в обрабатываемом информационном текстовом материале пример фиксируют в списке примеров объектов данного типа с одновременной фиксацией тех типов объектов, к которым они относятся, а в случае отсутствия в обрабатываемом информационном текстовом материале примеров типов объектов, соответствующих шаблонам, дальнейшую обработку информационного текстового материала прекращают.18. The method of automated processing of information text materials according to claim 1, characterized in that at the stage of extracting examples of objects by found arcs, types of objects are located at the vertices of the graph connected by these arcs and the found types of objects are fixed in a list, then for each a fixed type of objects, the corresponding set of logical constructions is selected, each of which is used to highlight examples of the corresponding type of objects in the information text material by comparing The words or phrases from the processed text with the template from the left side of the corresponding logical construction and, with a positive result of such a comparison, the example found in the processed information text material is fixed in the list of examples of objects of this type with simultaneous fixing of the types of objects to which they relate, and in case of absence in the processed informational textual material of examples of types of objects corresponding to templates, further processing of informational textual materials rial is stopped. 19. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что в случаях, когда типы объекты и/или типовые отношения в графе образа структуры графического представления информационной потребности потребителя описаны дополнительными характеристиками, для выделения которых из информационного текстового материала предварительно созданы соответствующие логические конструкции, обработку информационного текстового материала продолжают путем поиска в последнем конкретных фрагментов, соответствующих описанным дополнительным характеристикам, и фиксацией этих фрагментов в списках типов объектов и/или типовых отношений.19. The method of automated processing of information text materials according to claim 1, characterized in that in cases where the types of objects and / or typical relations in the image column of the structure of the graphical representation of the consumer’s information needs are described by additional characteristics, for which they are previously created from the information text material the corresponding logical constructions, the processing of informational textual material is continued by searching in the latter for specific fragments corresponding to uyuschih described further characteristics and fixation of the fragments in the lists of types of objects and / or model relations. 20. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап формирования элементарных графов содержит стадию формирования элементарных графов для примеров типовых отношений из списка примеров типовых отношений и стадию поиска и обработки синонимов.20. The method of automated processing of information text materials according to claim 1, characterized in that the step of forming elementary graphs comprises the step of forming elementary graphs for examples of typical relations from a list of examples of typical relations and the stage of searching and processing synonyms. 21. Способ автоматизированной обработки информационных текстовых материалов по п.20, отличающийся тем, что для формирования элементарных графов для примеров типовых отношений из списка примеров типовых отношений сначала для каждого из элементов списка примеров типовых отношений выбирают соответствующую ему дугу из графа образа структуры графического представления информационной потребности и по ней выбирают вершины, которые связаны этой дугой, затем из списка типов объектов выбирают примеры объектов, соответствующие выбранным вершинам, и для каждой такой тройки формируют элементарный граф, имеющий структуру вида “вершина - дуга - вершина”, причем в вершинах элементарного графа располагают примеры соответствующих типов объектов, а на дуге - пример соответствующего типового отношения, связывающего выбранные вершины.21. The method of automated processing of information text materials according to claim 20, characterized in that for the formation of elementary graphs for examples of typical relations from the list of examples of typical relations, first for each of the elements in the list of examples of typical relations choose the corresponding arc from the graph image structure of the graphical representation of information needs and select vertices that are connected by this arc, then from the list of types of objects select examples of objects corresponding to the selected vertices am, and for each such triple they form an elementary graph having a structure of the “vertex – arc – vertex” type, with examples of the corresponding types of objects being placed at the vertices of the elementary graph, and an example of the corresponding type relation connecting the selected vertices on the arc. 22. Способ автоматизированной обработки информационных текстовых материалов по п.20, отличающийся тем, что стадию поиска и обработки синонимов осуществляют путем сравнения названия каждого из примеров типов объектов из списка типов объектов с элементами словаря синонимов или с помощью эвристического алгоритма, заключающегося в том, что синонимами считают два примера одного типового объекта, если представление в исходном тексте первого из них полностью “вкладывается” в представление в исходном тексте второго из них или их представления в исходном тексте полностью совпадают, и в случае выявления синонимов для каждой пары формируют элементарный граф, имеющий структуру вида “вершина - дуга - вершина”, первая вершина которого соответствует примеру типового объекта, вторая - его синониму, а дуга - отношению с именем “синоним”, полученный элементарный граф фиксируют в общем списке элементарных графов.22. The method of automated processing of information text materials according to claim 20, characterized in that the stage of searching and processing synonyms is carried out by comparing the names of each of the examples of types of objects from the list of types of objects with elements of the dictionary of synonyms or using the heuristic algorithm, which consists in the fact that two examples of one typical object are considered synonyms if the representation in the source text of the first of them is completely “embedded” in the representation in the source of the second of them or their representation in the source text are completely identical, and if synonyms are identified for each pair, an elementary graph is formed having a structure of the form “vertex – arc – vertex”, the first vertex of which corresponds to an example of a typical object, the second to its synonym, and the arc to the relation with the name “synonym” ”, The obtained elementary graph is fixed in the general list of elementary graphs. 23. Способ автоматизированной обработки информационных текстовых материалов по п.20, отличающийся тем, что этап формирования элементарных графов дополнительно включает стадию формирования элементарных графов для неопределенных отношений.23. The method for automated processing of information text materials according to claim 20, characterized in that the step of forming elementary graphs further includes a step of forming elementary graphs for undefined relationships. 24. Способ автоматизированной обработки информационных текстовых материалов по п.23, отличающийся тем, что стадию формирования элементарных графов для неопределенных отношений осуществляют для примеров тех типов объектов, которые остались не использованными, но находятся в пределах одного предложения путем формирования из множества неиспользованных элементов из списка примеров типовых отношений и из списка типов объектов всех возможных их пар и формирования для каждой такой пары элементарного графа, тоже имеющего структуру вида “вершина - дуга - вершина”, причем первая вершина этого элементарного графа соответствует первому примеру объекта из выделенной пары, вторая - второму примеру объекта из выделенной пары, а дуга - неопределенному отношению с именем “???”, полученный элементарный граф фиксируют в общем списке элементарных графов.24. The method of automated processing of information text materials according to item 23, wherein the stage of forming elementary graphs for undefined relations is carried out for examples of those types of objects that have remained unused, but are within the same sentence by forming from a variety of unused elements from the list examples of typical relations and from the list of types of objects of all their possible pairs and the formation for each such pair of elementary graph, also having the structure of the form “ver ina - arc - vertex ”, with the first vertex of this elementary graph corresponding to the first example of an object from a selected pair, the second to the second example of an object from a selected pair, and the arc to an indefinite relation with the name“ ??? ”, the resulting elementary graph is fixed in the general list elementary graphs. 25. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап слияния элементарных графов в когнитивную карту обработанного информационного текстового материала осуществляют путем наложения одинаковых вершин построенных элементарных графов и исключения дублирующихся дуг.25. The method of automated processing of information text materials according to claim 1, characterized in that the step of merging elementary graphs into a cognitive map of the processed information text material is carried out by superimposing the same vertices of the elementary graphs constructed and eliminating duplicate arcs. 26. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что в когнитивную карту обработанного информационного текстового материала элементарные графы с дугами, имеющими в качестве имени неопределенное отношение “???”, вливают только после подтверждения необходимости этой операции пользователем.26. The method of automated processing of information text materials according to claim 1, characterized in that elementary graphs with arcs having an indefinite relation “???” are infused into the cognitive map of the processed information text material only after the user confirms the need for this operation. 27. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что этап формирования когнитивной карты для совокупности обработанных информационных текстовых материалов осуществляют после обработки последнего из информационных текстовых материалов из заданной совокупности путем наложения одинаковых вершин всех построенных когнитивных карт и исключения дублирующихся дуг.27. The method of automated processing of information text materials according to claim 1, characterized in that the step of forming a cognitive map for the totality of processed information text materials is carried out after processing the last of the information text materials from a given set by applying the same vertices of all constructed cognitive maps and eliminating duplicate arcs . 28. Способ автоматизированной обработки информационных текстовых материалов по п.1, отличающийся тем, что каждый из типов объектов и/или типовых отношений имеет единичные или множественные характеристики.28. The method of automated processing of information text materials according to claim 1, characterized in that each of the types of objects and / or typical relations has single or multiple characteristics. 29. Способ автоматизированной обработки информационных текстовых материалов по п.28, отличающийся тем, что характеристики могут быть числовыми, строковыми или ссылочными.29. The method of automated processing of information text materials according to claim 28, characterized in that the characteristics can be numerical, string or reference.
RU2003104608/09A 2003-02-18 2003-02-18 Method for automated processing of text information materials RU2242048C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2003104608/09A RU2242048C2 (en) 2003-02-18 2003-02-18 Method for automated processing of text information materials

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003104608/09A RU2242048C2 (en) 2003-02-18 2003-02-18 Method for automated processing of text information materials

Publications (2)

Publication Number Publication Date
RU2003104608A true RU2003104608A (en) 2004-09-20
RU2242048C2 RU2242048C2 (en) 2004-12-10

Family

ID=34387619

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003104608/09A RU2242048C2 (en) 2003-02-18 2003-02-18 Method for automated processing of text information materials

Country Status (1)

Country Link
RU (1) RU2242048C2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2605387C2 (en) * 2012-09-26 2016-12-20 Общество с ограниченной ответственностью "Колловэар" Method and system for storing graphs data
RU2538303C1 (en) * 2013-08-07 2015-01-10 Александр Александрович Харламов Method for automatic semantic comparison of natural language texts
RU2538304C1 (en) * 2013-08-22 2015-01-10 Александр Александрович Харламов Method for automatic semantic classification of natural language texts

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5715468A (en) * 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
RU2096824C1 (en) * 1996-04-29 1997-11-20 Государственный научно-технический центр гиперинформационных технологий Method for automatic processing of information for personal use
US5808615A (en) * 1996-05-01 1998-09-15 Electronic Data Systems Corporation Process and system for mapping the relationship of the content of a collection of documents
US6931604B2 (en) * 2000-12-18 2005-08-16 Derek Graham Lane Method of navigating a collection of interconnected nodes

Similar Documents

Publication Publication Date Title
Lita et al. Truecasing
EP0583083B1 (en) Finite-state transduction of related word forms for text indexing and retrieval
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
CN105824933A (en) Automatic question answering system based on main statement position and implementation method thereof
KR20160138077A (en) Machine translation system and method
CN113343706A (en) Text depression tendency detection system based on multi-modal features and semantic rules
CN113312922A (en) Improved chapter-level triple information extraction method
Chen et al. A morphological analyzer for st. lawrence island/central siberian yupik
KR102188739B1 (en) System and Method for Automated Emoticon Recommendation based on Emotion Ontology
CN113779961B (en) Conventional sentence pattern extraction method of natural language text and electronic device
Mittmann et al. Aoidos: A system for the automatic scansion of poetry written in Portuguese
Sampson et al. Natural language analysis by stochastic optimization: a progress report on Project APRIL
Salah et al. [Retracted] A New Rule‐Based Approach for Classical Arabic in Natural Language Processing
Sawalha Open-source resources and standards for Arabic word structure analysis: Fine grained morphological analysis of Arabic text corpora
Khidhir An AI model for Parsing the Text of Holy Quran Sentences
CN113361252A (en) Text depression tendency detection system based on multi-modal features and emotion dictionary
Kadim et al. Parallel HMM-based approach for arabic part of speech tagging.
Jain et al. Text independent root word identification in Hindi language using natural language processing
KR101506757B1 (en) Method for the formation of an unambiguous model of a text in a natural language
Panchal et al. NLP‐Based Spellchecker and Grammar Checker for Indic Languages
RU2003104608A (en) METHOD FOR AUTOMATED PROCESSING OF INFORMATION TEXT MATERIALS
Gulu-zada et al. A hybrid approach to Azerbaijani lemmatization: integrating rule-based methods with ML PoS tagging
Beseiso et al. A coreference resolution approach using morphological features in arabic
Sanders A statistical method for syntactic dialectometry
RU2242048C2 (en) Method for automated processing of text information materials