[go: up one dir, main page]

RU2285951C2 - System for controlling language translation - Google Patents

System for controlling language translation Download PDF

Info

Publication number
RU2285951C2
RU2285951C2 RU2002129785/09A RU2002129785A RU2285951C2 RU 2285951 C2 RU2285951 C2 RU 2285951C2 RU 2002129785/09 A RU2002129785/09 A RU 2002129785/09A RU 2002129785 A RU2002129785 A RU 2002129785A RU 2285951 C2 RU2285951 C2 RU 2285951C2
Authority
RU
Russia
Prior art keywords
terms
dictionary
text
translation
dictionaries
Prior art date
Application number
RU2002129785/09A
Other languages
Russian (ru)
Other versions
RU2002129785A (en
Inventor
Марк КРАСНОВ (US)
Марк КРАСНОВ
Original Assignee
Марк КРАСНОВ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/141,404 external-priority patent/US20030101046A1/en
Application filed by Марк КРАСНОВ filed Critical Марк КРАСНОВ
Publication of RU2002129785A publication Critical patent/RU2002129785A/en
Application granted granted Critical
Publication of RU2285951C2 publication Critical patent/RU2285951C2/en

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

FIELD: computer engineering.
SUBSTANCE: system contains processor with memory, in which software executed on processor is stored for comparing terms of text with terms of both common and specialized dictionary, while matches of terms being compared are shown on display and it is possible to insert translation of matching terms into text being translated. Processor is used for assigning priorities by means of graphic user interface to several dictionaries, as a result of which terms are offered on display on basis of assigned priorities, and for showing on display the longest translations of matching terms from text and terms from common or specialized dictionary.
EFFECT: increased speed and precision of translation, simplification of complicated translations.
2 cl, 10 dwg

Description

Изобретение относится к вычислительной технике и может быть использовано для автоматизированного перевода текста с одного языка на другой.The invention relates to computer technology and can be used for automated translation of text from one language to another.

На настоящий момент в области компьютеризированного перевода с иностранного языка известны средства машинного перевода и средства перевода, использующие память переводов. При использовании средств машинного перевода блок текста или предложение переводится посредством последовательного поиска перевода слов каждого предложения текста. Таким образом, осуществляется непосредственный поиск каждого переводимого слова в словарной базе данных. Затем программа машинного перевода собирает эти переводы в предложение, имеющее смысл. При использовании средств памяти перевода блок текста переводится непосредственно предложение за предложением или сегмент за сегментом. То есть осуществляется поиск перевода каждого предложения или сегмента в ранее составленной базе данных фраз и предложений языка.At the moment, in the field of computer-assisted translation from a foreign language, machine translation tools and translation tools using translation memories are known. When using machine translation tools, a block of text or a sentence is translated by sequentially searching for a translation of the words of each sentence of the text. Thus, a direct search for each translated word is carried out in the dictionary database. The machine translation program then collects these translations into a sentence that makes sense. When using translation memory, a block of text is translated directly sentence by sentence or segment by segment. That is, a search is made for the translation of each sentence or segment in a previously compiled database of phrases and sentences of the language.

Ранее были разработаны различные способы, позволяющие переводить документы исключительно компьютерными средствами. Например, Carbonell et al. в патенте США №6173785 описывает интерактивный текстовый редактор, который накладывает лексические и грамматические ограничения на подмножество естественного языка, используемое автором при создании первоначального текста. Эти ограничения помогают разрешать неоднозначность текста с целью улучшения возможности перевода. Кроме того, Motoyama в патенте США №6208956 описывает способ кодирования документов с помощью тэгов стандартного обобщенного языка разметки (SGML) и с использованием переводческих ресурсов в зависимости от тэгов. Тэги могут обозначать типы документов или части документа, перевод которых осуществляется. Кодируя документ таким образом, можно добиться более точного машинного перевода без наложения избыточных ограничивающих правил на слова и фразы документа, который подлежит переводу.Previously, various methods have been developed that allow documents to be translated exclusively by computer. For example, Carbonell et al. US Pat. No. 6,173,785 describes an interactive text editor that imposes lexical and grammatical restrictions on a subset of the natural language used by the author to create the original text. These limitations help resolve text ambiguity in order to improve translation capabilities. In addition, Motoyama in US Pat. No. 6,208,956 describes a method for encoding documents using tags of a standard generalized markup language (SGML) and using translation resources depending on the tags. Tags can indicate the types of documents or parts of a document that are being translated. By coding a document in this way, a more accurate machine translation can be achieved without imposing excessive restrictive rules on the words and phrases of the document to be translated.

Известны другие способы наложения ограничений и структурирования грамматики и лексики. Разрабатываются и усовершенствуются различные способы обработки семантических и идиоматических слов и фраз, а также способов обработки многозначных слов с использованием статистического анализа. Кроме того, для упрощения работы пользователей современные системы перевода могут включать в себя функцию параллельного отображения оригинального текста и его перевода. Дополнительно эти системы могут давать возможность пользователям выбирать, какие части машинного перевода принять, а от каких отказаться.Other methods are known for imposing restrictions and structuring grammar and vocabulary. Various methods for processing semantic and idiomatic words and phrases, as well as methods for processing multi-valued words using statistical analysis, are being developed and improved. In addition, to simplify the work of users, modern translation systems may include the function of parallel display of the original text and its translation. Additionally, these systems can enable users to choose which parts of machine translation to accept and which to refuse.

Решаемая настоящим изобретением задача - улучшение качества перевода.The problem solved by the present invention is improving the quality of translation.

Технический результат, который может быть получен при осуществлении заявленной системы, - повышение точности и скорости перевода, а также упрощение сложных переводов.The technical result that can be obtained by implementing the claimed system is to increase the accuracy and speed of translation, as well as simplify complex translations.

Для решения поставленной задачи с достижением указанного технического результата система для управления языковым переводом содержит процессор с памятью, дисплей, программное обеспечение, хранящееся в памяти и выполняемое на процессоре для сравнения терминов текста с терминами, находящимися, по крайней мере, в одном из словарей, и в систему введен, по крайней мере, один из множества специализированных словарей, а процессор выполнен с возможностью предъявления на дисплее совпадений между терминами текста и терминами словаря и специализированного словаря и вставки переводов совпадающих терминов текста и терминов словаря и специализированного словаря в текст, согласно изобретению процессор выполнен с возможностью присвоения приоритетов посредством графического интерфейса пользователя, по крайней мере, одному из словарей и, по крайней мере, одному из множества специализированных словарей, процессор выполнен обеспечивающим посредством графического интерфейса пользователя предъявление на дисплее исходя из присвоенных приоритетов совпадающих терминов текста с терминами словаря или специализированного словаря, а также с возможностью посредством графического интерфейса пользователя предъявления на дисплее наиболее длинных переводов совпадающих терминов текста и терминов словаря или специализированного словаря.To solve the problem with the achievement of the specified technical result, the language translation management system comprises a processor with memory, a display, software stored in the memory and executed on the processor for comparing text terms with terms found in at least one of the dictionaries, and at least one of the many specialized dictionaries has been entered into the system, and the processor is configured to show matches between text terms and dictionary and specialist terms on the display according to the invention, the processor is configured to prioritize through at least one of the dictionaries and at least one of the many specialized dictionaries, the processor made by providing through the graphical user interface the presentation on the display based on the assigned priorities of the matching text terms with the terms s specialized dictionary or dictionaries, as well as the chance by the GUI on the display presenting the longest matching translation text terms and specialized terms dictionary or vocabulary.

Возможен дополнительный вариант выполнения системы, в котором целесообразно, чтобы перед вставкой переводов процессор был выполнен с возможностью приведения терминов к стандартному виду, обеспечивающему определение их корневых компонентов.An additional embodiment of the system is possible, in which it is advisable that before inserting the translations the processor should be able to bring the terms to a standard form, providing the definition of their root components.

Прочие особенности и преимущества настоящего изобретения будут понятны из нижеследующего описания и прилагаемой формулы изобретения.Other features and advantages of the present invention will be apparent from the following description and the appended claims.

Фиг.1 изображает типовую компьютерную систему, на которой может быть реализован, по крайней мере, один из вариантов настоящего изобретения;Figure 1 shows a typical computer system on which at least one embodiment of the present invention may be implemented;

фиг.2 - типовой графический интерфейс пользователя (GUI) в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;figure 2 - a typical graphical user interface (GUI) in accordance with at least one embodiment of the present invention;

фиг.3 - увеличенный вид части типового графического интерфейса пользователя (GUI), показанного на фиг.2;figure 3 is an enlarged view of a part of a typical graphical user interface (GUI) shown in figure 2;

фиг.4 - окно словарного поиска в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;4 is a dictionary search window in accordance with at least one embodiment of the present invention;

фиг.5 - типовое окно опций в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;5 is a typical options window in accordance with at least one embodiment of the present invention;

фиг.6 - окно установки активного словаря в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;6 is a window for installing an active dictionary in accordance with at least one embodiment of the present invention;

фиг.7 - блок-схема, описывающая процесс работы в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;7 is a flowchart describing a process in accordance with at least one embodiment of the present invention;

фиг.8 - блок-схема, описывающая типовой способ обработки второго совпадения в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;Fig. 8 is a flowchart describing an exemplary method for processing a second match in accordance with at least one embodiment of the present invention;

фиг.9 - вид типового результирующего документа после выполнения сравнения в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;Fig.9 is a view of a typical resulting document after comparing in accordance with at least one embodiment of the present invention;

фиг.10 - типовое окно перевода в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения.10 is a typical translation window in accordance with at least one embodiment of the present invention.

Ниже приводится подробное описание конкретных вариантов реализации настоящего изобретения со ссылками на сопроводительные чертежи. В целях сохранения соответствия на разных чертежах одинаковые элементы обозначены одинаковыми номерами позиций.The following is a detailed description of specific embodiments of the present invention with reference to the accompanying drawings. In order to maintain compliance in different drawings, the same elements are indicated by the same reference numbers.

В целях обеспечения более точного понимания существа изобретения в нижеследующем подробном описании изобретения приводятся многочисленные специфичные детали. Однако специалистам в данной области должно быть понятно, что данное изобретение может быть реализовано и без этих специфичных деталей. В других же случаях подробное описание общеизвестных функций, наоборот, не приводится во избежание создания неопределенности для понимания существа изобретения.In order to provide a more accurate understanding of the invention, numerous specific details are set forth in the following detailed description of the invention. However, it will be understood by those skilled in the art that the invention may be practiced without these specific details. In other cases, a detailed description of well-known functions, on the contrary, is not given in order to avoid creating uncertainty for understanding the essence of the invention.

Настоящее изобретение относится к способам и устройствам для перевода с иностранного языка с использованием инструментов перевода Universe. Инструменты перевода Universe относятся к средствам, предоставляющим помощь при переводе. Инструменты перевода Universe анализируют предложения и предоставляют дополнительную определительную информацию на основе найденных слов и фраз. Исходя из слов и фраз, найденных в данном предложении, осуществляется поиск этих слов и фраз в определенном словаре с целью предоставления дополнительной определительной информации. Специальные словари содержат определительные фразы на исходном и целевом языке и составлены конкретно для работы в рамках данных специфичных тем. Специальные словари являются документами, составленными специально для работы с данным проектом и/или темой, и имеют более узкую направленность по сравнению с обычным словарем, содержат один или более переводов данного слова или фразы. Обычные словари, как правило, представляют собой развернутые документы, охватывающие все возможные толкования и соответствующие переводы слова или фразы. Далее инструменты перевода Universe работают с любыми парами языков, например, при переводе в обе стороны для языковых пар английский-французский, английский-испанский, английский-русский и.т.д.The present invention relates to methods and devices for translation from a foreign language using Universe translation tools. Universe translation tools are tools that provide translation assistance. Universe translation tools analyze sentences and provide additional definitive information based on words and phrases found. Based on the words and phrases found in this sentence, these words and phrases are searched in a specific dictionary in order to provide additional definitive information. Special dictionaries contain definition phrases in the source and target language and are specifically designed to work within the framework of these specific topics. Special dictionaries are documents compiled specifically for working with a given project and / or topic, and have a narrower focus than a regular dictionary, contain one or more translations of a given word or phrase. Conventional dictionaries, as a rule, are detailed documents covering all possible interpretations and corresponding translations of a word or phrase. Further, Universe translation tools work with any language pair, for example, when translating in both directions for language pairs English-French, English-Spanish, English-Russian, etc.

Настоящее изобретение может быть реализовано практически на любом типе компьютера независимо от используемой платформы. Например, как показано на фигуре 1, типовой компьютер (10) имеет процессор (12), связанный с памятью (14), устройством хранения информации (16) и рядом других элементов и функциональных узлов, типичных для современного компьютера (не показаны). Компьютер (10) снабжен связанными с ним средствами ввода информации, такими как клавиатура (18) и мышь (20), хотя в зависимости от имеющейся конфигурации эти средства вода могут принимать другие формы. Компьютер (10) связан также с устройствами вывода, такими как дисплей (22), которые также в зависимости от имеющейся конфигурации могут принимать другие формы. Компьютер (10) может быть соединен с сетью или другими ресурсами (24).The present invention can be implemented on virtually any type of computer, regardless of the platform used. For example, as shown in figure 1, a typical computer (10) has a processor (12) associated with a memory (14), an information storage device (16), and a number of other elements and functional units typical of a modern computer (not shown). The computer (10) is equipped with associated information input means, such as a keyboard (18) and a mouse (20), although, depending on the configuration, these means, water can take other forms. The computer (10) is also connected to output devices, such as a display (22), which can also take other forms depending on the configuration available. The computer (10) can be connected to a network or other resources (24).

Как показано на фигуре 2, инструмент перевода Universe резидентен в памяти, а в графическом интерфейсе пользователя (GUI) имеются выбираемые по усмотрению пользователя элементы управления окном, например, кнопки в панели инструментов редактора Microsoft Word®. GUI является частью прикладного программного обеспечения, которая взаимодействует с пользователем через графический дисплей. GUI принимает входные сигналы от пользователя посредством различных средств доступа, таких как мышь или комбинированный манипулятор, или через клавиатуру. Визуальный выходной сигнал GUI обычным образом выводится на устройство отображения, такое как экран монитора компьютера, и содержит средства управления, позволяющие пользователю взаимодействовать с GUI. Примерами средств управления являются окна, заголовки, кнопки, метки, панели меню, панели инструментов, диалоговые окна, меню, пиктограммы и т.д. Средства управления могут также представлять собой прикладные программы, которые могут запускаться пользователем, или пиктограмму курсора, показывающую положение мыши.As shown in Figure 2, the Universe translation tool is memory-resident, and the graphical user interface (GUI) has window controls selectable at the user's discretion, for example, buttons in the toolbar of the Microsoft Word® editor. The GUI is part of the application software that interacts with the user through a graphic display. The GUI receives input from the user through various means of access, such as a mouse or a combination pad, or through a keyboard. The visual output of the GUI is routinely output to a display device, such as a computer monitor screen, and contains controls that allow the user to interact with the GUI. Examples of controls are windows, titles, buttons, labels, menu bars, toolbars, dialog boxes, menus, icons, etc. The controls may also be applications that can be launched by the user, or a cursor icon showing the position of the mouse.

Пример визуального выходного сигнала GUI показан на фигурах 2, 3. Как видно из фигур, в окне (30) отображается редактор Microsoft Word® вместе с открытым документом. Кнопки инструмента перевода Universe включены в неподвижные панели инструментов, например, панели инструментов (32), (34), и плавающие панели инструментов, например, панель инструментов (36). Эти панели инструментов (32), (34) и (36) соответствуют различным функциям программы перевода Universe. Специалистам в данной области должно быть понятно, как создавать и выполнять динамическое позиционирование средств управления такого типа. Поэтому подробное описание этого процесса в данном документе не приводится.An example of the visual output of the GUI is shown in figures 2, 3. As can be seen from the figures, the Microsoft Word® editor is displayed in the window (30) along with the open document. The buttons of the Universe translation tool are included in fixed toolbars, for example, toolbars (32), (34), and floating toolbars, for example, a toolbar (36). These toolbars (32), (34) and (36) correspond to various functions of the Universe translation program. Specialists in this field should understand how to create and perform dynamic positioning of controls of this type. Therefore, a detailed description of this process is not given in this document.

Различные кнопки панелей инструментов (32), (34) и (36) активизируют различные функции программы перевода Universe. В частности, неподвижная панель инструментов (32) содержит кнопку "Merge translation" (принять перевод) (40), которая производит вставку переводов известных терминов в текст документа.The various toolbar buttons (32), (34) and (36) activate the various functions of the Universe translation program. In particular, the fixed toolbar (32) contains the “Merge translation” button (40), which inserts translations of known terms into the text of the document.

В неподвижной панели инструментов (34) имеется шесть кнопок, а именно кнопка "scan" (сканировать) (42), кнопка "translate" (перевести) (44), кнопка "auto" (авто) (46), кнопка "lookup" (поиск в словаре) (48), кнопка "clear" (очистить) (50) и кнопка "options..." (опции...) (52). Эти кнопки включают различные функции. Кнопка сканирования (42) включает сканирование активного документа на предмет поиска известных терминов, а также идентификации найденных терминов. Кнопка перевода (44) активизирует команду перевода известных терминов в активном документе. Этот процесс перевода происходит аналогично проверке правописания. Известные термины отображаются вместе с их переводом, а пользователь может по своему усмотрению вставить один перевод или вставить все переводы. Кнопка "авто" (46) включает команду поиска в документе известных терминов и автоматической вставки переводов всех найденных известных терминов. Кнопка поиска в словаре (48) запускает поиск выделенного термина в активных словарях или, при отсутствии выделенного текста, выводит на экран окно поиска в словаре. Кнопка очистки (50) удаляет все пометки, связанные с известными терминами, из активного документа. Кнопка "опции..." (52) выводит на экран окно опций словаря.The fixed toolbar (34) has six buttons, namely the scan button (42), the translate button (44), the auto button (46), the lookup button (dictionary search) (48), the "clear" button (50) and the "options ..." button (options ...) (52). These buttons include various functions. The scan button (42) includes scanning the active document for the search for known terms, as well as the identification of the found terms. The translation button (44) activates the translation command of known terms in the active document. This translation process is similar to spell checking. Known terms are displayed along with their translation, and the user can, at his discretion, insert one translation or insert all translations. The “auto” button (46) includes a command to search for known terms in a document and automatically insert translations of all found known terms. The search button in the dictionary (48) starts the search for the highlighted term in active dictionaries or, in the absence of highlighted text, displays a search window in the dictionary. The clear button (50) deletes all marks associated with known terms from the active document. The "options ..." button (52) displays the dictionary options window.

В плавающей панели инструментов (36) имеются пиктограммы, соответствующие команде поиска в словаре, т.е. кнопка-пиктограмма (54), и команде просмотра набора активных словарей, т.е. кнопка-пиктограмма (56). Кнопка-пиктограмма (54) включает поиск выделенного термина в активных словарях или, при отсутствии выделенного термина, выводит на экран окно поиска в словарях. Это позволяет пользователям осуществлять поиск известных терминов в заданных словарях. Кнопка (56) выводит на экран перечень активных словарей. В этом окне пользователь имеет возможность изменять набор активных словарей, а также устанавливать приоритеты активных словарей. Специалистам в данной области должно быть понятно, что используемые метки и пиктограммы, а также размещение и организация описанных выше кнопок являются лишь примером и могут быть изменены самым различных образом без отклонения от существа настоящего изобретения.In the floating toolbar (36) there are icons corresponding to the search command in the dictionary, i.e. an icon button (54), and a command for viewing a set of active dictionaries, i.e. pictogram button (56). The icon button (54) enables the search for the highlighted term in active dictionaries or, in the absence of a highlighted term, displays a search box in dictionaries. This allows users to search for known terms in defined dictionaries. Button (56) displays a list of active dictionaries. In this window, the user has the ability to change the set of active dictionaries, as well as set the priorities of active dictionaries. Specialists in this field should be clear that the labels and icons used, as well as the placement and organization of the buttons described above are just an example and can be changed in various ways without deviating from the essence of the present invention.

На фигуре 4 показано окно поиска в словаре согласно одному из вариантов реализации настоящего изобретения. Окно поиска в словаре (80) выводится на экран при нажатии на кнопку (48) или кнопку-пиктограмму (54). Окна поиска в словаре (80) содержат текстовое окно (82) для ввода ключевого слова поиска и падающее меню (84) терминов, найденных в словаре. Пользователь может выбрать указатели языка кнопками (86) и (88). Для примера показаны кнопки русского языка и английского языка.Figure 4 shows a search box in a dictionary according to one embodiment of the present invention. The search window in the dictionary (80) is displayed when you press the button (48) or the icon button (54). Search windows in the dictionary (80) contain a text window (82) for entering the search keyword and a drop-down menu (84) of terms found in the dictionary. The user can select the language indicators with the buttons (86) and (88). For example, the buttons of the Russian language and English are shown.

Кнопки управления (90), (92), (94), (96), (98) позволяют производить поиск выбранного термина в специальном словаре, просматривать и изменять набор активных специальных словарей, просматривать и изменять содержимое буфера обмена, выполнять функцию копирования, а также выполнять функцию возврата, соответственно. В окно поиска в специальном словаре также включены элементы меню, которые позволяют выполнять различные функции. Пункт меню "glossary" (словарь) (100) позволяет вывести на экран набор активных специальных словарей. В окне набора активных специальных словарей пользователь может выбрать словарь, а также добавить, удалить и установить приоритеты специальных словарей активного набора. Пункт меню "options" (опции) (102) позволяет вывести на экран окно опций специального словаря. В окне опций специального словаря пользователь может модифицировать параметры программы перевода Universe, касающиеся выполнения поиска в документах, исходного языка документа, в котором производится поиск, а также способа идентификации найденных терминов в документе. Наконец, пункт меню "help" (справка) (104) выводит на экран окно справки. В окне справки отображается документация на программу.The control buttons (90), (92), (94), (96), (98) allow you to search for the selected term in a special dictionary, view and change the set of active special dictionaries, view and change the contents of the clipboard, perform the copy function, and also perform a return function, respectively. The search box in the special dictionary also includes menu items that allow you to perform various functions. The menu item "glossary" (dictionary) (100) allows you to display a set of active special dictionaries. In the window of the set of active special dictionaries, the user can select a dictionary, as well as add, delete and prioritize special dictionaries of the active set. The menu option "options" (102) allows you to display the options window of a special dictionary. In the options window of the special dictionary, the user can modify the parameters of the Universe translation program related to the search in documents, the source language of the document in which the search is performed, as well as the method for identifying the terms found in the document. Finally, the “help” menu item (104) displays a help window. The help window displays the documentation for the program.

На фигуре 5 показано окно опций словаря (60). Окно опций словаря (60) выводится на экран при нажатии на кнопку опций (52). В окне опций словаря (60) пользователь имеет возможность модифицировать параметры программы перевода Universe, касающиеся выполнения поиска в документах, исходного языка документа, в котором производится поиск, а также способа идентификации найденных терминов в документе.Figure 5 shows the dictionary options window (60). The dictionary options window (60) is displayed when you press the options button (52). In the dictionary options window (60), the user has the opportunity to modify the parameters of the Universe translation program related to the search in documents, the source language of the document in which the search is performed, as well as the method for identifying the terms found in the document.

В качестве примера используются селективные кнопки (62) и (64), позволяющие пользователю выбрать между поиском терминов только в текущем словаре или в активном наборе словарей, соответственно. Селективные кнопки (66) и (68) используются, чтобы обеспечить возможность пользователю выбрать между идентификацией только первого самого длинного совпадения или всех самых длинных совпадений соответственно. Падающее меню (70) используется для выбора исходного языка документа. Наконец, кнопки изменения цвета (72), (74) и (76) позволяют пользователю выбирать, каким цветом отображать найденные термины и идентифицировать текст перевода, соответственно. Кроме того, кнопка очистки памяти (78) удаляет все пометки, касающиеся известных терминов и переводов, из активного документа аналогично кнопке очистки (50). Наконец, имеются кнопки "ОК" и "cancel" (отмена), которые работают так же, как в других стандартных окнах.As an example, selective buttons (62) and (64) are used, allowing the user to choose between searching for terms only in the current dictionary or in the active set of dictionaries, respectively. Selective buttons (66) and (68) are used to allow the user to choose between identifying only the first longest match or all the longest matches, respectively. The drop-down menu (70) is used to select the source document language. Finally, the color change buttons (72), (74) and (76) allow the user to choose which color to display the terms found and identify the translation text, respectively. In addition, the clear memory button (78) deletes all marks related to known terms and translations from the active document in the same way as the clear button (50). Finally, there are OK and cancel buttons that work the same way as in other standard windows.

На фигуре 6 показано окно набора активных словарей в соответствии с одним из вариантов реализации настоящего изобретения. Набор активных словарей (110) выводится на экран при нажатии кнопки-пиктограммы (56) или выборе пункта меню "словарь" (100) в окне (80) поиска в словаре. В окне набора активных словарей пользователь имеет возможность выбрать словарь и добавить, удалить и установить приоритет словарей активного набора. Все доступные словари перечислены либо в окне активного набора (112), либо в окне (114) словарей, не включенных в активный набор. Словари можно добавлять или исключать из активного набора, используя кнопки (116) и (118) соответственно, предварительно выделив нужный словарь в соответствующем окне.Figure 6 shows a window of a set of active dictionaries in accordance with one embodiment of the present invention. A set of active dictionaries (110) is displayed on the screen by pressing the icon button (56) or selecting the dictionary item (100) in the dictionary search window (80). In the window of the set of active dictionaries, the user has the opportunity to select a dictionary and add, remove and prioritize dictionaries of the active set. All available dictionaries are listed either in the window of the active set (112) or in the window (114) of dictionaries that are not included in the active set. Dictionaries can be added or excluded from the active set using the buttons (116) and (118), respectively, having previously selected the desired dictionary in the corresponding window.

Специальным словарям, включенным в активный набор, присваивается приоритет по принципу "сверху вниз". Изменение приоритета словаря осуществляется кнопкой приоритета (120) после выделения нужного словаря. В показанном примере используется одна единственная кнопка приоритета, которая действует по принципу повышения приоритета, т.е. при каждом нажатии на кнопку приоритет выбранного словаря повышается до следующего более высокого уровня. Специалистам в данной области должно быть понятно, что возможны самые различные варианты этой функции, которые не выходят за объем настоящего изобретения. Наконец, используются кнопки "ОК" и "cancel" (отмена), которые работают так же, как и в других стандартных окнах.Special dictionaries included in the active set are assigned priority from top to bottom. The dictionary priority is changed by the priority button (120) after highlighting the desired dictionary. In the example shown, one single priority button is used, which operates on the principle of increasing priority, i.e. Each time you press the button, the priority of the selected dictionary rises to the next higher level. Specialists in this field should be clear that there are a variety of options for this function, which are not beyond the scope of the present invention. Finally, the "OK" and "cancel" buttons are used, which work in the same way as in other standard windows.

На фигуре 7 показана блок-схема, описывающая процесс в соответствии с одним из вариантов реализации настоящего изобретения. Когда пользователь выбирает одну из кнопок активизации перевода, описанных выше (шаг 200), открытый документ анализируется на предмет известных терминов (шаг 202). Перед анализом выбранные термины приводятся к стандартному виду (шаг 201). Приведение к стандартному виду представляет собой процесс, который используется для приведения слов к их корневому компоненту с целью сравнения со словами, имеющимися в данном специальном словаре. Для английского языка приведение к стандартному виду заключается в поиске существительных во множественном числе и глаголов в прошедшем времени и преобразовании их, соответственно, в единственное число и настоящее время. Специалистам в данной области должно быть понятно, что в других языках приведение к стандартному виду может включать в себя более сложный процесс определения корневого компонента конкретного слова.7 is a flowchart describing a process in accordance with one embodiment of the present invention. When the user selects one of the translation activation buttons described above (step 200), the open document is analyzed for known terms (step 202). Before analysis, the selected terms are reduced to the standard form (step 201). Reducing to a standard form is a process that is used to bring words to their root component in order to compare with the words in this special dictionary. For the English language, reduction to the standard form consists in searching for plural nouns and verbs in the past tense and converting them, respectively, into the singular and the present tense. Specialists in this field should be clear that in other languages, the reduction to a standard form may include a more complex process of determining the root component of a particular word.

Анализ документа может включать в себя сравнение терминов, содержащихся в активном специальном словаре и наборе активных специальных словарей, с текстом документа с целью поиска совпадений. В ходе процесса сравнения, если для известного термина совпадений в тексте документа не обнаружено (шаг 204), система проверяет, было ли проведено сравнение по всем известным терминам, после чего процесс завершается (шаг 206).The analysis of the document may include comparing the terms contained in the active special dictionary and the set of active special dictionaries with the text of the document in order to find matches. During the comparison process, if no matches are found in the text of the document for the known term (step 204), the system checks whether the comparison was performed for all known terms, and then the process ends (step 206).

Если да, процесс останавливается. Иначе система продолжает сравнивать известные термины с текстом документа (шаг 202).If so, the process stops. Otherwise, the system continues to compare known terms with the text of the document (step 202).

При обнаружении совпадения для известного термина (шаг 204) система определяет, является ли обнаруженный известный термин частью другого известного термина (шаг 208). Если нет, известный термин предъявляется как таковой (шаг 210) и система определяет, завершен ли процесс (шаг 206). Если известный термин является частью другого термина (шаг 208), то может быть произведено одно из нескольких сравнений, в зависимости от выбранных пользователем опций и конкретного варианта реализации настоящего изобретения. В качестве примера ниже со ссылкой на фигуру 8 описан способ обработки второго совпадения (шаг 212). После возврата из обработки второго совпадения (шаг 212) система определяет, завершен ли процесс (шаг 206).If a match is found for a known term (step 204), the system determines whether the detected known term is part of another known term (step 208). If not, the known term is presented as such (step 210) and the system determines whether the process is completed (step 206). If the known term is part of another term (step 208), then one of several comparisons may be made, depending on the options selected by the user and the particular embodiment of the present invention. As an example, a method for processing a second match is described below with reference to FIG. 8 (step 212). After returning from processing the second match (step 212), the system determines whether the process is completed (step 206).

Согласно фигуре 8 система прежде всего определяет, выбрано ли использование набора активных словарей, или используется единственный словарь (шаг 214). При наличии активного набора (шаг 214) система определяет, является ли приоритет обнаруженного второго совпадения более высоким или более низким по сравнению с приоритетом существующего совпадения, частью которого он является (шаг 216). Если приоритет второго совпадения ниже приоритета существующего совпадения (шаг 216), система проверяет, необходимо ли возвращать все самые длинные совпадения (шаг 218). Как описано выше, возвращать ли все наиболее длинные совпадения или только одно наиболее длинное совпадение является опцией, устанавливаемой пользователем.According to figure 8, the system first determines whether the use of a set of active dictionaries is selected, or whether a single dictionary is used (step 214). If there is an active set (step 214), the system determines whether the priority of the detected second match is higher or lower than the priority of the existing match of which it is a part (step 216). If the priority of the second match is lower than the priority of the existing match (step 216), the system checks whether it is necessary to return all the longest matches (step 218). As described above, whether to return all the longest matches or only one longest match is an option set by the user.

Если необходимо возвращать все наиболее длинные совпадения (шаг 218), то второе совпадение возвращается как второй найденный термин (шаг 220), и процесс переходит на начало (шаг 212). С другой стороны, если необходимо возвращать только одно наиболее длинное совпадение (шаг 218), система сравнивает второе совпадение с существующим совпадением, чтобы определить, является ли второе совпадение наиболее длинным (шаг 222). Если нет, процесс возвращается на начало (шаг 212). Если да, второе совпадение предъявляется как наиболее длинное совпадение, а существующее совпадение более не предъявляется (шаг 224). Затем процесс переходит на начало (шаг 212).If it is necessary to return all the longest matches (step 218), then the second match is returned as the second term found (step 220), and the process goes to the beginning (step 212). On the other hand, if you want to return only one longest match (step 218), the system compares the second match with the existing match to determine if the second match is the longest (step 222). If not, the process returns to the beginning (step 212). If so, the second match is presented as the longest match, and the existing match is no longer presented (step 224). Then the process goes to the beginning (step 212).

Если приоритет второго совпадения выше, чем приоритет существующего совпадения (шаг 216), система опять определяет, следует ли возвращать все наиболее длинные совпадения (шаг 226). Если да, второе совпадение предъявляется как основное совпадение, а существующее совпадение предъявляется как вторичное совпадение в соответствии с приоритетом (шаг 228). Затем процесс переходит на начало (шаг 212). Иначе система определяет, является ли второе совпадение более длинным по сравнению с существующим совпадением (шаг 230). Если да, второе совпадение предъявляется как самое длинное совпадение, а существующее совпадение больше не предъявляется (шаг 224), как уже было описано выше. Однако, если второе совпадение не является самым длинным совпадением (шаг 230), возвращаются как второе совпадение, так и существующее совпадение, поскольку существующее совпадение является наиболее длинным, а второе совпадение является совпадением с более высоким приоритетом (шаг 228). Затем процесс возвращается на начало (шаг 212).If the priority of the second match is higher than the priority of the existing match (step 216), the system again determines whether to return all the longest matches (step 226). If so, the second match is presented as the primary match, and the existing match is presented as the secondary match in accordance with priority (step 228). Then the process goes to the beginning (step 212). Otherwise, the system determines whether the second match is longer than the existing match (step 230). If so, the second match is presented as the longest match, and the existing match is no longer presented (step 224), as already described above. However, if the second match is not the longest match (step 230), both the second match and the existing match are returned, since the existing match is the longest and the second match is the match with a higher priority (step 228). Then the process returns to the beginning (step 212).

Специалистам в данной области должно быть понятно, что в конкретном варианте реализации число описанных выше шагов может быть больше или меньше или шаги могут появляться в последовательности, отличной от описанной, без выхода за пределы объема настоящего изобретения.Specialists in this field should be clear that in a particular embodiment, the number of steps described above may be more or less, or steps may appear in a sequence different from that described without going beyond the scope of the present invention.

На фигурах 9, 10 показан документ, полученный в результате описанного выше сравнения. Документ (240) представляет собой текст, полностью аналогичный исходному документу, однако, как можно заметить, по всему тексту расставлены метки, показывающие, какие термины являются известными. Далее для выделения основных и вторичных известных терминов используются различные цвета. Исходя из этих обозначений, специалисты-переводчики смогут быстро определить, какие термины являются специальными техническими терминами, а какие общеупотребительными (по крайней мере, с точки зрения выбранного словаря). Взглянув на документ с обозначенными известными терминами, пользователь может выделить маркером слова или фразу, обозначенную как известную, например, слово "tanks" (252) и нажать кнопку поиска в словаре (48) или кнопку-пиктограмму (54), чтобы просмотреть соответствующий перевод (250).In figures 9, 10 shows a document obtained as a result of the above comparison. A document (240) is a text completely similar to the original document, however, as you can see, labels are placed throughout the text to indicate which terms are known. Further, different colors are used to highlight primary and secondary known terms. Based on these notations, translators will be able to quickly determine which terms are special technical terms and which are commonly used (at least from the point of view of the selected dictionary). Having looked at a document with known terms indicated, the user can select with a marker words or a phrase designated as known, for example, the word "tanks" (252) and press the search button in the dictionary (48) or the icon button (54) to view the corresponding translation (250).

Преимущества одного из вариантов реализации настоящего изобретения могут включать одно или более из нижеследующего. В одном из вариантов реализации настоящее изобретение упрощает перевод слов, предложений и фраз путем маркировки терминов, встречающихся в документе, которые соответствуют техническим или другим имеющим существенное значение словам, предложениям и фразам, хранящимся в специальных словарях. Может быть задано, в каких словарях производить поиск, а также приоритет обнаруженных совпадений. При наличии подключаемых словарей терминов переводы, выполняемые различными специалистами-переводчиками, будут единообразными. Технические термины, имеющие определенное значение в техническом контексте и совсем другое значение при обычном употреблении, будут переведены правильно. Термины, не представляющие трудность при переводе, могут быть предложены или полностью оставлены для перевода специалистом-переводчиком.Advantages of one embodiment of the present invention may include one or more of the following. In one embodiment, the present invention simplifies the translation of words, sentences and phrases by marking terms found in a document that correspond to technical or other significant words, sentences and phrases stored in special dictionaries. It can be set in which dictionaries to search, as well as the priority of matches found. In the presence of plug-in dictionaries of terms, the translations performed by various specialist translators will be uniform. Technical terms that have a certain meaning in a technical context and a completely different meaning in ordinary use will be translated correctly. Terms that are not difficult to translate can be proposed or fully reserved for translation by a specialist translator.

Может выполняться автоматический перевод наиболее сложной терминологии, специфичной для конкретного проекта. В процессе перевода возможно автоматическое и полное использование словарной базы данных. Может быть эффективно реализовано абсолютное соответствие с терминологией, утвержденной для данного проекта, а также полное соответствие переведенных материалов с утвержденными словарями специальных терминов. Может быть обеспечен более быстрый, непротиворечивый и точный перевод. Имеется возможность выдавать внештатным переводчикам документы, прошедшие предварительную обработку. Упрощается модернизация и оперативный контроль, а также управление базой данных. Специалистам в данной области должно быть понятно, что настоящее изобретение может включать в себя другие преимущества и особенности.An automatic translation of the most complex terminology specific to a specific project can be performed. During the translation process, automatic and full use of the dictionary database is possible. Absolute compliance with the terminology approved for a given project, as well as full compliance of translated materials with approved dictionaries of special terms, can be effectively implemented. A faster, more consistent and accurate translation can be provided. It is possible to issue documents that have undergone preliminary processing to freelance translators. Simplified modernization and operational control, as well as database management. Specialists in this field should be clear that the present invention may include other advantages and features.

Несмотря на то, что изобретение было описано на примере ограниченного числа вариантов реализации, специалистам в данной области, прочитавшим данное описание, должно быть понятно, что могут быть предложены другие варианты реализации, не выходящие за границы объема изобретения, описанного в настоящей заявке. Таким образом, объем изобретения должен быть ограничен только прилагаемой формулой изобретения.Despite the fact that the invention has been described by the example of a limited number of embodiments, those skilled in the art having read this description should understand that other embodiments may be offered without departing from the scope of the invention described in this application. Thus, the scope of the invention should be limited only by the attached claims.

Наиболее успешно заявленное техническое решение промышленно применимо в вычислительной технике для автоматического перевода наиболее сложной терминологии, специфичной для конкретного проекта.The most successfully claimed technical solution is industrially applicable in computer technology for the automatic translation of the most complex terminology specific to a specific project.

Claims (2)

1. Система для управления языковым переводом, содержащая процессор с памятью, дисплей, программное обеспечение, хранящееся в памяти и выполняемое на процессоре для сравнения терминов текста с терминами, находящимися по крайней мере в одном из словарей, и в систему введен по крайней мере один из множества специализированных словарей, а процессор предназначен для предъявления на дисплее совпадений между терминами текста и терминами словаря и специализированного словаря и вставки переводов совпадающих терминов текста и терминов словаря и специализированного словаря в текст, отличающаяся тем, что процессор предназначен для присвоения приоритетов посредством графического интерфейса пользователю по крайней мере одному из словарей и по крайней мере одному из множества специализированных словарей, процессор предназначен для предъявления на дисплее посредством графического интерфейса пользователя, исходя из присвоенных приоритетов, совпадающих терминов текста с терминами словаря или специализированного словаря, а также для предъявления на дисплее посредством графического интерфейса пользователя наиболее длинных переводов совпадающих терминов текста и терминов словаря или специализированного словаря.1. A system for managing a language translation comprising a processor with memory, a display, software stored in memory and executed on a processor to compare text terms with terms in at least one of the dictionaries, and at least one of many specialized dictionaries, and the processor is designed to present on the display matches between the terms of the text and the terms of the dictionary and the specialized dictionary and insert translations of matching text terms and dictionary terms and a specialized dictionary into text, characterized in that the processor is designed to assign priorities through a graphical interface to a user of at least one of the dictionaries and at least one of the many specialized dictionaries, the processor is designed to be presented on the display via a graphical user interface, based on the assigned priorities, matching terms of the text with the terms of a dictionary or a specialized dictionary, as well as for presentation on the display by means of graphic th user interface longest matching text translations of terms and terminology dictionary or a specialized dictionary. 2. Система по п.1, отличающаяся тем, что перед вставкой переводов процессор предназначен для приведения терминов к стандартному виду, обеспечивающему определение их корневых компонентов.2. The system according to claim 1, characterized in that before inserting the translations, the processor is designed to bring the terms to a standard form, providing a definition of their root components.
RU2002129785/09A 2002-05-08 2002-11-11 System for controlling language translation RU2285951C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US60/333,927 2001-11-28
US10/141,404 2002-05-08
US10/141,404 US20030101046A1 (en) 2001-11-28 2002-05-08 Word, expression, and sentence translation management tool

Publications (2)

Publication Number Publication Date
RU2002129785A RU2002129785A (en) 2004-06-20
RU2285951C2 true RU2285951C2 (en) 2006-10-20

Family

ID=37438054

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2002129785/09A RU2285951C2 (en) 2002-05-08 2002-11-11 System for controlling language translation

Country Status (1)

Country Link
RU (1) RU2285951C2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2607416C2 (en) * 2012-07-12 2017-01-10 Лингуалео, Инк. Crowd-sourcing vocabulary teaching systems
RU2628202C1 (en) * 2016-04-11 2017-08-15 Михаил Маркович Гольдреер Adaptive context-thematic machine translation

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5201042A (en) * 1986-04-30 1993-04-06 Hewlett-Packard Company Software process and tools for development of local language translations of text portions of computer source code
RU2104584C1 (en) * 1995-05-17 1998-02-10 Инна Владимировна Суходольская Vocabulary educational guidance
RU2104583C1 (en) * 1994-09-20 1998-02-10 Денис Константинович Рунов Method for parsing of syntactic structures
RU2122240C1 (en) * 1998-01-15 1998-11-20 Анатолий Леонидович Бродский Method for design of dictionary for translation from foreign language
JP2000137712A (en) * 1998-10-30 2000-05-16 Brother Ind Ltd Machine translation apparatus and computer-readable recording medium recording machine translation processing program
US20010029443A1 (en) * 2000-03-27 2001-10-11 International Business Machines Corporation Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
WO2001082119A2 (en) * 2000-04-24 2001-11-01 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5201042A (en) * 1986-04-30 1993-04-06 Hewlett-Packard Company Software process and tools for development of local language translations of text portions of computer source code
RU2104583C1 (en) * 1994-09-20 1998-02-10 Денис Константинович Рунов Method for parsing of syntactic structures
RU2104584C1 (en) * 1995-05-17 1998-02-10 Инна Владимировна Суходольская Vocabulary educational guidance
RU2122240C1 (en) * 1998-01-15 1998-11-20 Анатолий Леонидович Бродский Method for design of dictionary for translation from foreign language
JP2000137712A (en) * 1998-10-30 2000-05-16 Brother Ind Ltd Machine translation apparatus and computer-readable recording medium recording machine translation processing program
US20010029443A1 (en) * 2000-03-27 2001-10-11 International Business Machines Corporation Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
WO2001082119A2 (en) * 2000-04-24 2001-11-01 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2607416C2 (en) * 2012-07-12 2017-01-10 Лингуалео, Инк. Crowd-sourcing vocabulary teaching systems
RU2628202C1 (en) * 2016-04-11 2017-08-15 Михаил Маркович Гольдреер Adaptive context-thematic machine translation

Similar Documents

Publication Publication Date Title
US20030101044A1 (en) Word, expression, and sentence translation management tool
US7827026B2 (en) Bilingual authoring assistant for the “tip of the tongue” problem
US20030101046A1 (en) Word, expression, and sentence translation management tool
US5694559A (en) On-line help method and system utilizing free text query
US6760695B1 (en) Automated natural language processing
US5850561A (en) Glossary construction tool
CA1251570A (en) Bilingual translation system with self intelligence
US5321607A (en) Automatic translating machine
US5675815A (en) Language conversion system and text creating system using such
US4831529A (en) Machine translation system
JP2003030186A (en) Machine translation equipment
US4833611A (en) Machine translation system
Underwood et al. Translatability checker: A tool to help decide whether to use MT
Heyn Integrating machine translation into translation memory systems
EP0357344B1 (en) Computer assisted language translating machine
RU2285951C2 (en) System for controlling language translation
JPH06348751A (en) Language converter
JP2838984B2 (en) General-purpose reference device
JP4007630B2 (en) Bilingual example sentence registration device
JPS61260366A (en) Mechanical translating system having learning function
Salgado et al. Deliverable 1.3: The drafting of glosses as a mediation for equivalence
JPH0561902A (en) Mechanical translation system
JPS61260367A (en) Mechanical translating system
Boisen et al. Chinese information extraction and retrieval
JP3884001B2 (en) Language analysis system and method

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20101112