RU2285951C2 - System for controlling language translation - Google Patents
System for controlling language translation Download PDFInfo
- Publication number
- RU2285951C2 RU2285951C2 RU2002129785/09A RU2002129785A RU2285951C2 RU 2285951 C2 RU2285951 C2 RU 2285951C2 RU 2002129785/09 A RU2002129785/09 A RU 2002129785/09A RU 2002129785 A RU2002129785 A RU 2002129785A RU 2285951 C2 RU2285951 C2 RU 2285951C2
- Authority
- RU
- Russia
- Prior art keywords
- terms
- dictionary
- text
- translation
- dictionaries
- Prior art date
Links
- 238000013519 translation Methods 0.000 title claims abstract description 62
- 230000014616 translation Effects 0.000 claims abstract description 66
- 230000015654 memory Effects 0.000 claims abstract description 9
- 239000000126 substance Substances 0.000 abstract 1
- 238000000034 method Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
Изобретение относится к вычислительной технике и может быть использовано для автоматизированного перевода текста с одного языка на другой.The invention relates to computer technology and can be used for automated translation of text from one language to another.
На настоящий момент в области компьютеризированного перевода с иностранного языка известны средства машинного перевода и средства перевода, использующие память переводов. При использовании средств машинного перевода блок текста или предложение переводится посредством последовательного поиска перевода слов каждого предложения текста. Таким образом, осуществляется непосредственный поиск каждого переводимого слова в словарной базе данных. Затем программа машинного перевода собирает эти переводы в предложение, имеющее смысл. При использовании средств памяти перевода блок текста переводится непосредственно предложение за предложением или сегмент за сегментом. То есть осуществляется поиск перевода каждого предложения или сегмента в ранее составленной базе данных фраз и предложений языка.At the moment, in the field of computer-assisted translation from a foreign language, machine translation tools and translation tools using translation memories are known. When using machine translation tools, a block of text or a sentence is translated by sequentially searching for a translation of the words of each sentence of the text. Thus, a direct search for each translated word is carried out in the dictionary database. The machine translation program then collects these translations into a sentence that makes sense. When using translation memory, a block of text is translated directly sentence by sentence or segment by segment. That is, a search is made for the translation of each sentence or segment in a previously compiled database of phrases and sentences of the language.
Ранее были разработаны различные способы, позволяющие переводить документы исключительно компьютерными средствами. Например, Carbonell et al. в патенте США №6173785 описывает интерактивный текстовый редактор, который накладывает лексические и грамматические ограничения на подмножество естественного языка, используемое автором при создании первоначального текста. Эти ограничения помогают разрешать неоднозначность текста с целью улучшения возможности перевода. Кроме того, Motoyama в патенте США №6208956 описывает способ кодирования документов с помощью тэгов стандартного обобщенного языка разметки (SGML) и с использованием переводческих ресурсов в зависимости от тэгов. Тэги могут обозначать типы документов или части документа, перевод которых осуществляется. Кодируя документ таким образом, можно добиться более точного машинного перевода без наложения избыточных ограничивающих правил на слова и фразы документа, который подлежит переводу.Previously, various methods have been developed that allow documents to be translated exclusively by computer. For example, Carbonell et al. US Pat. No. 6,173,785 describes an interactive text editor that imposes lexical and grammatical restrictions on a subset of the natural language used by the author to create the original text. These limitations help resolve text ambiguity in order to improve translation capabilities. In addition, Motoyama in US Pat. No. 6,208,956 describes a method for encoding documents using tags of a standard generalized markup language (SGML) and using translation resources depending on the tags. Tags can indicate the types of documents or parts of a document that are being translated. By coding a document in this way, a more accurate machine translation can be achieved without imposing excessive restrictive rules on the words and phrases of the document to be translated.
Известны другие способы наложения ограничений и структурирования грамматики и лексики. Разрабатываются и усовершенствуются различные способы обработки семантических и идиоматических слов и фраз, а также способов обработки многозначных слов с использованием статистического анализа. Кроме того, для упрощения работы пользователей современные системы перевода могут включать в себя функцию параллельного отображения оригинального текста и его перевода. Дополнительно эти системы могут давать возможность пользователям выбирать, какие части машинного перевода принять, а от каких отказаться.Other methods are known for imposing restrictions and structuring grammar and vocabulary. Various methods for processing semantic and idiomatic words and phrases, as well as methods for processing multi-valued words using statistical analysis, are being developed and improved. In addition, to simplify the work of users, modern translation systems may include the function of parallel display of the original text and its translation. Additionally, these systems can enable users to choose which parts of machine translation to accept and which to refuse.
Решаемая настоящим изобретением задача - улучшение качества перевода.The problem solved by the present invention is improving the quality of translation.
Технический результат, который может быть получен при осуществлении заявленной системы, - повышение точности и скорости перевода, а также упрощение сложных переводов.The technical result that can be obtained by implementing the claimed system is to increase the accuracy and speed of translation, as well as simplify complex translations.
Для решения поставленной задачи с достижением указанного технического результата система для управления языковым переводом содержит процессор с памятью, дисплей, программное обеспечение, хранящееся в памяти и выполняемое на процессоре для сравнения терминов текста с терминами, находящимися, по крайней мере, в одном из словарей, и в систему введен, по крайней мере, один из множества специализированных словарей, а процессор выполнен с возможностью предъявления на дисплее совпадений между терминами текста и терминами словаря и специализированного словаря и вставки переводов совпадающих терминов текста и терминов словаря и специализированного словаря в текст, согласно изобретению процессор выполнен с возможностью присвоения приоритетов посредством графического интерфейса пользователя, по крайней мере, одному из словарей и, по крайней мере, одному из множества специализированных словарей, процессор выполнен обеспечивающим посредством графического интерфейса пользователя предъявление на дисплее исходя из присвоенных приоритетов совпадающих терминов текста с терминами словаря или специализированного словаря, а также с возможностью посредством графического интерфейса пользователя предъявления на дисплее наиболее длинных переводов совпадающих терминов текста и терминов словаря или специализированного словаря.To solve the problem with the achievement of the specified technical result, the language translation management system comprises a processor with memory, a display, software stored in the memory and executed on the processor for comparing text terms with terms found in at least one of the dictionaries, and at least one of the many specialized dictionaries has been entered into the system, and the processor is configured to show matches between text terms and dictionary and specialist terms on the display according to the invention, the processor is configured to prioritize through at least one of the dictionaries and at least one of the many specialized dictionaries, the processor made by providing through the graphical user interface the presentation on the display based on the assigned priorities of the matching text terms with the terms s specialized dictionary or dictionaries, as well as the chance by the GUI on the display presenting the longest matching translation text terms and specialized terms dictionary or vocabulary.
Возможен дополнительный вариант выполнения системы, в котором целесообразно, чтобы перед вставкой переводов процессор был выполнен с возможностью приведения терминов к стандартному виду, обеспечивающему определение их корневых компонентов.An additional embodiment of the system is possible, in which it is advisable that before inserting the translations the processor should be able to bring the terms to a standard form, providing the definition of their root components.
Прочие особенности и преимущества настоящего изобретения будут понятны из нижеследующего описания и прилагаемой формулы изобретения.Other features and advantages of the present invention will be apparent from the following description and the appended claims.
Фиг.1 изображает типовую компьютерную систему, на которой может быть реализован, по крайней мере, один из вариантов настоящего изобретения;Figure 1 shows a typical computer system on which at least one embodiment of the present invention may be implemented;
фиг.2 - типовой графический интерфейс пользователя (GUI) в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;figure 2 - a typical graphical user interface (GUI) in accordance with at least one embodiment of the present invention;
фиг.3 - увеличенный вид части типового графического интерфейса пользователя (GUI), показанного на фиг.2;figure 3 is an enlarged view of a part of a typical graphical user interface (GUI) shown in figure 2;
фиг.4 - окно словарного поиска в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;4 is a dictionary search window in accordance with at least one embodiment of the present invention;
фиг.5 - типовое окно опций в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;5 is a typical options window in accordance with at least one embodiment of the present invention;
фиг.6 - окно установки активного словаря в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;6 is a window for installing an active dictionary in accordance with at least one embodiment of the present invention;
фиг.7 - блок-схема, описывающая процесс работы в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;7 is a flowchart describing a process in accordance with at least one embodiment of the present invention;
фиг.8 - блок-схема, описывающая типовой способ обработки второго совпадения в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;Fig. 8 is a flowchart describing an exemplary method for processing a second match in accordance with at least one embodiment of the present invention;
фиг.9 - вид типового результирующего документа после выполнения сравнения в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения;Fig.9 is a view of a typical resulting document after comparing in accordance with at least one embodiment of the present invention;
фиг.10 - типовое окно перевода в соответствии, по крайней мере, с одним из вариантов реализации настоящего изобретения.10 is a typical translation window in accordance with at least one embodiment of the present invention.
Ниже приводится подробное описание конкретных вариантов реализации настоящего изобретения со ссылками на сопроводительные чертежи. В целях сохранения соответствия на разных чертежах одинаковые элементы обозначены одинаковыми номерами позиций.The following is a detailed description of specific embodiments of the present invention with reference to the accompanying drawings. In order to maintain compliance in different drawings, the same elements are indicated by the same reference numbers.
В целях обеспечения более точного понимания существа изобретения в нижеследующем подробном описании изобретения приводятся многочисленные специфичные детали. Однако специалистам в данной области должно быть понятно, что данное изобретение может быть реализовано и без этих специфичных деталей. В других же случаях подробное описание общеизвестных функций, наоборот, не приводится во избежание создания неопределенности для понимания существа изобретения.In order to provide a more accurate understanding of the invention, numerous specific details are set forth in the following detailed description of the invention. However, it will be understood by those skilled in the art that the invention may be practiced without these specific details. In other cases, a detailed description of well-known functions, on the contrary, is not given in order to avoid creating uncertainty for understanding the essence of the invention.
Настоящее изобретение относится к способам и устройствам для перевода с иностранного языка с использованием инструментов перевода Universe. Инструменты перевода Universe относятся к средствам, предоставляющим помощь при переводе. Инструменты перевода Universe анализируют предложения и предоставляют дополнительную определительную информацию на основе найденных слов и фраз. Исходя из слов и фраз, найденных в данном предложении, осуществляется поиск этих слов и фраз в определенном словаре с целью предоставления дополнительной определительной информации. Специальные словари содержат определительные фразы на исходном и целевом языке и составлены конкретно для работы в рамках данных специфичных тем. Специальные словари являются документами, составленными специально для работы с данным проектом и/или темой, и имеют более узкую направленность по сравнению с обычным словарем, содержат один или более переводов данного слова или фразы. Обычные словари, как правило, представляют собой развернутые документы, охватывающие все возможные толкования и соответствующие переводы слова или фразы. Далее инструменты перевода Universe работают с любыми парами языков, например, при переводе в обе стороны для языковых пар английский-французский, английский-испанский, английский-русский и.т.д.The present invention relates to methods and devices for translation from a foreign language using Universe translation tools. Universe translation tools are tools that provide translation assistance. Universe translation tools analyze sentences and provide additional definitive information based on words and phrases found. Based on the words and phrases found in this sentence, these words and phrases are searched in a specific dictionary in order to provide additional definitive information. Special dictionaries contain definition phrases in the source and target language and are specifically designed to work within the framework of these specific topics. Special dictionaries are documents compiled specifically for working with a given project and / or topic, and have a narrower focus than a regular dictionary, contain one or more translations of a given word or phrase. Conventional dictionaries, as a rule, are detailed documents covering all possible interpretations and corresponding translations of a word or phrase. Further, Universe translation tools work with any language pair, for example, when translating in both directions for language pairs English-French, English-Spanish, English-Russian, etc.
Настоящее изобретение может быть реализовано практически на любом типе компьютера независимо от используемой платформы. Например, как показано на фигуре 1, типовой компьютер (10) имеет процессор (12), связанный с памятью (14), устройством хранения информации (16) и рядом других элементов и функциональных узлов, типичных для современного компьютера (не показаны). Компьютер (10) снабжен связанными с ним средствами ввода информации, такими как клавиатура (18) и мышь (20), хотя в зависимости от имеющейся конфигурации эти средства вода могут принимать другие формы. Компьютер (10) связан также с устройствами вывода, такими как дисплей (22), которые также в зависимости от имеющейся конфигурации могут принимать другие формы. Компьютер (10) может быть соединен с сетью или другими ресурсами (24).The present invention can be implemented on virtually any type of computer, regardless of the platform used. For example, as shown in figure 1, a typical computer (10) has a processor (12) associated with a memory (14), an information storage device (16), and a number of other elements and functional units typical of a modern computer (not shown). The computer (10) is equipped with associated information input means, such as a keyboard (18) and a mouse (20), although, depending on the configuration, these means, water can take other forms. The computer (10) is also connected to output devices, such as a display (22), which can also take other forms depending on the configuration available. The computer (10) can be connected to a network or other resources (24).
Как показано на фигуре 2, инструмент перевода Universe резидентен в памяти, а в графическом интерфейсе пользователя (GUI) имеются выбираемые по усмотрению пользователя элементы управления окном, например, кнопки в панели инструментов редактора Microsoft Word®. GUI является частью прикладного программного обеспечения, которая взаимодействует с пользователем через графический дисплей. GUI принимает входные сигналы от пользователя посредством различных средств доступа, таких как мышь или комбинированный манипулятор, или через клавиатуру. Визуальный выходной сигнал GUI обычным образом выводится на устройство отображения, такое как экран монитора компьютера, и содержит средства управления, позволяющие пользователю взаимодействовать с GUI. Примерами средств управления являются окна, заголовки, кнопки, метки, панели меню, панели инструментов, диалоговые окна, меню, пиктограммы и т.д. Средства управления могут также представлять собой прикладные программы, которые могут запускаться пользователем, или пиктограмму курсора, показывающую положение мыши.As shown in Figure 2, the Universe translation tool is memory-resident, and the graphical user interface (GUI) has window controls selectable at the user's discretion, for example, buttons in the toolbar of the Microsoft Word® editor. The GUI is part of the application software that interacts with the user through a graphic display. The GUI receives input from the user through various means of access, such as a mouse or a combination pad, or through a keyboard. The visual output of the GUI is routinely output to a display device, such as a computer monitor screen, and contains controls that allow the user to interact with the GUI. Examples of controls are windows, titles, buttons, labels, menu bars, toolbars, dialog boxes, menus, icons, etc. The controls may also be applications that can be launched by the user, or a cursor icon showing the position of the mouse.
Пример визуального выходного сигнала GUI показан на фигурах 2, 3. Как видно из фигур, в окне (30) отображается редактор Microsoft Word® вместе с открытым документом. Кнопки инструмента перевода Universe включены в неподвижные панели инструментов, например, панели инструментов (32), (34), и плавающие панели инструментов, например, панель инструментов (36). Эти панели инструментов (32), (34) и (36) соответствуют различным функциям программы перевода Universe. Специалистам в данной области должно быть понятно, как создавать и выполнять динамическое позиционирование средств управления такого типа. Поэтому подробное описание этого процесса в данном документе не приводится.An example of the visual output of the GUI is shown in figures 2, 3. As can be seen from the figures, the Microsoft Word® editor is displayed in the window (30) along with the open document. The buttons of the Universe translation tool are included in fixed toolbars, for example, toolbars (32), (34), and floating toolbars, for example, a toolbar (36). These toolbars (32), (34) and (36) correspond to various functions of the Universe translation program. Specialists in this field should understand how to create and perform dynamic positioning of controls of this type. Therefore, a detailed description of this process is not given in this document.
Различные кнопки панелей инструментов (32), (34) и (36) активизируют различные функции программы перевода Universe. В частности, неподвижная панель инструментов (32) содержит кнопку "Merge translation" (принять перевод) (40), которая производит вставку переводов известных терминов в текст документа.The various toolbar buttons (32), (34) and (36) activate the various functions of the Universe translation program. In particular, the fixed toolbar (32) contains the “Merge translation” button (40), which inserts translations of known terms into the text of the document.
В неподвижной панели инструментов (34) имеется шесть кнопок, а именно кнопка "scan" (сканировать) (42), кнопка "translate" (перевести) (44), кнопка "auto" (авто) (46), кнопка "lookup" (поиск в словаре) (48), кнопка "clear" (очистить) (50) и кнопка "options..." (опции...) (52). Эти кнопки включают различные функции. Кнопка сканирования (42) включает сканирование активного документа на предмет поиска известных терминов, а также идентификации найденных терминов. Кнопка перевода (44) активизирует команду перевода известных терминов в активном документе. Этот процесс перевода происходит аналогично проверке правописания. Известные термины отображаются вместе с их переводом, а пользователь может по своему усмотрению вставить один перевод или вставить все переводы. Кнопка "авто" (46) включает команду поиска в документе известных терминов и автоматической вставки переводов всех найденных известных терминов. Кнопка поиска в словаре (48) запускает поиск выделенного термина в активных словарях или, при отсутствии выделенного текста, выводит на экран окно поиска в словаре. Кнопка очистки (50) удаляет все пометки, связанные с известными терминами, из активного документа. Кнопка "опции..." (52) выводит на экран окно опций словаря.The fixed toolbar (34) has six buttons, namely the scan button (42), the translate button (44), the auto button (46), the lookup button (dictionary search) (48), the "clear" button (50) and the "options ..." button (options ...) (52). These buttons include various functions. The scan button (42) includes scanning the active document for the search for known terms, as well as the identification of the found terms. The translation button (44) activates the translation command of known terms in the active document. This translation process is similar to spell checking. Known terms are displayed along with their translation, and the user can, at his discretion, insert one translation or insert all translations. The “auto” button (46) includes a command to search for known terms in a document and automatically insert translations of all found known terms. The search button in the dictionary (48) starts the search for the highlighted term in active dictionaries or, in the absence of highlighted text, displays a search window in the dictionary. The clear button (50) deletes all marks associated with known terms from the active document. The "options ..." button (52) displays the dictionary options window.
В плавающей панели инструментов (36) имеются пиктограммы, соответствующие команде поиска в словаре, т.е. кнопка-пиктограмма (54), и команде просмотра набора активных словарей, т.е. кнопка-пиктограмма (56). Кнопка-пиктограмма (54) включает поиск выделенного термина в активных словарях или, при отсутствии выделенного термина, выводит на экран окно поиска в словарях. Это позволяет пользователям осуществлять поиск известных терминов в заданных словарях. Кнопка (56) выводит на экран перечень активных словарей. В этом окне пользователь имеет возможность изменять набор активных словарей, а также устанавливать приоритеты активных словарей. Специалистам в данной области должно быть понятно, что используемые метки и пиктограммы, а также размещение и организация описанных выше кнопок являются лишь примером и могут быть изменены самым различных образом без отклонения от существа настоящего изобретения.In the floating toolbar (36) there are icons corresponding to the search command in the dictionary, i.e. an icon button (54), and a command for viewing a set of active dictionaries, i.e. pictogram button (56). The icon button (54) enables the search for the highlighted term in active dictionaries or, in the absence of a highlighted term, displays a search box in dictionaries. This allows users to search for known terms in defined dictionaries. Button (56) displays a list of active dictionaries. In this window, the user has the ability to change the set of active dictionaries, as well as set the priorities of active dictionaries. Specialists in this field should be clear that the labels and icons used, as well as the placement and organization of the buttons described above are just an example and can be changed in various ways without deviating from the essence of the present invention.
На фигуре 4 показано окно поиска в словаре согласно одному из вариантов реализации настоящего изобретения. Окно поиска в словаре (80) выводится на экран при нажатии на кнопку (48) или кнопку-пиктограмму (54). Окна поиска в словаре (80) содержат текстовое окно (82) для ввода ключевого слова поиска и падающее меню (84) терминов, найденных в словаре. Пользователь может выбрать указатели языка кнопками (86) и (88). Для примера показаны кнопки русского языка и английского языка.Figure 4 shows a search box in a dictionary according to one embodiment of the present invention. The search window in the dictionary (80) is displayed when you press the button (48) or the icon button (54). Search windows in the dictionary (80) contain a text window (82) for entering the search keyword and a drop-down menu (84) of terms found in the dictionary. The user can select the language indicators with the buttons (86) and (88). For example, the buttons of the Russian language and English are shown.
Кнопки управления (90), (92), (94), (96), (98) позволяют производить поиск выбранного термина в специальном словаре, просматривать и изменять набор активных специальных словарей, просматривать и изменять содержимое буфера обмена, выполнять функцию копирования, а также выполнять функцию возврата, соответственно. В окно поиска в специальном словаре также включены элементы меню, которые позволяют выполнять различные функции. Пункт меню "glossary" (словарь) (100) позволяет вывести на экран набор активных специальных словарей. В окне набора активных специальных словарей пользователь может выбрать словарь, а также добавить, удалить и установить приоритеты специальных словарей активного набора. Пункт меню "options" (опции) (102) позволяет вывести на экран окно опций специального словаря. В окне опций специального словаря пользователь может модифицировать параметры программы перевода Universe, касающиеся выполнения поиска в документах, исходного языка документа, в котором производится поиск, а также способа идентификации найденных терминов в документе. Наконец, пункт меню "help" (справка) (104) выводит на экран окно справки. В окне справки отображается документация на программу.The control buttons (90), (92), (94), (96), (98) allow you to search for the selected term in a special dictionary, view and change the set of active special dictionaries, view and change the contents of the clipboard, perform the copy function, and also perform a return function, respectively. The search box in the special dictionary also includes menu items that allow you to perform various functions. The menu item "glossary" (dictionary) (100) allows you to display a set of active special dictionaries. In the window of the set of active special dictionaries, the user can select a dictionary, as well as add, delete and prioritize special dictionaries of the active set. The menu option "options" (102) allows you to display the options window of a special dictionary. In the options window of the special dictionary, the user can modify the parameters of the Universe translation program related to the search in documents, the source language of the document in which the search is performed, as well as the method for identifying the terms found in the document. Finally, the “help” menu item (104) displays a help window. The help window displays the documentation for the program.
На фигуре 5 показано окно опций словаря (60). Окно опций словаря (60) выводится на экран при нажатии на кнопку опций (52). В окне опций словаря (60) пользователь имеет возможность модифицировать параметры программы перевода Universe, касающиеся выполнения поиска в документах, исходного языка документа, в котором производится поиск, а также способа идентификации найденных терминов в документе.Figure 5 shows the dictionary options window (60). The dictionary options window (60) is displayed when you press the options button (52). In the dictionary options window (60), the user has the opportunity to modify the parameters of the Universe translation program related to the search in documents, the source language of the document in which the search is performed, as well as the method for identifying the terms found in the document.
В качестве примера используются селективные кнопки (62) и (64), позволяющие пользователю выбрать между поиском терминов только в текущем словаре или в активном наборе словарей, соответственно. Селективные кнопки (66) и (68) используются, чтобы обеспечить возможность пользователю выбрать между идентификацией только первого самого длинного совпадения или всех самых длинных совпадений соответственно. Падающее меню (70) используется для выбора исходного языка документа. Наконец, кнопки изменения цвета (72), (74) и (76) позволяют пользователю выбирать, каким цветом отображать найденные термины и идентифицировать текст перевода, соответственно. Кроме того, кнопка очистки памяти (78) удаляет все пометки, касающиеся известных терминов и переводов, из активного документа аналогично кнопке очистки (50). Наконец, имеются кнопки "ОК" и "cancel" (отмена), которые работают так же, как в других стандартных окнах.As an example, selective buttons (62) and (64) are used, allowing the user to choose between searching for terms only in the current dictionary or in the active set of dictionaries, respectively. Selective buttons (66) and (68) are used to allow the user to choose between identifying only the first longest match or all the longest matches, respectively. The drop-down menu (70) is used to select the source document language. Finally, the color change buttons (72), (74) and (76) allow the user to choose which color to display the terms found and identify the translation text, respectively. In addition, the clear memory button (78) deletes all marks related to known terms and translations from the active document in the same way as the clear button (50). Finally, there are OK and cancel buttons that work the same way as in other standard windows.
На фигуре 6 показано окно набора активных словарей в соответствии с одним из вариантов реализации настоящего изобретения. Набор активных словарей (110) выводится на экран при нажатии кнопки-пиктограммы (56) или выборе пункта меню "словарь" (100) в окне (80) поиска в словаре. В окне набора активных словарей пользователь имеет возможность выбрать словарь и добавить, удалить и установить приоритет словарей активного набора. Все доступные словари перечислены либо в окне активного набора (112), либо в окне (114) словарей, не включенных в активный набор. Словари можно добавлять или исключать из активного набора, используя кнопки (116) и (118) соответственно, предварительно выделив нужный словарь в соответствующем окне.Figure 6 shows a window of a set of active dictionaries in accordance with one embodiment of the present invention. A set of active dictionaries (110) is displayed on the screen by pressing the icon button (56) or selecting the dictionary item (100) in the dictionary search window (80). In the window of the set of active dictionaries, the user has the opportunity to select a dictionary and add, remove and prioritize dictionaries of the active set. All available dictionaries are listed either in the window of the active set (112) or in the window (114) of dictionaries that are not included in the active set. Dictionaries can be added or excluded from the active set using the buttons (116) and (118), respectively, having previously selected the desired dictionary in the corresponding window.
Специальным словарям, включенным в активный набор, присваивается приоритет по принципу "сверху вниз". Изменение приоритета словаря осуществляется кнопкой приоритета (120) после выделения нужного словаря. В показанном примере используется одна единственная кнопка приоритета, которая действует по принципу повышения приоритета, т.е. при каждом нажатии на кнопку приоритет выбранного словаря повышается до следующего более высокого уровня. Специалистам в данной области должно быть понятно, что возможны самые различные варианты этой функции, которые не выходят за объем настоящего изобретения. Наконец, используются кнопки "ОК" и "cancel" (отмена), которые работают так же, как и в других стандартных окнах.Special dictionaries included in the active set are assigned priority from top to bottom. The dictionary priority is changed by the priority button (120) after highlighting the desired dictionary. In the example shown, one single priority button is used, which operates on the principle of increasing priority, i.e. Each time you press the button, the priority of the selected dictionary rises to the next higher level. Specialists in this field should be clear that there are a variety of options for this function, which are not beyond the scope of the present invention. Finally, the "OK" and "cancel" buttons are used, which work in the same way as in other standard windows.
На фигуре 7 показана блок-схема, описывающая процесс в соответствии с одним из вариантов реализации настоящего изобретения. Когда пользователь выбирает одну из кнопок активизации перевода, описанных выше (шаг 200), открытый документ анализируется на предмет известных терминов (шаг 202). Перед анализом выбранные термины приводятся к стандартному виду (шаг 201). Приведение к стандартному виду представляет собой процесс, который используется для приведения слов к их корневому компоненту с целью сравнения со словами, имеющимися в данном специальном словаре. Для английского языка приведение к стандартному виду заключается в поиске существительных во множественном числе и глаголов в прошедшем времени и преобразовании их, соответственно, в единственное число и настоящее время. Специалистам в данной области должно быть понятно, что в других языках приведение к стандартному виду может включать в себя более сложный процесс определения корневого компонента конкретного слова.7 is a flowchart describing a process in accordance with one embodiment of the present invention. When the user selects one of the translation activation buttons described above (step 200), the open document is analyzed for known terms (step 202). Before analysis, the selected terms are reduced to the standard form (step 201). Reducing to a standard form is a process that is used to bring words to their root component in order to compare with the words in this special dictionary. For the English language, reduction to the standard form consists in searching for plural nouns and verbs in the past tense and converting them, respectively, into the singular and the present tense. Specialists in this field should be clear that in other languages, the reduction to a standard form may include a more complex process of determining the root component of a particular word.
Анализ документа может включать в себя сравнение терминов, содержащихся в активном специальном словаре и наборе активных специальных словарей, с текстом документа с целью поиска совпадений. В ходе процесса сравнения, если для известного термина совпадений в тексте документа не обнаружено (шаг 204), система проверяет, было ли проведено сравнение по всем известным терминам, после чего процесс завершается (шаг 206).The analysis of the document may include comparing the terms contained in the active special dictionary and the set of active special dictionaries with the text of the document in order to find matches. During the comparison process, if no matches are found in the text of the document for the known term (step 204), the system checks whether the comparison was performed for all known terms, and then the process ends (step 206).
Если да, процесс останавливается. Иначе система продолжает сравнивать известные термины с текстом документа (шаг 202).If so, the process stops. Otherwise, the system continues to compare known terms with the text of the document (step 202).
При обнаружении совпадения для известного термина (шаг 204) система определяет, является ли обнаруженный известный термин частью другого известного термина (шаг 208). Если нет, известный термин предъявляется как таковой (шаг 210) и система определяет, завершен ли процесс (шаг 206). Если известный термин является частью другого термина (шаг 208), то может быть произведено одно из нескольких сравнений, в зависимости от выбранных пользователем опций и конкретного варианта реализации настоящего изобретения. В качестве примера ниже со ссылкой на фигуру 8 описан способ обработки второго совпадения (шаг 212). После возврата из обработки второго совпадения (шаг 212) система определяет, завершен ли процесс (шаг 206).If a match is found for a known term (step 204), the system determines whether the detected known term is part of another known term (step 208). If not, the known term is presented as such (step 210) and the system determines whether the process is completed (step 206). If the known term is part of another term (step 208), then one of several comparisons may be made, depending on the options selected by the user and the particular embodiment of the present invention. As an example, a method for processing a second match is described below with reference to FIG. 8 (step 212). After returning from processing the second match (step 212), the system determines whether the process is completed (step 206).
Согласно фигуре 8 система прежде всего определяет, выбрано ли использование набора активных словарей, или используется единственный словарь (шаг 214). При наличии активного набора (шаг 214) система определяет, является ли приоритет обнаруженного второго совпадения более высоким или более низким по сравнению с приоритетом существующего совпадения, частью которого он является (шаг 216). Если приоритет второго совпадения ниже приоритета существующего совпадения (шаг 216), система проверяет, необходимо ли возвращать все самые длинные совпадения (шаг 218). Как описано выше, возвращать ли все наиболее длинные совпадения или только одно наиболее длинное совпадение является опцией, устанавливаемой пользователем.According to figure 8, the system first determines whether the use of a set of active dictionaries is selected, or whether a single dictionary is used (step 214). If there is an active set (step 214), the system determines whether the priority of the detected second match is higher or lower than the priority of the existing match of which it is a part (step 216). If the priority of the second match is lower than the priority of the existing match (step 216), the system checks whether it is necessary to return all the longest matches (step 218). As described above, whether to return all the longest matches or only one longest match is an option set by the user.
Если необходимо возвращать все наиболее длинные совпадения (шаг 218), то второе совпадение возвращается как второй найденный термин (шаг 220), и процесс переходит на начало (шаг 212). С другой стороны, если необходимо возвращать только одно наиболее длинное совпадение (шаг 218), система сравнивает второе совпадение с существующим совпадением, чтобы определить, является ли второе совпадение наиболее длинным (шаг 222). Если нет, процесс возвращается на начало (шаг 212). Если да, второе совпадение предъявляется как наиболее длинное совпадение, а существующее совпадение более не предъявляется (шаг 224). Затем процесс переходит на начало (шаг 212).If it is necessary to return all the longest matches (step 218), then the second match is returned as the second term found (step 220), and the process goes to the beginning (step 212). On the other hand, if you want to return only one longest match (step 218), the system compares the second match with the existing match to determine if the second match is the longest (step 222). If not, the process returns to the beginning (step 212). If so, the second match is presented as the longest match, and the existing match is no longer presented (step 224). Then the process goes to the beginning (step 212).
Если приоритет второго совпадения выше, чем приоритет существующего совпадения (шаг 216), система опять определяет, следует ли возвращать все наиболее длинные совпадения (шаг 226). Если да, второе совпадение предъявляется как основное совпадение, а существующее совпадение предъявляется как вторичное совпадение в соответствии с приоритетом (шаг 228). Затем процесс переходит на начало (шаг 212). Иначе система определяет, является ли второе совпадение более длинным по сравнению с существующим совпадением (шаг 230). Если да, второе совпадение предъявляется как самое длинное совпадение, а существующее совпадение больше не предъявляется (шаг 224), как уже было описано выше. Однако, если второе совпадение не является самым длинным совпадением (шаг 230), возвращаются как второе совпадение, так и существующее совпадение, поскольку существующее совпадение является наиболее длинным, а второе совпадение является совпадением с более высоким приоритетом (шаг 228). Затем процесс возвращается на начало (шаг 212).If the priority of the second match is higher than the priority of the existing match (step 216), the system again determines whether to return all the longest matches (step 226). If so, the second match is presented as the primary match, and the existing match is presented as the secondary match in accordance with priority (step 228). Then the process goes to the beginning (step 212). Otherwise, the system determines whether the second match is longer than the existing match (step 230). If so, the second match is presented as the longest match, and the existing match is no longer presented (step 224), as already described above. However, if the second match is not the longest match (step 230), both the second match and the existing match are returned, since the existing match is the longest and the second match is the match with a higher priority (step 228). Then the process returns to the beginning (step 212).
Специалистам в данной области должно быть понятно, что в конкретном варианте реализации число описанных выше шагов может быть больше или меньше или шаги могут появляться в последовательности, отличной от описанной, без выхода за пределы объема настоящего изобретения.Specialists in this field should be clear that in a particular embodiment, the number of steps described above may be more or less, or steps may appear in a sequence different from that described without going beyond the scope of the present invention.
На фигурах 9, 10 показан документ, полученный в результате описанного выше сравнения. Документ (240) представляет собой текст, полностью аналогичный исходному документу, однако, как можно заметить, по всему тексту расставлены метки, показывающие, какие термины являются известными. Далее для выделения основных и вторичных известных терминов используются различные цвета. Исходя из этих обозначений, специалисты-переводчики смогут быстро определить, какие термины являются специальными техническими терминами, а какие общеупотребительными (по крайней мере, с точки зрения выбранного словаря). Взглянув на документ с обозначенными известными терминами, пользователь может выделить маркером слова или фразу, обозначенную как известную, например, слово "tanks" (252) и нажать кнопку поиска в словаре (48) или кнопку-пиктограмму (54), чтобы просмотреть соответствующий перевод (250).In figures 9, 10 shows a document obtained as a result of the above comparison. A document (240) is a text completely similar to the original document, however, as you can see, labels are placed throughout the text to indicate which terms are known. Further, different colors are used to highlight primary and secondary known terms. Based on these notations, translators will be able to quickly determine which terms are special technical terms and which are commonly used (at least from the point of view of the selected dictionary). Having looked at a document with known terms indicated, the user can select with a marker words or a phrase designated as known, for example, the word "tanks" (252) and press the search button in the dictionary (48) or the icon button (54) to view the corresponding translation (250).
Преимущества одного из вариантов реализации настоящего изобретения могут включать одно или более из нижеследующего. В одном из вариантов реализации настоящее изобретение упрощает перевод слов, предложений и фраз путем маркировки терминов, встречающихся в документе, которые соответствуют техническим или другим имеющим существенное значение словам, предложениям и фразам, хранящимся в специальных словарях. Может быть задано, в каких словарях производить поиск, а также приоритет обнаруженных совпадений. При наличии подключаемых словарей терминов переводы, выполняемые различными специалистами-переводчиками, будут единообразными. Технические термины, имеющие определенное значение в техническом контексте и совсем другое значение при обычном употреблении, будут переведены правильно. Термины, не представляющие трудность при переводе, могут быть предложены или полностью оставлены для перевода специалистом-переводчиком.Advantages of one embodiment of the present invention may include one or more of the following. In one embodiment, the present invention simplifies the translation of words, sentences and phrases by marking terms found in a document that correspond to technical or other significant words, sentences and phrases stored in special dictionaries. It can be set in which dictionaries to search, as well as the priority of matches found. In the presence of plug-in dictionaries of terms, the translations performed by various specialist translators will be uniform. Technical terms that have a certain meaning in a technical context and a completely different meaning in ordinary use will be translated correctly. Terms that are not difficult to translate can be proposed or fully reserved for translation by a specialist translator.
Может выполняться автоматический перевод наиболее сложной терминологии, специфичной для конкретного проекта. В процессе перевода возможно автоматическое и полное использование словарной базы данных. Может быть эффективно реализовано абсолютное соответствие с терминологией, утвержденной для данного проекта, а также полное соответствие переведенных материалов с утвержденными словарями специальных терминов. Может быть обеспечен более быстрый, непротиворечивый и точный перевод. Имеется возможность выдавать внештатным переводчикам документы, прошедшие предварительную обработку. Упрощается модернизация и оперативный контроль, а также управление базой данных. Специалистам в данной области должно быть понятно, что настоящее изобретение может включать в себя другие преимущества и особенности.An automatic translation of the most complex terminology specific to a specific project can be performed. During the translation process, automatic and full use of the dictionary database is possible. Absolute compliance with the terminology approved for a given project, as well as full compliance of translated materials with approved dictionaries of special terms, can be effectively implemented. A faster, more consistent and accurate translation can be provided. It is possible to issue documents that have undergone preliminary processing to freelance translators. Simplified modernization and operational control, as well as database management. Specialists in this field should be clear that the present invention may include other advantages and features.
Несмотря на то, что изобретение было описано на примере ограниченного числа вариантов реализации, специалистам в данной области, прочитавшим данное описание, должно быть понятно, что могут быть предложены другие варианты реализации, не выходящие за границы объема изобретения, описанного в настоящей заявке. Таким образом, объем изобретения должен быть ограничен только прилагаемой формулой изобретения.Despite the fact that the invention has been described by the example of a limited number of embodiments, those skilled in the art having read this description should understand that other embodiments may be offered without departing from the scope of the invention described in this application. Thus, the scope of the invention should be limited only by the attached claims.
Наиболее успешно заявленное техническое решение промышленно применимо в вычислительной технике для автоматического перевода наиболее сложной терминологии, специфичной для конкретного проекта.The most successfully claimed technical solution is industrially applicable in computer technology for the automatic translation of the most complex terminology specific to a specific project.
Claims (2)
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US60/333,927 | 2001-11-28 | ||
| US10/141,404 | 2002-05-08 | ||
| US10/141,404 US20030101046A1 (en) | 2001-11-28 | 2002-05-08 | Word, expression, and sentence translation management tool |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2002129785A RU2002129785A (en) | 2004-06-20 |
| RU2285951C2 true RU2285951C2 (en) | 2006-10-20 |
Family
ID=37438054
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2002129785/09A RU2285951C2 (en) | 2002-05-08 | 2002-11-11 | System for controlling language translation |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2285951C2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2607416C2 (en) * | 2012-07-12 | 2017-01-10 | Лингуалео, Инк. | Crowd-sourcing vocabulary teaching systems |
| RU2628202C1 (en) * | 2016-04-11 | 2017-08-15 | Михаил Маркович Гольдреер | Adaptive context-thematic machine translation |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5201042A (en) * | 1986-04-30 | 1993-04-06 | Hewlett-Packard Company | Software process and tools for development of local language translations of text portions of computer source code |
| RU2104584C1 (en) * | 1995-05-17 | 1998-02-10 | Инна Владимировна Суходольская | Vocabulary educational guidance |
| RU2104583C1 (en) * | 1994-09-20 | 1998-02-10 | Денис Константинович Рунов | Method for parsing of syntactic structures |
| RU2122240C1 (en) * | 1998-01-15 | 1998-11-20 | Анатолий Леонидович Бродский | Method for design of dictionary for translation from foreign language |
| JP2000137712A (en) * | 1998-10-30 | 2000-05-16 | Brother Ind Ltd | Machine translation apparatus and computer-readable recording medium recording machine translation processing program |
| US20010029443A1 (en) * | 2000-03-27 | 2001-10-11 | International Business Machines Corporation | Machine translation system, machine translation method, and storage medium storing program for executing machine translation method |
| WO2001082119A2 (en) * | 2000-04-24 | 2001-11-01 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
-
2002
- 2002-11-11 RU RU2002129785/09A patent/RU2285951C2/en not_active IP Right Cessation
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5201042A (en) * | 1986-04-30 | 1993-04-06 | Hewlett-Packard Company | Software process and tools for development of local language translations of text portions of computer source code |
| RU2104583C1 (en) * | 1994-09-20 | 1998-02-10 | Денис Константинович Рунов | Method for parsing of syntactic structures |
| RU2104584C1 (en) * | 1995-05-17 | 1998-02-10 | Инна Владимировна Суходольская | Vocabulary educational guidance |
| RU2122240C1 (en) * | 1998-01-15 | 1998-11-20 | Анатолий Леонидович Бродский | Method for design of dictionary for translation from foreign language |
| JP2000137712A (en) * | 1998-10-30 | 2000-05-16 | Brother Ind Ltd | Machine translation apparatus and computer-readable recording medium recording machine translation processing program |
| US20010029443A1 (en) * | 2000-03-27 | 2001-10-11 | International Business Machines Corporation | Machine translation system, machine translation method, and storage medium storing program for executing machine translation method |
| WO2001082119A2 (en) * | 2000-04-24 | 2001-11-01 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2607416C2 (en) * | 2012-07-12 | 2017-01-10 | Лингуалео, Инк. | Crowd-sourcing vocabulary teaching systems |
| RU2628202C1 (en) * | 2016-04-11 | 2017-08-15 | Михаил Маркович Гольдреер | Adaptive context-thematic machine translation |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20030101044A1 (en) | Word, expression, and sentence translation management tool | |
| US7827026B2 (en) | Bilingual authoring assistant for the “tip of the tongue” problem | |
| US20030101046A1 (en) | Word, expression, and sentence translation management tool | |
| US5694559A (en) | On-line help method and system utilizing free text query | |
| US6760695B1 (en) | Automated natural language processing | |
| US5850561A (en) | Glossary construction tool | |
| CA1251570A (en) | Bilingual translation system with self intelligence | |
| US5321607A (en) | Automatic translating machine | |
| US5675815A (en) | Language conversion system and text creating system using such | |
| US4831529A (en) | Machine translation system | |
| JP2003030186A (en) | Machine translation equipment | |
| US4833611A (en) | Machine translation system | |
| Underwood et al. | Translatability checker: A tool to help decide whether to use MT | |
| Heyn | Integrating machine translation into translation memory systems | |
| EP0357344B1 (en) | Computer assisted language translating machine | |
| RU2285951C2 (en) | System for controlling language translation | |
| JPH06348751A (en) | Language converter | |
| JP2838984B2 (en) | General-purpose reference device | |
| JP4007630B2 (en) | Bilingual example sentence registration device | |
| JPS61260366A (en) | Mechanical translating system having learning function | |
| Salgado et al. | Deliverable 1.3: The drafting of glosses as a mediation for equivalence | |
| JPH0561902A (en) | Mechanical translation system | |
| JPS61260367A (en) | Mechanical translating system | |
| Boisen et al. | Chinese information extraction and retrieval | |
| JP3884001B2 (en) | Language analysis system and method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20101112 |