BG66265B1

BG66265B1 - Метод за обработка, представяне и изобразяване на текст

Info

Publication number: BG66265B1
Application number: BG104741A
Authority: BG
Inventors: Randall Walker
Original assignee: Randall Walker
Priority date: 1998-02-02
Filing date: 2000-09-01
Publication date: 2012-10-31
Also published as: CN1119755C; NO20003925L; JP2002502066A; US7036075B2; US7765471B2; NO20003925D0; US20060129922A1; JP2011076637A; IL137658A0; MXPA00007586A; CA2319785A1; IL137658A; CN1296587A; EP1058895A2; WO1999039255A3; EP1058895A4; KR20010040749A; CA2319785C; US6279017B1; WO1999039255A2

Abstract

Изобретението се отнася до метод за обработка, представяне и изобразяване на текст за четене от човек. Методът включва извличане на специфични за текста атрибути от машинно четен текст и промяна на представянето на текста в зависимост от тези атрибути. Съгласно предпочитаното изпълнение на метода се извличат частите на речта и пунктуацията от изречение, прилагат се правила за прегъване, като се използват частите на речта за определяне на точките на прегъване и се представят текстови сегменти на отделни редове с определено хоризонтално отместване, получено на базата на специфичните за текста атрибути. Съгласно едно изпълнение на метода текстът се представя като извити криви с форма, зависеща от съдържанието. Друго изпълнение на метода включва представяне на относителното положение на текста в йерархична структура, използвайки редуващи се вертикално и хоризонтално подредени равнини. Друго изпълнение на метода включва четене на текстови сегменти на срещулежащи страници без изчакване за престраниране. Съгласно друго изпълнение текстът се представя така, че да позволява четене отдолу нагоре, наподобявайки четене отпред назад. При друго изпълнение думите се представят с цветове, отразяващи връзката между тях и по-големите текстови сегменти, от които са част.

Description

Настоящото изобретение се отнася до представяне на текст с помощта на компютър и по-специално, до усъвършенствана техника за представяне на текст чрез използване на специфични за съдържанието му атрибути за подобряване на практиката на четене.

Предшестващо състояние на техниката

Целта на четенето е да се въздейства върху съзнанието на четящия, независимо дали текстът, който се чете, представлява роман или индикатор на фона на предното стъкло на превозно средство. Материалът, представен в нетекстова среда, предава подходяща за възприемане от човека информация в доста по-голяма степен, отколкото съответното едномерно представяне на текст. Неподвижните картини представят такива характеристики на обектите като цветове, относителни размери, относително разположение, модели, групиране и йерархии. Обектът се разглежда в контекст. Например, снимка, в ъгъла на която е разположен малък обект заедно с други обекти, носи по-различна информация, отколкото същият обект сам, увеличен, разположен в центъра на снимката. Въвеждащите изречения и параграфи добавят информация за контекста дори само с местоположението си. Филмите имат допълнителни характеристики движение и промяна във времето. Голяма част от информацията постъпва в мозъка визуално и чрез разпознаване на модели. Друга част от информацията идва чрез слуха чрез тон, промяна на интонацията и промяна на силата на звука.

Понастоящем при четене на компютърно представен текст засега не се използва голяма част от човешкия мозък - използват се само част от възможностите и компютърното представяне на текст често се счита за неудобно, монотонно, механично и като цяло недостатъчно. Ако тряб ва да избират, повечето хора предпочитат да четат книга, отпечатана на хартия, отколкото на компютърен екран. Настоящото компютърно представяне на текстове е слабо в сравнение с книгите и още по-слабо в сравнение с възможностите си.

Съществуват разработки по компютърното представяне на текст. Huang (US Patent No. 4,880,385) разкрива опто-механическо скоростно четящо устройство, позволяващо представяне на напечатан на хартия текст през прозорче за четене ред по ред, с автоматично придвижване на редовете.

Има напредък в методите за компютърен разбор на естествена реч в части на речта. Shabes и съавтори (US Patent No. 5,475,588) описват усъвършенствана система за разбор за създаване на йерархични дървета. Black, Jr. и съавтори (US Patent No. 5,311,556) описват метод за съхраняване на информацията за частите на речта във файл, заедно с оригиналния текст, за усъвършенствано последващо търсене в текста. Okamoto и съавтори (US Patent No. 4,661,924) и Church (US Patent No. 5,146,405) описват методи за точното идентифициране на частите на речта. Zamora и съавтори (US Patent No. 4,887,212), van Vliembergen (US Patent No. 5,068,789), Hemphill и съавтори (US Patent No. 5,083,268) описват методи за разбор на естествен текст. Всички цитирани патенти са включени като позоваване.

Четенето е сложен процес и много фактори определят разликите в четенето на различни четящи и дори на един четящ при различни ситуации. Тези фактори включват вътрешни неврофизиологични състояния като дислексия, но също и възраст; поведенчески и мотивационни фактори; ниво на образование и предишна практика на четене; ограничения във възприемането. Четящият може да има различни цели на четенето, които определят как той или тя подхожда към материала. Въпреки всичко това текстовете се представят компютърно в най-лошия случай като едномерни “мъниста на броеница”, а в найдобрия - като двумерните текстове, представени в книгите. В действителност, дали текстът е представен напечатан или на електронен дисплей, няма почти никакво значение, тъй като представянето на текста е практически еднакво.

Примерите за монотонното представяне на

66265 Bl текст са многобройни. Главните изречения са изписани по същия начин като останалите изречения в параграфа. Техническите термини са представени като обикновените думи. Прилагателните изглеждат като съществителните. Сложните термини са представени като простите. Последният параграф в една глава е представен по същия начин като първия. Текстът е представен подравнен от двете страни с последен ред отляво, като накъсаните редове с постоянна ширина изискват периодическо рязко движение на очите от крайно ляво до крайно дясно положение. Текстът е разкъсан насред изречението, на средата на фразата и мисълта, като се прилагат остарели правила за писане. Такъв текст изисква очите да се движат напред-назад на големи разстояния, подобно на каретка на пишеща машина. Придвижва се ръчно, разчупва се на парчета в зависимост от това колко реда могат да се съберат на екрана.

Има сериозни основания срещу поставянето на едно изречение на страница в книга. Тези основания може би неоснователно са били пренесени към компютърното представяне на текст. Възможността за модификация на представянето на текста чрез използване на силата на цифровата обработка, така, че да увеличи способностите на четящия да възприема текста, изглежда е била пропусната от най-напредналите в компютърните науки.

Известен е и метод за представяне на текст, описан в US 5,802,533 от същия изобретател Walker Randall. Съгласно известния метод се получава изображение на продукт за четене изречение, което има зададени от автора съдържание на символите и последователност на символите в съдържанието на символите, като изображението на продукта за четене съдържа само зададено от автора съдържание на символи. Методът включва извличане на специфичните атрибути на изречението, които специфични атрибути включват мярка за трудност на изречението, а представянето на изречението включва скорост на автоматично напредване в изречението и промяната на скоростта в съответствие с мярката за трудност на изречението.

Известните методи обаче на са достатъчно ефективни, тъй като не получаваният компютърно осъществим продукт за четене не отчита определени технически параметри, свързани с конкретния потребител на този продукт.

По-специално необходим е метод за показване на разположението на текст в текстовата йерархия. Необходим е също така и метод за показване на текст във вид на срещулежащи страници, който да позволява четене на текста без изчакване за смяна на страниците. Полезна би била система за показване на текст, използваща естествената способност и предпочитание на човек да се придвижва напред при разглеждане на обекти. Необходим е и метод за показване на текст чрез използване на количествени модификации на цветовете за ясно представяне на кумулативната връзка между по-големи части на изречението и думите в тях.

За запазване на информацията в авторски текст, неговото представяне по дефиниция трябва систематически да представя в еднозначна структура последователността от думи, написани от автора. Желателно е също така допълнителната информация, която се изобразява чрез усъвършенствана техника за представяне на текст за интелигентно четене, да бъде вградена в необходимите процеси на самото представяне на текста (т.е. поставяне на буквите на контрастиращ фон при различно разположение в пространството и времето), отколкото да се въвеждат допълнителни символи, изискващи допълнително научаване, четене и интерпретация от четящия.

Техническа същност на изобретението

Настоящото изобретение се отнася до метод за усъвършенствано представяне на текст и устройство за представяне на текст за интелигентно четене от човек. Изобретението включва извличане от текст за машинно четене на характерни за него атрибути, промяна на представянето на текста в зависимост от атрибутите, и създаване на тримерен (време и повърхност на четене) визуален продукт за усъвършенстване на четенето. Предпочитаното изпълнение на изобретението извлича атрибути като части на речта от началното изречение и показва изречението на екрана като вертикална каскада от хоризонтални текстови сегменти. Сегментацията и хоризонталното отместване се определят чрез прилагане на правила, базирани на части на речта, пунктуация и предпочитанията на четящия. Цветът на текста и фона могат също да се променят в зависимост

66265 Bl от частите на речта и от положението на изреченията в параграфите и на параграфите в главите.

Изобретението добавя значещи визуални атрибути за усъвършенстване на компютърното представяне на текст, за разлика от монотонното и механично текстово представяне на съвременните системи. Създава се значещ визуален условен знак, който е свързан със съдържанието на новата фраза и с връзката й с предишната фраза. Този условен знак се появява преди прочитане на текста и задава контекста му. Процесът на разбор на изречението използва съдържанието и пунктуацията на изречението за създаване на система от значещи визуални условни знаци, включително отделни фрази, което стимулира по-бързо разпознаване на думи във фраза и тяхното значение. Сегментираното изречение се разполага каскадно надолу по страницата като модел от значещи фрази, определящи се от съдържанието на текста и предпочитанията на четящия, при което очите се придвижват на кратко разстояние от фраза до фраза.

Изречението представлява завършена мисъл, а параграфът - отделна тема или теза. Разбирането на текста се подобрява когато изреченията се появяват едно по едно и когато преходът от един параграф на следващия се указва визуално и съдържа пауза за изобразяване на тези елементи на текста. Изобретението създава подходящи визуални атрибути за осигуряване на тези сигнали. Визуалните атрибути могат да включват сегментация на текста, хоризонтално отместване на един ред спрямо друг, цвят на текста и на фона, яркост на текста и анимация. Анимацията може да съдържа мигане и просветляване, както и променящо се с времето, временно или постепенно увеличаване на яркостта на елементите на текста и промяна на текста от стандартно в каскадно представяне.

При една примерна процедура на четене четящият избира текст и съобщава на четящата система вида на този текст, напр. роман. Четящата система извлича съответната среда, записана от този четящ при предишно четене на такъв тип текст. Четящият има възможност да промени правилата за четене и наборите от думи, но отказва. Започвайки от началото на главата, където четящият е прекъснал предишния път, текстът се представя изречение по изречение като вертикална каскада от хоризонтални сегменти. Тъй като предс тавяните редове са накъсани на значещи текстови сегменти, а не завършват произволно при 80 изобразени символа, възможно е да се осъществи четене и разбиране на целия сегмент, като в резултат движението на очите е от център на сегмент до център на сегмент, надолу и настрани по екрана. Цветът на фона на изречението зависи от положението на изречението в параграфа и положението на параграфа в главата. Всяко изречение в параграфа може да има същия цвят, но с нарастващи доловими промени в наситеността или потъмняването на цвета между отделните изречения, както и нарастващи доловими промени в оттенъка между параграфите. По този начин цветът на фона осигурява небуквена информация за положението, обозначаваща началото и края на параграф и началото и края на глава от книгата.

Изреченията се сегментират в зависимост от правила, зададени от четящия. Всеки предлог “прегъва” фраза по определен начин, в резултат на което се получават два текстови сегмента, всеки от които се разполага на нов ред. Съдържанието на горния ред влияе върху хоризонталното отместване на долния ред. Един и същ предлог прегъва и отмества хоризонтално текста по един и същ начин навсякъде, където е допустимо. В резултат на това, един предлог предизвиква един и същ модел, с който четящият свиква. Частите на речта определят цвета на текста съгласно правила, зададени от четящия. В резултат на това, структурата на изречението и частите на речта се разпознават веднага поради разпознаването на модела и цвета, дори преди да бъде разпозната дума от текста. Това осигурява визуални, небуквени условни знаци на четящия.

Изреченията се сменят със скорост, зависеща от правило, зададено от четящия. Формулата се определя от вида текст, броя на думите, нивото на образование и броя срички на всеки ред. За по-добро разбиране, скоростта, с която се върви, е малко по-голяма от комфортната за четящия. По-дългата пауза между изреченията показва, че следва нов параграф. Четящият лесно взаимодейства със системата, като задържа по-трудните изречения по-дълго време на екрана и забързва или забавя представянето.

Описаната по-горе процедура на четене е

66265 Bl само примерна и не ограничава или изчерпва възможните изпълнения в обхвата на изобретението.

Процесът на усъвършенстване на техниката на представяне на текст използва факта, че елементите на текста имат небуквени качества, които могат да се използват за получаване на продукт за представяне на текст във времето и пространството, който е по-значещ и увеличава способността на четящия да възприема смисъла на текста сам по себе си в сравнение със съществуващите формати на компютър или на хартия. Каскадното разполагане на фразите по екрана дава визуална представа за това как би се възприел текста ако се чуе от четене на живо, без да се налага четящият да го произнася на глас. Четенето на такъв усъвършенстван текст е почти като слушане с очите, но като пълен визуален пакет, който се възприема почти едновременно.

Друг аспект на изобретението съдържа запис на действията на изпълнител, четящ текст на глас, като записът включва запис на говора, на движението на ръцете, на очите, на главата и на устата. За предпочитане действията се записват и се наслагват върху съответстващите им думи в текста. Представянето на текста може да се променя в зависимост от записаните действия. Атрибутите за представянето на текста може да включват отместване на текста, големина на буквите, дебелина на буквите, разстояние между буквите, между думите и между редовете.

Друг аспект на изобретението показва разположението на конкретен текст в йерархията на книгата, в която се намира, чрез промяна на “подреждането” на равнини или прозорци. Прозорците или равнините, представляващи различните йерархии, се подреждат в зависимост от ранга на текста в йерархията. Съгласно едно изпълнение прозорците за йерархиите се подреждат последователно хоризонтално и вертикално.

Друг аспект на изобретението показва текста на срещулежащи страници по такъв начин, че четенето на текста става без чакане за смяна на страниците. Съгласно един метод съдържанието на всяка страница се сменя при прочитане, без да е необходимо да са прочетени и двете страници.

Съгласно друг аспект на изобретението текстът се представя в оригиналната си последователност, отдолу нагоре, в перспектива, така че четенето на текста отдолу нагоре изглежда като четене отпред навътре. Съгласно едно изпълнение текстът се превърта гладко напред, при което изглежда, че четящият се придвижва напред през текста докато чете.

Съгласно друг аспект на изобретението се изчислява отношението между думите и по-големите текстови сегменти, от които думите са част. При едно изпълнение се започва с едно изречение, което се разделя няколко пъти на сегменти в зависимост от отношението между сегментите и подсегментите. Съотношението между сегментите и подсегментите се използва за изчисляване на цвят. Нивото или степента на рекурсия в алгоритъма за сегментация също се използва за определяне на цвят. Така полученият цвят се използва за съответната дума или фраза.

Кратко описание на приложените фигури

Фигура 1 представлява блок-схема от високо ниво на метод, използван при едно изпълнение на изобретението;

фигура 2 представя таблица, илюстрираща различните атрибути на елементите на едно изречение;

фигура 3 показва пример на усъвършенствано представен текст, включващ каскада и “десен ъгъл на отстъп”;

фигура 4 представя изречението съгласно фиг. 3 като усъвършенствано представен текст, включващ каскада и “леви и десни ъгли на отстъп”;

фигура 5 представя подробно стъпка 110;

фигура 6 показва набори думи, задаващи йерархията на вторичните точки на прегъване;

фигура 7 показва местата на точките на прегъване в изречение;

фигура 8 представя подробно стъпка 136; фигура 9 показва изречението от фиг. 7 като усъвършенствано представен текст;

фигура 10 показва повърхност на интервали на представяне, където времето, необходимо за прочитане, е функция на трудността и сложността на изречението;

фигура 11 показва изречението от фиг. 7 с визуално “произнасяне” на ударените срички;

фигура 12 представлява таблица на колони и отсеци, използвани за изчисляване на хоризонталното отместване;

66265 Bl фигура 13 показва крива, подходяща за извиване на текст;

фигура 14 илюстрира правила за разполагане на текстови сегменти върху кривата от фиг. 13, в зависимост от началните и крайните текстови атрибути;

фигура 15 показва междинен резултат от алгоритъма за извиване на текст;

фигура 16 показва няколко извити текстови сегменти, формирани върху криви съгласно фиг. 14 и фиг. 15;

фигура 17 показва компютърно представена книга преди отваряне;

фигура 18 показва компютърно представяне на книгата от фиг. 17 след отваряне, откривайки главите в нея;

фигура 19 показва компютърно представяне с главите от фиг. 18 след избирането на глава, откривайки страниците в нея;

фигура 19А илюстрира алтернативно изпълнение на компютърно представяне с главите от фиг. 18 след избирането на глава, показвайки страниците в нея;

фигура 20 показва компютърно представяне със страниците от фиг. 19 след избирането на страница, показвайки параграфите в нея;

фигура 21 показва компютърно представяне с параграфите от фиг. 20 след избирането на параграф, показвайки изреченията в него;

фигура 22 показва компютърно представяне на каскадно изречение върху страница, избрано съгласно фиг. 21;

фигура 23 показва метод за представяне на текст чрез представяне на няколко страници;

фигура 24 показва друг метод за представяне на текст чрез представяне на няколко страници;

фигура 25 илюстрира метод за представяне на текст, позволяващ четене отпред навътре, отдолу нагоре, при който изглежда, че текстът се движи напред;

фигура 26 представлява текстът съгласно фиг. 25 след едно придвижване напред; и фигура 27 представлява дървовидна диаграма на изречение, подразделено за присвояване на цвят и оцветяване на проза.

Подробно описание на предпочитаните изпълнения

На Фиг. 1 е показана блок-схема от високо ниво на метод, използван при изпълнение на изобретението. Разбира се, стъпките във Фиг. 1 и във всички такива схеми могат да бъдат разделени на допълнителни стъпки или да бъдат слети в по-малко стъпки, описвайки същото изпълнение.

При стъпка 102 се стартира четящото устройство и се предава идентификацията на четящия (ID) и идентификацията на текстовия файл, който ще бъде четен. При едно предпочитано изпълнение идентификацията на четящия се получава от операционната система. При друго изпълнение идентификацията се изисква от четящия. При едно изпълнение се предполага само един четящ. След получаване на идентификацията на четящия, в стъпка 104 се извличат зададените от четящия параметри, които са описани по-долу. При получаване на идентификацията на текста, в стъпка 106 се извличат текстовия файл и параметрите за дадения текст. При едно предпочитано изпълнение тези параметри имат стойности по подразбиране и не се изисква въвеждането им от четящия. В най-предпочитаното изпълнение се позволява въвеждане от четящия на предпочитани специфични параметри, стойностите им се приемат и параметрите се записват в стъпка 108. Съгласно едно изпълнение е възможно потребителят да използва падащи менюта, съдържащи диалогови кутии, за разглеждане на параметрите по подразбиране, и да ги променя чрез стандартни потребителски интерфейси, включващи въвеждане на числа и на текст, асансьори и бутони. Съгласно едно предпочитано изпълнение при определено позволение за достъп се позволява модификация на глобалните параметри, приложими за всички четящи. Възможно е четящият да зададе параметри само за текущия текст, за всички текстове от същия тип като текущия или за всички текстове, четени от този потребител.

Параметрите за дадения четящ включват: размери на полето за четене; цветова палитра за фона и текста; набори думи като входни данни за правила; минимална дължина на фразата; максимална дължина на реда; минимално и максимално тегло на текстовите сегменти; ъгли на отстъп; входни данни за правилата за хоризонтално отместване; предпочитания за хоризонтално подреждане; големина на междуфразов

66265 Bl интервал; скорост на представяне; пропорции на интервалите между изреченията и между параграфите; дефиниране на прикачване; спецификации на анимацията; дефиниране на параметрите за определяне на интервали на представяне в зависимост от съдържанието; дефиниране на параметри и тегло за определяне на фраза/текст, тегло, плътност, сложност и съдържание; и идентификатори на сценарии за специални събития.

Размери на полето за четене

Размерите на полето за четене могат да определят големината на прозореца за разглеждане на текст в двете направления X и Y и трето измерение - време. Полето може да представлява целия екран или по-малка част от него. Времевото измерение може да включва времето, през което се появяват зависимите от времето анимации, напр. мигане.

Цветова палитра

Цветовата палитра за текст и фон позволява задаване на предпочитаните цветове на фона и текста, които се променят в текста. В едно предпочитано изпълнение, цветът и яркостта на фона се променят в зависимост от положението на изречението в параграфа и от положението на параграфа в главата. Съгласно най-предпочитаното изпълнение яркостта се задава на дадено ниво за първото изречение в параграфа и на второ ниво за последното изречение в параграфа, като яркостта на всяко изречение между тях се променя постепенно от първото до второто ниво. В предпочитаното изпълнение цветът на фона се задава чрез първа стойност за първия параграф от главата и втора стойност за последния, като цветът на всеки параграф между тях се променя постепенно от първата до втората стойност. В найпредпочитаното изпълнение първият цвят е зелен, а вторият - виолетов.

В предпочитаните изпълнения цветът на текста може да се мени в зависимост от типовите и непрекъснати атрибути на думата. Типов атрибут е такъв, който зависи от категорията, в която попада думата. Съгласно най-предпочитаното изпълнение категориите включват части на речта, напр. глаголи, и технически термини. Непрекъснатите атрибути включват атрибути, които могат да бъдат измерени - като ниво на образование, напр. дванадесети клас, брой срички и дължина на думата. Съгласно предпочитаното изпълнение различните части на речта са с различен цвят. Съгласно най-предпочитаното изпълнение цветът на текста се променя заедно с цвета на фона за осигуряване на оптимален, предпочитан от потребителя контраст.

Използват се набори думи за определяне на някои части на речта. Например, “I” е местоимение, “had” е глагол, “а” е неопределителен член, a “farm” може да бъде съществително, глагол или прилагателно. Частите на речта трябва да бъдат вероятни части на речта, както с думата “farm”, която може да бъде съществително, глагол или прилагателно. На фиг. 2 е показан пример за части на речта в едно изречение. Показана е колона 150 с нееднозначните възможни части на речта, както и колона 152 с точното им идентифициране.

Съгласно предпочитаното изпълнение наборите думи се въвеждат чрез два метода. Първият метод използва структуриран текстов формат като Standard Generalized Mark-Up Language (SGML), който позволява въвеждане и извеждане на големи набори думи и речници от различни източници. След това се използват стандартните SGML инструменти за разбор за съхраняване на наборите думи в подходяща база данни. Вторият метод позволява интерактивно редактиране на набори думи чрез йерархия на падащи менюта и диалогови кутии. Съгласно предпочитаното изпълнение, наборите думи, зададени от четящия, се съхраняват в отделна база данни от думите в речника, позволявайки отделно съхранение, редактиране и по-бързо извличане.

Минимална дължина на текстов сегмент и максимална дължина на ред

Предпочитаното изпълнение включва задаване от четящия на минимална дължина на текстовия сегмент. Текстовият сегмент представлява част от текста, която се представя на един ред. Минималната дължина на текстовия сегмент, която може да бъде изразена чрез думи, представлява минимумът, който четящият желае да види на отделен ред. Максималната дължина на реда е максималната дължина, която четящият желае да види на един ред. Дължините могат да се измерват в брой символи, думи, срички, ниво на образование или произволна сума от техни произведения. Съгласно едно изпълнение минималната дължина на ред е десет символа, а максималната - тридесет и пет символа.

66265 Bl

Тегло на фразата

Теглото на една фраза е извлечен атрибут на фраза (текстов сегмент или потенциален текстов сегмент), даващ мярка за количеството материал в съответната фраза. Съгласно едно изпълнение теглото на фразата е просто броят думи в нея. Съгласно предпочитаното изпълнение, теглото на фразата включва плътността на фразата и сложността й. Плътността на фразата може да включва броя технически думи или броя думи, съответстващи на ниво по-високо от дадено. Сложността на фраза може да включва броя сходства при изписване между думите във фразата, броя нееднозначни думи, както и общото тегло на думи със зададено от четящия тегло.

Минимално и максимално тегло на текстов сегмент

Предпочитаното изпълнение включва зададени от четящия минимално и максимално тегло на текстов сегмент. Теглото на текстовия сегмент представлява количеството текст, което четящият желае да види на отделен ред. Съгласно предпочитаните изпълнения теглото на текстов сегмент е сумата от теглото на фразите в дадения сегмент.

Правила за хоризонтално подравняване

Правилата за хоризонтално подравняване определят хоризонталното подреждане на един ред от текста спрямо горния ред. Подравняването може да включва вида подравняване на текста, който се позиционира, т.е. дясно, ляво или центрирано. Подравняването може да включва и частта от текста на горния ред, спрямо която се измерва подреждането, т.е. целият ред или една фраза, а също така и спрямо коя точка се измерва, т.е. най-лявата, най-дясната или центъра. Съгласно едно изпълнение хоризонталното подравняване се измерва в рамките на реда, който се позиционира, а не спрямо горния ред.

Съгласно едно предпочитано изпълнение, първата фраза на един ред в подредена централно, измерено спрямо центъра на последната фраза на горния ред. Съгласно друго изпълнение целият ред се подравнява центрирано под центъра на горния ред. Съгласно друго изпълнение, в качеството на център на сегмент за подреждане се използва текстовият сегмент, който е “център на тежестта”, изчислен според трудността на всяка дума.

“Ъгъл на отстъп”

Ъгълът на отстъп е големината на хоризон талното отместване за всеки нов ред, което променя хоризонталното положение, определено само чрез правилата за хоризонтално подравняване. По дефиниция, всеки текстов сегмент се представя на нов ред. В предпочитаното изпълнение ъгълът на отстъп се задава чрез единици брой символи. Ъгълът на отстъп и хоризонталното подравняване поне частично определят в предпочитаните изпълнения разполагането на текста по екрана в каскади. На Фиг. 3 и 4 е показан пример на каскаден текст. Ъгълът на отстъп може да бъде нула, което означава, че хоризонталното положение на текстовия сегмент се определя само от правилата за хоризонтално подравняване. Ъгълът на отстъп може да бъде ляв или десен, което означава, че долният ред се отмества съответно наляво или надясно спрямо горния ред. На Фиг. 3 са представени само десни ъгли на отстъп.

Съгласно едно изпълнение ъгълът на отстъп е постоянен за всеки нов ред. В едно предпочитано изпълнение ъгълът на отстъп е функция на теглото на текстовия сегмент на горния ред. Съгласно друго предпочитано изпълнение правилата за хоризонтално подравняване изискват центрирано подравняване под центъра на всеки горен ред, а ъгълът на отстъп се пресмята така, че при представяне на всички редове да представлява сравнително права линия - от център на ред до център на ред, от горно ляво до долно дясно на монитора.

Съгласно едно предпочитано изпълнение, входните данни за определяне на ъгъла на отстъп включват атрибутите на текста на горния ред. Съгласно едно предпочитано изпълнение входните данни включват причината за прегъване на горния ред, т.е. първична точка на прегъване, вторична точка на прегъване или правило за разбиване. Съгласно едно предпочитано изпълнение се извиква по-голям ъгъл на отстъп, ако горният ред е прегънат поради първична, отколкото поради вторична точка на прегъване. Съгласно друго предпочитано изпълнение, входните данни включват теглото на текстовите сегменти на текущия и на горния редове.

Ясно е, че правилото за хоризонтално подравняване може да извиква ляво подравняване и измерване на хоризонтално отместване спрямо лявото поле, както и нулев ъгъл на отстъп, в резултат на което се получава ляво подравнен

66265 Bl текст на всеки ред.

Ясно е също така, че хоризонталното позициониране на текста може да бъде постигнато по множество еквивалентни на описания начини. По-специално, пресмятането на положението на текста може да бъде първо чрез подравняване, след това отместване или първо отместване, след това подравняване, което води до еквивалентни резултати.

Дължина на междуфразов интервал

Съгласно едно изпълнение междуфразовите интервали се асоциират с точки на прегъване, чието разположение е определено, но поради други правила остават на същия ред без да предизвикват прегъване. След точка на прегъване, която не е предизвикала нов ред, се добавя интервал от нула или повече празни символа. Съгласно предпочитаното изпълнение дължината на интервала е параметър, зададен от четящия, като интервал с дължина нула означава, че не се създава интервал. Тези интервали представляват визуален условен знак за наличието на фрази дори ако фразите не водят до получаване на нов ред.

Скорости на представяне

Скоростите на представяне определят продължителността на представяне и интервалите от време между представянето на една текстова група и следващата. Съгласно едно предпочитано изпълнение, на екрана се представя едно изречение. Съгласно едно предпочитано изпълнение продължителността на представяне може да бъде функция на броя думи от текста с подходящо тегло, нивото на образование, времето за произнасяне, броя фрази, броя срички или теглото на фразите. Интервалите време може да включват интервалите между изречения и между параграфи. Съгласно едно предпочитано изпълнение интервалите от време между изречения и параграфи са различни. По този начин постоянната скорост на появяване на текст при съществуващите системи може да бъде заменена от скорост, която зависи от това къде се намира текста и какво е съдържанието му.

Зони

Зоните са области от дисплея, където се представя текстът. Те могат да бъдат обособени прозорци, в които се представя текстът, или точки, в които започва текстовото представяне. Едно предпочитаното изпълнение включва актив на текстова зона, в която се представя четеният текст. Друго предпочитано изпълнение включва “предварителна” зона, представяща текстът, който предстои да бъде четен, и “последваща” зона, представяща прочетения вече текст. Съгласно едно изпълнение пълният текст, представен във всички зони на разглежданата повърхност, се управлява чрез предполагаемото време за прочитане или произнасяне. Съгласно едно изпълнение, на екрана се разполага само материал, който може да бъде прочетен за около една минута.

Анимация

Анимацията представлява променящо се с времето представяне на текст. Примери за анимация са мигане, размиване и просветляване, т.е. просветляване на последователни участъци от текста с определена скорост. Съгласно едно предпочитано изпълнение, модифициран ефект на “превъртане” се получава чрез подреждане на текста, който предстои да бъде прочетен, на плоски редове в “предварителна” зона в горната част на екрана, подреждане на вече прочетените редове в “последваща” зона в долната част на екрана и каскадно разполагане на текущото изречение в активната зона в средата на екрана. При едно изпълнение цветовете на прочетения и следващия текст и/или на фона им се различават от тези на текущо четения текст.

Прикачване

Прикачването включва обозначаване на това дали към дадено изречение са прикачени определение или фигура, свързани с дадена дума. Съгласно едно предпочитано изпълнение, думите, към които се прикачват определения, се задават с набор думи. Когато четящият избере дума с прикачено допълнение, се представя определение, фигура или друга електронна илюстрация. Съгласно предпочитаното изпълнение, при избирането на дума с прикачено допълнение се появява изскачащ прозорец с определението или фигурата. Предпочитаните методи за избиране включват десния бутон на мишката и клавиша десен SHIFT.

Събитие на четене

Събитието на четене включва появата и изчезването на изречение и всяко допълнително време до появата на следващото изречение. Събитието на четене включва последователност от моменти на четене. Моментът на четене представлява замръзнала картина на текст пред очи

66265 Bl те на четящия. В момента на четене очите на много четящи са фокусирани върху фраза, разположена самостоятелно на ред, която четящият възприема.

Скорост на четене

Интервал на представяне е продължителността на представяне на изречение на екрана. Този интервал може да се управлява от четящия или да бъде автоматично определен. При едно изпълнение четящият управлява чрез щракване на мишката. При друго изпълнение управлението може да се осъществява чрез детекция на движението на очите или на промяна на мозъчните вълни. Детекцията на мозъчни вълни работи чрез генериране на искане за ново изречение когато мозъчните вълни, съответстващи на осъществяване на четене, се променят във вълни, свързани с край на четенето.

Скоростта на четене се измерва в обем текст за единица време. Такива единици за обем текст могат да се отчитат чрез единици за дължина като брой думи, срички, време за произнасяне или всяка от описаните по-горе мерки за дължина или тегло на фраза или произволна сума от техни произведения. Единиците за обем текст могат да се отчитат и чрез единици за сложност като обсъдените по-горе във връзка със сложност или тегло на фраза или произволна сума от техни произведения. В предпочитаното изпълнение Единиците за обем текст се изчисляват за дадено изречение и се използват за сравняване на действителната скорост на четене, в Единици обем текст за единица време, с управляваните от четящия интервали на представяне, след което се задават интервали за автоматично управление на представянето на текста. По този начин интервалът на представяне може да бъде зависим от съдържанието и да следи вероятната предпочитана от четящия скорост на представяне.

Специални събития

Специалните събития са зависещи от времето събития, които се случват по време на събитието на четене. Специалните събития включват визуален или звуков условен сигнал, даващ знак за оставащото време. Например, при изтичане на 75% от зависимия от съдържанието интервал на представяне, на екрана се появява визуален условен знак. Специалните събития могат да бъдат организирани чрез сценарий за специални събития. Съставните специални събития включват последователност от специални събития.

Визуално произнасяне

Визуалното произнасяне включва промяна във времето на цвета или яркостта на отделните фрази, думи и срички или на някои от изброените елементи. Съгласно едно изпълнение, ударението на по-дълги и по-трудни думи, изискващи повече време за произнасяне, се обозначава чрез просветляване. Визуалното произнасяне е пример за съставно специално събитие.

Смъкване на каскадата надолу

Съгласно едно изпълнение, текстът се представя в “предварителна” зона за част от зависимия от съдържанието интервал на представяне, след което се представя в каскаден вид сегмент по сегмент или ред по ред. Смъкването на каскадата е пример за съставно специално събитие.

Нелинеен текст

Линейният текст е текст, представян и четен от начало до край. Книга, предназначена за четене от начало до край, е стандартен пример за линеен текст. Нелинейният текст включва представяне и четене на текста по различен начин спрямо линейния. Пример за нелинеен текст е Хипертекстът, където определени думи са представени така, че показват връзка, напр. текстът е заграден в “<“ и “>” или оцветен в синьо. Представянето на нелинеен текст може да бъде управлявано както от четящия, така и автоматично. Пример затова е автоматичното представяне на Хипертекст в дълбочина от първи ред, следвайки хипертекстова връзка от първи порядък, игнорирайки циклите. Друг пример е представяне в широчина от първи порядък, представяйки дадено ниво на текстам следвано от Хипертекстови връзки от главното ниво, следвани от Хипертекст връзките от първото ниво - до достигане на най-дълбокото ниво или до прекъсване от четящия. Друг пример е ограничаването на представянето в дълбочина или в широчина от първи порядък, така че да включва само участъци с определени ключови думи.

Магическа лупа за четене

Съгласно едно изпълнение, представянето на текста може да започне чрез представяне на обикновен, неформатиран текст. Когато четящият желае да види текста чрез усъвършенствано представяне, той обозначава участъка от

66265 Bl текста за усъвършенстване чрез поставяне на икона “магическа лупа за четене” над част от изречението. Това и следващите изречения се представят като усъвършенстван текст. Усъвършенстваното представяне продължава докато четящият не дезактивира магическата лупа за четене. Тази лупа може да служи като алтернативен начин за влизане в процесора за усъвършенстван текст.

Метод

Съгласно Фиг. 1, стъпка 110, текстът се подлага на предварителна обработка. Стъпка 110 е показана подробно на Фиг. 5. Прави се разбор на текста за определяне на параграфи, изречения, думи и пунктуация. Параграфите може да се идентифицират чрез празни редове, маркери за параграф, символи за отстъп, табулатори или други подходящи характеристики в текста. Изреченията могат да бъдат идентифицирани по граматически правила, включващи точки, разстояния, главни букви на първи думи, съкращения или липсата им. Съгласно едно предпочитано изпълнение краят на добре построено изречение се обозначава чрез точка, въпросителен знак или удивителен знак - сами или следвани от точка, от два празни интервала или знак за край на параграф.

В стъпка 124 изречението се разбива на думи и пунктуация. В предпочитаните изпълнения се запазват оригиналните, определени от автора, ударения - напр. курсив или подчертаване. Съгласно едно изпълнение се използва стандартен лексикален скенер, като напр. Lex™, при който краят на дума се обозначава съгласно граматическите правила чрез бял празен интервал или пунктуационен знак. При друго изпълнение се използва написан на ръка лексикален анализатор. При едно изпълнение форматиращите символи като табулатори и символи за нов абзац се приемат за пунктуация. Разположението на думата се запаметява за предпочитане като атрибут на думата, за осъществяване на връзка и търсене в оригиналния текст.

Едно предпочитано изпълнение позволява също така група думи да бъдат “захванати” заедно и да се разпознават като група. Съгласно едно изпълнение, такива групи думи се разпознават от лексикалния скенер. Съгласно друго изпълнение, те се разпознават от процесор за предварителна обработка преди лексикалния скенер, за да се осигури разпознаването им като фраза, а не просто като отделни думи. “Захванатите” думи, например “Принцът на китовете” ще бъдат разпознати като една фраза и за предпочитане няма да бъдат разделени от предлога на две фрази, разположени на два реда.

В стъпка 126 думите се проверяват в речници и таблици за определяне на атрибутите им. Обработката на текста продължава за определяне на типовите и непрекъснати атрибути. Съгласно едно предпочитано изпълнение, важните типови атрибути включват части на речта, а важните непрекъснати атрибути включват разположение на думата, ниво на образование, време за произнасяне и брой срички, разположение, звук и ниво на звуково ударение. Идентифицирането на частите на речта с точност 100% изисква пространно програмиране за определяне на реалния контекст. За използване на изобретението не е необходима такава точност, защото грешките за маловажни, тъй като четящият е човек, а не машина. Възможните части на речта се определят първо чрез търсене на думата в речник. В този речник е необходимо да са описани само вероятните части на речта за тази дума, а не определение. Например, думата “farm” може да бъде съществително, прилагателно или глагол. В едно предпочитано изпълнение атрибутът части на речта се запазва с помощта на таблица. Едно изпълнение добавя атрибут на граматическа нееднозначност, който указва дали след проверка думата запазва нееднозначността си. При друго изпълнение за указване на нееднозначността се използва съществуването на повече от една възможни части на речта.

Съгласно едно предпочитано изпълнение, в речниците има части на речта, които се задават по подразбиране. В едно най-предпочитано изпълнение може да се добави набор думи, който да замени или допълни набора, зададен по подразбиране. Съгласно друго изпълнение техническите думи се задават чрез набори думи, въведени от четящия.

На Фиг. 6 са представени девет набора думи, определящи части на речта, подредени йерархично. Такива набори думи и йерархии се използват и като входни данни за правилата за прегъване, описани по-нататък. Едно предпочитано изпълнение проверява наборите думи, илюстрирани на Фиг. 6, започвайки от Клас 1,

66265 Bl

Подклас 1 и завършвайки с Клас 3, Подклас 1. Търсенето се прекратява при откриването на дума или фраза. При ограничения речник и статичния характер на наборите думи на Фиг. 6, за търсене тези думи и фрази едно най-предпочитано изпълнение използва бърз, написан на ръка инструмент за разбор. Предпочитаните изпълнения съдържат инструменти за разбор, писани на С, C++, Perl, компилирани AWK, AWK и AWK на С, С с нерекурсивни функции или всеки друг подходящ език. Едно изпълнение на инструмент за търсене използва YACC.

При едно изпълнение речникът представлява стандартен достъпен речник на електронен носител, напр. CD-ROM. Думите от стандартния речник се обработват за определяне на атрибути като част на речта и брой срички. Тъй като при много от изпълненията не са необходими обяснения на думите, възможно е съхранението на множество думи, към които да се асоциира само брой срички и част на речта. В най-предпочитано изпълнение, най-широко използваните и найскоро използваните думи се съхраняват в памет за бърз достъп, като твърдотелна оперативна памет (RAM). При изпълненията, където речниците трябва да бъдат обработвани допълнително на ръка, се предпочита бърз метод, използващ добавяне на класифициращ коментар, засичане на нееднозначност на класификациите и формално групиране. При изпълнения, където наборите думи са фиксирани преди четене, се предпочита добавяне на класифициращ коментар без формално групиране.

При друго изпълнение, нивото на ударение при произнасяне се извлича като атрибут в зависимост отчасти от частта на речта. При найпредпочитано изпълнение ударението се категоризира като първично, вторично и никакво. Съгласно едно изпълнение, времето за произнасяне и действителния звук, напр. какъвто може да се открие в звуков файл, също се извличат от речника и се съхраняват като атрибути на думата.

В стъпка 128 се търсят специфичните за текста и специфичните за четящия набори думи. Съгласно предпочитано изпълнение, специфичните за четящия набори думи се запазват в отделна база данни от речника, позволявайки отделно съхраняване и по-бързо извличане. При едно изпълнение специфичните за четящия набори думи се проверяват преди речниците, а речници те се проверяват само ако необходимите думи и атрибути не се открият в наборите думи на четящия. За търсене на думи предпочитаните изпълнения използват йерархия на базите данни.

В стъпка 130 се премахва нееднозначността на частите на речта. При едно изпълнение се използва микрограматика за определяне на вероятните части на речта. Микрограматиката използва съседните или близките думи за по-точно определяне на най-вероятната част на речта на дадена дума. Например, думата “farm” във фразата “a farm in” най-вероятно е съществително, тъй като се предхожда от неопределителен член и е последвана от предлог. Като друг пример, ако думата може да бъде съществително или глагол и се предхожда от “could”, “will”, “shall” или “to”, то най-вероятно тя е глагол. Ако думата “farm” се предхожда от “will”, вероятно тя е глагол. При друго изпълнение снемането на нееднозначността се прави просто чрез избиране на статистически най-вероятната употреба на думата. При друго изпълнение няма автоматично снемане на нееднозначността, а само ръчно чрез човешко редактиране. Съгласно едно предпочитано изпълнение, за всяка дума се съхранява атрибут на нееднозначност, указващ дали думата запазва граматическата си нееднозначност след проверката. При друго изпълнение не се запазва атрибут на нееднозначност, а той се извлича съществуването на възможни части на речта, съхранени за съответната дума. При едно изпълнение за нееднозначността се съди по визуално показване на ивичен или променлив цвят на текста, свързан със съответната част на речта. Например, ако глаголите са оранжеви, а прилагателните са жълти, то възможен глагол или прилагателно ще има жълти и оранжеви ивици или букви.

При едно изпълнение на изобретението, частите на речта се определят отчасти чрез търсене на морфеми (корени) и прилагане на атрибут за част на речта в зависимост от наставки, напр. “-ly”, “-ing”.

В стъпка 132 определените за думите и фразите атрибути се записват, създавайки “обогатено изречение”, което вероятно няма да се променя за различни четящи. Например, нивото на образование и частта на речта за дадена дума няма да се променят за различните четящи, дори те да предпочитат различна дължина на текс

66265 Bl товите сегменти и скорости на представяне. При едно изпълнение обогатеното изречение се запазва постоянно като файл. При друго изпълнение обогатеният текст се запазва на CD-ROM. Съгласно предпочитано изпълнение обогатеното изречение се вгражда като свързан списък от възли, като всеки възел съдържа атрибутите на думата и фразата, описани по-горе, включително положението на думата в оригиналния текст.

Съгласно Фиг. 5, в стъпка 134 се определят първичните точки на прегъване чрез прилагане на съответни правила. Точките на прегъване са точки, разделящи текста между букви. Съгласно едно предпочитано изпълнение, точките на прегъване се разделят на първични и вторични. Първичните се определят чрез съответни правила, дефиниращи местата на първичните точки на прегъване на базата на пунктуация. Фиг. 7 илюстрира първична точка на прегъване след запетайката, следваща “Africa”. Първичните точки на прегъване разделят текста на “суперфрази”. В предпочитано изпълнение първичните точки на прегъване се намират след всяка запетайка, двоеточие, точка и запетая и леви квадратни, кръгли и фигурни скоби. Разположението на точката на прегъване може да бъде запазено като атрибут във възел в свързан списък от възли, формиращ обогатеното изречение.

Вторичните точки на прегъване се определят също чрез прилагане на съответни правила. В предпочитаните изпълнения вторичните точки на прегъване и правилата са подредени йерархично и правилата за вторичните точки на прегъване имат като входни данни частите на речта. Съгласно най-предпочитано изпълнение, правилата за вторично прегъване включват като входни данни атрибутите на съдържанието на текстовите сегменти и фрази, които се обработват. Например, вторична точка на прегъване може да бъде получена за текстов сегмент, превишаващ максимално предпочитаното от четящия тегло на сегмента, дори ако максималната дължина на сегмента не е достигната.

Непрекъснатите атрибути като трудност на фразата, плътност, сложност, сила и време за произнасяне могат да се използват като входни данни за правило, което променя йерархията, установена чрез таблица като показаната на Фиг. 6, където се използват само частите на речта за определяне на йерархията на вторичното прегъване.

Например, текстов сегмент с тегло по-голямо от 35% над средното за текста, ще бъде класифицирано като Клас 1, независимо от ранга, който би се извикал от таблицата на Фиг. 6. Съгласно едно предпочитано изпълнение, теглото или сила на фразата, а не самите части на речта, се използват изключително за определяне на ранга на вторичните точки на прегъване.

При алтернативно изпълнение, правилата за прегъване извикват прегъване на базата на броя символи на реда, като частите на речта се показват в съответни цветове. Последното изпълнение може и да няма предимствата на каскадното представяне, но предлага визуални условни знаци на базата на съдържание.

На Фиг. 6 е показана таблица, използвана в предпочитано изпълнение за определяне на вторичните точки на прегъване. Например, предлозите определят вторични точки на прегъване от Клас 3, Подклас 1. На Фиг. 7 има вторични точки от клас 3 пред предлозите “in” и “of’. Вторичните точки на прегъване разделят супер-фразите на “мини-фрази”, както е показано на Фиг. 7. Мини-фразите са свързани с текстовите сегменти чрез това, че мини-фразите често са същите като сегментите и често се показват отделно на нов ред. След идентифицирането на минифразите обаче, правилата може да налагат появяването на повече или по-малко от една минифраза като текстов сегмент на един ред.

Първоначално се прилагат правилата за първично прегъване, а след това - правилата за вторично прегъване по реда на ранга на правилото. Пример за йерархия на правила за вторично прегъване е показан на Фиг. 6. Той е установен чрез присвояване на ранг на наборите думи, предизвикващи вторични точки на прегъване. Някои предпочитани изпълнения използват тегло или сила на фраза, а не само частите на речта, за определяне на ранга на вторичните точки. Найпредпочитано изпълнение позволява четящият да въведе предпочитания за определяне на ранга на вторичните точки на прегъване - на базата на части на речта или на тегло/сила на фразата. Някои четящи предпочитат сегментиране на текста на базата на структура, докато други - на базата на сложност или вероятно време за прочитане на сегмента.

В предпочитаното изпълнение правилата за вторично прегъване се прилагат до достигане на

66265 Bl определен лимит. Този лимит често е минимална дължина на реда. Един метод за определяне на разположението на вторичните точки на прегъване е показан на Фиг. 5, стъпка 136, и подробно на Фиг. 8, стъпка 136. При едно изпълнение, когато прилагането на правило за вторично прегъване към супер-фраза води до това, че дължината на получената мини-фраза е по-малка от зададената минимална дължина на ред, правилото за прегъване не се прилага и към съответната супер-фраза не се прилагат повече правила за прегъване. Обратно, когато не съществува точка на прегъване по правилата, а редът превишава зададената максимална дължина, се прилага правило за разбиване, което предизвиква прегъването на текста на два реда. Когато към всички супер-фрази не могат да се прилагат повече правила за прегъване, процесът на прегъване е завършен.

Съгласно Фиг. 1, в стъпка 111 параметрите, атрибутите и правилата за прегъване се използват като входни данни за правилата за хоризонтално отместване. Тези правила определят хоризонталното разположение на текстовите сегменти. В предпочитано изпълнение правилата за хоризонтално отместване включват правилата за хоризонтално подравняване и за ъгъл на отстъп. В това изпълнение хоризонталното отместване е сумата от резултата от правилото за хоризонтално подравняване и за ъгъла на отстъп. В едно лесно за въвеждане изпълнение правилото за хоризонтално отместване е просто ъгъла на отстъп, приложен за центриран текст. Такова изпълнение не използва като входни данни правилото на прегъване, завършващо предхождащия текстов сегмент, и осигурява минимално движение на очите при четене на текстовата каскада. При друго изпълнение се добавя ляв отстъп за предшестваща точка на прегъване от клас 1 и десен отстъп за клас 3. При предпочитаното изпълнение четящият има възможност да зададе допълнително дясно или ляво отместване за точките на прегъване, което включва зададени от четящия стойности за първичните точки на прегъване и за всеки клас и подклас от вторични точки на прегъване. При едно изпълнение допълнителното отместване се съхранява в таблица в единици брой символи. След определянето на хоризонталното отместване остава представянето на текста.

В примера от Фиг.9 супер-фразата 1 “I had a farm in Africa” е отделена от супер-фразата 2 “at the foot of the Ngong Hills” чрез първична точка на прегъване след запетая. Супер-фразата 2 е разделена на две мини-фрази от вторична точка на прегъване преди предлога “of’. В изпълнението, илюстрирано на Фиг. 9, две мини-фрази са представени като един текстов сегмент, тъй като мини-фразата “in Africa” има дължина по-малка от минималната дължина от три думи, зададена от четящия. Първата минифраза, “at the foot” на новия ред е центрирана под горния текстов сегмент и отместена надясно чрез ъгъл на отстъп. Последната мини-фраза “of the Ngong Hills” е отместена наляво поради правило за хоризонтално отместване, което извиква ляво отместване ако предшестващият ред завършва с вторична, а не с първична точка на прегъване. По този начин, при примера от Фиг. 9, общото хоризонтално отместване се определя от комбинация от ъгъла на отстъп и подравняването на реда.

В предпочитаното изпълнение пунктуационните символи, които са по двойки, например квадратни, кръгли и фигурни скоби и кавички, служат като символи, определящи положението на първични точки на прегъване. Съгласно едно изпълнение такива сдвоени пунктуационни символи се включват като входни данни за правилата за хоризонтално отместване, включително за правилата за хоризонтално подравняване и за ъгли на отстъп. Например дълъг текстов сегмент с много фрази в скоби може да има намалени хоризонтални отмествания и вертикално отместване, т.е. по-малко междуредово разстояние, отколкото останалия текст в активната област на разглежданата повърхност.

В стъпка 112 се създава усъвършенстваният текст. На този етап се създават необходимите кодове за получаване на подходящо представен текст. Например където заданията от четящия изискват оцветяване на техническите думи в червено и обогатеният текст показва, че дадена дума е технически термин, ще бъде създаден служебен знак, който ще се интерпретира от стъпката на показване като изискващ червен текст. Подобно кодиране може да се изисква за анимация. На този етап усъвършенстваният текст може да се съхрани за по-късно представяне.

66265 Bl

В стъпка 113 усъвършенстваният текст се представя на дисплея - по един текстов сегмент на нов ред. Усъвършенстваният текст може да съдържа и анимация, оцветяване на фона, оцветяване на текста, прикачване на допълнения и скорост на представяне, които бяха описани по-горе. Съгласно едно предпочитано изпълнение, цветът на фона се представя в зависимост от положението на изречението и на параграфа.

При друго изпълнение, илюстрирано на Фиг. 11, част от текста се представя в един цвят или с една яркост за известен период от време, след което следва представяне с втори цвят или яркост. На Фиг. 11 изречението се представя на три нови реда, означени със стрелки 200, 202 и 203. В рамките на тези редове текстът се представя на един ред, като думите от Фиг. 11 са представени на различни редове за да илюстрират времевите промени на началния текст от цвят/ яркост 206 до цвят/яркост 207 и на началния текст от цвят/яркост 208 до цвят/яркост 209. Текстът “Af” с 206 е ударената сричка в “Africa”, поради което първоначално е представен с цвят/яркост 206. Текстът “gong” също е ударената сричка в “Ngong”, поради което е с начален цвят/яркост 208, който се сменя с цвят/яркост 209.

Предпочитаното изпълнение, показано на Фиг. 1, позволява редактирането на обогатения текст от стъпка 132 и усъвършенствания текст от стъпка 113. Съгласно едно предпочитано изпълнение, за избиране на част от текста, която ще се редактира, се използва устройство за посочване на дума, като напр. мишка. Обогатеното изречение, съответстващо на тази част от текста, се избира вътрешно и атрибутите му стават достъпни за редактиране. Това може да бъде направено чрез използване на падащи менюта, които позволяват редактирането на всеки атрибут на обогатеното изречение и на усъвършенствания текст. На местата, където редакциите могат да влияят на представянето, текстът минава отново предварителна обработка в съответствие със стъпка 110. В редакционната сесия на стъпка 114 бележките на четящия, скрити или непосредствено видими, се приемат и могат да се съхраняват в обогатените и усъвършенствани изречения. Тези бележки имат същата функция като бележките, написани на ръка в книга. Редактируемите характеристики включват части на речта, определения, цвят, текст, точки на пре гъване и хоризонтално отместване.

Редактираните атрибути и представянето на това изпълнение могат също да бъдат съхранени в стъпка 116, като промените се запазват. Съгласно едно изпълнение се запазват само усъвършенстваните изречения. При едно предпочитано изпълнение се запазват и обогатеният, и усъвършенстваният текст. В предпочитаните изпълнения някои поправки се запазват или като специфични за четящия, или като глобални, за представяне при всички четящи текста. Ръчното редактиране на усъвършенствания текст е особено полезно, когато текстът ще бъде многократно четен от други, както електронна книга.

При един вариант на изпълнението от Фиг. 1 стъпките 113, 114 и 116 са пропуснати, т.е. няма човешка намеса и непосредствено представяне. При това изпълнение обогатеният и усъвършенстваният текст се съхраняват за по-нататъшно представяне. Усъвършенстваният текст може да бъде съхранен в стандартен текстообработващ формат, като Microsoft Word ^<ТМ) или Corel Word Perfect ^(ТМ) програми. При това изпълнение софтуерът за представяне може да бъде прост, малък и бърз в сравнение със софтуера, необходим за търсене на думи и анализиране на текст. Такова представяне е предпочитано изпълнение за масовото разпространение на усъвършенстван текст за четене като “електронни книги”.

При един свързан вариант на изпълнението от Фиг. 1, самият усъвършенстван текст се извиква в стъпка 116, без да е необходима предварителна обработка и без да се позволяват редакции. Такова представяне е също предпочитано изпълнение за масово разпространение на усъвършенстван текст за четене като “електронни книги”.

Обръщайки се към Фиг. 1, стъпка 113, представянето на всеки екран от усъвършенствания текст може да бъде инициирано ръчно като чрез щракване на мишката. Съгласно едно предпочитано изпълнение скоростта на представяне се управлява от параметри, зададени от четящия, включващи време на представяне на текста и интервали време между изречения и между параграфи. При най-предпочитаното изпълнение се измерва Съдържанието на Текста и то определя интервала на представяне. Съгласно предпочитано изпълнение, за определяне на ин

66265 Bl тервала на представяне, като мярка за Съдържанието на Текста се използва времето за произнасяне на текста. Съгласно друго изпълнение, за измерване на Съдържанието на Текста и определяне на интервала на представяне се използва теглото на фразите.

Предпочитаното изпълнение позволява четящите да увеличат времето за представяне на едно изречение, както и да увеличават и намаляват скоростта на представяне. Тази скорост може да бъде записана, а така също и дължината и трудността на изречението, съответстващи на даден интервал на представяне. Фиг. 10 илюстрира примерна триизмерна графика, “Повърхност на интервала на представяне”, показваща времето, необходимо за прочитане на изречение, като функция на два атрибута - трудност и дължина на изречението. Времето, необходимо за прочитане, може да бъде определяно чрез предпочитанията на четящия или чрез споменатото проследяване на движението на очите или на активността на мозъчните вълни. След това времето може да се корелира спрямо два атрибута, като на Фиг. 10, или спрямо произволен брой атрибути. В предпочитаното изпълнение интервалът на представяне се настройва непрекъснато да съвпада с предполагаемото необходимо на четящия време.

Съгласно друго изпълнение, най-подходящо за точно измерване на скорост на четене, входните данни за правилата за прегъване се менят и се следи получената скорост на четене. При изпълнение, подходящо за създаване на оптимален масов пазарен продукт за четене, входните данни за правилата на прегъване се променят, като се записват скоростите на четене за представителна извадка четящи. Входните данни се променят за получаване на оптимална скорост на четене и възприемане. Например, за определяне на оптималната скорост на четене, се мени значението на частите на речта при вторичните правила за прегъване, спрямо значението на теглото на фразата.

Съгласно друго изпълнение, за определяне на относителния принос на структурата на изречението, частите на речта, дължината и сложността му, се анализира ръчно редактирано от четящия начално представяне на изречение. След такъв начален период на “настройка” или “обучение”, подобни съотношения се използват за правилата за прегъване за автоматично усъвър шенстване на текста. За по-нататъшно прецизиране на правилата на прегъване могат да се използват следващи редакции.

Съгласно стъпка 118, представянето на текста спира при свършване на текста или по желание на четящия. Стъпка 120 осигурява изчистване, включващо запазване на последния обогатен и усъвършенстван текст, както и запаметяване на информация за сесията на четене.

Примерен метод

Обзор на примерния метод

Настоящото изобретение съдържа метод за прегъване и отместване на текст, за който заявителят счита, че превъзхожда метода, описан по-горе под заглавието “метод”.

Съгласно едно изпълнение на настоящото изобретение пунктуационните знаци се класифицират като “последователни” или заграждащи. Последователните пунктуационни знаци включват две точки, точка и запетая, запетая, еднократно двойно тире (“—”) и многоточие. Заграждащите или обхващащи пунктуационни знаци включват кавички, кръгли скоби, квадратни скоби (като в [ и ]) и двойка двойни тирета. Настоящото изобретение работи най-добре когато заградените в скоби участъци не започват в един заграден в скоби сегмент и да завършват в друг заграден в скоби сегмент, както са и случаите на практика.

Сегментите в заграждащи пунктуационни знаци могат да бъдат последователно разделени от последователни пунктуационни знаци или части от тях да бъдат заградени от вътрешни заграждащи пунктуационни знаци или и двете. Има случай, когато две запетайки в един сегмент формират нещо като заграждане: средният от трите нови сегмента е “заграден” от другите два сегмента. Това е често срещано и разграничава подчинено изречение от самостоятелното. По този начин “например” и други изрази се вграждат в по-големи фрази. В някои случаи заграден текст, напр. текст в кавички, може да продължава повече от едно изречение.

Съгласно описания по-долу метод, заградените сегменти се идентифицират. Текстът извън заградения сегмент се проверява за последователни пунктуационни знаци, които се използват за първо прегъване. Незаграденият и заг

66265 Bl раденият текст се разделят чрез стъпки на прегъване, при които всеки от видовете текст се поставя на отделен ред. Заграденият текст се поставя на отделен ред, като заграждащите пунктуационни знаци са в самото начало и в самия край на всеки сегмент. Този цикъл се повтаря ако е необходимо. След като сегментът не съдържа други пунктуационни знаци освен тези в началото и в края му, той напуска алгоритъма за “прегъване според пунктуацията” и започва “прегъване според думите”. Стъпки 1 до 15 на описания по-долу алгоритъм описват прегъването според пунктуацията.

Прегъването според думите започва от стъпка 16 и прегъва всеки сегмент, докато той се вмести между максималната и минималната зададена стойност. Точките на прегъване в текста ще се определят чрез прегъващи думи, които могат да се задават чрез списък. Съгласно предпочитаното изпълнение думите или фразите от този списък се асоциират с класификационен код или кодова дума, съдържаща информация за думата. В описания по-долу пример класификацията включва буквена представка и числов ранг или номер на ниво. Буквените представки включват “Ь” (прегъване преди думата, а не след нея), “а” (запазена за бъдеща употреба, прегъване след думата), “х” (списък на определителни подложни местоимения), “у” (списък предопределители), “z” (списък след-определители). В Приложение 1 са дадени примери на думи и асоциирани кодове.

В описания по-долу пример, номерата на нивата са от 0 до 99. По-малките номера на нива имат по-висок ранг и се обработват първи от алгоритъма. В описаните по-долу стъпки за означаване на тази стойност се използва променливата “п”. В обхвата 10-39 са включени препъващи думи тип “Ь”. В обхвата 40-46 са включени глаголи, които са 40 (модални), 41 (have, спомагателни глаголи), 42 (глаголите “съм”), 43 (еднозначно преходни глаголи), 44 (еднозначно непреходни глаголи), 45 (нееднозначно преходни глаголи, думи, които не винаги са глаголи), и 46 (нееднозначно непреходни глаголи, думи, които не винаги са глаголи).

Буквените представки, свързани с глаголите, включват “с” (инфинитив), “d” (минало причастие), “е” (други форми, които не изискват спомагателни глаголи), “f” (може да бъде едновременно инфинитив и минало причастие) и “g” (герундий). Класификацията на глаголите се използва за усъвършенстван метод за обработка на глаголи, описан в друга глава.

Понятието “пътека” се отнася до единица за хоризонтално отместване, подразделена на подединици, наричани “отсеци”. В предпочитаното изпълнение всяка пътека е широка 4 интервала и се подразделя на 4 отсека, всеки от които е широк 1 интервал. Пътеките се номерират от 1 до 5, а отсеците се обозначават А, В, С и D. Съгласно предпочитаното изпълнение Пътека 1, отсек А започва 2 интервала след лявото поле, следва отсек В, С, D, след което идва отсек 2, слот А и т.н.

Символът “X” (главна буква) обозначава “номера на поколението”, т.е. степента или нивото на рекурсия на алгоритъма. Например, изречение се разделя на сегмент 1 и сегмент 2, сегмент 2 се подразделя на сегменти 2.1 и 2.2, а сегмент 2.1 се подразделя на сегменти 2.1.1 и 2.1.2. Сегментите 2.1.1 и 2.1.2 са от трето поколение. X се използва често за определяне на грубото хоризонтално отместване, т.е. за номера на пътеката.

Символът “х” (малка буква) обозначава индекса или мястото в изречението или фрагмента при определена дума. Символът х се инкрементира/декрементира в единици думи, а не символи.

Символът “п” се отнася до номера на нивото на прегъващата дума. В примера, описан по-долу, нивото на препъващите думи варира от 1 до 99.

Обръщайки се към Фиг. 12, таблица 320 включва заглавен ред 322, описващ интервалите от лявото поле за всяка колона под него. Заглавната колона 324 съдържа списък от нивата на препъващите думи. Редовете са разделени на последователности от пътеки 328, всяка от които е подразделена на 4 отсека. Последователност от Х-ове, например 330, обозначава разположението на началото на текстовия сегмент при зададени ниво на прегъващата дума и пътека.

Символът X в таблицата показва отсека и пътеката, в които ще се постави първия символ на сегмента в зависимост от прегъващата дума, предизвикала прегъването и получаването на съответния сегмент. Всяко ниво на прегъваща дума,

66265 Bl напр. bl0, Ь20, може да бъде поставено във всяка от пътеките от 2 нагоре. Коя пътека ще се използва се определя от поколението на прегъване, водещо до получаването на съответния сегмент. След това в съответната пътека (напр. пътека 3 за трето поколение прегъване) се определя отсека в зависимост от нивото на прегъващата дума, както е показано в таблицата. По този начин сегмент, получен чрез трето поколение прегъване, направено от дума с ранг Ь20, ще бъде поставен в пътека 3, отсек В, а сегмент, получен чрез трето поколение прегъване, направено от дума с ранг Ь70, ще бъде поставен в пътека 3, отсек D.

За нивата, обозначени в таблицата като Ь85, прегъването ще става преди и след думата - т.е. ще поставя сумата сама на ред. Указанията в таблицата показват къде да бъдат поставени думата с ранг Ь85 и следващият я сегмент. Критерият за определяне на дума с ранг Ь85 не е описан в списъка с прегъващи думи, но е дефиниран като думи с дължина по-голяма от 12 символа. Както показва положението им в таблицата с прегъващи думи, думите Ь85 се използват за прегъване само ако по-нагоре в списъка няма други възможности за прегъване на сегмента. В противен случай не присъства в явен вид в алгоритъма.

Метод

Рекурсивният алгоритъм започва със задаване на Х=1. По този начин първоначално се използва първата пътека и степента на рекурсия на алгоритъма е 1.

Прегъване при пунктуация

1. Освен пунктуационните знаци (пз), които могат да се намират в самото начало или самия край на изречение (сегмент), имали и други пз в изречението/сегмента? Да - отиди на стъпка

2. Не - отиди на стъпка 16.

2. Имали заграждащи пунктуационни знаци в изречението/сегмента? Да - отиди на стъпка

3. Не - отиди на стъпка 4.

3. Има ли последователни пунктуационни знаци “извън” заградения текст в това изречение/ сегмент? (* Ако изречението започва без кавички, но вторият елемент от двойката следва по-нататък в него, т.е. цитатът е започнал в предишно изречение и свършва в това, то сегментът от началото на изречението до интервала след втория елемент на двойката също е “заграден” сегмент. Правилото е аналогично и ако изречението съдържа първата, но не и втората кавичка.) Да отиди на стъпка 4. Не - отиди на стъпка 9.

4. Има ли двоеточия/точка и запетая в незаградения текст от стъпка 3? Да - отиди на стъпка 5. Не - отиди на стъпка 6.

5. Прегъни изречението/сегмента след всяко двоеточие/точка и запетая, постави последващия текст (който може да съдържа заграден текст) на нов ред и постави отстъп на всеки нов ред на положение Пътека X, Отсек А; след това отиди на стъпка 6.

6. Има ли запетайки в незаградения текст? Да - отиди на стъпка 7. Не - отиди на стъпка 8.

7. Прегъни изречението/сегмента след всяка запетая и постави последващия текст (който може да съдържа заграден текст) на нов ред; постави отстъп на новия ред от текста след първата запетая на Пътека X, Отсек D; постави отстъп на текста след втората запетая на Пътека X, Отсек В: постави отстъп на всеки допълнителен ред, който следва нечетна по ред запетая, на Пътека X, Отсек D; постави отстъп на всеки допълнителен ред, който следва четна по ред запетая, на Пътека X, Отсек В. След това отиди на стъпка 15.

8. Има ли единични знаци “двойно тире” (—) или многоточие (...) в незаградения текст? Да - прегъни изречението/сегмента непосредствено преди всяко единично “двойно тире” или многоточие: постави всеки нов сегмент, съдържащ “двойно тире” или многоточие и текста вдясно от него (който може също да съдържа заграден текст) на нов ред; постави отстъп на всеки нов ред на Пътека X, Отсек С. След това отиди на стъпка 15.

9. Има ли текст между самото начало на изречението/сегмента (което може да бъде заграждащ пунктуационен знак) и първия заграждащ пунктуационен знак в самото изречение/ сегмент? Да - отиди на стъпка 10. Не - запази първия заграждащ пунктуационен знак на същото положение (не прегъвай и не поставяй отстъп при този пунктуационен знак. Например изречение или сегмент може да започва или завършва със скоба, която да е непосредствено следвана от кавичка - тогава съгласно тази стъпка те се оставят заедно); и отиди на стъпка 11.

10. Прегъни изречението/сегмента непосредствено преди първия заграждащ пунктуационен знак (вляво от който, съгласно стъпка 9, има текст); постави първия заграждащ пункту

66265 Bl ационен знак в самото изречение и текста вдясно от него на нов ред; постави отстъп на този ред на Пътека X, Отсек D. След това отиди на стъпка 11.

11. Има ли съответстващи си заграждащи пунктуационни знаци в изречението/сегмента (т.е. вторият елемент на заграждащата двойка)? Да отиди на стъпка 12. Не - тогава вторият елемент на заграждащата двойка пунктуационни знаци е в по-нататъшно изречение; отиди на стъпка 15.

12. Има ли текст вдясно от втория елемент (съгласно стъпка 11) от заграждащата двойка пунктуационни знаци? Да - отиди на стъпка

13. Не - то вторият елемент на двойката пунктуационни знаци е краят на изречението/сегмента; отиди на стъпка 15.

13. Прегъни изречението/сегмента непосредствено след втория елемент на заграждащата двойка; постави отстъп на новия ред на положение Пътека X, Отсек В, след това отиди на стъпка 14.

14. Имали друг заграждащ пунктуационен знак вдясно от втория елемент на предишната пунктуационна двойка? Да - върни се на стъпка 10 и повтори стъпки 10-14 за този следващ заграден сегмент вдясно от (не вложен в) предишния. Не - отиди на стъпка 15.

15. Вземи всички новоформирани в стъпките 1 до 14 сегменти, добави 1 към X и се върни на стъпка 1. Продължи прегъването и поставянето на отстъпи, използвайки пътека Х+1. Повтори стъпки 1 до 15 до получаване на сегменти, чиито пунктуационни знаци са разположени само в началото или в края или и двете. Така накрая всички сегменти се изпращат на стъпка 16 за прегъване според думите.

Прегъване според думите

16. Тази стъпка е началото на прегъването според думите. За всяка стойност на X на стъпка 1, където отговорът е Не и сегментът се изпраща на стъпка 16, за Пътеката, от която започва прегъването според думите, използвайте по-голямото от: 2 или X. Например: ако изречение, преминаващо през цикъла за първи път (където Х=1), няма пунктуационни знаци и отговорът на стъпка 1 е Не, то започни прегъването според думите не от X (което е 1), а от 2 (което е поголямо), т.е. започни от Пътека 2. Ако обаче за получаване на сегмент готов за прегъване според думите са били необходими два цикъла през стъпки 1-15, то в началото на третия цикъл, където Х=3 и отговорът на стъпка 1 е Не, на стъпка 16 прегъването според думите ще започне от Пътека Х=3. Това ще постави прегъванията според думите с 1 пътека надясно от последната пътека, използвана при прегъването според пунктуацията. След определяне на пътеката, на която ще бъде отстъпа на първото поколение прегъване според думите на изречението/сегмента, отиди на стъпка 17.

17. Изречението/сегментьт превишава ли Максималната дължина на ред (т.е. броя думи или символи на сегмента) или простира ли се извън наличното място надясно? Не - спри. Да отиди на стъпка 18.

18. Има ли думи в сегмента, които са в списъка с прегъващи думи на ниво [п] (т.е. на ниво bl0 при п=10)? Не - отиди на стъпка 18А. Да - отиди на стъпка 19.

18А. Повтори проверката за списъка прегъващи думи от ниво [п+1] (напр. ниво Ь20, след това ЬЗО и т.н.); ако няма думи в сегмента, които да бъдат открити на никакво ниво в списъка до п=95, отиди на стъпка 29. NB Думи, обозначени като 99 с представка w, х, у, z, се използват в цикъла за глаголи, но не се използват пряко като прегъващи думи.

19. Има ли повече от една думи в сегмента, принадлежащи на Прегъващите думи от ниво [п]? Да - използвай първата дума, която се появява в сегмента и отиди на стъпка 20. Не отиди на стъпка 21.

20. Сегментът, формиран чрез използване на думата от стъпка 19, превишава ли Минималната дължина на ред? Не - повтори проверката, използвайки следващата дума в сегмента, която е от същото ниво прегъващи думи [п]. Ако никоя от думите от ниво [п] не води до получаване на сегмент, превишаващ Минималната дължина на ред, върни се на стъпка 18 и повтори за [п+1]. Да - отиди на стъпка

21.

21. Прегъни изречението на мястото, обозначено чрез думата (преди нея ако представката е Ь, след нея ако представката е а или по-нататък), и постави новия сегмент на един от отсеците на Пътека X или Пътека 2, в зависимост от това което е по-голямо. Отсекът от тази пътека, който трябва да се използва, се определя от нивото на прегъващата дума (виж Фиг. 12, описана по

66265 Bl долу). След това отиди на стъпка 22.

22. Сегментът превишавали Максималната дължина на ред или простира ли се извън наличното място надясно? Не - спри. Да - отиди на стъпка 23.

23. Има ли други нива, които да се проверят в списъка с прегъващи думи? Провери до п=95. Думите, които имат код с п=99, напр. w99, х99, у99, z99, се използват за цикъл на глаголите, описан в следваща глава, но не се използват пряко като думи за прегъване. Да - отиди на стъпка

24. Не - отиди на стъпка 29.

24. Има ли думи в сегмента, които да се открият в списъка с прегъващи думи на ниво [п] (напр. ниво bl 0 при п=10)? Не - повтори проверката за списъка с прегъващи думи от ниво [п+1 ]. Ако в сегмента няма думи, които да са в никакво ниво на списъка, отиди на стъпка 29. Да - отиди на стъпка 25.

25. Има ли повече от една прегъваща дума в сегмента от ниво [п]? Да - използвай първата дума, която се появява в сегмента и отиди на стъпка 26. Не - отиди на стъпка 27.

26. Сегментът, формиран при използването на думата от стъпка 25, превишава ли Минималната дължина на ред? Не - повтори проверката, използвайки следващата дума от сегмента, която е от същото ниво [п]. Ако никоя от думите от ниво [п] не води до сегмент, превишаващ Минималната дължина на ред, върни се на стъпка 24 и повтори за [п+1]. Да - отиди на стъпка 27.

27. Прегъни изречението на мястото, обозначено от думата (преди нея ако представката е Ь, след нея ако представката е а) и постави новия сегмент на Пътека Х+1 или Пътека 2+1, в зависимост от това кое е по-голямо (т.е. една пътека вдясно от използваната за отстъп на предишното прегъване според дума). Формираният сегмент превишава ли Максималната дължина на ред или простира ли се извън наличното място надясно? Не - спри. Да - отиди на стъпка 28.

28. Има ли все още нива от списъка с препъващи думи, които да бъдат проверени? Да отиди на стъпка 23 и осъществи всички възможни прегъвания, използвайки Пътека Х+х или Пътека 2+х, като отстъпите са съгласно таблицата на Фиг. 12. Не - отиди на стъпка 29.

29. “Огъни” сегмента на два или повече нови сегмента, така че новите сегменти да са по къси от Максималната дължина на ред и наличното пространство надясно, и центрирай тези нови сегменти под първия сегмент в групата.

Допълнително прегъване за глаголи

Настоящата глава описва допълнителен процес на прегъване на текст, съдържащ английски глаголи. Допълнителният процес се включва в описания по-горе алгоритъм за “усъвършенствано прегъване” при стъпка 18, и е описан по-долу. Допълнителният процес не е необходим за използване на изобретението, но осигурява допълнителна обработка на прегъване за глаголи.

За процеса на прегъване на текст е желателно да се избягва прекъсването на поредица от свързани глаголи, които трябва да останат в един сегмент, и прегъването да се осъществява при глаголи при идентифициране на дискретна глаголна фраза; като такъв, той не изисква при идентифициране глаголът задължително да бъде в началото на нов ред. Идентификацията на подходящата граница на фразата, включваща един или повече глаголи, може да води до формирането на нов ред след глагола (на английски).

За процеса на прегъване на текст е желателно също така: да се избягва отделянето на частицата “to” от инфинитивната форма (само от нея) на глагола, който следва; да се свързват по аналогичен начин думите “and” и “or” със следващи ги глаголи, които са идентифицирани за прегъване (всички форми на глаголите, не само инфинитивната); да се обработват дадени комбинации глагол+предлог (или глагол+наречие) като една дума, така че последващо прегъване да не разделя предлозите и наречията от комбинациите, към които принадлежат (напр. “they broke up the fight”, за разлика от “he walked up the hill”); по аналогичен начин да се обработват отрицателните (“not”) форми на спомагателните глаголи като една дума, така че те да се разглеждат като една дума спрямо други глаголи (напр. “could not go” трябва да се обработва по същия начин като “could go”). Желателно е също съкращенията на спомагателните глаголи при местоимения да се обозначават като глаголи (напр. “you’ll”, “we’ve”, “you’re”).

Глаголите са сложни - те могат да бъдат спомагателни, модални или обикновени по функция. Могат да бъдат правилни или непра

66265 Bl вилни по спрежение. Могат да бъдат преходни, непреходни или и двете според това дали изискват пряко допълнение. Могат да бъдат нееднозначни по отношение на това дали наистина са глаголи, а не други части на речта. Могат да се комбинират с различни предлози или наречия, което да променя значението им спрямо значението на отделния глагол. Имат няколко форми, които могат или не могат да се комбинират със спомагателни глаголи за създаване на различни времена и които се съгласуват с лицето и падежа на подлога.

Понастоящем не е практично да се организира каскадно форматиране, използвайки всички тези променливи и комбинациите им. Възможно е обаче глаголите да се класифицират в четири големи функционални групи (модални, have, be и обикновени); обикновените глаголи да се подразделят на еднозначни/нееднозначни и преходни/строго непреходни; за всяка от тези групи да се идентифицират пет различни форми (инфинитив, минало причастие, герундий, други и комбинация инфинитив-минало причастие).

Дефиниции за Метод за прегъване при глаголи

Символът “х” (малка буква) обозначава индексът или мястото в изречение или част от изречение при определена дума. Величината х се инкрементира/декрементира в думи, а не в символи.

В цикъла за глаголи терминът “п” се отнася до положението на дадена дума в текста спрямо положението на разглежданата дума. Променливата “п” не се отнася до ниво на прегъваща дума, както в предишния алгоритъм.

Въведение

За всяка от категориите на глагола според формата и функцията му съществуват четири основни операции, които определят дали трябва да се осъществи прегъване при глагола, х (който иначе е идентифициран за прегъване чрез критерии MIN и МАХ). Тези операции разглеждат думата непосредствено преди въпросния глагол (х1) и определят дали тя принадлежи към набор думи дефинирани специално за този клас функция и форма. На базата на това, в зависимост от резултатите от операциите за (х+1), възможното прегъване се пропуска (и се разглежда следващият глагол в сегмента, който може да предизвика прегъване на това ниво на прегъване) или прегъването се запазва като възможност.

Съдържанието на тези набори думи за (х1) операциите включва: думи, които снемат нееднозначността на възможния глаголсъществително, получавайки съществително; и думи, които са подходящи помощни глаголи за въпросния глагол.

В следваща операция възможното прегъване преди х се отлага ако (х+1) е глагол. Глаголът (х+1) се проверява за това дали думата пред него (т.е. х) е в списъка му; ако х не присъства в списъка на х+1, то прегъването се осъществява преди х+1, а не преди х (защото х+1 е глагол, принадлежащ на отделна глаголна фраза). Ако х е в списъка на глагола х+1 (т.е. х е помощен глагол за х+1), то прегъването НЕ се осъществява при х+1, а се разглежда думата след х+1 (т.е. х+2). Ако думата след х+1 не е глагол, тогава се осъществява първоначално отложеното прегъване преди х.

Този процес използва насочеността на процеса на прегъване: процедурата на прегъване придвижва проверката на всеки потенциален глагол в изречението - от първия до последния. Ако има два глагола един след друг, то х-1 операцията за втория глагол от двойката (операция, която разглежда първия глагол от двойката, за да провери дали присъства в списъка, характерен за формата на втория глагол) определя дали между първия и втория глагол ще има прегъване.

Операция х-1 е необходима за всеки глагол, дори ако той е първата дума над Минималната стойност за ред. Причината за това е, че е възможно помощните глаголи на даден глагол х да са били прескочени при предишни потенциално прегъвания, тъй като попадат в Минималната стойност на ред. При обратната проверка към началото на сегмента обаче, операцията х-1 ще засече дали наистина глаголът х се предхожда от помощен глагол (независимо, че х-1 е в границите на Минималната стойност на ред). В този случай не се осъществява прегъване при х.

Още повече, дори ако х е последван от друг глагол при тази ситуация (или всяка ситуация, където х-1 е помощен глагол за х), глаголът след х (на позиция х+1) няма да бъде активно търсен след като операцията (х-1) определи, че х се предхожда от помощен глагол. Вместо това процесът на прегъване - който все още се управлява от факта, че сегментът остава

66265 Bl по-голям от Максимална стойност на ред (тъй като прегъването при х не е осъществено), ще продължи към следващия глагол в сегмента; процесът стига до разглеждане на следващия глагол, който е бил х+1, и се обработва като ново х (наричано тук х*). Операцията х*-1 ще разглежда предишното х и ще определи дали х*-1 е помощен глагол за х*.

Операцията х-1 за глаголи от ниво 40 (модални глаголи, виж по-долу) и операциите х-1 и х+1 за глаголи от ниво 45/46 (нееднозначни глаголи, които могат да бъдат преходни [45] или строго непреходни [46]) са леко различни от използваните за всички останали глаголи. В случая на модални глаголи алгоритъмът е опростен, тъй като само инфинитивна форма на модален глагол (а има само един модален глагол, който е в инфинитивна форма, т.е. “do”) може да бъде предхождан от друг модален глагол (напр. “could do”). В случая на глаголи от ниво 45/46 първоначално се извършва стандартната х-1 операция, но тя е следвана от специализирани х-1 и х+1 проверки. Тези проверки целят снемането на нееднозначността на х и включват връзки глагол глагол на някоя страна на х.

Проверка за възможно прегъване при глагол х от по-ниско ниво (напр. 40) може да завърши с осъществяване на прегъване на място пред следващ глагол от по-високо ниво (напр. 46), ако х е следван от един или повече последователно разположени глаголи. След осъществяването на прегъване отново се прави проверка > МАХ. Ако е необходимо допълнително прегъване, процесът отново започва чрез търсене първо на глаголи от по-ниско ниво. Това отсява отначало по-простите глаголни фрази (напр. започващите с модален глагол, като напр. “I could have bought some milk”); следват глаголни времена използващи помощни глаголи (напр. “We have been going there for several years”); следват еднозначните глаголи; след това нееднозначните глаголи. Надяваме се, че сегментите ще бъдат свеждани до < МАХ чрез другите нива и стъпките за нееднозначни глаголи няма да се използват често. Докато глаголите ниво 45/46 започнат да се използват за иницииране на проверка за прегъване, глаголите от по-високи нива ще са отсети. Това позволява някои полезни предположения за връзките глагол - глагол между два различни глагола от ниво 45/46.

Освен сравненията на глаголи, има четири справочни списъка, които се използват: списък с определителни подложни местоимения (които правят непосредствено следващия нееднозначен глагол определено глагол, означени са с х99 в списъка с думи); а списък пред-определители (които правят следващ нееднозначен глагол определено друга част на речта, обозначени са с у99 в списъка с думи); списък след-определители (които правят предхождащ нееднозначен глагол подходяща граница на фраза, обозначени са със z99 в списъка с думи) и списък с глаголи, подпомагащи герундий (които предотвратяват прегъване пред герундий, обозначени с w99 в списъка с думи).

Може да се използва описания по-горе алгоритъм за присвояване на Пътеки и Отсеци. Пътеката X, на която се поставя новоформирания сегмент, се получава от историята на последователното прегъване на “предшествениците” на сегментите от предишните прегъвания. Отсекът (a, b, с, d) във всяка Пътека, в който се поставя новоформирания сегмент, досега е бил функция на нивото на прегъващата дума. Тъй като по дефиниция думите в цикъла за глаголи са глаголи, присвояването на отсек ще бъде същото, напр. Слот Ь.

Ако обаче е необходимо да се пренесат разликите в прегъванията при цикъла за глаголи, присвояването на отсек може да се промени. Всяко прегъване преди разглеждания глагол х може да бъде на Отсек с. Всяко прегъване на място преди следващ глагол след х (т.е. х+п), когато х се следва от един или повече глаголи, може да бъде на Отсек b АКО глаголът на х+n е еднозначен (43 или 44). Всички други прегъвания на места след х могат да бъдат в отсек d.

Преглед на процеса

Създава се лексикон (сборник) от глаголи. Това може да бъде направено ръчно, но правилата, представени тук, позволяват автоматизацията на този процес с помощта на електронен речник. Всеки глагол се обозначава според функцията и формата си.

Според терминологията на настоящия списък с прегъващи думи глаголите биха били на “ниво 40-те”. Тогава четирите функционални групи са: модални=40; глаголи have=41, глаголи фе=42; и обикновени глаголи=43/44 и 45/46. Групите 43/44 са еднозначни глаголи, т.е. те са

66265 Bl винаги глаголи. Групите 45/46 са нееднозначни глаголи, т.е. не е сигурно дали са глаголи. Нечетният номер на тези двойки представлява преходните глаголи, а четният номер - строго непреходните. Глаголите от 43 или 44 ниво се търсят едновременно при търсенето на нов кандидат за глагол за прегъване. След откриването на глагол от 43 или 44 ниво, операциите х-1 са различни за 43 и за 44. Аналогично, глаголите от 45 и 46 ниво ще бъдат първоначално търсени едновременно, но ще бъдат обработвани различно след идентификацията им като потенциално прегъващи.

“Отворени” глаголи, а именно такива, които не се предхождат от глагол, се идентифицират за евентуално прегъване в зависимост от номера на функционалната група, както за другите думи от списъка с прегъващи думи. Низ от последователни глаголи (или потенциални глаголи) може да има няколко функционални нива: “Не should not (40) have (41) been (42) bringing (43) work (43) home.” Стъпките, описани по-нататък, позволяват продължаването на операциите (х-1) и след това (х+1) през низа независимо от нивата на прегъване на думите в него.

Един предпочитан метод включва пет различни вида класификации на представките на глаголите в зависимост от формата на всеки глагол. Поради това съм нарекъл тези пет групи: е (за инфинитивна форма, напр. “to walk”, но също и “I walk” и т.н.); d (за минало причастие, напр. “walked”; е (за други форми, неизискващи помощен глагол, включително: тези модални глаголи, които имат само тази форма, трето лице единствено число на правилните глаголи, напр. “he walks”, но също “he goes”); f (за форми, които са едновременно инфинитив и минало причастие, както е при някои неправилни глаголи като “to cut” и “have cut”); и g (за герундий, напр. walking).

По-долу са дадени примери за това как ще се обозначават различните глаголи според тази класификация. Други примери има в Приложение 1.

Do с 40, Did е 40, Does е 40, Could е 40,

Might е 40, Have с 41, Had d 42, Having g 41,

Has e 41, Be c 42, Been d 42, Being g 42, Am e 42,

Is e 42, Were e 42,

Walk c 45, Walked d 45, Walking g 45, Walks e 45,

Cut f 45, Cuts e 45, Done d 45, Doing g 45,

Bring c 43, Brought d 45, Bringing g 45, Go c 45,

Gone d 45, Going g 46, Goes e 44, Went e 44.

Свързване c описания по-горе примерен метод

Следващите стъпки 18 и 18А заместват стъпки 18 и 18А в описания по-горе алгоритъм при изпълнения, използващи цикъл за глаголи:

18. Има ли думи в сегмента, които присъстват в списъка с препъващи думи за ниво [n] (b 10 до Ь39, и Ь50 до Ь99)? Ако Не - отиди на стъпка 18А. Ако Да - отиди на стъпка 19.

Стъпка 18А. Повтори проверката за списъка с прегъващи думи от ниво [п+1 ]. Ако няма повече прегъващи думи на ниво Ь39, то преди да отидеш на ниво Ь50, влез в цикъла за глаголи за алгоритми, включващи ниво 40-49. След излизане от цикъла за ниво 40-49, продължи прегъването, започвайки от ниво Ь50 на стъпка 18. Ако няма повече думи в сегмента, които да са в никое ниво в списъка с прегъващи думи, отиди на стъпка 29.

Цикъл за глаголи

Q1. Има ли в сегмента думи с обозначение 40 до 46 (с коя да е буква с, d, е, f преди тях)?

Не - върни се на стъпка 18 от стандартния алгоритъм.

Да - отиди на стъпка Q2.

Q2. Има ли в сегмента (или останалата част от сегмента) глагол, обозначен с 40?

Не - отиди на стъпка Q20.

Да - отиди на стъпка Q3.

Q3. За първия (или следващия) глагол от ниво 40 (х) в сегмента, х над Минималната стойност на ред ли е (>MIN)?

Не - върни се на стъпка Q2 и провери за следващи глаголи от ниво 40 в сегмента вдясно от х.

Да - отиди на стъпка Q4.

Q4. Глаголът х от “с” форма ли е (т.е. обозначен ли е като с40)?

Не - отиди на стъпка Q6.

Да - отиди на стъпка Q5.

Q5. Думата, предхождаща х (т.е. х-1) е ли глагол от ниво 40?

66265 Bl

He - отиди на стъпка Q6.

Да - тогава НЕ прегъвай на мястото преди X. Върни се на стъпка Q2 и провери за следващ глагол от ниво 40 в сегмента вдясно от х.

Q6. ВЕРОЯТНО ще има прегъване на мястото преди х, но може вместо това да има прегъване преди друг глагол на положение х+п. Провери думата (думите) след х (х+п), започвайки от п=1. Е ли х+п глагол (т.е. някоя от думите, обозначени с 40, 41, 42, 43, 44, 45 или 46 с някоя от буквите с, d, е, f, g преди числото)?

Не - отиди на стъпка Q6A.

Да - отиди на стъпка Q7.

Q6A. Думата х е ли от форма “с” или “f ’?

Не - прегъни на мястото преди х. Ако думата преди х е “и” или “или”, то не прегъвай преди х. Вместо това, ако думата “и” или “или” е поголяма от минималната стойност на ред (>ΜΓΝ), прегъни преди нея. Ако думата “и” или “или” преди х е по-малка от минималната стойност на ред (<ΜΙΝ), то не прегъвай - върни се на стъпка 2 и провери за глаголи в сегмента вдясно от х. Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент / изречение), Отсек А. След това отиди на стъпка Q19.

Да - отиди на стъпка Q6B.

Q6В. Е ли х-1 думата “to”?

Не - прегъни на мястото преди х. Ако думата преди х е “и” или “или”, не прегъвай преди х. Вместо това, ако думата “и” или “или” е поголяма от минималната стойност на ред (>MIN), прегъни преди нея. Ако думата “и” или “или” преди х е по-малка от минималната стойност на ред (<ΜΙΝ), то не прегъвай - върни се на стъпка 2 и провери за глаголи в сегмента вдясно от х. Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/ изречение), Отсек С. След това отиди на стъпка Q19.

Да - прегъни на мястото преди “to”. Ако думата непосредствено преди “to” е “и” или “или”, то прегъни преди “и” или “или”, вместо преди “to”. Ако сумарно думата “и” или “или” и думата “to” са по-големи от Минималната стойност на ред (>ΜΙΝ), то прегъни преди думата “и” или “или” или преди думата “to”, в зависимост от това коя е първа. Ако думата “и” или “или” или думата “to” преди х е по-малка от Минималната стойност на ред (<MIN), не прегъвай - вместо това се върни на стъпка 2 и прове ри за глаголи в сегмента вдясно от х. Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/ изречение), Отсек С. След това отиди на стъпка Q19.

Q7. Думата х+п от “е” форма ли е?

Не - отиди на стъпка Q7A.

Да - отиди на стъпка Q17.

Q7A. Думата х+п от “с” форма ли е?

Не - отиди на стъпка Q9.

Да - отиди на стъпка Q8.

Q8. Думата (х-п)-1 плапол от ниво 40 ли е?

Не - отиди на стъпка Q17.

Да - отиди на стъпка Q18.

Q9. Думата х+п от “f” форма ли е?

Не - отиди на стъпка Q11.

Да - отиди на стъпка Q10.

Q10. Думата (х+п)-1 е ли глагол от ниво 40, 41 или 42?

(Отбележете, че се приема за много рядко такива неправилни глаголи, чиито инфинитив и минало причастие са еднакви (т.е. “f” форми), да са и строго непреходни, И че писателят ще постави пред миналото причастие на такъв глагол глагола “be”).

Не - отиди на стъпка Q17.

Да - отиди на стъпка Q18.

QI 1. Думата (х+п) е ли една от следните: d41,d42, d43 или d45?

He - отиди на стъпка Q13.

Да - отиди на стъпка Q12.

Q12. Думата (х+п)-1 е ли глагол от ниво или 42?

Не - отиди на стъпка Q17.

Да - отиди на стъпка Q18.

Q13. Думата х+п е ли една от следните: d44 или d46?

Не - отиди на стъпка Q15.

Да - отиди на стъпка Q14.

Q14. Думата (х+х)-1 е ли глагол от ниво 41?

Не - отиди на стъпка Q17.

Да - отиди на стъпка Q18.

Q15. Думата х+п е ли от “g” форма?

Не - отиди на стъпка Q17.

Да - отиди на стъпка Q16.

Q16. Думата (х+п)-1 е ли глагол от ниво

ИЛИ помощен глагол за герундий (w99)?

Не - отиди на стъпка Q17.

66265 Bl

Да - отиди на стъпка Q18.

Q17. [“Да” за Q7 или “не” за Q8, 10, 12, 14, 15, 16] Тогава прегъни, но НЕ на мястото преди х. Вместо това, прегъни на мястото ПРЕДИ х+п. Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/изречение), Отсек В. След това отиди на стъпка Q19.

Q18. [“Да” за Q8, 10, 12, 14, 16] Тогава добави 1 към η и се върни на стъпка Q6, използвайки п+1 вместо п. (Т.е. провери за следващата дума след х+1 и виж дали е глагол или не и продължи в зависимост от това)

Q19. Имали все още сегменти, превишаващи Максималната дължина на ред (или наличното място надясно)?

Не - спри.

Да - върни се на стъпка Q2.

Q20. Има ли в сегмента (или останалата част от него) глагол от ниво 41 ?

Не - отиди на стъпка Q34.

Да - отиди на стъпка Q21.

Q21. За първия (следващия) глагол от ниво 41 (х) в сегмента, е ли х над Минималната стойност на ред (>ΜΙΝ)?

Не - върни се на стъпка Q20 и провери сегмента за глагол от ниво 41 вдясно от х.

Да - отиди на стъпка Q22.

Q22. Думата х е ли от “е” форма?

Не - отиди на стъпка Q22A.

Да - отиди на стъпка Q33.

Q22A. Думата х е ли от “с” форма?

Не - отиди на стъпка Q24.

Да - отиди на стъпка Q23.

Q23. Думата (х-1) е ли глагол от ниво 40?

Не - отиди на стъпка Q33.

Да - отиди на стъпка Q32.

Q24. Думата х е ли от “f” форма?

Не - отиди на стъпка Q26.

Да - отиди на стъпка Q25.

Q25. Думата (х-1) е ли глагол от ниво 40, 41 или 42?

Не - отиди на стъпка Q33.

Да - отиди на стъпка Q32.

Q26. Думата х е ли една от следните: d41, d42, d43 или d45?

He - отиди на стъпка Q28.

Да - отиди на стъпка Q27.

Q27. Думата (х-1) е ли глагол от ниво 41 или 42?

Не - отиди на стъпка Q33.

Да - отиди на стъпка Q32.

Q28. Думата х е ли една от следните: d44 или d46?

Не - отиди на стъпка Q30.

Да - отиди на стъпка Q29.

Q29. Думата (х-1) е ли глагол от ниво 41 ?

Не - отиди на стъпка Q33.

Да - отиди на стъпка Q32.

Q30. Думата х е ли от “g” форма?

Не - отиди на стъпка Q32.

Да - отиди на стъпка Q31.

Q31. Думата (х-1) е ли глагол от ниво 42 ИЛИ помощен глагол за герундий (w99)?

Не - отиди на стъпка Q33.

Да - отиди на стъпка Q32.

Q32. [“Да” за Q23, 25, 27, 29 или 31] Отиди на стъпка Q32A

Q32A. Думата х е ли глагол от ниво 45 или 46?

Не - Тогава НЕ прегъвай на мястото преди х, а се върни на стъпка Q20 и провери за друг глагол в сегмента вдясно от х. (Ако в сегмента няма повече глаголи от ниво 41, стъпка Q20 насочва проверката към стъпка Q34 за глаголи от ниво 42. Аналогично, проверката се насочва от стъпка Q34 към стъпка Q36 за глаголи от нива 43/44 и от стъпка Q36 към стъпка Q38 за глаголи от нива 45/46).

Да - отиди на стъпка Q40.

Q33. [“Да” за Q22 и “не” за Q23, 25, 27, 29,30 или 31 ] Отиди на стъпка Q3 3 А.

Q33A. Думата х е ли глагол от ниво 45 или 46?

Не - ВЕРОЯТНО ще има прегъване на мястото преди х, но първо провери (х+n). Върни се на стъпка Q6.

Да - отиди на стъпка Q42.

Q34. Има ли в сегмента (или останалата част от него) други глаголи от ниво 42?

Да - отиди на стъпка Q36.

Не - отиди на стъпка Q35.

Q35. За първия (следващия) глагол от ниво 42, х, в сегмента, е ли х над Минималната дължина на ред (>ΜΓΝ)?

Не - върни се на стъпка Q34 и провери за следващия глагол от ниво 42 в сегмента вдясно от х.

Да - отиди на стъпка Q22.

Q36. Има ли в сегмента (или останалата

66265 Bl част от него) други глаголи от ниво 43 ИЛИ от ниво 44? [Забележка: глаголите от ниво 43 или 44 се търсят на тази стъпка].

Не - отиди на стъпка Q38.

Да - отиди на стъпка Q37.

Q37. За първия (следващия) глагол от ниво 43/44, х, в сегмента, е ли х над Минималната стойност на ред (>MIN)?

Не - върни се на стъпка Q36 и провери за следващ глагол от ниво 43/44 в сегмента вдясно от х.

Да - отиди на стъпка Q22.

Q38. Има ли в сегмента (или останалата част от него) глаголи от ниво 45 ИЛИ от ниво 46? [Забележка: глаголите от ниво 45 или 46 се търсят на тази стъпка].

Не - върни се в стандартния алгоритъм, стъпка 18 и продължи проверката, използвайки прегъващи думи от ниво Ь50.

Да - отиди на стъпка Q39.

Q39. За първия (следващия) глагол от ниво 45/46, х, в сегмента, е ли х над Минималната стойност за ред (>MIN)?

Не - върни се на стъпка Q38 и провери за следващ глагол от ниво 45/46 в сегмента вдясно от X.

Да - отиди на стъпка Q22.

Q40. [“Да” от стъпка Q32A] е ли х глагол от ниво 45?

Не - [следователно х е глагол от ниво 46] прегъни на мястото СЛЕД х. След това отиди на стъпка Q19.

Да - отиди на стъпка Q41.

Q41. [х е глагол от ниво 45] Е ли (х+1) глагол? [Забележка: досега, ако (х+1) е наистина глагол, той трябва да е от ниво 45 или 46]

Не - тогава НЕ прегъвай на мястото преди х. Вместо това, върни се на стъпка Q38 и провери за следващ глагол от ниво 45/46 в сегмента, вдясно от х.

Да - НЕ прегъвай на мястото преди х. Вместо това, ПРЕГЪНИ на мястото преди (х+1) (т.е. на мястото СЛЕД х). Постави новоформирания сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/изречение), Отсек D. След това отиди на стъпка Q19.

Q42. [“Да” за стъпка Q33A] Е ли (х+1) глагол?

Не - отиди на стъпка Q43.

Да - прегъни на мястото преди (х+1), т.е.

на мястото след х. Постави новоформирания сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/изречение), Отсек D. След това отиди на стъпка Q19.

Q43. Е ли х от форма “с” или “f ’?

Не - отиди на стъпка Q45.

Да - отиди на стъпка Q44.

Q44. Е ли (х-1) думата “to”?

Не - отиди на стъпка Q45.

Да - прегъни на мястото преди “to”. Ако думата непосредствено преди “то” е “и” или “или”, то прегъни преди “и” или “или”, а не преди “to”. Ако сумарно думата “и” или “или” и думата “to” са по-големи от Минималната стойност на ред (>ΜΙΝ), то прегъни преди думата “и” или “или” или преди думата “to”, в зависимост от това коя е първа. Ако думата “и” или “или” или думата “to” преди х е по-малка от Минималната стойност на ред (<ΜΙΝ), то не прегъвай - вместо това се върни на стъпка 38 и провери за глаголи от ниво 45/46 в сегмента вдясно от х.

Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/изречение), Отсек С. След това отиди на стъпка Q19.

Q45. Думата (х-1) е ли в списъка с определителни подложни местоимения [списък х99; тези думи са I, we, he, she, they, who и т.н.]?

He - отиди на стъпка Q46.

Да - прегъни на мястото СЛЕД х. Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/ изречение), Отсек D. След това отиди на стъпка Q19.

Q46. Думата (х-1) е ли в списъка “предопределители” [у99]?

Не - отиди на стъпка Q46A.

Да - НЕ прегъвай на мястото преди х и се върни на стъпка Q38 за проверка за глаголи от ниво 45/46 в сегмента отдалечен от х.

Q46A. Е ли х от форма “f“d” или “g”?

He - отиди на стъпка Q47.

Да - прегъни на мястото преди х. Ако думата непосредствено преди х, т.е. (х-1) е “и” или “или”, то не прегъвай преди х. Вместо това, ако думата “и” или “или” е по-голяма от Минималната стойност на ред (>ΜΙΝ), то прегъни преди нея. Ако думата “и” или “или” преди х е по-малка от Минималната стойност на ред (<ΜΙΝ), то не прегъвай - вместо това се върни

66265 Bl на стъпка 38 и провери за глаголи от ниво 45/46 в сегмента вдясно от х.

Q47. Думата х е ли глагол от ниво 45?

Не - НЕ прегъвай на мястото преди х и се върни на стъпка Q38 за проверка за глаголи от ниво 45/46 в сегмента вдясно от х.

Да - отиди на стъпка Q48.

Q48. Думата (х+1) е ли в списъка “следопределители” [z99]?

Да - ПРЕГЪНИ на мястото ПРЕДИ х. (Ако думата непосредствено преди х е думата “и” или “или”, то не прегъвай преди х. Вместо това, ако думата “и” или “или” е по-голяма от Минималната стойност на ред (>ΜΙΝ), то прегъни преди нея. Ако думата “и” или “или” преди х е по-малка от Минималната стойност на ред (<Μ1Ν), то не прегъвай - вместо това се върни на стъпка 38 и провери за глаголи от ниво 45/46 в сегмента вдясно от х.

Постави новия сегмент на Пътека X (спрямо предишните прегъвания на оригиналния сегмент/изречение), Отсек С. След това отиди на стъпка Q19. (Край на цикъла за глаголи)

Допълнителни аспекти на изобретението

Усъвършенстване на текст чрез действия на четящ изпълнител

Представянето на текст може да бъде усъвършенствано чрез използване на действията на четящ или четящ-изпълнител в качеството на входни данни и множество аудио-визуални ефекти в качеството на изходни данни. Съгласно едно изпълнение четящ или четящ изпълнител чете текст на глас, променяйки силата и височината на тона, интонацията си и прави паузи за ефект. Терминът “четящ изпълнител” се използва за да го разграничи от четящия усъвършенстван текст и за да отбележи, че четенето на глас може да включва много други действия освен говоренето. Изреченият текст се записва, за да се използва при представянето на текста. При едно изпълнение изреченият текст се записва електронно и се анализира за атрибути на речта като височина и сила на тона, интонация и паузи. Съгласно предпочитано изпълнение атрибутите на изречения текст се анализират, а анализираните атрибути се записват заедно със самия изречен текст. Атрибутите като сила и височина на тона и инто нация се записват и наслагват съответно на буквите, сричките и думите на текста, които също се съхраняват, така че атрибутите могат да се извличат и възпроизвеждат по някакъв начин в съответствие с оригиналния текст. Атрибутите на действията на четящия изпълнител могат да се представят чрез атрибути на представянето като шрифт, интензивност, дебелина на шрифта, големина на буквите, цвят на буквите, цвят на фона, междубуквено разстояние, разстояние между думите, между редовете и между изреченията.

При едно примерно изпълнение на изобретението силата на звука на четящия се възпроизвежда като интензитет на буквите, а височината на тона - като дебелина на буквите, като по-високите тонове се възпроизвеждат чрез потесни символи, а по-ниските тонове - чрез пошироки символи. Интензивността на буквите се отнася до броя пиксели на единица площ с различен цвят от околните фонови точки. При един пример интензивният текст е черен на бял фон, а по-малко интензивният - сив текст на бял фон. При друго примерно изпълнение на изобретението цветът на символите се мени в съответствие с височината на тона. Например, думи с по-висок тон се възпроизвеждат в посока към червения край на видимия спектър, а тези с по-нисък тон - в посока към виолетовия край. При друг пример текстът се отмества от нормалната хоризонтална основна линия в съответствие с височината на тона на четящия изпълнител. При едно изпълнение текстът се отмества нагоре за по-висок от средното тон и надолу - за по-нисък.

При друго изпълнение на изобретението, интервалите и продължителността на произнасянето на специфични думи от изпълнителя се възпроизвеждат в усъвършенствания текст чрез разстоянието между буквите, думите и изреченията. Времето за произнасяне на дума и интервалите между думи и изречения могат да бъдат записани, което позволява измерването на нормалното разстояние между думи и изречения. Произнасяните по-бавно думи могат да се възпроизвеждат чрез допълнително междубуквено разстояние. По-дългият от нормален интервал между думите може да бъде възпроизведен чрез по-голямо от нормално разстояние между думите на представения текст. Още по-дългите интервали могат да се възпроизвеждат чрез представяне на отделените думи или фрази на нов

66265 Bl ред. Изключително дълги интервали могат да се възпроизвеждат като отделени думи или фрази на нови редове, които са на по-голямо от стандартното вертикално разстояние.

Жестове на ръцете

Съгласно друг аспект на изобретението, записаните по време на четене действия на четящия изпълнител включват и жестове на ръцете и пръстите. За предпочитане положението и ориентацията на ръцете се записват и съхраняват в съответствие с всяка прочетена на глас дума. Думата “ориентация” се отнася за посоката, в която сочат ръцете, пръстите или дланите. В двумерна равнина ориентацията може да се запише като двумерен вектор. В тримерен модел ръцете могат да бъдат записани като тримерен вектор. Положенията могат да се запишат като положение спрямо раменете или други опорни точки на тялото на четящия изпълнител.

При избрани подходящи текстови извадки вертикалното и хоризонталното отместване на текста може да се променя в съответствие със съдържанието му. Пример затова би било представянето на изреченията “От една страна...” и “От друга страна...”. Първата фраза би могла да се отмести хоризонтално наляво, а второто, противопоставено изречение - надясно. Аналогично могат да се използват и вертикални отмествания, които да се използват за подчертаване на движенията на ръцете като “Той обеща това, но даде само това”.

Положението и ориентацията на ръцете може да се запише чрез използване на известна технология, като например поставяне на инфрачервени отражателни точки на определени места по ръцете. Отражението на прожектирана инфрачервена светлина се регистрира и записва, позволявайки последващо възпроизвеждане на движенията. При друго изпълнение четящият изпълнител използва ръкавици и положението на ръцете се записва директно с цифрова камера, използвайки контраста на ръцете и по-тъмния фон.

Изражения на лицето

Съгласно друг аспект на изобретението изражението на лицето на четящия изпълнител по време на четене се записва и се съхранява в съответствие е думите, които се четат. При едно изпълнение се записват формата на окото или клепача, отвореността на окото, положението на веждите, положението на главата, на брадичката и формата на устата. Израженията на лицето на четящия изпълнител могат да бъдат записани за всяка отделна дума и да се възпроизведат за всеки отделен ред. Съгласно едно изпълнение крайните положения се използват за представяне на положението за целия ред. Съгласно друго изпълнение, за представянето на реда се използва осредненото положение. Съгласно друго изпълнение изразите на лицето се използват за промяна на представянето на самия текст. При едно примерно изпълнение степента на отвореност на устата се използва за промяна на степента на отвореност на определени затворени гласни, например “О”, Колкото е по-отворена устата на четящия изпълнител, толкова по-голямо е “О”. При друго примерно изпълнение височината на дадени букви като “W” или “Т” се променя в зависимост от степента на отвореност на клепачите. Описаното представяне на изразите на лицето се комбинира с описаното съгласно един аспект на изобретението просветляване на текст. Съгласно едно изпълнение, над думата, която ще се просветли, се възпроизвежда графика на лице. Характеристиките на анимираното лице се променят динамически. Съгласно друго изпълнение, до всеки ред от текста се представя лице, което се променя при просветляване на реда. При друго изпълнение лицето се представя близо до фразата, която ще се представя усъвършенствано, като лицето е със статично изражение.

Представяне на текст по крива

Съгласно друг аспект на изобретението, в зависимост от действията на четящия изпълнител текстът се представя по крива линия, вместо по стандартната права линия. При едно изпълнение кривата е или невидима, или значително по-слабо видима от представяния текст. При едно изпълнение кривата се променя в зависимост от действията на четящия изпълнител. При един пример хоризонталното отместване е по-голямо за по-високи тонове и е по-малко за по-ниски тонове. Тонът на думата може да се получи от фонетичен речник, т.е. може да бъде проверен, а не да се получава от гласа на говорител. При друг пример хоризонталното отместване се променя в зависимост от силата на гласа на четящия изпълнител. При едно примерно изпълнение действията на четящия изпълнител се потискат значително за получаване на рав

66265 Bl номерно плуваща, гладко извита линия.

Извиване на текст

Въведение

При говоримия език промяната на интонацията, височината и силата на тона при различните думи създава сигнал, който може да се разглежда като крива или траектория. От произнасянето дори на няколко думи от изречение, на “слухова дъска” се “начертава” началото на тази крива. Слушащият използва тази начална крива за създаване и предсказване в ума си на структурата на фразата или изречението като цяло, дори преди то да е напълно завършено от произнасящия.

Тази огромна информация прави говоренето и слушането много ефективни. Съвременната технология на представянето на текст обаче не позволява лесно създаването на система, която да представя съгласувано и значещо тези слухови криви в графична форма. Вместо това, четящият трябва да възстанови ликторската сила на изречението чрез декодиране на символите на текста и наум да пресъздаде слуховото представяне на изречението като цяло.

В рамките на едно изречение могат да се идентифицират сегменти на базата на анализ на същността, които имат характерни прозодични рамки. Настоящото изобретение описва метод за създаване на графични връзки на тези рамки на сегментите на изречението и за интегриране на тези графични подединици в по-голяма структура, изобразяваща изречението като цяло.

Процесът

1. Сегментите на изречението се идентифицират чрез използване на описаните по-горе алгоритми за “прегъване на изречението”.

2. Вместо правилата за хоризонтално отместване се дефинират набор криви, на всяка от които се присвоява сегмент от изречението.

3. Кривите се подреждат на полето за четене, следвайки модел, който еднозначно изобразява последователността от сегменти (напр. отгоре надолу); положението на сегментите в тази подредба може леко да се модифицира, без да се променя дадената последователност, с оглед оптимизацията на възприемането на кривите и четенето на изречението.

На Фиг. 13 е показан пример на главна крива 340, определяща размера и ориентацията на сегментни криви. На кривата 340 е разполо жена последователност от букви, напр. буквата “Н”, обозначена чрез 344. Крива на сегмент от изречение, начертана от Начална буква (А до G) до Крайна буква (Н до К), ще бъде ориентирана в полето за четене и по отношение на другите сегментни криви спрямо положение, отбелязано със стрелка 342 в горната част на кривата 340.

Положението на Началната буква върху кривата се определя от условията за започване на сегмент. Положението на Крайната буква се определя от условията за завършване на сегмент. Тези условия са систематизирани в таблица 350 на Фиг. 14.

След като алгоритмите за прегъване на изречение са идентифицирали сегментите на изречението, които ще заемат отделни редове (при това описание, те ще заемат отделни криви), се измерва дължината на сегмента. Начертава се линия, съответстваща на тази дължина. След това тази линия се “огъва” така, че формата (в градуси и ориентация) на новоформираната крива да съвпада с положенията на Началната и Крайната букви, определени на Фиг. 13 и 14. Определя се и точката “на окачване”, т.е. положението на стрелката в горния край на кривата.

Размерът на сегментната крива се определя чрез дължината й, измерена в брой символи; независимо от дължината обаче, формата и ориентацията на тази крива се определят по описания по-горе процес. Ако даден сегмент е много къс, т.е. извитият сегмент ще бъде много малък и кривината много голяма, се задава минимална кривина. Тогава къси сегменти с Н край се поставят на Начална буква, съответстваща на условията за започване - но остатъкът от сегмента следва кривата с минимална кривина, като “точката на окачване” се задава също от тази “минимална” крива. Аналогично, къси сегменти с крайна буква I, J или К се поставят в съответната крайна буква в зависимост от условията за завършване на сегмент, а остатъкът от сегмента следва кривата с минимална кривина и нейната “точка на окачване”.

Параметрите за максимална дължина на ред по всяка вероятност ще предотвратят появата на прекадено дълги сегменти, т.е. с толкова много символи, че кривите им да бъдат много дълги и сравнително плоски.

След това новоформираните криви се

66265 Bl позиционират, като в този пример това става чрез поставяне на първия сегмент от изречението отгоре. При едно изпълнение разположението на точката на окачване на следващия сегмент може да бъде функция на края на предния сегмент. След като всички криви са позиционирани, върху тях се разполагат символите на всеки сегмент, а линиите и точките на окачване се изтриват. Пример за този процес е показан на Фиг. 15 и 16.

Нови качества, придадени чрез процеса на извиване на текст

Този метод за представяне на текст позволява на четящия да разпознава, по специфичната крива на разположение на символите, структурата на отделния сегмент и функциите му (не само положението му) в цялостната структура на изречението. Това осигурява графична информация, улесняваща процеса на възприемане на сегментите на изречението при четене. Това е подобно на начина, по който промяната на интонацията и височината на тона при различните думи създава слухова крива, помагаща на четящия да предскаже дължината на фразата и дали тя е край на изречение или подчинено изречение.

Стандартният текст използва само пунктуационни знаци, които често се забелязват чак след като четящият е прочел цялата фраза - това пречи на четящия да си създаде съответстващ фонологичен модел на прочетеното преди прочитането на целия сегмент. Кривите, създадени чрез нашия процес, позволяват предварителното разпознаване на информацията за структурата и функцията на фразата, която да се използва за разпознаване на думи и възприемане на фрази. Тези криви се определят и по смисъл (т.е. по прегъващите думи), а не само по пунктуация. Също така те разграничават сегментите, получени при прегъването на изречението, чрез представяне на условията за начало и край на сегмента.

Обръщайки се към Фиг. 15, изречение 380 представлява първото изречение на Гетисбъргското обръщение, показано в каскадна форма, получена чрез алгоритмите (Стъпка 1 от частта “Процесът” по-горе). Колоната 386 показва началната 382 и крайната 384 букви за всеки ред от изречението. Това определя вида крива, който да бъде присвоен на всеки сегмент.

На Фиг. 16 е показано интегрирането на отделните сегментни криви от стъпка 3. Например, изречението 408 е извито по кривата 400, започ вайки от крайно положение А и завършвайки на крайно положение 404, с точка на окачване 406. Следващите сегменти са поставени под предхождащите ги сегменти чрез поставяне на точката на окачване на около две трети от дължината на кривата над тях. Положението на точките на окачване може да се оптимизира чрез допълнителни правила, базирани на съдържанието. При едно изпълнение се появяват само символите на текста, а линиите и Началните и Крайните букви - не. Последователността от извити текстови криви, получени чрез примера от Фиг. 15, е представена чрез кривите 410,412,414, 416 и 418.

Тези криви усъвършенстват “визуалната прозодия” на представянето на текста. Всяко изречение придобива далеч по-уникален визуален характер. Освен това кривите разкъсват монотонността на линейно представения текст, което може да намали умората на очните мускули.

Представяне на текстови йерархии

Друг аспект на настоящото изобретение осигурява усъвършенствано средство за представяне на текстови йерархии и разположението на четения текст в тези йерархии. Стандартната текстова йерархия, изброена от най-висок към най-нисък ранг, включва номер на том, част, глава, подраздел, страница, параграф, изречение. Настоящото изобретение осигурява метод за информиране на четящия за броя на единиците на всяко йерархично ниво, както и положението на четения текст в тази йерархия.

На Фиг. 17 е представена неотворена книга 200. Книгата се активира (избира) за четене от четящия, както е показано чрез “X”. Активирането (избирането) от четящия може да се осъществи по всеки известен метод, включително движение на курсора и чрез мишката. На Фиг. 18 книгата е избрана, отворена и изобразена като равнина 202, запълваща значителна част от екрана 201. Отварянето на книгата 201 разкрива множество глави 206. всяка от които има открито поле 204. При едно изпълнение, в полето на всяка глава е изписан номерът й, както е показано чрез 208. Чрез “X” на Фиг. 18 е показано избиране на глава 4, което води до “разтваряне” на главите на глава 4, както е показано на Фиг. 19.

На Фиг. 19 е илюстриран резултатът от из

66265 Bl бирането на глава 4. Показаните глави 206 са се разтворили на глава 4, показвайки нейните страници 210. Страниците 210 имат вертикални открити полета 212. При едно изпълнение на изобретението страниците са номерирани и подредени подобно на страниците на печатна книга. При друго изпълнение страниците са номерирани така, че да се използват преимуществата на усъвършенствания формат на представяне на текст, без да се прави аналог е печатно издадена книга. По-специално, страниците може да се форматират и номерират така, че да съдържат само максимален брой параграфи или максимален брой думи, в зависимост от това кое се достигне първо. При това изпълнение няма нужда параграфите да се разкъсват по страниците. Максималният брой думи и параграфи за предпочитане са приблизително равни на тези на стандартна печатна страница. При друго изпълнение на изобретението е зададен максимален брой страници в глава, например 50, като параграфите се разпределят равномерно в тези 50 страници. При последния пример на екрана се показват наймного само 50 страници. На Фиг. 19 чрез “X” е показано избиране от четящия на страница 3, при което страниците се разтварят там, както е показано на Фиг. 20.

На Фиг. 19А е показано алтернативно изпълнение на резултата от избирането на глава 4 от Фиг. 18. Главите 206 са изобразени разделени на глава 4, откривайки нейните страници 210 А, които имат хоризонтални открити полета 212А. При това изпълнение ранговете на текстовите йерархии са показани по такъв начин, че за йерархии от по-нисък ранг полетата са по-къси. В примера от Фиг. 19А полетата на страниците 21ОА са практически успоредни на полетата на главите 206 и са по-къси от тях.

На Фиг. 20 е показан резултатът от избирането на страница 3. Страниците 210 са отворени на страница 3, откривайки параграфите 214 в нея. Отначало са показани само хоризонтални открити полета за параграфи 216 в долната част на екрана. Избирането на параграф 3 от четящия е показано чрез “X”, при което параграфите се разделят при параграф 3, както е показано на Фиг. 21.

На Фиг. 21 е показан резултатът от избирането на параграф 3. Параграфите 214 се разделят при параграф 3, откривайки изреченията

218 с вертикални открити полета 220. При едно изпълнение първоначално се появява първото изречение, обозначено чрез 222. При друго изпълнение първоначално при отваряне на параграфа се появяват само отворените полета 220. Избирането на изречение 4 от четящия е показано на Фиг. 21 чрез “X” и предизвиква разделяне на изреченията при изречение 4, както е илюстрирано на Фиг. 22.

На Фиг. 22 е показан резултатът от избирането на изречение 4, обозначено чрез 223. Това изречение е текущото. При едно изпълнение завършването на четенето на изречение 4 се указва от четящия чрез активиране на компютърно периферно устройство, например бутон на мишката. При друго изпълнение завършването на четенето на изречението се отбелязва чрез изтичане на определен период от време, пресметнат в съответствие е теглото на изречението и предишната скорост на четене на четящия. При предпочитаното изпълнение определянето на завършване на четене на изречение може да се превключва както на режим време, така и на режим активиране от четящия. При едно изпълнение скоростта се настройва от четящия при използване напр. на плъзгач. Това позволява лесно увеличаване и намаляване на скоростта в зависимост от четения пасаж.

При обозначаване на завършване на четенето на изречение, се появява следващото. Съгласно Фиг. 22, при едно изпълнение изречение 4 се приплъзва наляво, откривайки изречение 5. При друго изпълнение изречение 4 и следващите изречения в параграфа се придвижват наляво с ширината на едно поле, като изречение 4 продължава да се придвижва докато застане под изречение 3. При това изпълнение четеното изречение може да се задържи в едно положение чрез придвижване на изречението преди текста му да стане видим за четящия. След прочитане на последното изречение от параграфа се отваря следващият параграф откривайки изреченията в него. Картината напомня Фиг. 21, но с открит или свален надолу следващ параграф.

В едно предпочитано изпълнение на изобретението последователните текстови йерархии са представени чрез равнини с последователни хоризонтални и вертикални открити полета. Казано по друг начин, използвайки терминологията на Microsoft Windows, последователните

66265 Bl текстови йерархии са представени чрез последователни хоризонтално и вертикално подредени равнини. При едно изпълнение, най-външната йерархия, с най-висок ранг, се появява зад вътрешните, с по-нисък ранг, йерархии, като отворените йерархии с по-нисък ранг са показани върху йерархиите с по-висок ранг. При друго изпълнение външните йерархии, с по-висок ранг, изглеждат по-близо до четящия, а вътрешните, с по-нисък ранг, са показани по-далече от четящия. При това изпълнение за предпочитане текущата отворена йерархия не се показва, с изключение на изречението, което се чете. При едно примерно изпълнение с хоризонтално подредени текстови единици и отворена текстова единица номер 3, текстовите единици изглеждат като разпръсната отворена колода карти, при които 1 е върху 2, което е върху горния край на 3, а 4 е под 3 и 5 е под 4. Единиците в горната част на екрана изглеждат по-близо до четящия, отколкото единиците в долната част на екрана. Такава е подредбата по отношение на параграфи, с отворен параграф 3, при изпълнението, показано на Фиг. 22.

При друго изпълнение текстовите единици от 1 до 3 са като описаните, но единица 4 е върху долния край на 3, а 5 е над всички без горния край на 4. При това подреждане при движение от външно поле единиците изглеждат отдалечаващи се от четящия до показване на отворения текст, след което изглеждат приближаващи се към четящия до достигане на противоположното външно поле. Тази подредба е аналогична на последователност от многопластови една в друга театрални завеси, където външната е най-отпред, повътрешните са зад външните и откриват по-тесен отвор от по-външните.

В общия случай ориентацията на полетата се променя в зависимост от представяното ниво на текстова йерархия. Докато при описаните изпълнения полетата са ориентирани последователно хоризонтално и вертикално, е 90 градуса отместване, в общия случай отместването може да бъде по-малко. При един пример йерархията от най-високо ниво има хоризонтални полета (илюстрирано чрез часовник - простиращи се от 9 h до 3 h), а следващото по-ниско ниво е с отместване от 30 градуса, простиращо се от 10 h до 4 h.

Обръщайки се отново към Фиг. 22, предс тавянето на текущо четената “книга” може да бъде обяснено без да се описва как четящият е стигнал до дадено изречение. Следващата пониска текстова йерархия е представена чрез главите 206, подредени хоризонтално и с хоризонтални открити полета 204. Следващата по-ниска йерархия, страниците 210, е наложена върху главите 206. Страниците 210 са подредени вертикално и са с вертикални открити полета 212. Следващата по-ниска йерархия, параграфите 214, са показани върху страниците 210 и са подредени хоризонтално, с хоризонтални открити полета 216. Следващата по-ниска йерархия, изреченията 218, е вертикално подредена, с вертикални открити полета 220.

Четящият може да визуализира разположението на четеното изречение в параграфа, на параграфа в страницата, на страницата в главата и на главата в книгата. Вмъкнатите плоски текстови йерархии могат да дадат на четящия триизмерно усещане за разположението на четения текст чрез използване на известни методи за тримерно осветяване (представяне на сянка) и перспектива, напр. получаване на сянка от плосък ръб и скосяване.

При едно изпълнение изреченията се представят на хоризонтално плъзгащи се равнини, а при друго - в последователност от хоризонтално подредени равнини, които се плъзгат хоризонтално, аналогично на параграфите 214 от Фиг. 22. При едно изпълнение се задава изреченията винаги да се представят в хоризонтално или вертикално подредени равнини, сменяйки хоризонтално с вертикално подреждане при увеличаване на ранга на йерархиите.

При някои текстове може да има голям брой текстови единици, например много голям брой страници в една глава или книга без глави. При такова положение може да се създадат изкуствени йерархии. При едно изпълнение може да се създаде йерархия тип “Порядък на десет”. Например, ако броят на главите е по-голям от 50, може да се създаде изкуствена единица от “10 глави”. Тази изкуствена единица може да се създаде или като йерархия от по-висок ранг, която се представя по съответния начин, или просто като единица от същия ранг, която се подрежда по същия начин, но се представя различно. При един пример, единицата “ 10 глави” се подрежда вертикално, а главите се под32

66265 Bl реждат хоризонтално. При друг пример и единиците “10 глави”, и главите се подреждат хоризонтално, но единицата “10 глави” е с потъмен цвят или по някакъв начин различен вид.

Представяне на текст върху срещулежащи страници

Съгласно друг аспект на изобретението се осигурява метод за представяне на текст на последователни страници. На Фиг. 23 са представени лява страница 250 с дясно поле 252 и дясна страница 254 с ляво поле 255, разположено зад дясното поле 252. Като лява страница 250 е показана страница номер 3, а като дясна страница 254 - страница номер 4. Чрез “X” е обозначено четенето на страница 3. Завършването на четенето на страница 3 може да бъде указано на системата чрез действие от страна на четящия или чрез изтичане на интервал време. При завършване на четенето на страница 3, показано със стрелка 251, страница 4 се представя “пред” страница 3, при което лявото поле 255 на дясната страница 254 закрива дясното поле 252 на лявата страница 250. След прочитане на страница 4, указано чрез стрелка 253, се представят новите страници, като в качеството на лява страница 250 се показва страница 5, а в качеството на дясна страница 254 - страница 6. По този начин се сменят лява и дясна страница, по подобие на стандартния начин на четене на печатни книги, към който са привикнали читателите.

На Фиг. 24 е илюстрирано друго изпълнение на изобретението. Показани са лява страница 260 с дясно поле 262 и дясна страница 264 с ляво поле 265, разположено зад десния отстъп 262. В качеството на страница 260 е показана страница номер 3, а в качеството на дясна страница 264 - страница 4. Чрез “X” е указана страница 3. След прочитане на страница 3, показано чрез стрелка 261, страница 4 излиза отпред, така че лявото поле 265 застава пред дясното 262. Освен това, при прочитане на страница 3, тя се замества от страница 5. Такава конфигурация е невъзможна при стандартните хартиени книги. След прочитане на страница 4, указано чрез стрелка 263, страница 5 излиза отпред, страница 4 се маха и се заменя със страница 6.

Изпълнението, илюстрирано на Фиг. 24, има предимството, че позволява разкъсването на сегменти по страници, осигурявайки винаги следващата страница на екрана. Това прави въз можно четящият да се придвижва от прочетения текст без да чака появата на следващия. Например, сегмент, разкъсан на страници 3 и 4, ще може да се прочете без необходимата пауза за показване на съдържанието на страница 4. Сегмент, разкъсан на страници 4 и 5, ще може да се прочете без необходимата пауза за показване на съдържанието на страница 5. Накратко, четящият може да чете електронно представен текст без да изчаква обръщането на страниците, като в същото време има познатото представяне на текст на две страници - едно връщане към подвързаните хартиени книги. Средната конфигурация от Фиг. 24 не е ограничена от подвързване.

Представяне на текст за четене отпред назад

На Фиг. 25 е илюстриран друг аспект на настоящото изобретение чрез екранно представяне на текст 280 с първи ред 282, втори ред 284, трети ред 286 и четвърти ред 288. Използвайки методи за представяне в перспектива, може да се направи така, че първият ред 282 да изглежда по-близо до четящия от втория 284, вторият 284 - по-близо от третия 286, и третият 286 - по-близо от четвъртия 288. При едно изпълнение на изобретението текстът се представя екран по екран или страница по страница, като всички редове на екрана, дори най-отдалечените, могат да бъдат прочетени. При едно изпълнение текущи четеният ред е указан като по-ярък или с по-голям контраст от текста, който не се чете. Четеният ред може да бъде достигнат чрез просветляващ курсор с ширината на ред, придвижван с вероятната скорост на четене на четящия. При вариант на това изпълнение полупрозрачен филтър с ширина един ред се придвижва върху четения ред, така че текстът, който не е на четения ред, изглежда леко замъглен и не толкова отчетлив като четения в момента текст.

На Фиг. 26 е показано представянето съгласно Фиг. 25, но с модифицирана страница 290, като текстът е придвижен с един ред напред. Първият ред 282 е избутан извън екрана, а найотпред сега е вторият ред 284. При това изпълнение на изобретението текстът може да се придвижва към четящия с по един ред. Със съвременните технологии текстът може да се развърта плавно напред към четящия. Може да се постигне ефект на перспектива чрез изобразяване

66265 Bl на по-долните редове с по-голям шрифт и поголеми междуредови разстояния. Могат да се използват и тримерни шрифтове. При едно предпочитано изпълнение текстът се представя като усъвършенстван текст след обработка чрез описаните методи за прегъване.

При друго изпълнение текстът се представя така, че да изглежда представян отпред назад при четене отдолу нагоре, както беше описано по-горе. При това изпълнение текстът не се придвижва гладко, а се представя статично, екран по екран, на страници, състоящи се от множество разкъсани части от редове.

Изпълненията, илюстрирани на Фиг. 25 и 26 използват естествения процес на обработка на образи, получен при човешката еволюция. Поточно, преди четенето човешките същества обработват информацията при ходене или придвижване напред по някакъв начин, като новата информация отначало е по-далечна и с времето при придвижване през местността се приближава. Писането на английски се осъществява отгоре надолу, позволявайки на пишещия да чете написаното на предишния ред. При писането отдолу нагоре авторът би закривал написаното с ръката си. Това е добре известно на левичарите в леко по-различна форма. Писането на английски става отляво надясно, позволявайки на дяснопишещите да виждат току-що написаните думи. Левичарите закриват написаното и често, за да компенсират това, заемат положение с извита пишеща ръка. Поради това при печатането е възприет начина отгоре надолу, използван при писане на ръка, без това да е необходимо. Настоящото изобретение освобождава представянето на текста от тази конвенция, позволявайки представянето чрез по-естествен, макар и по-нестандартен формат.

Промяна на моделите на преход при различни нива на текст

Съгласно друг аспект на изобретението моделите на преход между текстовите представяния се променят в зависимост от нивото или йерархичната структура на текста. При едно изпълнение преходът между изреченията в един параграф е различен от прехода между параграфи. Преходът между изречения може да се мени в зависимост от положението на изречението в параграфа. Преходът между параграфи може да се мени в зависимост от положението на параг рафа в главата или друга текстова йерархия, в която се намира.

При едно примерно изпълнение на изобретението преходът между параграфи се осъществява чрез разтваряне на представяното изречение преди представянето на следващото. Разтварянето може да бъде фино за първия параграф в главата, грубо за последния и на плавно променящи се по големина зрънца за междинно разположените параграфи. При друго примерно изпълнение, всяко последователно изречение в параграфа може да се представя като започващо по-надясно, по-надолу или и двете. По този начин при напредване в параграфа последователните изречения се движат надясно, надолу или и в двете посоки.

Съгласно друго изпълнение на изобретението, с параграфа, който се представя, се асоциира музикална тоналност на даден инструмент. При един пример с всеки параграф се асоциират едни и същи тоналност и инструмент. В началото на представянето на параграфа се изсвирват низходящ ред от тонове в съответната тоналност, чиито брой съответства на броя изречения в параграфа. В началото на представянето на всяко изречение се изсвирва съответният тон нагоре или надолу по гамата. При съответното примерно изпълнение се изсвирват брой тонове, който съответства на поредния номер или положението на изречението. При едно изпълнение ако изречението съдържа поне едно подчинено изречение, се изсвирва акорд. При друго изпълнение, ако изречението съдържа изрази за противопоставяне като “въпреки” или “обаче” може да се изсвири минорен или дисонантен акорд. При друго изпълнение за всеки параграф се използва различен инструмент и/ или тоналност.

Отделяне във времето

Съгласно друг аспект на изобретението някои думи се появяват за по-дълго време от останалите думи в изречението. При едно примерно изпълнение избраните думи се появяват порано от останалите. При друго примерно изпълнение избраните думи остават и след като останалите са престанали да се представят. При друго примерно изпълнение избраните думи се представят пред и след представянето на останалите думи. Счита се, че четящият обръща повече внимание на думите, представените преди или след

66265 Bl останалите. Счита се, че по-рано представените думи се регистрират и частично се анализират преди прочитането на останалата част от изречението, при което четящият следи думите по-внимателно и не е необходимо да се връща назад.

Съгласно едно изпълнение думите се избират на базата на предполагаемата трудност, която ще има с тях четящият. При едно примерно изпълнение за отделяне във времето се избират думи, които са над определено ниво на образование. При друго изпълнение за отделяне във времето се избират думи, при които има несъответствие между изписване и произношение. Тук под думи с несъответствие между произношение и изписване се разбират думи, чието про.изношение не може да бъде отгатнато по начина им на изписване. При друго примерно изпълнение се използва речник за честота на използване на думи, като за отделяне във времето се избират думи, които се срещат по-рядко.

Оцветяване на проза

Съгласно друг аспект на изобретението, за обозначаване на връзката на части от изречение с друго изречение се използва оцветяване, заедно с анализ на текста. Едно изпълнение на този метод може да включва описаните по-долу стъпки.

а. Анализиране на изречението и подразделянето му на множество текстови сегменти на базата на връзките между сегментите.

б. Организиране на текстовите сегменти в йерархично дърво с изходно матерно разклонение множество матерни и дъщерни разклонения.

в. Присвояване на всяко дъщерно разклонение на атрибут в зависимост от връзката му с матерното разклонение.

г. Присвояване на цвят на изходното разклонение.

д. Присвояване на цвят на всяко дъщерно разклонение под изходното разклонение, на базата на цвета на изходното разклонение, но модифициран според връзката между дъщерното и матерното разклонение.

е. Повтаряне на стъпка “д” до присвояване на цвят на всички разклонения.

ж. Представяне на текста на редове във вида, определен от автора, но с цветовете, присвоени на йерархичното дърво.

На Фиг. 27 е илюстрирано едно изпълне ние на описания алгоритъм, като матерно-дъщерните връзки са от групата, състояща се от обект, действие и модификация. Оригиналното изречение 300 е подразделено на три текстови сегмента 302,304 и 306, както е показано чрез дървото 301. Сегментът 302 има връзка “обект” с матерната единица 300, сегментът 304 - връзка “действие”, и сегментът 306 - връзка “действие”. Матерната единица 300, на ниво (поколение) 0 при 308, има троен начален цвят (Червено Зелено Синьо), обозначен като Ч 00-3 00-С 00. Количеството добавен цвят на всяко поколение може да зависи от номера на поколението. На Фиг. 27 са добавени 100 единици цвят за дъщерно разклонение от първото поколение 310, 50 единици за второто поколение 312 и 25 единици за третото поколение 314. Самият цвят се добавя в зависимост от матерно-дъщерната връзка. На Фиг. 27 за обекти се добавя Синьо, за действия Червено, а за модификация - Зелено.

На Фиг. 27, сегментът 302 има връзка “обект” с матерната единица 300 и е от първо поколение, така че се добавят 100 единици синьо. Добавеното количество цвят намалява с всяко поколение. По този начин функцията на всяка дума в изречението се влияе най-силно от функцията на най-големия сегмент, от който тя е част.

Нови качества, придадени чрез процеса на оцветяване на проза

Речта е комуникационна система, при която отделните произнесени единици, като напр. думи, имат собствено значение, а общото значение се изгражда чрез връзките между група думи. Последователността от думи е важна структурна информация, която се използва за изграждането на значението на връзките между думите. В рамките на последователностите от думи, между по-малките последователности от думи съществуват специално връзки. По този начин, поредицата от две или повече по-малки последователности от думи в рамките на по-голяма последователност представляват също вид структурна информация, която се използва за получаване на значението на връзките между всички думи.

Освен избирането на последователността, с която се произнасят думите, говорещият произнася всяка дума или група думи с определени звукови атрибути, които се добавят към простото произнасяне на фонемите и обозначават как

66265 Bl ва е думата. Тези допълнителни звукови атрибути включват височината и силата на тона, както и тембъра, с които се произнасят. Тези атрибути се заменят и комбинират така, че отделната дума във фразата се модифицира спрямо значението на същите атрибути за фразата като цяло.

Следователно тези допълнителни атрибути на произношението, като височина и сила на тона и тембър (обозначавани нататък като интонационни атрибути) представляват многомерна система от стойности, които се комбинират и заменят при последователни нива на диференциация на групи думи в рамките на по-големи групи думи. Тези стойности представляват връзката на думата (или думите) с по-голямата единица, от която са част.

Освен това, всяка подединица е в рамките на интонационните стойности, които са подходящи за непосредствения й контекст. Аналогично, по-голяма единица, която може да съдържа няколко собствени подединици, е свързана с още по-голямата единица, съдържаща подобни подединици, чрез промяна на тези интонационни стойности, подходяща за по-големия контекст.

Например, при внимателно прослушване на изречението “Лилавата шапка на лилавия клоун беше пъхната в лилава кутия” ще бъде различено, че интонационните стойности на всяка от думите “лилав” се различават по интонационен начин от по-големите единици, които се модифицират от всяка дума “лилав”. В първия случай “(лилавата) шапка” е главният обект (подлог) на изречението като цяло: в този случай интонационната стойност на “лилав” се изгражда от основен набор стойности, използван за представяне на главния обект.

Във втория случай фразата “на (лилавия) клоун” представлява сегмент, който има модифицираща връзка с фразата на подлога. Следователно втората дума “лилав” е по-тиха от първата, но все пак с височина, която я отделя от “клоун”, по същия начин, по който първата дума “лилав” се отделя от “шапка”.

В третия случай цялата фраза - “беше пъхната в лилавата кутия” се променя в различно интонационно измерение (тембърът е по-остър), отделяйки се от първата половина на изречението, като начин за обозначаване, че този сегмент е “действие” за цялото изречение. Подединиците на тази фраза запазват тази основна стойност на тем бъра и я модифицират чрез промяна на интонационните стойности на всяка подединица на базата на връзката на под единицата с по-големия сегмент, от който са част. По този начин, третата дума “лилав” все още има (в по-малкия контекст на връзката й с “(лилавата) кутия”) височина на тона, която я отличава от “кутия”, но има по-остър тембър отколкото първите две думи “лилав”, понеже като част от “беше сложена в (лилава) кутия” е в измерението “действие”.

За по-нататъшно илюстриране на тази интонационна структура, забележете как думата “шапка” има два различни набора интонационни стойности в следното изречение: “Лилавата шапка на лилавия клоун беше пъхната в кутията за шапки.” Втората дума “шапка” в това изречение има набор интонационни стойности, които обозначават модификационните й характеристики за обекта (“кутия”, допълнение) на сегмента за действие на изречението (“беше пъхната в”). За разлика от това, първата дума “шапка” има набор от интонационни стойности, които я поставят като главен обект на изречението като цяло. Във второто примерно изречение втората дума “шапка” има набор от стойности за височината и силата на тона и интонация, които са еквивалентни на тези за третата дума “лилав” в изречението от първия пример.

Както беше казано, тези измерения на интоналността в говоренето са комбинируеми и заменяеми стойности. Освен това те са прозрачни, в смисъл че се възприемат едновременно със словната единица, която носи отделна информация: следователно всяка произнесена дума носи пакет от синтактична и семантична информация. В такъв смисъл измеренията на интоналността не са обяснителни, т.е. не изискват допълнително произнасяне. Например, човек не произнася преди всяка фраза на изречението “Подлог - лилавата шапка - определение на подлога - на лилавия клоун - действие - беше сложена в -допълнение - лилавата кутия.”

Съществуващите обаче методи за представяне на връзките между групи думи в изречение, като йерархични дървета или граматически диаграми, не са прозрачни, а разчитат на допълнителни обяснителни бележки и символи за обозначаване на групите думи. От своя страна, тези обозначения са фиксирани и стойностите не се комбинират или заменят при последова

66265 Bl телно подразделяне на подединици, или пък тези стойности се ограничават в зависимост от контекста им.

Следователно желателно е усъвършенстваното представяне на текст да обогати външния вид на действителните думи от текста с визуални атрибути подобни на интонационните атрибути на речта. Тези визуални атрибути биха могли да създадат многомерна система от комбинируеми и заменяеми стойности, които да представят атрибутите на думите в допълнение към отделното им значение. Тези визуални атрибути трябва да бъдат прозрачни, т.е. да се възприемат едновременно с възприемането на самите думи.

Освен това, с изключение на случаите когато методът за представяне на текст осигурява еднозначното представяне на авторовата последователност от думи, това не е представяне на текст по смисъла на настоящото описание, а просто метод за демонстриране на резултатите от някои тесни аспекти на анализ на текст, които подчиняват целостта на авторовото послание на целите на този анализ.

Описаният процес на “оцветяване на проза” представя уникално тези интонационни условия на речта чрез еднозначно представяне на текст. Освен това, този процес представлява нов подход към самия синтактичен анализ поради това, че характеристиките като обект, действие и модификация, представляващи връзките между матерни и дъщерни сегменти, се комбинират и заменят при последователните нива на разделяне на изречение.

С други думи, не само че усъвършенстваното визуално представяне на текст трябва да се стреми към условията на речта, но и самият синтактичен анализ трябва да се стреми към условията на интоналността. Основно упражнение за проверка на граматическите правила в лингвистическия анализ е създаването на последователност от думи на базата на граматически правила и след това слушането на предложеното изречение за проверяване дали “звучи добре”. Както беше показано при обсъждането на интонационните стойности, възможно е вътрешното “разсъждаване”, чрез което “завършените изречения” се разпознават интуитивно като правилни предложения, да се осъществява чрез многомерна система от атрибути за връзките между подединиците с по-големите единици, външен израз на които е интоналността. Математиката на ума може да бъде музикална.

Този метод може да се използва за представяне на текст или чрез описаното прегъване, или чрез използване на стандартно представяне на текст, но с цветове. Също така методът може да спре преди сегментиране на изречение до думи. Например, алгоритъмът може да спре след определен брой нива или да остави фрази непроменени, оставайки всички думи във фразата с еднакъв цвят.

В настоящото описание бяха изтъкнати множество характеристики и предимства на изобретението, разкрито чрез този документ. Ясно е обаче, че това описание в много отношения е само илюстративно. Могат да се правят промени в детайлите, особено при комбиниране, разделяне и подреждане на стъпките, без да се излиза извън обхвата на изобретението. Този обхват е описан чрез приложените претенции.

Claims

1. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене - изречение, което има зададени от автора съдържание на символите и последователност на символите в съдържанието на символите, където изображението на продукта за четене съдържа само зададено от автора съдържание на символи, като методът включва:

а) извличане на специфичните атрибути на изречението, които специфични атрибути включват мярка за трудност на изречението, а представянето на изречението включва скорост на автоматично напредване в изречението и промяната на скоростта в съответствие с мярката за трудност на изречението, характеризиращ се с това, че се извършва и

б) промяна на хоризонталните и вертикалните позиции на части от символите от съдържанието на символите на изречението върху дисплея в съответствие с тези атрибути, поддържайки зададената от автора последователност на символите във визуално показваните модели на позициите на символите.

2. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 1, при кой

66265 Bl то специфичните атрибути на изречението включват разположение на изречението в рамките на целия документ, а представянето на изречението включва цвета на фона и промяната му в съответствие с разположението на изречението.

3. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 1, при който специфичните атрибути на изречението включват мярка за трудност на изречението.

4. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 3, при който мярката за трудност на изречението включва предполагаемото време за произнасяне на изречението.

5. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 3, при който мярката за трудност на изречението включва степента на сложност за даденото изречение.

6. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 1, при който:

а) атрибутите включват пунктуация и части на речта;

б) извличането на атрибутите включва разбиване на изречението на пунктуацията и части на речта;

в) промяната на представянето на изречението се осъществява чрез правила с входни и изходни данни;

г) входните данни за правилата включват споменатите части на речта;

д) представянето на изречението включва визуални атрибути; и

е) изходните данни от правилата включват споменатите визуални атрибути.

7. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 6, при който:

а) правилата включват правила за прегъване, като

б) правилата за прегъване разделят изречението на текстови сегменти; и

в) входните данни на правилата за прегъване включват пунктуация.

8. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 7, при който входните данни на правилата за прегъване включват също така и части на речта.

9. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 8, при който визуалните атрибути включват представяне на сегментите на изречението в цвят, зависещ от частите на речта.

10. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 8, при който визуалните атрибути включват представяне на сегментите на изречението на нов ред.

11. Метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 1, характеризиращ се с това, че методът се осъществява с компютър, като се извършва и количествена промяна на представянето на изречението в съответствие със специфичните атрибути на изречението.

12. Компютърно осъществяван метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 11, при който представянето на изречението еднозначно показва последователността на изречението.

13. Компютърно осъществяван метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 11, при който изречението се показва в перспектива, като сегментите на изречението, намиращи се над други сегменти, изглеждат по-далече от четящия, така че при четене на изречението отдолу нагоре изглежда, че изречението се чете отпред назад.

14. Компютърно осъществяван метод за обработка и представяне на текст, включващ получаване на изображение на продукт за четене съгласно претенция 11, при който представянето на изречение включва представяне на множество сегменти на изречението, като всяко представяне на сегменти на изречението има начално хоризонтално и вертикално отместване, което се променя количествено в зависимост от атрибутите.

15. Компютърно осъществяван метод за обработка и представяне на текст, включващ по

66265 Bl лучаване на изображение на продукт за четене съгласно претенция 11, при който атрибутите включват пунктуация и части на речта.

16. Компютърно осъществяван метод за обработка и представяне на текст, включващ по- 5 лучаване на изображение на продукт за четене, използващ зададено от автора изречение, където показването на последователност от символи в изречението е дословна последователност от символите, като методът се състои от следните стъпки:

а) извличане на специфичните атрибути от зададеното от автора изречение; при което съгласно метода се извършва и

б) промяна на показването на последователността от символи на изречението, така че множество сегменти на изречението са едновременно позиционирани по такъв начин, че се появяват в текстова каскада отгоре надолу и напречно, използвайки стойностите на извлечените специфични атрибути на изречението.