Claims (21)
1. Автоматизированный способ определения профиля доменного имени, включающий:1. An automated method for determining the profile of a domain name, including:
а. идентификацию статуса первой веб-страницы, ассоциированной с доменным именем, с помощью попытки получения первой веб-страницы;but. identifying the status of the first web page associated with the domain name by attempting to obtain the first web page;
б. определение назначения доменного имени на основе статуса первой веб-страницы, если попытка получения первой веб-страницы приводит к ошибке;b. determining a domain name assignment based on the status of the first web page if an attempt to obtain the first web page results in an error;
в. переход к шагам (г)-(к) только при успешной попытке получения первой веб-страницы;at. Going to steps (d) - (k) only if you successfully try to get the first web page;
г. извлечение первой веб-страницы доменного имени с помощью коммуникационной компьютерной сети;d. retrieving the first web page of the domain name using a communication computer network;
д. идентификацию множества дополнительных веб-страниц, связанных с доменным именем на основе гиперссылок, извлеченных из первой веб-страницы;e. the identification of many additional web pages associated with the domain name based on hyperlinks extracted from the first web page;
е. идентификацию статуса дополнительных веб-страниц с помощью попытки получения статуса дополнительной веб-страницы;e. identifying the status of additional web pages by attempting to obtain the status of an additional web page;
ж. определение приоритетов гиперссылок, извлеченных из первой веб-страницы на основе сравнения с предварительно установленными данными;g. prioritizing hyperlinks retrieved from the first web page based on a comparison with predefined data;
з. выделение контента из первой страницы и, по меньшей мере, из одной страницы множества дополнительных веб-страниц с помощью коммуникационной компьютерной сети, причем по меньшей мере одна страница из множества дополнительных веб-страниц выбрана на основе определения приоритетов;h. extracting content from the first page and from at least one page of the plurality of additional web pages using a communication computer network, wherein at least one page from the plurality of additional web pages is selected based on prioritization;
и. обработку контента с помощью таблицы предварительно установленных ассоциированных элементов данных для определения контекстных соответствий, существующих в контенте;and. processing the content using a table of predefined associated data elements to determine contextual matches that exist in the content;
к. определение назначения доменного имени на основе статуса первой веб-страницы, статуса дополнительных веб-страниц и контекстных соответствий, идентифицированных с помощью обработки контента; иk. determining the purpose of a domain name based on the status of the first web page, the status of additional web pages and contextual identifications identified by the content processing; and
л. выполнение, по меньшей мере, одного из отображения, хранения и/или отправки определенного назначения домена.l performing at least one of the display, storage and / or sending of a specific domain assignment.
2. Автоматизированный способ анализа домена, включающий: идентификацию статуса первой страницы, связанной с доменом;2. An automated method for analyzing a domain, including: identifying the status of the first page associated with the domain;
извлечение первой страницы;extracting the first page;
идентификацию множества дополнительных страниц из домена на основе гиперссылок из первой страницы;the identification of many additional pages from the domain based on hyperlinks from the first page;
идентификацию статуса дополнительных страниц;identification of the status of additional pages;
определение приоритета гиперссылок на основе сравнения с предварительно установленными данными;prioritization of hyperlinks based on comparison with predefined data;
выделение контента из первой страницы и, по меньшей мере, из одной страницы из множества дополнительных веб-страниц с помощью коммуникационной компьютерной сети, причем, по меньшей мере, одна страница из множества дополнительных веб-страниц выбирается на основе определения приоритетов;extracting content from the first page and at least one page from the plurality of additional web pages using a communication computer network, wherein at least one page from the plurality of additional web pages is selected based on prioritization;
обработку контента с помощью набора маркеров сигнатуры для определения контекстного соответствия;processing content using a set of signature markers to determine contextual match;
определение назначение домена в соответствии со статусом первой страницы, статусом дополнительных страниц и результатами обработки контента;determining the purpose of the domain in accordance with the status of the first page, the status of additional pages and the results of content processing;
выполнение по меньшей мере, одного из отображения, хранения и/или отправки определенного назначения домена.performing at least one of the display, storage and / or sending of a specific domain assignment.
3. Способ по п.2, в котором определение назначения домена дополнительно основано на, по меньшей мере, одном из определенного доменного имени, маркера посредника регистратора, отсутствия определенного типа данных, альтернативного сервера публикаций страниц, идентификатора социальных сообществ, а также типа данных, в контенте.3. The method according to claim 2, in which the determination of the domain’s purpose is additionally based on at least one of a specific domain name, a registrar intermediary token, the absence of a specific data type, an alternative page publishing server, an identifier of social communities, as well as a data type, in the content.
4. Способ по п.2, дополнительно содержащий: идентификацию одного или нескольких доменов на основе назначения; и4. The method according to claim 2, further comprising: identifying one or more domains based on the destination; and
определение категорий идентифицированных доменов, соответствующей категории домена, отличающейся от соответствующего назначения домена.determination of the categories of identified domains, the corresponding domain category, different from the corresponding domain purpose.
5. Способ по п.4, дополнительно содержащий идентификацию и извлечение соответствующих доменов на основе определенной категории и основного назначения домена.5. The method according to claim 4, further comprising identifying and extracting the corresponding domains based on a specific category and main purpose of the domain.
6. Способ по п.2, дополнительно содержащий идентификацию и извлечение соответствующих доменов на основе определенного статуса и назначения домена.6. The method according to claim 2, further comprising identifying and retrieving the corresponding domains based on the determined status and purpose of the domain.
7. Способ по п.2, в котором контент включает исполняемый код, встроенный в первую страницу или в дополнительные страницы, а набор маркеров сигнатуры конфигурируется для определения контекстных соответствий в рабочей программе.7. The method according to claim 2, in which the content includes executable code embedded in the first page or in additional pages, and the set of signature markers is configured to determine contextual correspondences in the work program.
8. Способ по п.2, в котором контент включает графическую, видео и аудио информацию, встроенную в первую страницу или в дополнительные страницы, а набор маркеров сигнатуры конфигурируется для определения контекстных соответствий в графической, видео и аудио информации.8. The method according to claim 2, in which the content includes graphic, video and audio information embedded in the first page or in additional pages, and the set of signature markers is configured to determine contextual correspondences in the graphic, video and audio information.
9. Способ по п.2, в котором следующие гиперссылки из первой страницы включают путем обхода переадресаций версии https веб-страницы.9. The method according to claim 2, in which the following hyperlinks from the first page include bypassing redirects to the https version of the web page.
10. Способ по п.2, дополнительно содержащий: получение входного набора доменов от пользователя;10. The method according to claim 2, further comprising: obtaining an input set of domains from the user;
идентификацию атрибутов, которые являются общими среди входных доменов из числа контекстно соответствующего контента; иidentification of attributes that are common among input domains from among contextually relevant content; and
вывод пользователю идентифицированных атрибутов.output to the user identified attributes.
11. Способ по п.2, дополнительно содержащий: получение входного набора назначений от пользователя;11. The method according to claim 2, further comprising: receiving an input set of appointments from the user;
идентификацию доменов, которые соответствуют входному набору назначений; иidentification of domains that correspond to the input set of destinations; and
вывод пользователю идентифицированных доменов.output to the user of identified domains.
12. Способ по п.4, дополнительно содержащий:12. The method according to claim 4, further comprising:
получение входного набора назначений и категорий от пользователя;receiving an input set of assignments and categories from the user;
идентификацию доменов, которые соответствуют входному набору назначений и категорий; иidentification of domains that correspond to the input set of assignments and categories; and
вывод пользователю идентифицированных доменов.output to the user of identified domains.
13. Способ по п.2, в котором идентификация статуса первой страницы включает:13. The method according to claim 2, in which the identification of the status of the first page includes:
попытку получения доменного имени первой страницы;attempt to get the domain name of the first page;
идентификацию статуса домена как нефункционального при неудаче получения доменного имени; иidentification of the status of a domain as non-functional in case of failure to obtain a domain name; and
идентификацию статуса как недоступного, если доменное имя получено, но контент недоступен; иidentification of the status as inaccessible if the domain name is received, but the content is not available; and
идентификация статуса дополнительных страниц включает:Identification of the status of additional pages includes:
попытку получения доменного имени или сетевого адреса первой дополнительной страницы;an attempt to obtain the domain name or network address of the first additional page;
идентификацию статуса домена как нефункционального, при неудаче получения доменного имени или сетевого адреса, иidentification of the status of the domain as non-functional, in case of failure to obtain a domain name or network address, and
идентификацию статуса как недоступного, если доменное имя получено, но контент недоступен.identification of the status as inaccessible if the domain name is received, but the content is not available.
14. Машиночитаемый носитель данных, хранящий команды, приспособленные для выполнения компьютером шагов, включающих:14. A computer-readable storage medium that stores instructions adapted for a computer to perform steps including:
идентификацию статуса первой страницы, связанной с доменом;identification of the status of the first page associated with the domain;
извлечение первой страницы;extracting the first page;
идентификацию множества дополнительных страниц из домена на основе гиперссылок из первой страницы;the identification of many additional pages from the domain based on hyperlinks from the first page;
идентификацию статуса дополнительных страниц;identification of the status of additional pages;
определение приоритета гиперссылок на основе сравнения с предварительно установленными данными;prioritization of hyperlinks based on comparison with predefined data;
выделение контента из первой страницы и, по меньшей мере, из одной страницы множества дополнительных веб-страниц, причем, по меньшей мере, одна страница из множества дополнительных веб-страниц выбрана на основе определения приоритетов;extracting content from the first page and from at least one page of the plurality of additional web pages, wherein at least one page from the plurality of additional web pages is selected based on prioritization;
обработку контента с помощью набора маркеров сигнатуры маркера для определения контекстного соответствия;processing content using a set of markers of the signature of the marker to determine contextual match;
определение назначение домена в соответствии со статусом первой страницы, статусом дополнительных страниц и результатами обработки контента;determining the purpose of the domain in accordance with the status of the first page, the status of additional pages and the results of content processing;
выполнение, по меньшей мере, одного из отображения, хранения и отправки определенного назначения домена.performing at least one of the mapping, storage and sending of a specific domain assignment.
15. Машиночитаемый носитель данных по п.14, причем определение назначения домена основано, по меньшей мере, на одном из определенного доменного имени, маркера посредника регистрации, отсутствия определенного типа данных, альтернативного сервера публикаций страниц, идентификатора социальных сообществ, а также типа данных, в контенте.15. The machine-readable storage medium of claim 14, wherein the determination of the domain’s purpose is based on at least one of a specific domain name, a registration intermediary token, the absence of a specific data type, an alternative page publishing server, social community identifier, and data type, in the content.
16. Машиночитаемый носитель данных по п.14, причем команды дополнительно включают:16. The computer-readable storage medium according to 14, and the commands further include:
идентификацию одного или нескольких доменов на основе назначения; иidentification of one or more domains based on destination; and
определение категорий идентифицированных доменов, причем соответствующие категории домена отличаются от соответствующего назначения упомянутого домена.defining the categories of identified domains, the corresponding domain categories differ from the corresponding purpose of the mentioned domain.
17. Машиночитаемый носитель данных по п.14, причем контент включает исполняемый код, встроенный в первую страницу или в дополнительные страницы, а набор маркеров сигнатуры конфигурирован для определения контекстных соответствий в рабочей программе.17. The computer-readable storage medium according to claim 14, wherein the content includes executable code embedded in the first page or in additional pages, and the set of signature markers is configured to determine contextual correspondences in the work program.
18. Машиночитаемый носитель данных по п.14, причем контент включает графическую, видео и аудио информацию, встроенную в первую страницу или в дополнительные страницы, а набор маркеров сигнатуры конфигурирован для определения контекстных соответствий в графической, видео и аудио информации.18. The computer-readable storage medium according to claim 14, wherein the content includes graphic, video and audio information embedded in the first page or in additional pages, and the set of signature markers is configured to determine contextual correspondences in the graphic, video and audio information.
19. Машиночитаемый носитель данных по п.16, причем команды дополнительно включают:19. The computer-readable storage medium according to clause 16, and the commands further include:
получение входного набора назначений и категорий от пользователя;receiving an input set of assignments and categories from the user;
идентификацию доменов, которые соответствуют входному набору назначений и категорий; иidentification of domains that correspond to the input set of assignments and categories; and
вывод пользователю идентифицированных доменов.output to the user of identified domains.
20. Машиночитаемый носитель данных по п.14, причем идентификация статуса первой страницы включает:20. Machine-readable storage medium according to 14, and the identification of the status of the first page includes:
попытку получения доменного имени первой страницы;attempt to get the domain name of the first page;
идентификацию статуса домена как нефункционального при неудаче получения доменного имени; иidentification of the status of a domain as non-functional in case of failure to obtain a domain name; and
идентификацию статуса как недоступного, если доменное имя получено, но контент недоступен,identification of the status as inaccessible if the domain name is received, but the content is not available,
идентификация статуса дополнительных страниц включает:Identification of the status of additional pages includes:
попытку получения доменного имени или сетевого адреса первой дополнительной страницы;an attempt to obtain the domain name or network address of the first additional page;
идентификацию статуса домена как нефункционального при неудаче получения доменного имени или сетевого адреса; иidentification of the status of a domain as non-functional in case of failure to obtain a domain name or network address; and
идентификацию статуса как недоступного, если доменное имя получено, но контент недоступен.identification of the status as inaccessible if the domain name is received, but the content is not available.
21. Устройство, содержащее21. A device containing
электронный блок связи, сконфигурированный для обмена данными по электронной сети;an electronic communication unit configured to exchange data over an electronic network;
средство для идентификации статуса первой страницы, связанной с доменом;means for identifying the status of the first page associated with the domain;
средство для извлечения первой страницы;means for extracting the first page;
средство для идентификации множества дополнительных страниц из домена на основе гиперссылок из первой страницы;means for identifying multiple additional pages from the domain based on hyperlinks from the first page;
средство для идентификации статуса дополнительных страниц;means for identifying the status of additional pages;
средство для определения приоритета гиперссылок на основе сравнения с предварительно установленными данными;means for determining the priority of hyperlinks based on comparison with predefined data;
средство для выделения контента из первой страницы и, по меньшей мере, из одной страницы из множества дополнительных веб-страниц, причем, по меньшей мере, одна страница из множества дополнительных веб-страниц выбрана на основе определения приоритетов;means for extracting content from the first page and at least one page from the plurality of additional web pages, wherein at least one page from the plurality of additional web pages is selected based on prioritization;
средство для обработки контента с помощью набора маркеров сигнатуры для определения контекстного соответствия;means for processing content using a set of signature markers to determine contextual match;
средство для определения назначения домена в соответствии со статусом первой страницы, статусом дополнительных страниц и результатами обработки контента; иmeans for determining the purpose of the domain in accordance with the status of the first page, the status of additional pages and the results of content processing; and
по меньшей мере, одно из отображения и хранение, которое отображает и хранит определенное назначение домена, соответственно.
at least one of a display and storage that displays and stores a specific domain assignment, respectively.