[go: up one dir, main page]

KR101223139B1 - Transformation method of markup data using multi thread - Google Patents

Transformation method of markup data using multi thread Download PDF

Info

Publication number
KR101223139B1
KR101223139B1 KR1020100139970A KR20100139970A KR101223139B1 KR 101223139 B1 KR101223139 B1 KR 101223139B1 KR 1020100139970 A KR1020100139970 A KR 1020100139970A KR 20100139970 A KR20100139970 A KR 20100139970A KR 101223139 B1 KR101223139 B1 KR 101223139B1
Authority
KR
South Korea
Prior art keywords
data
html
web page
xml
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020100139970A
Other languages
Korean (ko)
Other versions
KR20120077860A (en
Inventor
최이권
이승권
김남진
배종환
정현철
전현택
나성준
허정은
Original Assignee
모젼스랩(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모젼스랩(주) filed Critical 모젼스랩(주)
Priority to KR1020100139970A priority Critical patent/KR101223139B1/en
Publication of KR20120077860A publication Critical patent/KR20120077860A/en
Application granted granted Critical
Publication of KR101223139B1 publication Critical patent/KR101223139B1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/88Mark-up to mark-up conversion
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 HTML로 작성된 웹페이지를 호환성이 뛰어난 XML 데이터로 변환/생성하는 방법에 관한 것으로, 본 발명은 (A) 사용자로부터 HTML 언어로 작성된 변환 대상 웹페이지의 정보를 입력받는 단계와; (B) 상기 변환 대상 웹페이지 정보를 인터넷을 통해 수집하여 분석하는 단계와; (C) 상기 변환 대상 웹페이지를 구성하는 구성 객체에 각각 식별 스레드를 부여하는 단계와; (D) 상기 변환 대상 웹페이지 데이터를 상기 식별 스레드가 부여된 각 객체 단위로 분할하는 단계와; (E) 상기 (D) 단계에 의해 분할된 HTML 데이터를 각각 다수개의 프로세서들에게 할당하는 단계와; (F) 상기 (E) 단계에 의해 각각 할당된 HTML 데이터를 XML 데이터로 변환하는 단계; 그리고 (G) 상기 (F) 단계의 변환된 각각의 XML 데이터들을 병합하는 단계를 포함하여 수행된다. 이와 같은 본 발명에 따르면, HTML 언어로 작성된 웹 데이터를 XML 언어로 작성된 데이터로 변환함에 있어, 변환 속도가 향상되는 장점이 있다.The present invention relates to a method for converting / generating a web page written in HTML into highly compatible XML data. The present invention includes the steps of: (A) receiving information of a conversion target web page written in HTML language from a user; (B) collecting and analyzing the conversion target web page information through the Internet; (C) assigning identification threads to configuration objects constituting the conversion target web page; (D) dividing the conversion target web page data into each object unit to which the identification thread is assigned; (E) allocating the HTML data divided by the step (D) to a plurality of processors, respectively; (F) converting the HTML data allocated by the step (E) into XML data; And (G) merging the converted XML data of step (F). According to the present invention, in converting web data written in the HTML language into data written in the XML language, there is an advantage that the conversion speed is improved.

Description

다중 스레드를 이용한 마크업 데이터 변환 방법{TRANSFORMATION METHOD OF MARKUP DATA USING MULTI THREAD} TRANSFORMATION METHOD OF MARKUP DATA USING MULTI THREAD}

본 발명은 HTML로 작성된 웹페이지를 호환성이 뛰어난 XML 데이터로 변환/생성하는 방법에 관한 것으로, 중소기업청에서 발주한 '국내 휴대폰 콘텐츠개발을 위한 PC 기반의 통합 Builder 구현' 연구과제의 결과물이다.
The present invention relates to a method of converting / generating a web page written in HTML into highly compatible XML data. The present invention is the result of a research project of 'Integrated Builder Implementation based on PC for Domestic Mobile Phone Content Development' ordered by Small and Medium Business Administration.

지금까지 인터넷 환경의 주류를 이루던 유선망의 경우, 웹페이지는 HTML(Hyper Text Markup Language) 문서를 이용하여 구축되어 왔다.In the wired network, which has been the mainstream of the Internet environment, web pages have been constructed using Hyper Text Markup Language (HTML) documents.

여기서, HTML은 SGML 애플리케이션으로 World Wide Web 상에서 문서가 표시되는 규정을 말하는 것으로인터넷 프로토콜 간의 표준이다.Here, HTML refers to a regulation for displaying a document on the World Wide Web as an SGML application and is a standard among Internet protocols.

그러나, HTML은 1)태그가 한정되어 있어 태그에 포함된 의미를 전달하기 어렵고, 2)데이터의 계층구조를 표현할 수 없어 최근 사용자들의 요구에 맞는 기능들을 제공하지 못하는 단점이 있다.However, HTML has a disadvantage in that it is difficult to convey meaning included in a tag because 1) a tag is limited.

이에 따라 최근에는 W3C가 제안한 XML을 통한 웹페이지 구축이 확대되고 있다. 상기 XML은 사용자가 구조화된 데이터베이스를 사용하여 각 언어 간 확장 및 호환이 용이한 마크업 언어이다.Accordingly, the construction of web pages through XML proposed by the W3C has been recently expanded. The XML is a markup language that is easily extended and compatible between languages by using a structured database.

나아가 현재의 인터넷 환경이 유선 위주에서 무선 또는 유무선을 복합한 형태로 급속하게 발전하고 있으며, 서비스 제공자들은 이동 통신망에서 인터넷 서비스를 제공하기 위해 WML(Wireless Markup Language), mHTML(mHypertext Markup Language), HDML(Handheld Devices Markup Language), cHTML(cHypertext Markup Language) 등과 같은 무선언어와 호환이 가능한 XML을 이용하여 웹페이지를 구축하고 있다.Furthermore, the current Internet environment is rapidly developing from wired to wireless or wired and wireless, and service providers are using wireless markup language (WML), mHypertext Markup Language (mHTML), and HDML to provide Internet services in a mobile communication network. Web pages are constructed using XML compatible with wireless languages such as (Handheld Devices Markup Language) and cHTML (cHypertext Markup Language).

살핀 바와 같이, 종래 수십 년간 누적된 인터넷 상의 다양한 정보들은 HTML 언어를 이용하여 구축되어 왔고, 최근 발전하는 모바일 단말기에서 무선 인터넷을 통하여 종래 웹페이지를 구현하기 위하여 HTML로 작성된 데이터를 XML 데이터로 변환하는 과정이 필요하게 되었다.As described above, various informations accumulated on the Internet for decades have been constructed using the HTML language, and recently developed mobile terminals convert the data written in HTML to XML data to implement conventional web pages through the wireless Internet. The process was needed.

이러한 작업은 작업자들의 수작업에 의해서 이루어지기도 하지만, 최근에는 이를 위하여, HTML 데이터를 호환성이 높은 XHTML 또는 XML 데이터로 변환하는 시스템이 개발되어 사용되고 있다(KR 공개 10-2004-0038459호, 한국전자통신연구원).Although this work is performed by the manual labor of workers, recently, a system for converting HTML data into highly compatible XHTML or XML data has been developed and used (KR Publication No. 10-2004-0038459, Korea Electronics and Telecommunications Research Institute). ).

한편, 최근 시스템들은 다중 프로세서에 유리하도록 듀얼, 멀티 코어를 구비하여 다중 프로세싱이 가능하도록 설계되고 있고, 종래의 HTML 데이터의 변환 시스템은 이러한 최근 하드웨어 시스템을 충분히 활용할 수 없는 문제점이 있다.On the other hand, recent systems are designed to be capable of multiple processing with dual and multi-cores to favor multiple processors, and the conventional HTML data conversion system has a problem in that it cannot fully utilize such a recent hardware system.

또한, HTML로 작성된 데이터의 양은 누적된 기간 만큼이나 방대하여, 변환 작업의 속도를 향상시킬 수 있는 효율적인 마크업 언어 변화 방법의 필요성은 날로 대두되고 있는 실정이다.
In addition, since the amount of data written in HTML is as large as the accumulated period, there is a need for an efficient method of changing the markup language that can speed up the conversion work.

본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로서, 본 발명의 목적은, HTML 언어로 작성된 웹 데이터를 XML 언어로 변환함에 있어, 변환속도를 향상키는 변환 데이터 생성 방법을 제공하는 것이다.
SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is to provide a conversion data generation method for improving conversion speed in converting web data written in HTML language into XML language.

상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명은 (A) 사용자로부터 HTML 언어로 작성된 변환 대상 웹페이지의 정보를 입력받는 단계와; (B) 상기 변환 대상 웹페이지 정보를 인터넷을 통해 수집하여 분석하는 단계와; (C) 상기 변환 대상 웹페이지를 구성하는 구성 객체에 각각 식별 스레드를 부여하는 단계와; (D) 상기 변환 대상 웹페이지 데이터를 상기 식별 스레드가 부여된 각 객체 단위로 분할하는 단계와; (E) 상기 (D) 단계에 의해 분할된 HTML 데이터를 각각 다수개의 프로세서들에게 할당하는 단계와; (F) 상기 (E) 단계에 의해 각각 할당된 HTML 데이터를 XML 데이터로 변환하는 단계; 그리고 (G) 상기 (F) 단계의 변환된 각각의 XML 데이터들을 병합하는 단계를 포함하여 수행된다.According to a feature of the present invention for achieving the above object, the present invention includes the steps of (A) receiving information of the conversion target web page written in the HTML language from the user; (B) collecting and analyzing the conversion target web page information through the Internet; (C) assigning identification threads to configuration objects constituting the conversion target web page; (D) dividing the conversion target web page data into each object unit to which the identification thread is assigned; (E) allocating the HTML data divided by the step (D) to a plurality of processors, respectively; (F) converting the HTML data allocated by the step (E) into XML data; And (G) merging the converted XML data of step (F).

이때, 상기 제 (C) 단계는, 변환할 HTML 데이터를 구성하는 각 객체를 동일 종류별로 구분하여, 동일 객체들을 묶어 분할될 수도 있다.In this case, in the step (C), the objects constituting the HTML data to be converted may be classified by the same type, and the same objects may be bundled and divided.

그리고 상기 제 (G) 단계는, 변환된 HTML 데이터들을 상기 HTML 데이터에 포함된 식별 스레드 순서로 배열하여 생성될 수도 있다.
The (G) step may be generated by arranging the converted HTML data in the order of identification threads included in the HTML data.

본 발명에 따르면, HTML 언어로 작성된 웹 데이터를 XML 언어로 작성된 데이터로 변환함에 있어, 컴퓨터 시스템의 하드웨어 특성을 충분히 활용하여 데이터 변환 속도가 향상되는 장점이 있다.
According to the present invention, in converting web data written in the HTML language into data written in the XML language, the data conversion speed is improved by fully utilizing the hardware characteristics of the computer system.

도 1 은 본 발명에 의한 마크업 데이터의 변환을 구현하는 시스템을 도시한 블록도.
도 2 는 본 발명에 의한 마크업 데이터 변환 방법을 도시한 흐름도.
도 3 은 본 발명에 의한 마크업 데이터의 변환 방법을 개념적으로 도시한 예시도.
1 is a block diagram illustrating a system for implementing the conversion of markup data according to the present invention;
2 is a flowchart illustrating a markup data conversion method according to the present invention;
3 is an exemplary diagram conceptually illustrating a method of converting markup data according to the present invention;

이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명한다.Hereinafter, with reference to the drawings will be described in detail preferred embodiments of the present invention.

도 1 은 본 발명에 의한 마크업 데이터의 변환을 구현하는 시스템을 도시한 블록도이고, 도 2 는 본 발명에 의한 마크업 데이터 변환 방법을 도시한 흐름도이며, 도 3 은 본 발명에 의한 마크업 데이터의 변환 방법을 개념적으로 도시한 예시도이다.1 is a block diagram showing a system for implementing the conversion of markup data according to the present invention, FIG. 2 is a flowchart illustrating a markup data conversion method according to the present invention, and FIG. 3 is a markup according to the present invention. It is an exemplary diagram conceptually showing a data conversion method.

먼저, 도 1에 도시한 바와 같이, 본 발명을 구현하는 마크업 데이터 변환 시스템은 인터넷(200)을 통해 웹서버(300)로부터 수집된 HTML 웹 데이터를 XML 데이터로 변환하는 XML 변환기(100)를 포함하여 구성된다.First, as shown in FIG. 1, the markup data conversion system implementing the present invention includes an XML converter 100 for converting HTML web data collected from the web server 300 to XML data through the Internet 200. It is configured to include.

이를 위해 상기 XML 변환기(100)는 인터넷을 통해 웹서버(300)에 접속되고, 이를 통해 HTML 웹 페이지 데이터(400)들을 수집할 수 있다.To this end, the XML converter 100 is connected to the web server 300 through the Internet, through which the HTML web page data 400 can be collected.

한편, 상기 XML 변환기(100)는, 수집된 HTML 웹페이지 데이터를 다수개로 분할하는 분할처리부(110)와, 분할된 각 데이터를 XML 데이터로 변환하는 제1프로세서(122)와 제2프로세서(124) 내지 제N프로세서(126) 그리고 상기 제1프로세서(122) 내지 제N프로세서(126)에서 생성된 XML 데이터를 병합하는 병합 처리부(130)를 포함하여 구성된다.On the other hand, the XML converter 100, the division processing unit 110 for dividing the collected HTML web page data into a plurality, the first processor 122 and the second processor 124 for converting each divided data into XML data ) To an N-th processor 126 and a merge processor 130 for merging the XML data generated by the first processor 122 to the N-th processor 126.

이때, 상기 분할 처리부(110)는, 상기 HTML 데이터를 분할함에 있어, 전체 HTML 데이터의 구조를 파악하고, 상기 HTML 데이터를 구성하는 객체들을 분리하여 각각의 객체들에게 식별 스레드를 부여한다.At this time, the division processing unit 110, in dividing the HTML data, grasps the structure of the entire HTML data, separates the objects constituting the HTML data and assigns an identification thread to each object.

그리고 각 식별 스레드 별로, 상기 HTML 데이터를 분할한다.The HTML data is divided for each identification thread.

또한, 상기 제1프로세서(122) 내지 제N프로세서(126)는 상기 분할 처리부(110)에서 분할된 HTML 데이터를 각각 전달받아 XML 데이터로 변환하는 부분으로, XML 파서의 기능을 수행한다.In addition, the first processor 122 to the N-th processor 126 receive HTML data divided by the division processing unit 110 and convert the HTML data into XML data, respectively, and perform an XML parser function.

그리고 상기 병합 처리부(120)는 상기 제1프로세서(122) 내지 제N프로세서(126)에서 생성된 양분된 XML 데이터를 하나로 병합하여, 완전히 변환된 XML 데이터를 생성하는 부분이다.The merge processor 120 merges the bisected XML data generated by the first processor 122 to the N-th processor 126 into one to generate a completely converted XML data.

이하에서는 본 발명에 의한 마크업 데이터 변환 방법의 구체적인 실시예를 보다 상세하게 설명한다.Hereinafter, specific embodiments of the markup data conversion method according to the present invention will be described in more detail.

도 2에 도시한 바와 같이, 본 발명에 의한 마크업 데이터 변환 방법은, 마크업 데이터 변환 시스템에 접속한 사용자로부터 변환할 대상(URL 주소)을 입력받는 것으로부터 시작된다(S110).As shown in Fig. 2, the markup data conversion method according to the present invention starts from receiving a target (URL address) to be converted from a user connected to the markup data conversion system (S110).

이때, 상기 마크업 데이터 변환 시스템이 상기 변한 대상을 입력받으면, XML 변환기(100)는 인터넷 웹서버(300)를 통해 상기 변환대상 웹페이지의 정보를 수신하여 분석한다(S120). 이때 분석은 분할처리부(110)에서 수행되며, 분석 내용은 상기 변환 대상 웹페이지의 구조를 파악하는 것으로, 구체적으로는 상기 HTML 데이터의 테그(Tag) 정보를 독출하여 상기 HTML 데이터를 구성하는 객체를 파악하는 것을 말한다.At this time, when the markup data conversion system receives the changed object, the XML converter 100 receives and analyzes the information of the conversion target web page through the Internet web server 300 (S120). In this case, the analysis is performed by the division processing unit 110, and the analysis content is to identify the structure of the conversion target web page. Specifically, an object constituting the HTML data by reading tag information of the HTML data is read. Say something to grasp.

여기서 상기 객체는 상기 HTML 데이터를 구성하는 각 단위체를 말하는 것으로, HTML 언어의 경우 통상 <head>, <body> 등과 같이 '< >'로 구분된다.Herein, the object refers to each unit constituting the HTML data, and in the case of the HTML language, it is generally divided into '<>', such as <head> and <body>.

상기 웹페이지 구조의 일 예는 도 3에 원본 소스로 도시되어 있다An example of the webpage structure is shown in FIG. 3 as an original source.

그리고 상기 분할 처리부(110)는, 상기 제120 단계의 분석 결과를 이용하여, 상기 변환 대상 데이터에 포함된 각 객체들에게 식별 스레드를 순서대로 부여한다(S132).In addition, the division processing unit 110 assigns identification threads to the objects included in the conversion target data in order using the analysis result of step 120 (S132).

상기 식별 스레드는 상기 분할된 데이터의 변환 이후, 병합 과정에서, 변환된 데이터를 원본 데이터의 형태와 동일하게 유지하기 위한 식별 인자가 된다.The identification thread is an identification factor for maintaining the converted data in the same form as the original data in the merge process after the conversion of the divided data.

상기 식별 스레드를 부여한 일 예가 도 3에 도시되어 있다.An example of assigning the identification thread is shown in FIG. 3.

이 후, 상기 분할 처리부(110)는 상기 변환 대상 웹페이지 데이터를 다수개로 분할한다(S134).Thereafter, the division processing unit 110 divides the conversion target web page data into a plurality (S134).

이때, 분할 방법은 1) 상기 변환 대상인 HTML 데이터의 각 객체를 각각 분할 할 수도 있고, 또는 2) 상기 변환 대상인 HTML 데이터에 포함된 각 객체 중 동일 종류의 객체들을 묶어 분할할 수도 있다.In this case, the division method may include 1) dividing each object of the HTML data to be converted, or 2) grouping and dividing the same type of objects among the objects included in the HTML data to be converted.

상기 분할의 일 예가 도 3에 선으로 도시되어 있다.An example of such a division is shown by a line in FIG. 3.

그리고 상기 분할처리부(110)에서 식별 스레드가 부여되어 분할된 HTML 데이터는 제1프로세서(122) 내지 제N프로세서(126)에 각각 할당된다(S140).HTML data divided by the identification thread is assigned by the division processing unit 110 and assigned to the first processor 122 to the N-th processor 126, respectively (S140).

다음으로, 상기 제1프로세서(122) 내지 제N프로세서(126)는 할당받은 각 HTML 데이터를 XML 데이터로 변환한다(S150).Next, the first processor 122 to the N-th processor 126 converts each assigned HTML data into XML data (S150).

상기 HTML 데이터를 XML 데이터로 변환하는 것은, 'XML 파서'의 공지된 기술이므로, 본 명세서에서 상세히 설명하지는 않도록 한다.Since converting the HTML data into XML data is a known technique of an 'XML parser', it will not be described in detail herein.

한편, 상기 제1프로세서(122) 및 제N프로세서(126)에서 생성된 분할된 XML 데이터는 병합처리부(130)에서 병합되어, 완전히 변환된 XML 데이터가 생성된다(S160, S170).On the other hand, the divided XML data generated by the first processor 122 and the N-th processor 126 is merged in the merge processing unit 130, to generate a completely converted XML data (S160, S170).

이때, 상기 병합 과정에서 상기 병합처리부(130)는 생성된 XML 데이터를 상기 XML 데이터에 포함된 식별 스레드 별로 배열하여, 원본 데이터와 동일한 순서로 매열시켜 병합한다.In this case, in the merging process, the merging processing unit 130 arranges the generated XML data for each identification thread included in the XML data, merges them in the same order as the original data.

변환된 XML 데이터의 일 예가 도 3에 도시되어 있다.An example of transformed XML data is shown in FIG. 3.

본 발명의 권리는 위에서 설명된 실시예에 한정되지 않고 청구범위에 기재된 바에 의해 정의되며, 본 발명의 분야에서 통상의 지식을 가진 자가 청구범위에 기재된 권리범위 내에서 다양한 변형과 개작을 할 수 있다는 것은 자명하다.The rights of the present invention are not limited to the embodiments described above, but are defined by the claims, and those skilled in the art can make various modifications and adaptations within the scope of the claims. It is self-evident.

예를 들어, 전술한 변환 방법은 HTML 데이터를 XML 데이터로 변환하는 방법 뿐만 아니라, xHTML 데이터를 XML 데이터로 변환하는 경우, XML 데이터를 다양한 무선 마크업 언어로 변환하는 것에도 적용될 수 있다.
For example, the above-described conversion method may be applied not only to converting HTML data into XML data but also to converting XML data into various wireless markup languages when converting xHTML data into XML data.

본 발명은 HTML로 작성된 웹페이지를 호환성이 뛰어난 XML 데이터로 변환/생성하는 방법에 관한 것으로, 본 발명에 따르면, HTML 언어로 작성된 웹 데이터를 XML 언어로 작성된 데이터로 변환함에 있어, 컴퓨터 하드웨어의 특성을 충분히 활용하여 변환 속도가 향상되는 장점이 있다.
The present invention relates to a method of converting / generating a web page written in HTML into highly compatible XML data. According to the present invention, in converting web data written in HTML language into data written in XML language, the characteristics of computer hardware The advantage of using this method is that the conversion speed is improved.

100 : XML 변환기 110 : 분할 처리부
122 : 제1프로세서 124 : 제2프로세서
130 : 병합 처리부 200 : 인터넷
300 ; Web 서버 400 ; 웹페이지
100: XML converter 110: split processing unit
122: first processor 124: second processor
130: merge processing unit 200: the Internet
300; Web server 400; Web page

Claims (3)

(A) 사용자로부터 HTML 언어로 작성된 변환 대상 웹페이지의 정보를 입력받는 단계와;
(B) 상기 변환 대상 웹페이지 정보를 인터넷을 통해 수집하여 분석하는 단계와;
(C) 상기 변환 대상 웹페이지를 구성하는 구성 객체에 각각 식별 스레드를 부여하는 단계와;
(D) 상기 변환 대상 웹페이지 데이터를 상기 식별 스레드가 부여된 각 객체 단위로 분할하는 단계와;
(E) 상기 (D) 단계에 의해 분할된 HTML 데이터를 각각 다수개의 프로세서들에게 할당하는 단계와;
(F) 상기 (E) 단계에 의해 각각 할당된 HTML 데이터를 XML 데이터로 변환하는 단계; 그리고
(G) 상기 (F) 단계의 변환된 각각의 XML 데이터들을 병합하는 단계를 포함하여 수행되고:
상기 제 (C) 단계는,
변환할 HTML 데이터를 구성하는 각 객체를 동일 종류별로 구분하여, 동일 객체들을 묶어 분할함을 특징으로 하는 다중 스레드를 이용한 마크업 데이터 변환 방법.
(A) receiving information of the conversion target web page written in the HTML language from the user;
(B) collecting and analyzing the conversion target web page information through the Internet;
(C) assigning identification threads to configuration objects constituting the conversion target web page;
(D) dividing the conversion target web page data into each object unit to which the identification thread is assigned;
(E) allocating the HTML data divided by the step (D) to a plurality of processors, respectively;
(F) converting the HTML data allocated by the step (E) into XML data; And
(G) merging the transformed respective XML data of step (F), wherein:
Step (C) is,
Markup data conversion method using a multi-threaded, characterized in that each object constituting the HTML data to be converted by classifying the same type, the same object is grouped and divided.
삭제delete 제 1 항에 있어서,
상기 제 (G) 단계는,
변환된 HTML 데이터들을 상기 HTML 데이터에 포함된 식별 스레드 순서로 배열하여 생성됨을 특징으로 하는 다중 스레드를 이용한 마크업 데이터 변환 방법.
The method of claim 1,
The (G) step,
Markup data conversion method using a multi-threaded, characterized in that generated by arranging the converted HTML data in the order of the identification thread included in the HTML data.
KR1020100139970A 2010-12-31 2010-12-31 Transformation method of markup data using multi thread Expired - Fee Related KR101223139B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100139970A KR101223139B1 (en) 2010-12-31 2010-12-31 Transformation method of markup data using multi thread

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100139970A KR101223139B1 (en) 2010-12-31 2010-12-31 Transformation method of markup data using multi thread

Publications (2)

Publication Number Publication Date
KR20120077860A KR20120077860A (en) 2012-07-10
KR101223139B1 true KR101223139B1 (en) 2013-02-05

Family

ID=46711292

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100139970A Expired - Fee Related KR101223139B1 (en) 2010-12-31 2010-12-31 Transformation method of markup data using multi thread

Country Status (1)

Country Link
KR (1) KR101223139B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101243058B1 (en) * 2012-10-25 2013-03-13 한국과학기술정보연구원 Xml thesis constructing system and method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6012098A (en) 1998-02-23 2000-01-04 International Business Machines Corp. Servlet pairing for isolation of the retrieval and rendering of data
JP2000222275A (en) 1999-01-29 2000-08-11 Internatl Business Mach Corp <Ibm> Method, system, and storage medium for web page content adjustment
KR20010106666A (en) * 2000-05-22 2001-12-07 복인근 Method and System for extracting and storing data from HTML type web pages and Storing media extracted the data
KR20020061887A (en) * 2001-01-18 2002-07-25 장문성 Method for transforming document and recording media thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6012098A (en) 1998-02-23 2000-01-04 International Business Machines Corp. Servlet pairing for isolation of the retrieval and rendering of data
JP2000222275A (en) 1999-01-29 2000-08-11 Internatl Business Mach Corp <Ibm> Method, system, and storage medium for web page content adjustment
KR20010106666A (en) * 2000-05-22 2001-12-07 복인근 Method and System for extracting and storing data from HTML type web pages and Storing media extracted the data
KR20020061887A (en) * 2001-01-18 2002-07-25 장문성 Method for transforming document and recording media thereof

Also Published As

Publication number Publication date
KR20120077860A (en) 2012-07-10

Similar Documents

Publication Publication Date Title
US20060230100A1 (en) Web content transcoding system and method for small display device
CN113468448B (en) Page rendering methods and devices
CN110765385B (en) Method and system for browsing OFD document webpage end
Malik et al. Big-data: transformation from heterogeneous data to semantically-enriched simplified data
CN107391153B (en) Code generation method and device based on Spring and MyBatis framework integration
US20150067476A1 (en) Title and body extraction from web page
CN112947900B (en) Web application development method and device, server and development terminal
CN104765717A (en) Method and device for mass document format conversion
TWI539302B (en) Late resource localization binding for web services
EP2874071A1 (en) Method of implementing structured and non-structured data in xml document
KR101516213B1 (en) Responsive Web Generating Method By Converting Document To Responsive Web
CN105528369B (en) Webpage code-transferring method, device and server
KR101287371B1 (en) Method and Device for Collecting Web Contents and Computer-readable Recording Medium for the same
CN101196812A (en) Method for script language calling multiple output parameter interface by component software system
US20130159327A1 (en) Apparatus and method for visualizing data
KR101223139B1 (en) Transformation method of markup data using multi thread
Paternò et al. Automatically adapting web sites for mobile access through logical descriptions and dynamic analysis of interaction resources
KR102060660B1 (en) Method and Apparatus For Providing Web Browsing Service
US20060047693A1 (en) Apparatus for and method of generating data extraction definition information
KR101223138B1 (en) Transformation method of markup data using division processing
Sheng et al. Techniques on developing context‐aware web services
CN109783160B (en) Webpage file loading system and method for rapid transmission and rendering
Saralegi¹ et al. Kimatu, a tool for cleaning non-content text parts
JP5338487B2 (en) Syntax analysis device, syntax analysis method, and program
CN104965924B (en) A kind of date storage method and device

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

P14-X000 Amendment of ip right document requested

St.27 status event code: A-5-5-P10-P14-nap-X000

P14-X000 Amendment of ip right document requested

St.27 status event code: A-5-5-P10-P14-nap-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

FPAY Annual fee payment

Payment date: 20160112

Year of fee payment: 4

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

FPAY Annual fee payment

Payment date: 20170103

Year of fee payment: 5

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

FPAY Annual fee payment

Payment date: 20180105

Year of fee payment: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20190111

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20190111

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000