WO2010093084A1

WO2010093084A1 - 분산 스페이스를 이용하여 분산 프로그래밍 환경을 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체

Info

Publication number: WO2010093084A1
Application number: PCT/KR2009/002014
Authority: WO
Inventors: 김우현; 김두호; 윤태일
Original assignee: NHN Corp
Current assignee: NHN Corp
Priority date: 2009-02-11
Filing date: 2009-04-17
Publication date: 2010-08-19
Anticipated expiration: 2011-08-11
Also published as: US8799619B2; JP5646511B2; US20120030446A1; KR100983479B1; JP2012517631A; KR20100091757A

Abstract

본 발명은 분산 스페이스를 이용하여 분산 프로그래밍 환경을 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다. 본 발명의 일 태양에 따르면, 분산 환경에서 데이터를 처리하기 위한 방법으로서, 다수의 노드가 제공하는 자원을 이용하여 가상 스페이스를 생성하는 단계, 및 제1 어플리케이션이 상기 가상 스페이스로부터 데이터를 읽거나 상기 가상 스페이스에 데이터를 쓰는 단계를 포함하고, 상기 데이터는 상기 데이터의 속성에 따라 결정되는 상기 가상 스페이스 상의 특정 위치 영역에 맵핑되고, 상기 제1 어플리케이션은 상기 위치 영역에 상기 데이터에 대한 읽기 작업 또는 쓰기 작업을 수행하는 방법이 제공된다.

Description

분산 스페이스를 이용하여 분산 프로그래밍 환경을 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체

본 발명은 분산 스페이스를 이용하여 분산 프로그래밍 환경을 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다. 보다 상세하게는, 본 발명은 다수의 노드 또는 프로세스(process)가 접근할 수 있는 분산 스페이스를 생성하고, 상기 분산 스페이스를 통하여 데이터가 공유될 수 있도록 함으로써 분산 프로그래밍이 가능하도록 하는 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다.

네트워크 통신 기술의 발전으로 인하여 원격 컴퓨터들 간에 대용량 데이터의 전송이 용이하게 되었고, 이에 따라, 다수의 컴퓨터가 협력하여 하나의 작업을 처리하는 분산 프로그래밍(또는 컴퓨팅) 기술이 점차 보편화되어 가고 있다.

이와 같은 분산 프로그래밍 환경을 구축하기 위한 주요 기술로서 SBA(Space-Based Architecture)를 들 수 있다. SBA는 튜플 스페이스(tuple space)를 이용하여 상태 기반의(stateful) 고성능 어플리케이션들의 선형 확장성(scalability)을 달성하기 위한 소프트웨어 구조 패턴으로서, 예일 대학의 David Gelernter에 의해 제안된 린다(Linda)의 튜플 스페이스 개념으로부터 출발한다. SBA에 따르면, 모든 분산 프로세스들은 스페이스를 기반으로 하여 상호 통신과 자원 공유를 수행하기 때문에 서로에 대한 자세한 정보를 알 필요가 없고, 시간과 공간의 제약 없이 단순한 인터페이스만으로도 다양한 방식의 분산 프로그래밍이 가능하게 된다는 장점을 가진다.

최근 DHT(Distributed Hash Table)라는 비중앙집권형 분산 시스템 이 주목 받고 있는데, DHT는 해쉬 테이블(hash table)과 유사한 룩업(lookup) 서비스를 제공하는 특징을 가지고 있다. DHT는 자원의 균등한 분산과 구조화된 토폴로지(topology)에 의해 네트워크의 확장성과 강건함(robustness)을 보장하면서도, 빠른 룩업 서비스를 제공할 수 있기 때문에 P2P 서비스와 같은 다양한 분야에서 활용되고 있다.

이러한 DHT의 기술적 우위에도 불구하고, 분산 환경에서 대규모 계산 문제에 관하여 이를 적용한 사례를 찾기는 쉽지 않은 것이 사실이다. 이에 따라, SBA와 DHT의 장점을 모두 포괄하는 새로운 분산 프로그래밍 환경에 대한 필요성이 대두되고 있다.

본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.

또한, 본 발명은 작업의 분배를 통해 분산 처리의 효율성을 증대시키되, 분산 프로그래밍 환경의 선형적 확장성을 보장하는 것을 다른 목적으로 한다.

또한, 본 발명은 구조화된 토폴로지를 기반으로 하여 데이터에 대한 접근이 빠르게 수행될 수 있도록 하는 것을 또 다른 목적으로 한다.

본 발명에 의하면, 대규모의 계산 문제를 다수의 컴퓨터를 이용하여 분산 처리함으로써 작업의 효율성을 증대시킬 수 있다.

본 발명에 의하면, 분산 프로그래밍 환경의 선형적 확장성이 보장되는 효과를 달성할 수 있다.

본 발명에 의하면, 분산 프로그래밍 환경 하에서 데이터에 대한 접근이 빠르게 수행되도록 할 수 있다.

도 1은 본 발명의 일 실시예에 따른 전체 시스템의 구성을 개략적으로 나타내는 도면이다.

도 2는 본 발명의 일 실시예에 따른 가상 스페이스를 예시적으로 나타내는 도면이다.

도 3 내지 도 4는 본 발명의 일 실시예에 따른 두 가지 방식의 마스터-워커 모델을 도시하고 있다.

도 5 내지 도 6은 본 발명의 일 실시예에 따라 장애 조치가 수행되는 모습을 예시적으로 나타내는 도면이다.

도 7은 3-copy 리플리케이션 정책 하에서 노드가 추가된 경우 수행되는 데이터 교환을 예시적으로 나타내는 도면이다.

<주요 도면부호에 관한 간단한 설명>

100: 통신망

200: 클러스터

200a~200f: 노드

210~270: 가상노드

300: 어플리케이션

상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.

본 발명의 일 태양에 따르면, 분산 환경에서 데이터를 처리하기 위한 방법으로서, 다수의 노드가 제공하는 자원을 이용하여 가상 스페이스를 생성하는 단계, 및 제1 어플리케이션이 상기 가상 스페이스로부터 데이터를 읽거나 상기 가상 스페이스에 데이터를 쓰는 단계를 포함하고, 상기 데이터는 상기 데이터의 속성에 따라 결정되는 상기 가상 스페이스 상의 특정 위치 영역에 맵핑되고, 상기 제1 어플리케이션은 상기 위치 영역에 상기 데이터에 대한 읽기 작업 또는 쓰기 작업을 수행하는 방법이 제공된다.

본 발명의 다른 태양에 따르면, 분산 환경에서 데이터를 처리하기 위한 시스템으로서, 다수의 노드가 제공하는 자원을 이용하여 생성되는 가상 스페이스, 및 상기 가상 스페이스로부터 데이터를 읽거나 상기 가상 스페이스에 데이터를 쓰는 제1 어플리케이션을 포함하고, 상기 데이터는 상기 데이터의 속성에 따라 결정되는 상기 가상 스페이스 상의 특정 위치 영역에 맵핑되고, 상기 제1 어플리케이션은 상기 위치 영역에 상기 데이터에 대한 읽기 작업 또는 쓰기 작업을 수행하는 시스템이 제공된다.

이 외에도, 본 발명을 구현하기 위한 다른 방법, 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.

이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.

[본 발명의 바람직한 실시예]

전체 시스템의 구성

도 1에 도시되어 있는 바와 같이, 본 발명의 일 실시예에 따른 전체 시스템은, 통신망(100), 분산 프로그래밍 환경을 구성하는 클러스터(200), 및 분산 프로그래밍 환경을 기반으로 하여 수행되는 다수의 어플리케이션(300)으로 구성될 수 있다.

먼저, 통신망(100)은 유선 및 무선과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다.

본 발명의 일 실시예에 따르면, 클러스터(200)는 다수의 컴퓨터(이하, "노드"라고 칭함)로 구성되고, 분산 프로그래밍이 수행될 수 있도록 연산 장치, 메모리 등과 같은 자원을 어플리케이션(300)에 제공하는 기능을 수행할 수 있다. 즉, 본 발명의 일 실시예에 따른 클러스터(200)는 다수의 어플리케이션(300)이 데이터 또는 프로그램 코드를 공유할 수 있도록 장치를 제공하고, 어플리케이션(300)의 요청에 따라 특정 데이터를 제공하거나, 어플리케이션(300)이 요청한 작업을 수행한 결과를 어플리케이션(300)에 반환할 수 있다.

또한, 본 발명의 일 실시예에 따르면, 다수의 노드로 구성된 클러스터(200)가 제공하는 자원은 하나의 통합 스페이스를 형성하므로, 어플리케이션(300)은 마치 하나의 컴퓨터와 작업을 수행하는 것처럼 동작할 수 있다.

또한, 본 발명의 일 실시예에 따르면, 상기 통합 스페이스의 각 영역은 어플리케이션(300)의 요청에 따라 적어도 하나의 가상 스페이스(virtual space)에 맵핑될 수 있고, 상기 가상 스페이스에는 특정 어플리케이션(300)들만이 접근할 수 있도록 함으로써, 공통된 작업을 수행하고자 하는 다수의 어플리케이션(300) 간에 통신이나 데이터 공유가 가능하도록 하고, 서로 독립된 어플리케이션(300)들 간의 간섭이 배제되도록 할 수 있다.

본 발명의 일 실시예에 따르면, 어플리케이션(300)은 클러스터(200)를 이용하여 분산 프로그래밍 작업을 수행하고자 하는 프로그램일 수 있다.

본 발명의 일 실시예에 따르면, 어플리케이션(300)은 가상 스페이스로부터 데이터를 읽는 작업을 수행하거나 가상 스페이스에 데이터를 쓰는 작업을 수행함으로써, 다른 어플리케이션(300)과 통신할 수도 있고, 이를 통해 분산 프로그래밍이 수행될 수도 있다.

한편, 도 1에서 어플리케이션(300)은 클러스터(200)를 구성하는 노드와 물리적으로 분리된 다른 컴퓨터 상에서 실행되는 것처럼 도시되어 있지만, 본 발명의 다른 실시예에 따르면, 어플리케이션(300)은 클러스터(200) 내에 포함된 노드 상에서 동작하는 프로그램일 수 있다. 또한, 본 발명에 있어서 어플리케이션(300)이란 소정의 작업을 수행하거나 소정 작업의 수행을 돕기 위하여 설계된 프로그램을 통칭하는 것으로서, 응용 프로그램만이 아니라, 프로세스, 쓰레드(thread) 등을 포괄하는 최광의의 의미로 이해되어야 할 것이다.

데이터의 저장 및 이용

본 발명의 일 실시예에 따르면, 특정 작업을 수행하고자 하는 어플리케이션(300)은 해당 어플리케이션에 할당된 가상 스페이스에 데이터를 저장하거나 저장된 데이터를 이용함으로써 해당 작업을 수행하게 된다. 보다 구체적으로는, 어플리케이션(300)에 의해 다루어지는 데이터는 (key, value)의 쌍으로 구성될 수 있다. 여기서, key는 데이터에 대한 인덱스로서 기능할 수 있고, value는 데이터의 값일 수 있다.

본 발명의 일 실시예에 따르면, 상기와 같은 데이터는 소정의 기준에 따라 가상 스페이스 내에 저장되는데, 그 구체적인 태양을 도 2를 참조하여 설명하면 다음과 같다.

도 2를 참조하면, 가상 스페이스는 적어도 하나의 가상 노드(210~270)가 제공하는 스페이스들이 통합된 것으로서, 마치 하나의 거대 메모리와 같이 표현된 것을 알 수 있다. 따라서, 가상 노드(210~270)는 가상 스페이스의 영역을 다수의 섹션으로 구분 짓는 기준점의 기능을 수행할 수 있다. 또한, 각각의 가상 노드(210~270 중 하나)가 제공하는 스페이스는 각각의 가상 노드(210~270 중 하나)가 생성되어 있는 노드(200a~200f) 상에 존재하는 특정 자원(예를 들면, 메모리)에 맵핑될 수 있다. 여기서, 특정 노드(예를 들면, 200a)가 가상 노드를 생성한다는 것은 상기 노드(200a)의 자원(예를 들면, 메모리의 일 영역)이 해당 가상 노드에 할당되는 것을 의미한다.

본 발명의 일 실시예에 따르면, 도 2에 도시된 각각의 가상 노드(210~270 중 하나)는 적어도 하나의 노드(200a~200f)에 의해 생성될 수 있다. 예를 들면, 가상 노드 F(260)와 가상 노드 G(270)가 모두 노드(200a)에 의해 생성될 수도 있고, 가상 노드 F(260)는 노드(200a)에 의해 생성되고, 가상 노드 G(270)는 노드(200b)에 의해 생성될 수도 있다.

본 발명의 일 실시예에 따르면, 가상 스페이스에 데이터가 저장되는 경우, 저장된 데이터는 가상 스페이스 내의 특정 영역에 맵핑될 수 있다. 보다 구체적으로는, 데이터의 key에 소정의 해쉬 함수를 적용하여 가상 스페이스 내에 맵핑시킬 수 있을 것이다. 도 2를 참조하면, 특정 데이터의 key를 파라미터로 하여 해쉬 함수를 적용하면, 상기 데이터가 가상 스페이스의 3107 영역에 맵핑되는 것을 볼 수 있다.

본 발명의 일 실시예에 따르면, 각각의 가상 노드(210~270 중 하나)에는 각각의 가상 노드(210~270 중 하나)가 담당할 수 있는 가상 스페이스의 데이터 영역에 관한 정보가 ID(이하, "스페이스 ID"라고 함)의 형태로 부여되어 있을 수 있다. 도 2를 참조하면, 가상 노드 F(260)의 경우 스페이스 ID로서 "2906"이 부여되어 있고, 가상 노드 G(270)의 경우 스페이스 ID로서 "3485"가 부여되어 있는 것을 확인할 수 있다. 이와 같은 스페이스 ID를 이용하여 가상 스페이스 내의 데이터를 각각의 가상 노드에 분배할 수 있다. 예를 들면, 도 2의 가상 노드 F(260)의 경우, 자신의 스페이스 ID인 2906 이상이고 가상 노드 G(270)의 스페이스 ID인 3485 미만인 가상 스페이스 영역 내로 맵핑되는 데이터에 대한 처리(예를 들면, read, write, take 등)를 담당할 수 있을 것이다.

위와 같은 스페이스 ID는 다양한 방식으로 부여될 수 있다. 본 발명의 일 실시예에 따르면, 스페이스 ID는 분산 프로그래밍 환경을 관리하는 운영자에 의하여 수동으로 부여될 수도 있지만, 가상 스페이스가 생성되거나 가상 스페이스에 참여하는 가상 노드의 수가 변경됨에 따라 자동적으로 결정되도록 할 수도 있을 것이다.

보다 구체적으로는, 가상 노드에 부여되는 스페이스 ID는 가상 스페이스에 저장되는 데이터가 맵핑될 수 있는 영역과 밀접하게 관련되어 있으므로, 데이터를 가상 스페이스 내에 맵핑시키는 데에 이용되는 해쉬 함수와 동일한 해쉬 함수를 이용하여 결정될 수 있을 것이다. 본 발명의 일 실시예에 따르면, 스페이스 ID의 결정을 위하여 해쉬 함수에 입력되는 파라미터에는 가상 노드를 생성한 노드의 IP 주소 정보, 통신 포트 정보, 가상 스페이스의 속성 정보, 가상 스페이스의 명칭 정보 등이 포함될 수 있다.

상기와 같이 가상 스페이스에 데이터를 저장하는 방식이 실제 분산 프로그래밍 환경에 적용된 모습의 일 예로서, 대규모 작업이 다수의 세그먼트로 분할되어 다수의 어플리케이션에게 분배되는 경우를 상정할 수 있다. 즉, 특정 어플리케이션이 대규모 작업을 분산 처리가 가능한 다수의 부분 작업으로 분할하여 이를 분산 스페이스에 저장함으로써, 상기 부분 작업들이 다수의 다른 어플리케이션에 의해 분산 처리되도록 할 수 있다.

본 발명의 일 실시예에 따르면, 상기와 같은 방법에 따라 저장되는 데이터는 해당 데이터에 대한 read/take 작업을 수행하고자 하는 어플리케이션(300)에 의해 동일한 방식으로 룩업될 수 있다. 즉, 어플리케이션(300)이 특정 key를 가지는 데이터를 룩업하고자 하는 경우, 해당 key에 해쉬 함수를 적용하여 가상 스페이스 내에서의 위치를 획득하고, 해당 위치 영역에 대한 처리를 담당하는 가상 노드로부터 상기 key에 대응되는 데이터를 획득할 수 있을 것이다.

본 발명의 다른 실시예에 따르면, 가상 스페이스에 저장된 데이터에 대한 룩업은 지역성이 보장되는 방식으로 수행될 수 있다. 즉, 어플리케이션(300)이 룩업할 수 있는 가상 스페이스의 영역을 가상 스페이스 내의 특정 영역으로 제한할 수 있다. 예를 들면, 어플리케이션1에게는 가상 노드 A(210) 및 가상 노드 B(220)가 담당하는 영역에 대한 룩업만을 허용하고, 어플리케이션2에게는 가상 노드 B(220) 및 가상 노드 C(230)가 담당하는 영역에 대한 룩업만을 허용하며, 어플리케이션3에게는 가상 노드 D(240) 및 가상 노드 E(250)가 담당하는 영역에 대한 룩업만을 허용할 수 있다. 이때, 가상 스페이스에 저장되는 데이터를 미리 샘플링하여 데이터의 특성을 파악함으로써 데이터가 가상 스페이스 상에서 고르게 분포됨에 따라 분산 프로그래밍이 보다 효율적으로 수행되도록 할 수 있다. 이는, 데이터 처리의 지역성이 보장되는 마스터-워커 모델이나 스캐터-개더 모델에서 더욱 중요할 수 있는데, 데이터 처리 모델에 관한 구체적인 내용은 후술하기로 한다.

본 발명의 일 실시예에 따르면, 가상 스페이스를 이용하는 다수의 어플리케이션(300)이 가상 스페이스에 참여하는 노드(200a~200f) 상에 존재하는 경우에 상기와 같은 방식을 채택하게 되면, 데이터를 처리하고자 하는 어플리케이션(300)이 룩업할 수 있는 가상 스페이스의 영역을 해당 어플리케이션(300)이 존재하는 노드로부터 생성된 가상 노드들이 담당하는 영역으로 한정할 수 있고, 따라서, 데이터를 할당하는 어플리케이션(300)에 의해 작업이 분산되는 과정에만 네트워크 통신이 요구될 뿐, 데이터를 처리하고자 하는 어플리케이션(300)이 분산된 작업을 처리하는 과정에는 네트워크 통신이 불필요하게 되므로, 분산 프로그래밍 과정에서 네트워크에 걸리는 부하를 줄일 수 있다는 장점을 가질 수 있다.

이때, 특정 어플리케이션(300)이 2개 이상의 가상 노드에 대하여 룩업할 수 있는 경우, 어느 가상 노드가 우선시되어야 하는지에 대하여는 다양한 기준이 있을 수 있는데, 예를 들면, 복수의 가상 노드를 순차적으로 또는 임의적으로 룩업할 수도 있고, 가장 큰 용량의 데이터가 저장된 가상 노드를 우선하여 룩업하는 경우도 상정할 수 있을 것이다.

또한, 상기와 같은 지역성의 보장은 데이터의 룩업 과정뿐만 아니라, 데이터의 저장 과정에도 이용될 수 있는데, 예를 들면, 작업을 분산시키는 어플리케이션(300)이 자신에게 허용된 특정 영역에만 데이터를 저장하고, 분산된 작업을 처리하는 어플리케이션(300)은 임의의 가상 노드로부터 데이터를 룩업하여 처리하는 방식도 가능할 것이다.

이하에서는, 본 발명의 일 실시예에 따른 가상 스페이스를 이용하여 작성되는 실제의 분산 프로그래밍 코드의 예를 살펴봄으로써, 본 발명을 보다 구체적으로 살펴보기로 한다.

1. 클라이언트-서버 모델

클라이언트(client)-서버(server) 모델은 분산 환경을 위한 대표적인 네트워크 프로그래밍 모델이다. 본 발명의 일 실시예에 따른 클라이언트-서버 모델은 하나의 가상 스페이스를 할당 받고 서로 다른 key를 대상으로 write-take 함수를 사용함으로써 쉽게 구현할 수 있다.

표 1은 본 발명의 일 실시예에 따른 클라이언트-서버 모델의 실제 구현 코드를 예시적으로 나타내고 있다.

<표 1: 클라이언트-서버 모델의 분산 프로그램 코드의 예>

표 1의 프로그램 코드를 살펴보면, 네트워크 관련 이슈들(socket, thread, process, signal, pipe 등)은 분산 스페이스 클래스(상기 코드에 따르면 "Coord" 클래스)에 감추고, 사용자는 단지 write 메쏘드(method) 또는 take 메쏘드 등을 이용하여 분산 스페이스에 접근 가능하도록 함으로써 사용자가 자신의 개발 목적과 의도에만 집중할 수 있도록 투명한 분산 환경을 지원한다. 따라서, 사용자는 클라이언트-서버 모델을 개발하기 위한 별도의 네트워크 관련 프로그래밍에 대하여 숙지할 필요가 없게 된다는 장점이 있다.

2. 마스터-워커 모델

마스터(master)-워커(worker) 모델은 분산 환경에서 로드 밸런스(load balance)를 유지하는 병렬 처리(parallel processing)를 지원하기 위하여 유용하게 활용될 수 있다. 따라서, 분산 환경에서 병렬 처리를 수행하기 위하여 마스터-워커 모델이 가지는 의미는 매우 크다고 할 수 있다.

도 3 내지 도 4를 참조하면, 본 발명의 일 실시예에 따른 마스터-워커 모델은 크게 두 가지 방식으로 실행될 수 있음을 알 수 있다. 하나는 도 3에 나타난 바와 같이 마스터와 워커들 사이에서 동일 key를 사용하여 write-take 작업을 수행함으로써 작업을 분배하는 방식이고, 다른 하나는 도 4에 나타난 바와 같이 마스터가 다양한 key로 write 작업을 수행하고 워커들은 자신이 할당 받은 분산 스페이스 영역의 key에 관해서만 take 작업을 수행하는 방식이다. 전자의 경우에는 워커들이 마스터의 작업을 경쟁적으로 할당 받아 처리하고, 후자의 경우에는 마스터가 작업을 균등하게 분산시키면, 워커들은 자신에게 할당된 작업만 지역성을 보장하면서 처리하게 된다.

표 2는 본 발명의 일 실시예에 따른 마스터-워커 모델의 실제 구현 코드를 예시적으로 나타내고 있다.

<표 2: 마스터-워커 모델의 분산 프로그램 코드의 예>

표 2의 프로그램 코드를 살펴보면, 마스터와 워커가 "job"이라는 공통된 key를 사용하여 write-take 작업을 수행함으로써 작업이 분배되는 것을 확인할 수 있다. 상기와 같은 마스터-워커 모델의 장점은 마스터의 경우 워커들이 어디에 위치해 있고 얼마나 많은지를 인식할 필요가 없다는 사실이다. 마스터는 단지 자신이 해결하고자 하는 작업을 분산 스페이스에 입력하는 것으로 충분하며, 워커들은 작업이 할당되는 것을 대기하고 있다가 할당된 작업을 수행하기만 하면 된다.

본 발명의 일 실시예에 따르면, 상기와 같은 마스터-워커 모델에 스케쥴러의 기능을 추가할 수 있다. 스케쥴러는 작업의 큐잉 타임(queuing time)과 프로세싱 타임(processing time)을 모니터링하면서 워커의 개수를 동적으로 조절할 수 있다. 즉, 처리할 작업이 증가하거나 작업의 수행 시간이 길어지면 사용 가능한 노드 또는 가상 노드에 워커를 더 할당함으로써 전체 작업의 처리 성능을 향상시킬 수 있다.

3. 스캐터-개더 모델

스캐터(scatter)-개더(gather) 모델은 대용량 데이터를 분산 처리할 때에 유용하게 사용된다. 본 발명의 일 실시예에 따른 스캐터-개더 모델은 데이터를 분산하는 즉시 데이터를 수집 처리할 수 있는 on-the-fly 방식을 지원하므로 다양한 장점을 가질 수 있다. 이는 분산 환경을 위한 pipeline과 같은 것으로 실시간으로 대량의 리퀘스트(request)를 효율적으로 분산 처리해야 하는 경우에 탁월한 효과를 가질 수 있다.

본 발명의 일 실시예에 따르면, 스캐터-개더 모델은 다수의 스캐터가 처리될 작업을 가상 스페이스에 입력하면, 다수의 개더가 가상 스페이스에 입력된 데이터를 할당 받아 처리하는 방식일 수 있다. 이때, 앞서 클라이언트-마스터 모델에서 설명한 바와 같이, 개더는 동일한 key를 이용하여 경쟁적으로 작업을 할당 받을 수도 있고, 자신만의 가상 스페이스 영역에 할당된 작업만을 처리함으로써 지역성을 보장 받을 수도 있을 것이다.

표 3은 본 발명의 일 실시예에 따른 스캐터-개더 모델의 실제 구현 코드를 예시적으로 나타내고 있다.

<표 3: 스캐터-개더 모델의 분산 프로그램 코드의 예>

표 3의 프로그램 코드를 살펴보면, 스캐터가 get_kv() 메쏘드를 이용하여 임의의 key를 생성하여 데이터를 가상 스페이스에 입력하면, 개더는 입력된 데이터의 key를 구별하지 않고, 자신에게 할당된 영역에 입력된 데이터에 대하여 작업을 수행하는 것을 확인할 수 있다. 상기와 같은 스캐터-개더 모델의 장점은 스캐터에서 단순히 (key, value) 쌍으로 데이터를 입력하면, 가상 스페이스로 데이터가 고르게 분산되고, 개더는 자기 자신에게 할당된 데이터만 처리하는 방식으로 지역성이 보장되기 때문에 성능 향상에 도움이 될 수 있다는 점이다. 뿐만 아니라 on-the-fly 방식으로 데이터를 분산하고 수집하여 처리하기 때문에 분산 처리의 효율성이 높아진다는 장점도 있다.

장애 조치

본 발명의 일 실시예에 따른 분산 프로그래밍 환경은 데이터 리플리케이션(data replication) 방식으로 장애에 대처할 수 있다. 이는, 하나의 노드(여기서, 노드는 물리적 노드와 가상 노드를 통칭하는 의미로 사용됨)에 저장되는 데이터를 다른 노드에 중복하여 저장함으로써, 특정 노드에 장애가 발생하는 경우에도 장애가 발생한 노드의 데이터를 복구할 수 있도록 하는 방식이다.

도 5 내지 도 6은 본 발명의 일 실시예에 따라 장애 조치가 수행되는 모습을 예시적으로 나타내는 도면이다. 상기 도면에서는 하나의 노드에 존재하는 데이터가 다른 2개의 노드에 복제되어 총 3개의 카피(3-copy)가 유지되는 상황을 가정하였다.

도 5를 참조하면, 특정 어플리케이션(300)에 의해 입력된 데이터 a가 노드 D에 맵핑되어 저장되는 경우, 노드 D에 저장되는 데이터 a는 노드 D의 후속 노드인 노드 E 및 노드 F에 복제되어 저장될 수 있다.

한편, 도 6은 노드 D에 장애가 발생한 경우 데이터 a에 접근하고자 하는 어플리케이션(300)의 동작에 관하여 도시하고 있는데, 보다 구체적으로는, 어플리케이션(300)은 노드 D에서 데이터 a에 대한 룩업에 실패하는 경우, 노드 D의 후속 노드인 노드 E 및 노드 F에 대하여 순차적인 룩업을 수행함으로써 데이터 a를 획득할 수 있다. 만약 노드 E에서 데이터 a에 대한 룩업이 성공하는 경우, 노드 F에서의 룩업은 생략될 수 있을 것이다.

상기와 같은 n-copy 리플리케이션 정책이 가상 스페이스에 노드가 추가되거나 제외되는 경우에도 유지될 수 있도록 하기 위해서는, 가상 스페이스에 노드가 추가되거나 삭제되는 시점에 데이터의 교환이 수행되어야 한다.

도 7은 3-copy 리플리케이션 정책 하에서 노드가 추가된 경우 수행되는 데이터 교환을 예시적으로 나타내는 도면이다. 도 7은 노드 A, B, C, D, E 및 G로 구성된 가상 스페이스에서 노드 E와 노드 G 사이에 노드 F가 추가된 상황을 가정하여 도시되었다.

도 7에 도시된 상황에서, 3-copy 리플리케이션 정책을 유지하기 위하여는, 노드 D 및 노드 E의 데이터가 새로이 추가된 노드 F에 복제되어야 하고, 기존에 노드 G가 담당하던 데이터 역시 노드 F로 복제되어야 할 것이다. 즉, 새로이 추가된 노드를 space_id라고 가정하고, 임의의 노드 x의 선행 노드 및 후행 노드를 각각 predecessor(x) 및 successor(x)로 가정하면, 다음과 같은 세 단계의 과정이 수행될 수 있다.

1. successor(space_id)는 space_id에게 space_id가 담당할 데이터를 전달한다.

2. predecessor(space_id)는 space_id에게 space_id가 리플리케이션할 데이터를 전달한다.

3. predecessor(predecessor(space_id))는 space_id에게 space_id가 리플리케이션할 데이터를 전달한다.

상기와 같은 프로세스는 가상 스페이스 상에서 특정 노드가 제외되는 경우에도 유사하게 구현될 수 있을 것이다.

기타 실시예

이하에서는, 본 발명의 이해를 돕기 위하여, 본 발명에 따른 분산 프로그래밍 환경을 이용하여 작업을 처리하는 실시예를 살펴보기로 한다.

본 발명의 일 실시예에 따른 분산 프로그래밍 환경은 대용량의 데이터를 정렬하기 위한 병합 정렬(merge sort) 작업에 이용될 수 있다.

일반적으로 분산 프로그래밍 환경에서 수행되는 대규모 데이터에 대한 병합 정렬 작업은, 병합 정렬될 데이터를 n개의 노드에 분배하여 각각의 노드에서 데이터의 단편에 대하여 부분적으로 정렬이 수행되도록 한 후, 정렬된 n개의 데이터 단편들 중 일부를 정렬 기준에 부합하게 병합하여 새로운 데이터 단편을 생성하는 과정을, 모든 데이터 단편이 하나의 데이터로 병합될 때까지 반복하여 수행함으로써 이루어지게 된다. 이때, 병합이 반복되는 횟수가 증가할수록 데이터 단편의 노드 간 이동 횟수가 증가하므로 네트워크의 부하가 증가하고 처리 능력이 저하되게 된다.

그러나, 본 발명에 따른 분산 프로그래밍 환경 하에서는, 상기와 같은 문제점을 최소화시킨 채로 병합 정렬을 수행할 수 있는데, 그 구체적인 과정은 다음과 같다.

우선, 병합 정렬될 데이터를 n 개의 프로세스에 분배하여 각각의 노드가 정렬될 데이터를 소정의 해쉬 함수를 이용하여 분산 스페이스에 저장하게 된다. 이때, 해쉬 함수를 적절히 설정하는 경우, 저장되는 데이터가 정렬 기준에 따라 분산 스페이스 내의 소정의 영역에 맵핑될 수 있다. 예를 들면, 정렬될 데이터가 1,000 이하의 자연수로 구성되고, 가상 스페이스가 10개의 가상 노드로 구성되는 경우, 해쉬 함수가 모듈라(modular) 연산을 포함하게 함으로써 1~100 사이의 데이터는 가상 노드 1의 영역에 맵핑되고, 101~200 사이의 데이터는 가상 노드 2의 영역에 맵핑되며, 901~1,000 사이의 데이터는 가상 노드 10의 영역에 맵핑되도록 할 수 있을 것이다. 이와 같은 경우, 각각의 가상 노드의 영역에 저장된 데이터를 정렬한 후, 가상 노드 1의 영역에 저장된 데이터부터 가상 노드 10의 영역에 저장된 데이터까지를 순차적으로 병합함으로써 병합 정렬 작업을 완료할 수 있게 된다. 이와 같은 방법에 따르는 경우, 기존의 병합 정렬 방식에 비하여 노드 간의 데이터 전송량이 감소하므로 네트워크의 부하를 줄일 수 있고, 반복적인 병합 과정이 생략되므로 처리 능력이 향상되는 것을 확인할 수 있다.

이때, 주의하여야 할 점은, 데이터의 특성에 따라 데이터가 가상 스페이스에 편중적으로 맵핑될 수 있다는 것이다. 예를 들면, 상기 병합 정렬의 예에서 정렬될 데이터가 몇몇 숫자들로만 구성되는 경우, 특정 가상 노드에 데이터가 집중되게 되어, 분산 프로그래밍의 효율이 저하될 수 있다.

본 발명의 일 실시예에 따르면, 가상 스페이스에 데이터를 저장하기 이전에, 저장될 데이터 집합에 대한 샘플링 작업을 통하여 데이터의 특성을 파악함으로써 상기와 같은 상황을 방지할 수 있다. 앞서 예시한 병합 정렬 작업을 예로 들어 보다 자세히 설명하면, 병합 정렬이 수행될 데이터의 일부를 샘플링하고, 샘플링된 데이터에 해쉬 함수를 적용하여 본 결과, 1~300 사이의 값을 가지는 데이터의 개수가 10퍼센트 정도를 차지하는 것으로 파악되는 경우, 가상 노드 1의 영역에 1~300 사이의 데이터가 저장될 수 있도록 해쉬 함수를 조정하거나 가상 노드 1이 담당하는 가상 스페이스 상의 영역을 늘림으로써 일부의 가상 노드에 데이터가 편중되는 현상을 방지할 수 있을 것이다.

한편, 본 발명의 일 실시예에 따른 분산 프로그래밍 환경은 레거시 코드(legacy code)를 재사용하기 위한 모델에도 적용될 수 있다. 보다 구체적으로는, 대부분의 소스 코드는 부분적으로라도 시스템의 플랫폼에 종속되는 특성이 있는데, 시스템의 플랫폼이 업그레이드되거나 변경되는 경우에 기존의 소스 코드에 대한 변경 작업이 필요할 수밖에 없다. 그러나, 본 발명에 따른 분산 프로그래밍 환경 하에서는, 레거시 코드에 의해 처리되는 데이터를 분산 스페이스를 통해 입출력함으로써 레거시 코드를 재사용할 수 있는 효과를 달성할 수 있다. 보다 구체적으로는, 시스템의 플랫폼이 변경되는 경우에도, 분산 스페이스에 저장되는 데이터의 형식을 일정하게 유지함으로써 레거시 코드에 의한 데이터 처리 결과가 변경된 플랫폼 하에서도 적용되도록 할 수 있을 것이다.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims

분산 환경에서 데이터를 처리하기 위한 방법으로서,

다수의 노드가 제공하는 자원을 이용하여 가상 스페이스를 생성하는 단계, 및

제1 어플리케이션이 상기 가상 스페이스로부터 데이터를 읽거나 상기 가상 스페이스에 데이터를 쓰는 단계

를 포함하고,

상기 데이터는 상기 데이터의 속성에 따라 결정되는 상기 가상 스페이스 상의 특정 위치 영역에 맵핑되고,

상기 제1 어플리케이션은 상기 위치 영역에 상기 데이터에 대한 읽기 작업 또는 쓰기 작업을 수행하는 방법.
제1항에 있어서,

상기 다수의 노드의 각각은 상기 가상 스페이스에서 적어도 하나의 가상 노드에 대응되는 방법.
제1항에 있어서,

상기 위치 영역은 상기 데이터에 소정의 해쉬 함수를 적용함으로써 결정되는 방법.
제3항에 있어서,

상기 해쉬 함수는 상기 데이터를 상기 가상 스페이스 상의 특정 위치로 맵핑시키기 위한 것인 방법.
제4항에 있어서,

상기 해쉬 함수에 의해 처리되는 데이터는 미리 샘플링된 것인 방법.
제5항에 있어서,

상기 해쉬 함수, 또는 상기 다수의 노드의 각각이 제공하는, 상기 가상 스페이스의 일 영역은, 상기 샘플링을 통하여 조절될 수 있는 방법.
제1항에 있어서,

상기 쓰여진 데이터를 제2 어플리케이션에 제공하는 단계를 더 포함하는 방법.
제7항에 있어서,

상기 제1 어플리케이션 및 상기 제2 어플리케이션은 동일한 키(key)를 공유하는 방법.
제8항에 있어서,

상기 데이터의 속성은 상기 키를 포함하고, 상기 제2 어플리케이션은 상기 키를 이용하여 상기 데이터를 획득하는 방법.
제1항 내지 제9항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체.
분산 환경에서 데이터를 처리하기 위한 시스템으로서,

다수의 노드가 제공하는 자원을 이용하여 생성되는 가상 스페이스, 및

상기 가상 스페이스로부터 데이터를 읽거나 상기 가상 스페이스에 데이터를 쓰는 제1 어플리케이션

을 포함하고,

상기 데이터는 상기 데이터의 속성에 따라 결정되는 상기 가상 스페이스 상의 특정 위치 영역에 맵핑되고,

상기 제1 어플리케이션은 상기 위치 영역에 상기 데이터에 대한 읽기 작업 또는 쓰기 작업을 수행하는 시스템.
제11항에 있어서,

상기 다수의 노드의 각각은 상기 가상 스페이스에서 적어도 하나의 가상 노드에 대응되는 시스템.
제11항에 있어서,

상기 위치 영역은 상기 데이터에 소정의 해쉬 함수를 적용함으로써 결정되는 시스템.
제13항에 있어서,

상기 해쉬 함수는 상기 데이터를 상기 가상 스페이스 상의 특정 위치로 맵핑시키기 위한 것인 시스템.
제14항에 있어서,

상기 해쉬 함수에 의해 처리되는 데이터는 미리 샘플링된 것인 시스템.
제15항에 있어서,

상기 해쉬 함수, 또는 상기 다수의 노드의 각각이 제공하는, 상기 가상 스페이스의 일 영역은, 상기 샘플링을 통하여 조절될 수 있는 시스템.
제11항에 있어서,

상기 쓰여진 데이터를 제공 받는 제2 어플리케이션을 더 포함하는 시스템.
제17항에 있어서,

상기 제1 어플리케이션 및 상기 제2 어플리케이션은 동일한 키를 공유하는 시스템.
제18항에 있어서,

상기 데이터의 속성은 상기 키를 포함하고, 상기 제2 어플리케이션은 상기 키를 이용하여 상기 데이터를 획득하는 시스템.