[go: up one dir, main page]

KR102247812B1 - 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법 - Google Patents

특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법 Download PDF

Info

Publication number
KR102247812B1
KR102247812B1 KR1020200170138A KR20200170138A KR102247812B1 KR 102247812 B1 KR102247812 B1 KR 102247812B1 KR 1020200170138 A KR1020200170138 A KR 1020200170138A KR 20200170138 A KR20200170138 A KR 20200170138A KR 102247812 B1 KR102247812 B1 KR 102247812B1
Authority
KR
South Korea
Prior art keywords
information
gene
insertion site
gene insertion
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020200170138A
Other languages
English (en)
Other versions
KR102247812B9 (en
Inventor
서해영
김어진
장다영
김성수
김상호
Original Assignee
(주)셀레브레인
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)셀레브레인 filed Critical (주)셀레브레인
Priority to KR1020200170138A priority Critical patent/KR102247812B1/ko
Application granted granted Critical
Publication of KR102247812B1 publication Critical patent/KR102247812B1/ko
Priority to CN202180093173.0A priority patent/CN116802739A/zh
Priority to US18/251,138 priority patent/US20240331802A1/en
Priority to PCT/KR2021/011553 priority patent/WO2022124529A1/ko
Priority to EP21903576.3A priority patent/EP4261829A4/en
Publication of KR102247812B9 publication Critical patent/KR102247812B9/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템은, 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 운영에 필수적인 코드정보, 장비정보, 작업자정보, 작업정보, 고객정보, 협력업체정보, 파라메타정보, 참조유전자정보, 암 유발유전자정보 및 염기서열변환표정보를 관리하는 기본정보 관리 유닛, 상기 유전자 삽입부위 분석 시스템을 위한 오더 정보(고객주문, 작업지시, 자재주문 정보를 포함함), 계약정보, 프로젝트정보, 유전자 삽입 부위 분석정보 및 프로젝트 수행결과정보를 관리하는 유전자 삽입부위 분석 유닛, 및 상기 기본정보 관리 유닛 및 상기 유전자 삽입부위 분석 유닛에서 생성하거나 참조하는 기본정보 DB(회사정보 DB, 사용자정보 DB, 참조게놈정보 DB, COSMIC정보 DB, 장비정보 DB, 인력정보 DB, 자재정보 DB, 표준작업정보 DB, 염기서열변환표 DB, 코드정보 DB, 파라메타정보 DB를 포함함), 오더정보 DB, 계약정보 DB, 프로젝트정보 DB, 유전자 삽입부위 정보 DB, 염기서열분석정보 DB 및 프로젝트 진행정보 DB를 관리하는 DB 관리 유닛을 포함한다.

Description

특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법{SYSTEM AND METHOD FOR ANALYZING GENE INTEGRATION SITE OF GENE-CELL THERAPY WHICH SPECIFIC GENES INSERTED}
이하의 설명은 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법에 관한 것이다.
합성신약으로 치료가 불가능한 희귀·난치성 질환의 치료를 위해 유전자치료제(Gene Therapy), 세포치료제 (Cell Therapy) 및 유전자가 삽입된 세포치료제(Gene-Cell Therapy)가 차세대 바이오 의약품으로 개발되고 있다.
유전자치료제(Gene Therapy)는 암 유발 가능성의 제기와 기술적인 제약점들로 인해 현실적인 한계를 극복하지 못하고 있으며, 세포치료제(Cell Therapy)는 살아있는 세포를 치료에 이용하는 것으로 초기에는 피부세포나 연골세포를 이용한 피부재생·연골결손 치료제였으나, 최근에는 종양, 퇴행성 질환을 타깃으로 단순한 세포치료제(1세대 세포치료제)보다 기능 항진용 유전자를 삽입한 세포 치료제(2세대 세포치료제)에 대한 연구가 활발해지면서 이들이 개발의 중심에 자리잡고 있다. 세포치료제는 주로 성체줄기세포(조혈줄기세포 또는 간엽줄기 세포)를 이용하고 있다. 조혈줄기세포는 증식과 분화를 통해 평생 끊임없이 혈액을 만드는 세포이며, 조혈줄기세포의 증식을 도와주는 간엽줄기세포는 골수(Bone Marrow)에 100만개 정도 존재하며, 골수 밖으로 나와 여러 장기들의 재생을 도와주는 역할을 하는 것으로 알려져 있다. 간엽줄기세포 기반 세포 치료제는 분화를 통해 손상된 조직을 대체하는 것이 아니라 손상된 조직의 재생을 촉진하는 것에 효과가 있는 것으로 알려져 있다. 간엽줄기세포 자체만으로는 재생치료를 위한 유효성의 부족함이 증명되어 기능 항진용 유전자를 간엽줄기세포에 삽입 후 계대배양을 거쳐서 세포치료제로 개발하고 있다.
이와 같은 체외조작 과정(체외 조작방법-기능 항진용 유전자 삽입, 계대배양, 배양조건 등) 및 세포자체의 분화력 등이 유전적 불안정성을 내포하게 된다. 유전적 불안정성은 돌연변이, 불일치 복구 결함(Mismatch Repair Deficiency), 염색체 불안정성 (chromosomal instability) 등의 기전에 기인하는 것으로 논의되고 있다. 불일치 복구결함은 여러가지 유전자들의 과변이성(genetic hypermutability) 상태를 의미하는 것으로 길이 돌연변이(Length Mutation) 중에서도 염기서열 반복이 짧은 현미부수체에서도 높은 빈도로 발견되고 있다. 염색체 불안정성(chromosomal instability)은 염색체 수나 구조 전반에 걸쳐 영향을 미치는 것으로 세포간의 차이가 있어 세포마다 염색체 이상 여부는 다를 수 있다.
이와 같은 구조적 결함이 발생한 경우 다음 계대 세포에게 전해질 수 있어 증식이 반복될 경우 염색체 이상을 가진 복제가 발생할 수 있다. 미국 FDA는 세포 또는 유전자의 내구성, 오프 타킷 효과(원하지 않은 유전자를 편집하는 문제) 등을 고려하여 유전자 치료제(Gene Therapy) 또는 유전자가 삽입된 세포치료제(Gene-Cell therapy)에 관련된 이론적 위험성을 시판 이전 임상시험 만으로 모두 확인하는 것이 사실상 불가능하다고 판단하여 시판 후 임상연구가 이론적 위험을 적시 적소에 해결할 수 있을 것이라는 가정하에 장기간 추적관찰을 중요하게 여기고 있다. 염색체 삽입형 바이러스를 이용한 유전자가 삽입된 줄기세포치료제(ex-vivo therapy)의 경우 유전독성의 위험성이 제시되고 있다. 실 예로 조혈모세포(HSC : Hematopietic stem cell)에 LMO2, BMI1, CND2, EVI1 등의 유전자가 3~10 kb에 삽입된 이후 6년에 걸쳐 백혈병(Leukemia)이 유발된 사례가 있다. 중간엽줄기세포(MSC: Mesenchymal Stem Cell)는 간질세포(Stromal Cell)로서 조혈모세포와 달리 생체 내에서 어떤 세균종이 다른 종의 집락 주위에 직접 인접된 부위에서 더욱 왕성하게 성장하여 집락을 이루는 집락 현상(in vivo colonization)이 일어나지 않고, 체내 잔존성이 없어서 유전독성의 위험이 없음이 밝혀졌다. 그러나, 안전성을 검증하기 위하여 유전자가 삽입된 바이러스에 감염된 중간엽줄기세포의 계대배양별·염색체별 유전자들의 삽입부위의 상관관계 분석이 중요시되고 있다. 유전자염기서열분석은 일반적으로 골수(Bone Marrow)에서 중간엽줄기세포를 채취하여 유전자를 이입한 바이러스(레트로, 아데노, 렌티 등)로 감염시킨 후 계대배양별로 DNA를 추출하여 LAM-PCR(Linear Amplification Mediated-Polymerase Chain Reaction) 기법으로 증폭시켜 다양한 NGS (Next Generation Sequencing) 플랫폼을 이용하여 분석하거나, GenomeWalker방법으로 분석을 실시하고 있다. 그러나 기존의 분석 방법은 감도, 재현성, 정확성 및 유해 유전자의 존재 여부와 관련된 문제점을 내포하고 있으며, 또한 대량의 염기서열분석 데이터를 효율적으로 분석기 위한 최신 ICT(Information & Communications Technology) 기술을 적극적으로 활용하지 못하고 있다.
전술한 배경기술은 발명자가 본원의 개시 내용을 도출하는 과정에서 보유하거나 습득한 것으로서, 반드시 본 출원 전에 일반 공중에 공개된 공지기술이라고 할 수는 없다.
한국 등록특허 제10-184987호 (2018.04.11) 한국 공개특허 제10-2020-0098189호 (2020.08.20) 한국 공개특허 제10-2006-0015550호 (2006.02.17)
실시예의 목적은, 유전자ㆍ세포치료제 제조를 위해 골수에서 채취한 중간엽줄기세포를 1차 계대배양 후 체외조작(특정 유전자를 삽입한 바이러스를 감염시킴) 및 계대배양 후 세포 내 핵에서 DNA를 추출하여 NGS (Next Generation Sequencing)기법에 의한 염기서열분석데이터를 확보하여 각 계대배양별·염색체별 유전자의 삽입위치(Integration Site)(시작위치와 종료위치), 수량, biotype 정보를 추출·저장하여 다양한 형태의 분석 보고서를 작성할 수 있는 시스템을 제공함과 최신 정보기술인 클라우드 컴퓨팅(SaaS : Software as a Service) 기법을 적용하여 하나의 시스템으로 국내·외 유전자·세포치료제를 개발하는 조직(기업체, 공공기관, 대학 등)이 각각의 개별시스템처럼 운영할 수 있도록 하는데 그 목적이 있다.
실시예들에서 해결하려는 과제들은 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
실시예에 따른 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법에 대해서 설명한다.
특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템은, 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 운영에 필수적인 코드정보, 장비정보, 작업자정보, 작업정보, 고객정보, 협력업체정보, 파라메타정보, 참조유전자정보, 암 유발유전자정보 및 염기서열변환표정보를 관리하는 기본정보 관리 유닛, 상기 유전자 삽입부위 분석 시스템을 위한 오더 정보(고객주문, 작업지시, 자재주문 정보를 포함함), 계약정보, 프로젝트정보, 유전자 삽입 부위 분석정보 및 프로젝트 수행결과정보를 관리하는 유전자 삽입부위 분석 유닛, 및 상기 기본정보 관리 유닛 및 상기 유전자 삽입부위 분석 유닛에서 생성하거나 참조하는 기본정보 DB(회사정보 DB, 사용자정보 DB, 참조게놈정보 DB, COSMIC정보 DB, 장비정보 DB, 인력정보 DB, 자재정보 DB, 표준작업정보 DB, 염기서열변환표 DB, 코드정보 DB, 파라메타정보 DB를 포함함), 오더정보 DB, 계약정보 DB, 프로젝트정보 DB, 유전자 삽입부위 정보 DB, 염기서열분석정보 DB 및 프로젝트 진행정보 DB를 관리하는 DB 관리 유닛을 포함한다.
일 측에 따르면, 상기 기본정보 관리 유닛은, 회사정보를 관리하는 회사정보 관리 모듈, 사용자정보 DB를 관리하는 사용자정보 관리 모듈, 참조게놈정보 DB를 관리하는 참조게놈정보 관리 모듈, COSMIC정보 DB를 관리하는 COSMIC정보 관리 모듈, 장비정보 DB를 관리하는 장비정보 관리 모듈, 인력정보 DB를 관리하는 인력정보 관리 모듈, 자재정보 DB를 관리하는 자재정보 관리 모듈, 표준작업정보 DB를 관리하는 표준작업정보 관리 모듈, 염기서열변환표 DB를 관리하는 염기서열변환표 관리 모듈, 코드정보 DB를 관리하는 코드정보 관리 모듈 및 파라메타정보 DB를 관리하는 파라메터정보 관리 모듈을 포함하는 기본정보 관리 모듈을 포함한다.
일 측에 따르면, 상기 유전자 삽입부위 분석 유닛은, 오더정보를 관리하는 오더정보 관리 모듈, 계약정보를 관리하는 계약정보 관리 모듈, 프로젝트정보를 관리하는 프로젝트 관리 모듈, 유전자 삽입부위 정보를 관리하는 유전자 삽입부위 분석 모듈 및 프로젝트 진행정보를 관리하는 프로젝트산출물 관리 모듈을 포함한다.
한편, 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법은, 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 운영에 필수적인 기본정보를 DB에 기록하는 기본정보 관리 단계, 고객과의 협의 과정을 프로젝트정보 DB에 등록하고, 주문정보를 오더정보 DB에 등록하고, 오더정보를 기반으로 한 계약조건을 계약정보 DB에 등록하고, 프로젝트정보를 프로젝트진행 DB에 등록하고, 프로젝트를 수행하는 프로젝트 시작 단계, 상기 프로젝트 수행 단계에서 생성된 시퀀싱 데이터에 대해서 데이터 전처리 단계, 데이터 정형화 단계, 데이터 주석등록 단계, 분석용 데이터 추출 및 등록 단계를 포함하는 시퀀싱 데이터 처리 단계, 분석대상을 설정하는 검색조건 설정 단계, 분석방법을 선택하는 단계, 분석한 결과를 확인하는 분석보고서 확인 및, 분석결과를 DB에 등록하는 단계를 포함하는 유전자 삽입부위 분석 단계, 및 고객에게 제출할 분석보고서를 작성하고, 고객 피드백을 등록하고, 총투입비용산정 및 대금청구를 수행하고, 프로젝트를 종료 처리하는 프로젝트 종료 단계를 포함한다.
일 측에 따르면, 상기 프로젝트 수행 단계는, 시퀀싱 작업에 대해 오더정보 DB 및 프로젝트 진행정보 DB에 시퀀싱 작업정보를 등록하는 시퀀싱 작업정보 등록 단계를 포함하고, 상기 시퀀싱 작업정보 등록 단계는, 시퀀싱 데이터를 처음부터 끝까지 순차적으로 읽고, 마지막 레코드를 읽으면 시퀀싱 작업결과정보를 유전자 삽입부위 정보 DB 및 프로젝트 진행정보 DB에 등록한다. 또한, 상기 시퀀싱 작업정보 등록 단계는, 상기 시퀀싱 데이터가 4의 배수+1인 레코드를 읽어서 중복되는 데이터는 하나의 고유값 1건으로 등록하고, 가변 값은 분리하여 별도의 레코드로 등록한다. 그리고 상기 시퀀싱 작업정보 등록 단계는, 상기 시퀀싱 데이터가 4의 배수+2인 레코드를 4글자 단위로 읽어서 염기서열변환표 DB에서 해당하는 값을 2진수로 변환한다. 여기서, 상기 시퀀싱 데이터에서 4글자 단위로 읽은 값에 N 또는 U가 있을 경우 또는 상기 염기서열변환표 DB에 해당 값이 없을 경우에는, 유전자 삽입부위 정보 DB의 염기정보-오류테이블에 저장한다. 그리고 상기 시퀀싱 작업정보 등록 단계는, 상기 시퀀싱 데이터가 4의 배수+4인 레코드는 품질점수이므로 압축하고, 유전자 삽입부위 정보 DB의 염기정보-품질점수 테이블에 저장한다.
일 측에 따르면, 상기 유전자 삽입부위의 분석을 위한 데이터를 생성하고 계대배양별로 분석하여 유전자 삽입부위 정보 DB에 등록하고, 계대배양별·염색체별 유전자들의 상관 관계를 분석한다.
일 측에 따르면, 상기 유전자 삽입부위의 분석은, 골수에서 동시에 채취한 중간엽줄기세포와 중간엽줄기세포에 복수개의 유전자를 삽입한 중간엽줄기세포를 동일한 조건으로 계대배양을 실시하여 발현량 정보를 t-value 기법으로 비교 분석할 수 있다. 여기서, 상기 발현량 정보는, 계대별 총 발현량, 총 유전자수, 바이오타입별 발현량, 염색체별 발현량, 염색체별 유전자수, 염색체별 바이오타입별 발현량, 유전자별 발현량, 삽입한 유전자의 발현량, 삽입한 유전자의 인근 유전자 및 상기 삽입한 유전자의 발현량을 비교분석 할 수 있다.
실시예들에 따르면,
첫째, 복수개의 유전자가 삽입된 줄기세포치료제에 대해서 임상시험계획승인 신청(IND, Investigational New Drug) 단계에서 이론적인 위험성이 없음을 사전에 파악할 수 있다.
둘째, 복수개의 유전자가 삽입된 줄기세포의 계대배양별 염기서열 데이터와 인체의 염기서열분석 데이터의 비교를 효율적으로 실행할 수 있고, 계대배양별·염색체별 유전자들의 상관관계를 분석할 수 있다.
셋째, 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석을 위한 고객의 요청부터 임상시험계획승인 신청을 위한 보고서 작성까지의 전 과정을 통합 관리하여 신뢰도를 보증할 수 있다.
넷째, 최신 컴퓨터 기술인 클라우드 컴퓨팅(Cloud Computing) 기술 및 SaaS (Service as a Software) 기술을 적용하여 국내·외 많은 연구자가 개별시스템처럼 사용할 수 있다.
실시예에 따른 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 일 실시예에 따른 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템의 구성을 도시한 모식도이다.
도 2는 도 1의 유전자 삽입부위 분석 시스템에서, 고객의 분석의뢰부터 최종 유전자 삽입부위 분석보고서를 제출하는 업무 흐름을 개략적으로 도시한 블록도이다.
도 3a는 일 실시예에 따른 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템의 구성을 도시한 블록도이다.
도 3b는 도 3a에서 기본정보 관리 모듈의 구성을 도시한 블록도이다.
도 3c는 도 3a에서 기본정보 DB의 구성을 도시한 블록도이다.
도 4는 일 실시예에 따른 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템을 이용한 중간엽줄기세포에 삽입된 유전자의 삽입부위를 분석하고, 고객의 의뢰부터 유전자 삽입부위 분석보고서 제출하는 방법의 단계를 개략적으로 설명한 순서도이다.
도 5는 도 4에서 기본정보 관리 단계를 보다 구체적으로 설명하는 순서도이다.
도 6은 도 4에서 프로젝트 시작 단계를 보다 구체적으로 설명하는 순서도이다.
도 7은 도 6에서 프로젝트 수행 단계를 보다 구체적으로 설명하는 순서도이다.
도 8은 도7에서 시퀀싱 작업정보 등록 단계를 보다 구체적으로 설명하는 순서도이다.
도 9는 도 4에서 시퀀싱 데이터 처리 단계를 설명하는 순서도이다.
도 10은 도 9에서 데이터 전처리(pre-processing) 단계를 보다 구체적으로 설명하는 순서도이다.
도 11은 도 4에서 유전자 삽입부위 분석 단계를 개략적으로 설명하는 순서도이다.
도 12는 도 4에서 프로젝트 종료 단계를 개략적으로 설명하는 순서도이다.
도 13a는 도 7에서 시퀀싱 작업정보 등록 단계에서 생성된 NGS Data (FastQ)의 기본정보를 보여주는 도면이다.
도 13b는 도 13a의 NGS Data (FastQ)를 관리하기 위한 유전자 삽입부위 정보 DB의 ERD(Entity-Relationship Diagram)를 나타내는 블록도이다.
도 14는 도 10에서 분석대상용 데이터 등록 단계에서 생성하는 유전자 삽입 부위정보 DB의 분석대상 테이블의 그룹(Entity Group)의 ERD를 나타내는 블록도이다.
도 15a는 도 13b의 염기서열데이터에서 공백이 없는 경우에 2진수로 변환하기 위한 염기서열변환표 DB이다.
도 15b는 도 13b의 염기서열데이터에서 공백이 있는 경우에 2진수로 변환하기 위한 염기서열변환표 DB이다.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.
실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
또한, 실시예의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
어느 하나의 실시예에 포함된 구성요소와, 공통적인 기능을 포함하는 구성요소는, 다른 실시예에서 동일한 명칭을 사용하여 설명하기로 한다. 반대되는 기재가 없는 이상, 어느 하나의 실시예에 기재한 설명은 다른 실시예에도 적용될 수 있으며, 중복되는 범위에서 구체적인 설명은 생략하기로 한다.
이하, 도 1 내지 도 15b를 참조하여 일 실시예들에 따른 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템(이하, '유전자 삽입부위 분석 시스템'이라 함)(10) 및 그 방법에 대해서 설명한다. 참고적으로, 도 1은 일 실시예에 따른 클라우드 컴퓨팅기술 기반 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템(10)의 운영 개념을 설명하기 위한 모식도이다. 도2는 도 1의 유전자 삽입부위 분석 시스템(10)에서 유전자 삽입부위 분석을 요구하는 고객과의 계약, 고객으로부터 유전자 삽입 후 계대배양된 줄기세포를 인계 받아서 DNA 추출, 라이브러리 제작, 시퀀싱 데이터 생성, 시퀀싱 데이터 품질관리 및 분석, 유전자 삽입부위 분석, 유전자 삽입부위 분석보고서 작성 및 프로젝트를 관리하는 일련의 업무흐름을 개략적으로 도시한 블록도이다. 도 3a는 일 실시예에 따른 유전자 삽입부위 분석 시스템(10)의 구성을 설명하는 블록도이고, 도 3b는 도 3a에서 기본정보 관리 모듈(21)의 구성을 도시한 블록도이고, 도 3c는 도 3a에서 기본정보 DB(41)의 구성을 도시한 블록도이다.
도 1 내지 도 2를 참조하면, 유전자 삽입부위 분석 시스템(Gene Integration Site Analysis System)(10)은 클라우드 컴퓨팅(Cloud Computing) 기술 및 SaaS (Service as a Software) 기술을 적용하여 국내·외 많은 연구자가 개별시스템처럼 사용할 수 있다. 또한, 유전자 삽입부위 분석 시스템(10)은, 고객의 요청에 따라 DNA를 추출하고, 라이브러리를 제작하고, 시퀀싱 데이터를 처리 및 분석하고, 유전자 삽입부위에 대한 분석을 수행하고, 분석보고서를 작성하는 작업을 수행함으로써 추출 고객이 요청하는 특정 유전자가 삽입된 줄기세포에 대한 계대배양된 염기서열분석 임상시험계획승인 신청(IND, Investigational New Drug)을 위한 보고서 작성까지 전 과정을 통합하여 관리한다.
도 3a 내지 도 3c를 참조하면, 유전자 삽입부위 분석 시스템(10)은 기본정보 관리 유닛(20)과, 유전자 삽입부위 분석 유닛(30) 및 DB 관리 유닛(40)을 포함하여 구성된다.
기본정보 관리 유닛(20)은 유전자 삽입부위 분석 시스템(10)의 운영을 위한 기본정보를 관리하는 기본정보 관리 모듈(21)을 포함하여 구성된다.기본정보 관리 모듈(21)은 회사정보 DB(411)를 관리하는 회사정보 관리 모듈(211), 사용자정보 DB(212)를 관리하는 사용자정보 관리 모듈(212), 참조 게놈(인간유전체(GRCh/hg38))정보 DB(413)를 관리하는 참조게놈정보 관리 모듈(213), 암과 관련된 체세포 돌연변이에 대한 정보를 담고 있는 유전자의 목록(COSMIC, Catalogue of Somatic Mutations in Cancer)정보 DB(414)를 관리하는 COSMIC정보 관리 모듈(214), 작업을 수행하는 장비정보 DB(415)를 관리하는 장비정보 관리 모듈(215), 인력정보 DB(416)를 관리하는 인력정보 관리 모듈(216), 자재정보 DB(417)를 관리하는 자재정보 관리 모듈(217), 특정유전자가 삽입된 줄기세포의 염기서열데이터를 획득하기 위한 각종 작업(DNA 추출, 라이브러리제작, LAM-PCR증폭, NGS 시퀀싱(Sequencing) 등) 수행에 필요한 표준작업정보 DB(418)를 관리하는 표준작업정보 관리 모듈(218), 염기서열데이터를 2진수로 변환하기 위한 염기서열변환표 DB(419)를 관리하는 염기서열변환표 관리 모듈(219), 코드정보 DB(41a)를 관리하는 코드정보 관리 모듈(21a), 파라메타정보 DB(41b)를 관리하는 파라메타정보 관리 모듈(21b)을 포함한다.
유전자 삽입부위 분석 유닛(30)은, 고객의 의뢰를 기준으로 주문오더를 생성하고, 계약서 날인 후 계약정보를 등록하고 프로젝트관리를 시작하고, 고객의 유전자가 삽입된 세포를 인계 받아서 DNA 추출, 라이브러리 제작, LAM-PCR 증폭, NGS 분석 단계를 거쳐 유전자 삽입부위 분석을 수행하고 최종보고서를 작성하여 고객에게 제출하고 프로젝트의 종료 처리를 수행한다. 유전자 삽입부위 분석 유닛(30)은 각종 오더 정보(고객 주문오더, DNA 추출작업오더, 라이브러리 제작오더, 시퀀싱 오더)를 관리하는 오더정보 관리 모듈(31), 고객과의 계약정보를 관리하는 계약정보 관리 모듈(32), 고객의 계약을 이행하기 위한 프로젝트정보를 관리하는 프로젝트 관리 모듈(33), 시퀀싱 오더 결과인 시퀀싱 데이터를 이용하여 유전자 삽입부위를 분석하는 분석 모듈(34), 분석결과를 고객에게 제출하고 프로젝트를 종료하기 위한 프로젝트산출물 관리 모듈(35)을 포함하여 구성된다.
오더정보 관리 모듈(31)은 고객과의 협의를 거쳐 확정된 계약조건에 따른 주문오더정보, 자체제작 또는 외주제작(DNA 추출작업, 라이브러리제작, LAM-PCR증폭, NGS 시퀀싱) 등의 작업오더정보, 소요자재의 구매오더정보를 오더정보 DB(42)에 등록한다. 계약정보 관리 모듈(32)은 고객과의 협의에 의해 확정된 계약정보를 계약정보 DB(43)에 등록한다. 프로젝트 관리 모듈(33)은 고객의 주문정보 및 계약정보에 연동된 프로젝트정보를 프로젝트정보 DB(44)에 등록한다. 유전자 삽입분석 모듈(34)은 NGS 시퀀싱 데이터 및 유전자 삽입분석을 위한 데이터를 추출하여 유전자 삽입부위 정보 DB(45)에 등록한다. 프로젝트산출물 관리 모듈(35)은 프로젝트 진척정보, 유전자 삽입부위 분석결과를 프로젝트 진행정보 DB(46)에 등록한다.
DB 관리 유닛(40)은 기본정보 DB(41), 오더정보 DB(42), 계약정보 DB(43), 프로젝트정보 DB(44), 유전자 삽입부위 정보 DB(45), 프로젝트 진행정보 DB(46)를 포함하는 DB 관리 유닛(40)을 포함하여 구성된다.
기본정보 DB(41)는 기본정보 관리 유닛(20) 및 유전자 삽입부위 분석 유닛(30)의 각 모듈에서 생성하거나 참조되어지는 데이터가 데이터베이스관리시스템(DBMS, Data Base Management System)에 의해 관리되는 회사정보 DB(411), 사용자정보 DB(412), 참조게놈정보 DB(413), COSMIC정보 DB(414), 장비정보 DB(415), 인력정보 DB(416), 자재정보 DB(417), 표준작업정보 DB(418), 코드정보 DB(41a), 파라메타정보 DB(41b)를 포함하여 구성된다.
여기서, 회사정보 DB(411)는 운영회사 및 고객(기업체, 공공기관, 대학 등)의 사업자등록번호 또는 고유번호, 일련번호, 조직의 명칭, 대표전화번호, 팩스번호, 주소, 대표자 성명 등을 포함한다. 사용자정보 DB(412)는 성명, 비밀번호, 연락처(핸드폰, 사무실, 팩스 등), 이메일 주소, 직책코드, 권한코드, 이메일 수신여부, SMS문자 수신여부 등을 포함한다. 참조게놈정보 DB(413)는 인간 게놈프로젝트(HGP : Human Genome Project)를 통해 확인된 인간 유전자의 종류와 기능 정보를 포함하고 있는 것으로, 미국의 NCBI (National Center for Biotechnology Information)에서 관리하고 있는 DB를 참조하거나, 복제하여 로컬컴퓨터에 저장하여 참조할 수 있다. COSMIC정보 DB(414)는 유전자 명칭, Entrez DB의 ID 번호, 유전자의 위치(염색체 삽입위치(Integration Site)의 시작위치, 종료위치), 암에서의 역할 등의 정보를 포함한다. 장비정보 DB(415)는 장비번호, 장비명칭, 장비사양, 장비메이커, 구입가격, 시간당 사용단가 등의 정보를 포함한다. 인력정보 DB(416)는 작업을 수행하는 작업자의 요구능력정보, 시간당 단가정보 등을 포함한다. 자재정보 DB(417)는 표준작업정보 DB(418)의 소요자재정보에 해당하는 자재의 자재번호, 자재명칭, 투입단위, 단가, 납품처 코드 정보 등을 포함한다. 표준작업정보 DB(418)는 유전자 삽입부위 정보 분석을 위한 각종 작업정보를 관리하는 작업번호, 작업명칭, 작업시간, 작업을 수행하는 장비정보, 소요되는 자재정보, 작업을 수행하는 작업자의 요구능력정보, 전·후 작업정보 등을 포함한다. 염기서열변환표 DB(419)는 유전체의 염기서열 (DNA의 기본단위 뉴클레타이드의 구성 성분 중 하나인 핵염기들(A(아데닌), T(티민), G(구아닌), C(사이토신))을 순서대로 나열한 것) 데이터를 효율적으로 저장하기 위한 변환표로 4Byte(32 bit) 글자를 가변 bit (1~8bit) 숫자로 변환할 수 있게 한다. 코드정보 DB(41a)는 표준작업정보 번호, 표준장비사용시간, 표준자재코드, 표준자재소요량, 표준인건비코드, 표준 작업시간, 표준작업단가 정보 등 포함한다. 코드정보 DB는 각종 코드정보를 포함한다. 파라메타정보 DB(41b)는 Noise 기준 값, 동일 유전자의 합산 간격, 시퀀싱 분석량, 세포의 종류, 감염 바이러스 종류, 삽입 유전자 종류, 유전자 삽입위치(Integration Site) 전·후 매핑(mapping)의 부 정확성(Noise Data)의 범위, 동일 유전자의 전사위치(Transcription Site)가 일정 범위 이내에 있을 경우 동일한 Site로 간주하는 일정범위 값, Pooled Sample을 대상으로 할 경우의 시퀀싱 분석량 값(1G, 3G, 10G 등) 등의 정보를 포함한다.
이하에서는, 도 4 내지 도 15b를 참조하여 실시예들에 따른 유전자 삽입부위 분석 시스템(10)을 이용한 특정 유전자가 삽입된 바이러스에 감염된 줄기세포치료제의 계대배양별·염색체별 유전자들의 삽입부위를 분석하는 방법을 설명한다. 참고적으로, 도 4는 도 3a에서 유전자 삽입부위 분석 시스템(10)을 이용하여 고객의 의뢰에 의한 특정유전자가 삽입된 줄기세포의 유전자 삽입부위를 분석하고 그 결과를 고객에게 제출하는 방법을 개략적으로 설명한 순서도이다. 도 5는 도 4에서 기본정보 관리 단계(100)를 설명하는 순서도이다. 도 6은 도 4에서 프로젝트의 시작 단계(200)를 설명하는 순서도이고, 도 7은 도 6에서 프로젝트 수행 단계(250)를 설명하는 순서도이고, 도 8은 도 7에서 시퀀싱 작업정보 등록 단계(254)를 설명하는 순서도이다. 도 9는 도 4에서 시퀀싱 데이터 처리 단계(300)를 설명하는 순서도이고, 도 10은 도 9에서 데이터 전처리(pre-processing) 단계(310)를 설명하는 순서도이다. 도 11은 도 4에서 유전자 삽입부위 분석 단계(400)를 설명하는 순서도이다. 도 12는 도 4에서 프로젝트 종료 단계(500)를 설명하는 순서도이다. 그리고 도 13a는 도 7에서 시퀀싱 작업정보 등록 단계(254)에서 생성된 NGS Data(FastQ)의 기본정보를 보여주는 도면이고, 도 13b는 도 13a의 NGS Data(FastQ)를 관리하기 위한 유전자 삽입부위 정보 DB의 ERD(Entity-Relationship Diagram)를 나타내는 블록도이다. 도 14는 도 10에서 분석대상용 데이터 등록 단계(314)에서 생성하는 유전자 삽입 부위정보 DB의 분석대상 테이블의 그룹(Entity Group)의 ERD를 나타내는 블록도이다. 도 15a와 도 15b는 도 13b의 염기서열데이터를 2진수로 변환하기 위한 염기서열변환표 DB로서, 도 15a는 공백이 없는 경우이고, 도 15b는 공백이 있는 경우의 DB이다.
우선, 기본정보 관리 단계(100)는 기본정보를 각각의 DB에 기록한다.
구체적으로, 도 5를 참조하면, 기본정보 관리 단계(100)에서 단계 구분이 준비 단계일 경우, 유전자 삽입부위 분석 시스템(10)을 운영하는 회사정보를 회사정보 관리 모듈(211)을 통해 회사정보 DB(411)에 등록하고(111), 운영하는 회사에 소속한 사용자정보를 사용자정보 관리 모듈(212)을 통해 사용자정보 DB(412)에 등록하고(112), 참조게놈정보를 참조게놈정보 관리 모듈(213)을 통해 참조게놈정보 DB(413)에 등록하고(113), 암과 관련된 체세포 돌연변이에 대한 정보를 담고 있는 유전자의 목록 COSMIC 정보를 COSMIC정보 관리 모듈(214)을 이용하여 COSMIC정보 DB(414)에 등록하고(114), 특정유전자가 삽입된 줄기세포의 염기서열데이터를 획득하기 위한 각종 작업을 수행하는 장비에 관한 정보를 장비정보 관리 모듈(215)을 통해 장비정보 DB(415)에 등록하고(115), 해당 작업을 수행할 인력(요구능력, 시간당 단가 등) 정보를 인력정보 관리 모듈(216)을 통해 인력정보 DB(416)에 등록하고(116), 해당 작업에 소요되는 자재정보를 자재정보 관리 모듈(217)을 통해 자재정보 DB(417)에 등록하고(117), 해당 작업의 표준작업정보를 표준작업정보 관리 모듈(218)을 통해 표준작업정보 DB(418)에 등록하고(118), 염기서열정보를 압축하기 위하여 염기서열변환표를 염기서열변환표 관리 모듈(219)을 통해 염기서열변환표 DB(419)에 등록하고(119), 시스템 운영에 필요한 코드 정보를 코드정보 관리 모듈(21a)을 통해 코드정보 DB(41a)에 등록하고(11a), 시스템 운영에 필요한 각종 파라메터를 파라메타정보 관리 모듈(21b)을 통해 파라메타정보 DB(41b)에 등록한다(11b).
그리고, 단계 구분이 운영 단계일 경우에는, 신규 고객이 발굴되면 회사정보 관리 모듈(211)을 통해 회사정보 DB(411)에 등록하고(11c), 고객회사에 소속된 사용자정보를 사용자정보 관리 모듈(212)을 통해 사용자정보 DB(412)에 등록하고(11d), 고객의 요구에 맞는 파라메타 정보를 파라메타정보 관리 모듈 (21b)을 통해 파라메타정보 DB(41b)에 등록한다(11e).
다시 도 4를 참조하면, 기본정보 관리 단계(100) 이후에는, 프로젝트 시작 단계를 수행한다(200).
도 6을 참조하면, 프로젝트 시작 단계(200)는 고객과의 협의 과정을 견적관리(210)를 이용하여 프로젝트정보 DB(44)에 등록한다. 협상결과 주문을 체결하여 수주하였을 경우, 주문정보를 오더정보 DB(42)에 등록하고(220), 오더정보를 기반으로 한 계약조건을 계약정보 DB(43)에 등록하고(230), 고객의 계대배양별 관리를 위해 프로젝트정보를 프로젝트진행 DB(44)에 등록하고(240), 프로젝트 수행 단계(250)를 수행한다.
그리고 도 7을 참조하면, 프로젝트 수행 단계(250)는 고객의 계대배양된 세포 및 관련정보를 인계 받아 프로젝트 진행정보 DB(46)에 등록하고(251), DNA 추출작업에 대해 오더정보 DB(42) 및 프로젝트 진행정보 DB(46)에 DNA 추출작업 오더정보를 등록하고(252), 라이브러리제작작업에 대해 오더정보 DB(42) 및 프로젝트 진행정보 DB(46)에 라이브러리제작 작업오더정보를 등록하고(253), 시퀀싱 작업에 대해 오더정보 DB(42) 및 프로젝트 진행정보 DB(46)에 시퀀싱 작업정보를 등록한다(254).
또한, 도 8을 참조하면, 시퀀싱 작업정보 등록 단계(254)는 NGS 시퀀싱 작업자가 작업결과와 함께 제출한 시퀀싱 데이터(FastQ)를 시퀀싱 데이터를 처음부터 끝까지 순차적으로 읽고(2541), 마지막 레코드를 읽었으면 시퀀싱 작업결과정보를 유전자 삽입부위 정보 DB(45) 및 프로젝트 진행정보 DB(46)에 등록한다(2548).
시퀀싱 데이터 순차 읽기(2541)에서 읽은 시퀀싱 데이터의 레코드가 4의 배수+1이면서 첫번째 레코드(n=0)일 경우 헤더 테이블(FastQHeader)(1302)에 등록하고, 시퀀싱 데이터의 리드(도 13b의 첫번째 라인)에 해당하므로 헤더정보의 고유 값들(고유정보)을 추출하여 유전자 삽입부위 정보 DB(45)의 고유정보 테이블(FastQ_Line#1-Overview)(1303)에 등록(2542)하고, 헤더 정보의 가변적인 값들(가변정보)을 유전자 삽입부위 정보 DB(45)의 가변정보 테이블(FastQ_Line#1-Detail)(1304)에 등록하고(2543), 다음 레코드를 읽는다(2541).
또한 시퀀싱 데이터 순차 읽기(2541)에서 읽은 시퀀싱 데이터의 레코드가 4의 배수+2일 경우 염기서열 데이터이므로 4글자(4 Byte)씩 읽어서 염기서열변환표 DB(419)의 레퍼런스 시퀀스 테이블(Reference Sequence)(1301)에서 해당 값(가변 2진수, 1~8bit)을 확인한다. 예를 들어, 도 15a를 참조하면, 염기서열 AAAA 일 경우 2진수 0를, AAAC일 경우 2진수 1을, 염기서열 TTTG일경우 2진수 1111110을, 염기서열 TTTT일 경우 2진수 11111111이다. 확인된 값을 유전자 삽입부위 정보 DB(45)의 염기정보 테이블(FastQ_Line#2_Detail-Char)(1305)에 등록하고 다음 4Byte를 처리한다. 상기와 같은 방식으로 처리하면 도 13b의 도시와 같이 151글자를 읽어서 148글자(1,184 bit)는 위치정보(84 bit) 변환정보(261 bit)로 변환되어 압축율이 71.9%에 이른다. 또한 4Byte씩 읽은 데이터가 공백이 1 내지 3개 있을 경우 염기서열변환표 DB(419)의 레퍼런스 시퀀스 테이블(1301)에서 해당 값(가변 2진수, 1~8bit)을 확인하고, 도 15b의 염기서열변환표를 참조하여 해당 2진수를 부여한다. 예를 들면, AAAb 일 경우 2진수 0을, AACb일 경우 2진수 1을 TTTb일경우 2진수 111111을, AAbb일 경우 2진수 1000000을, Tbbb일경우 1010011 이다. 압축율은 도 13b의 도시와 같이 나머지 3글자(공백 1글자, 4 Byte 32 bit)는 위치정보(6bit), 변환정보(6bit) 12 bit로 관리되므로 압축율 62.5%이다. 상기와 같이 확인된 값을 유전자 삽입부위 정보 DB(45)의 염기정보 테이블(FastQ_Line#2_Detail-Blank)(1306)에 등록하고 다음 4Byte를 처리한다. 또한 읽은 데이터가 N 또는 U를 포함하면 오류정보이므로 유전자 삽입부위 정보 DB(45)의 염기정보-오류테이블(FastQ_Line#2_Detail-Not Match)(1307)에 등록(2545) 하고 다음 레코드를 읽는다(2541). 여기서, 도 13b와 같은 경우 오류데이터가 없어서 등록되지 않는다.
또한 시퀀싱 데이터 순차 읽기(2541)에서 읽은 시퀀싱 데이터의 레코드가 4의 배수+3일 경우는 단순한 연결을 표시하므로(값은 “+”이다) 다음 레코드를 읽는다(2546).
그리고 시퀀싱 데이터 순차 읽기(2541)에서 읽은 시퀀싱 데이터의 레코드가 4의 배수+4일 경우 품질점수(Quality Score)의 값을 의미하므로 데이터 압축기법(Huffman Coding Method)을 적용하여 압축하여 유전자 삽입부위 정보 DB(45)의 염기정보-품질점수 테이블(FastQ_Line#4_Quality Score)(1308)에 등록하고(2547), 다음 레코드를 읽는다(2541). 예를 들어, 도 13b와 같이 Huffman Coding Method로 변환할 경우 151글자(1208 bit)가 39글자 및 55bit(7글자)로 압축되어 압축율은 74.2%이다.
다시 도 4를 참조하면, 프로젝트 시작 단계(200) 후 시퀀싱 데이터 처리 단계를 수행한다(300).
도 9를 참조하면, 시퀀싱 데이터 처리 단계(300)는 데이터 전처리(pre-processing) 단계(310), 데이터 정형화 단계(320), 데이터 주석등록 단계(330), 분석용 데이터 추출 및 등록 단계(340)를 포함한다.
도 10을 참조하면, 데이터 전처리 단계(310)는 불필요 데이터 제거 단계(311), 참조데이터와 매핑하는 단계(312), 중복데이터를 제거하는 단계(313) 및 분석대상용 데이터 등록 단계(314)를 포함한다.
여기서, 시퀀싱 데이터처리 단계(300)는 일반적인 유전체 염기서열 분석 파이프라인으로, 유전체 발현이 특정 환경에 영향을 받은 정도 분석, 질환을 야기하는 유전체 분석등에 사용되어지고 있으나, 본 실시예는 기능 항진용 특정 유전자가 줄기세포에 삽입된 줄기세포를 분석하므로 계대배양별·염색체별 유전자들의 삽입부위 상관 분석이 필수적으로 수행되기 때문에, 데이터 전처리 단계(310)의 불필요 데이터 제거 단계(311), 중복데이터 제거 단계(313)를 생략할 수 있다. 또한, 참조데이터 매핑 단계(312)는 시퀀싱 작업정보 등록 단계(254)를 역순으로 수행하면서 데이터 2진화된 부분(4n+2 Line)을 원래의 데이터로 변환하고, 변환된 본래의 데이터를 이용하여 참조게놈정보 DB(413)와 매핑하여 유전자정보를 확인한다(312). 그리고 확인된 유전자정보 중 중복데이터를 제거하거나(313), 제거하지 않고 분석대상용 데이터를 유전자 삽입 부위정보 DB(45)의 분석대상 데이터 테이블에 등록한다(314).
데이터 정형화 단계(320)는 특정 유전자의 특정 유전자 삽입위치(Integration Site)의 전·후 부분에 산포되어 있을 경우 합치는 것을 수행한다(320).
데이터 주석등록 단계(330)는 인근 유전자와 연관시키거나, 유전자 온톨로지 분석, 게놈 특징연관분석을 수행하고, 피크 값은 유전자 발현데이터와 연관시키는 등의 작업을 수행한다.
분석용 데이터 추출 및 등록 단계(340)는 유전자 삽입부위 분석을 위한 데이터를 생성하여 유전자 삽입부위 정보 DB(45)의 분석대상 데이터 테이블에 등록한다.
다시 도 4를 참조하면, 시퀀싱 데이터 처리 단계(300) 이후에는, 유전자 삽입부위 분석 단계를 수행한다(400).
도 11을 참조하면, 유전자 삽입부위 분석 단계(400)는 검색조건 설정 단계(410), 분석방법 선택 단계(420), 분석보고서 확인 단계(430) 및 분석결과 등록 단계(440)를 포함한다.
검색조건 설정 단계(410)는 시퀀싱 데이터 처리 단계(300)에서 생성된 유전자 삽입부위 정보 DB(45)의 검색을 위한 조건 값을 결정하는 단계다. 즉, 고객정보, 프로젝트정보, 계대배양정보를 전 계대별 또는 특정 계대를 검색하기 위하여 검색조건을 설정한다.
다음으로, 설정된 검색조건을 이용하여 데이터를 조회 후 분석방법을 결정하고(420), 결정된 분석방법을 실행하여 조회된 보고서 확인 단계(430)를 거쳐, 분석결과를 프로젝트 진행정보 DB(46)에 등록한다(440).
여기서, 계대배양별 유전자 삽입부위의 분석은, 골수에서 동시에 채취한 중간엽줄기세포와 복수개의 유전자를 삽입한 중간엽줄기세포를 동일한 조건으로 계대배양을 실시하고 발현량 정보를 t-value 기법으로 비교 분석하게 된다. 여기서, 발현량 정보로는 계대별 총 발현량, 총 유전자수, 바이오타입별 발현량, 염색체별 발현량, 염색체별 유전자수, 염색체별 바이오타입별 발현량, 유전자별 발현량, 삽입한 유전자의 발현량, 삽입한 유전자의 인근 유전자 및 상기 삽입한 유전자의 발현량 등이 있다. t-value 기법은 하기 식 (1)과 같이 상기 두 표본 집단 간의 평균 값을 비교한다.
Figure 112020132725185-pat00001
………………………………………………………(1)
여기서 t = 표본 평균차이의 통계적인 지표이고,
Figure 112020132725185-pat00002
는 두 표본 그룹의 평균 차이이고,
Figure 112020132725185-pat00003
는 두 표본 그룹간 평균 차이에 대한 불확실도를 나타낸다.
불확실도는 다음의 식 (2)로 나타낼 수 있다.
Figure 112020132725185-pat00004
………………………(2)
여기서, s1, s2는 각 표본의 표준편차(Standard Deviation)이고, n1, n2는 각 표본의 개수이다.
따라서, 식 (1)과 식 (2)로부터 식 (1)은 다음의 식 (3)으로 나타낼 수 있다.
Figure 112020132725185-pat00005
…………………………………………………(3)
한편, 두 표본 집단의 n1과 n2가 동일하고, 분산이 같다고 가정하면 식 (3)은 다음의 식 (4)로 나타낼 수 있다.
Figure 112020132725185-pat00006
…………………………………………………………(4)
여기서, sp는 pooled standard deviation으로, 여기서,
Figure 112020132725185-pat00007
이다.
또한, 두 표본 집단의 n1과 n2는 다르지만, 두 표본 집단의 분산이 같다고 가정할 경우에는 식 (3)은 다음의 식 (5)로 나타낼 수 있다.
Figure 112020132725185-pat00008
………………………………………………………(5)
여기서,
Figure 112020132725185-pat00009
이다.
다시, 도 4를 참조하면, 유전자 삽입부위 분석 단계(400) 이후에는 프로젝트를 종료한다(500).
도 12를 참조하면, 프로젝트 종료 단계(500)는 분석보고서 제출 단계(510), 고객 피드백 등록 단계(520), 총투입비용산정 및 대금청구 단계(430)와 프로젝트 종료 처리 단계(540)를 포함한다.
분석보고서 제출 단계(510)는 유전자 삽입부위 분석 단계(400)에서 등록한 프로젝트 진행정보 DB(46)를 참조하여 특정유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석보고서를 PDF파일로 작성하여 고객에게 전달한다.
다음으로, 분석보고서에 대한 고객의 피드백을 받아서 고객 피드백을 프로젝트 진행정보 DB(46)에 등록한다(520). 그리고 고객의 피드백이 접수되면 오더정보(42)의 작업오더 DB(42)를 참조하여 작업시간, 소요자재, 투입 인력 및 시간 정보 등을 확인하여 총투입비용을 산정하여 프로젝트 진행정보 DB(46)에 등록하고 고객에게 대금을 청구한다(430). 또한 표준원가정보와 총투입비용산정 및 대금청구 단계에서 산출된 총 투입이용을 비교하여 손익을 계산하여 프로젝트 진행정보 DB(46)에 등록하고 프로젝트를 종료 처리한다(540).
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.
10 : 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템
20 : 기본정보 관리 유닛
21 : 기본정보 관리 모듈
211 : 회사정보 관리 모듈
212 : 사용자정보 관리 모듈
213 : 참조게놈정보 관리 모듈
214 : COSMIC정보 관리 모듈
215 : 장비정보 관리 모듈
216 : 인력정보 관리 모듈
217 : 자재정보 관리 모듈
218 : 표준작업정보 관리 모듈
219 : 염기서열변환표 관리 모듈
21a : 코드정보 관리 모듈
21b : 파라메타정보 관리 모듈
30 : 유전자 삽입부위 분석 유닛
31 : 오더정보 관리 모듈
32 : 계약정보 관리 모듈
33 : 프로젝트 관리 모듈
34 : 유전자 삽입부위 분석 모듈
35 : 프로젝트산출물 관리 모듈
40 : DB 관리 유닛
41 : 기본정보 DB
411 : 회사정보 DB
412 : 사용자정보 DB
413 : 참조게놈정보 DB
414 : COSMIC정보 DB
415 : 장비정보 DB
416 : 인력정보 DB
417 : 자재정보 DB
418 : 표준작업정보 DB
419 : 염기서열변환표 DB
41a : 코드정보 DB
41b : 파라메타정보 DB
42 : 오더정보 DB
43 : 계약정보 DB
44 : 프로젝트정보 DB
45 : 유전자 삽입부위 정보 DB
46 : 프로젝트 진행정보 DB

Claims (12)

  1. 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 운영에 필수적인 코드정보, 장비정보, 작업자정보, 작업정보, 고객정보, 협력업체정보, 파라메타정보, 참조유전자정보, 암 유발유전자정보 및 염기서열변환표정보를 관리하는 기본정보 관리 유닛;
    상기 유전자 삽입부위 분석 시스템을 위한 오더 정보(고객주문, 작업지시, 자재주문 정보를 포함함), 계약정보, 프로젝트정보, 유전자 삽입 부위 분석정보 및 프로젝트 수행결과정보를 관리하는 유전자 삽입부위 분석 유닛; 및
    상기 기본정보 관리 유닛 및 상기 유전자 삽입부위 분석 유닛에서 생성하거나 참조하는 기본정보 DB(회사정보 DB, 사용자정보 DB, 참조게놈정보 DB, COSMIC정보 DB, 장비정보 DB, 인력정보 DB, 자재정보 DB, 표준작업정보 DB, 염기서열변환표 DB, 코드정보 DB, 파라메타정보 DB를 포함함), 오더정보 DB, 계약정보 DB, 프로젝트정보 DB, 유전자 삽입부위 정보 DB, 염기서열분석정보 DB 및 프로젝트 진행정보 DB를 관리하는 DB 관리 유닛;
    을 포함하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템.
  2. 제1항에 있어서,
    상기 기본정보 관리 유닛은,
    회사정보를 관리하는 회사정보 관리 모듈, 사용자정보 DB를 관리하는 사용자정보 관리 모듈, 참조게놈정보 DB를 관리하는 참조게놈정보 관리 모듈, COSMIC정보 DB를 관리하는 COSMIC정보 관리 모듈, 장비정보 DB를 관리하는 장비정보 관리 모듈, 인력정보 DB를 관리하는 인력정보 관리 모듈, 자재정보 DB를 관리하는 자재정보 관리 모듈, 표준작업정보 DB를 관리하는 표준작업정보 관리 모듈, 염기서열변환표 DB를 관리하는 염기서열변환표 관리 모듈, 코드정보 DB를 관리하는 코드정보 관리 모듈 및 파라메타정보 DB를 관리하는 파라메터정보 관리 모듈을 포함하는 기본정보 관리 모듈;
    을 포함하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템.
  3. 제1항에 있어서,
    상기 유전자 삽입부위 분석 유닛은,
    오더정보를 관리하는 오더정보 관리 모듈, 계약정보를 관리하는 계약정보 관리 모듈, 프로젝트정보를 관리하는 프로젝트 관리 모듈, 유전자 삽입부위 정보를 관리하는 유전자 삽입부위 분석 모듈 및 프로젝트 진행정보를 관리하는 프로젝트산출물 관리 모듈;
    을 포함하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템.
  4. 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 운영에 필수적인 기본정보를 DB에 기록하는 기본정보 관리 단계;
    고객과의 협의 과정을 프로젝트정보 DB에 등록하고, 주문정보를 오더정보 DB에 등록하고, 오더정보를 기반으로 한 계약조건을 계약정보 DB에 등록하고, 프로젝트정보를 프로젝트진행 DB에 등록하고, 프로젝트를 수행하는 프로젝트 시작 단계;
    상기 프로젝트 수행 단계에서 생성된 시퀀싱 데이터에 대해서 데이터 전처리 단계, 데이터 정형화 단계, 데이터 주석등록 단계, 분석용 데이터 추출 및 등록 단계를 포함하는 시퀀싱 데이터 처리 단계;
    분석대상을 설정하는 검색조건 설정 단계, 분석방법을 선택하는 단계, 분석한 결과를 확인하는 분석보고서 확인 및, 분석결과를 DB에 등록하는 단계를 포함하는 유전자 삽입부위 분석 단계; 및
    고객에게 제출할 분석보고서를 작성하고, 고객 피드백을 등록하고, 총투입비용산정 및 대금청구를 수행하고, 프로젝트를 종료 처리하는 프로젝트 종료 단계;
    를 포함하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  5. 제4항에 있어서,
    상기 프로젝트 수행 단계는, 시퀀싱 작업에 대해 오더정보 DB 및 프로젝트 진행정보 DB에 시퀀싱 작업정보를 등록하는 시퀀싱 작업정보 등록 단계를 포함하고,
    상기 시퀀싱 작업정보 등록 단계는,
    시퀀싱 데이터를 처음부터 끝까지 순차적으로 읽고, 마지막 레코드를 읽으면 시퀀싱 작업결과정보를 유전자 삽입부위 정보 DB 및 프로젝트 진행정보 DB에 등록하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  6. 제5항에 있어서,
    상기 시퀀싱 작업정보 등록 단계는,
    상기 시퀀싱 데이터가 4의 배수+1인 레코드를 읽어서 중복되는 데이터는 하나의 고유값 1건으로 등록하고, 가변 값은 분리하여 별도의 레코드로 등록하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  7. 제5항에 있어서,
    상기 시퀀싱 작업정보 등록 단계는,
    상기 시퀀싱 데이터가 4의 배수+2인 레코드를 4글자 단위로 읽어서 염기서열변환표 DB에서 해당하는 값을 2진수로 변환하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  8. 제7항에 있어서,
    상기 시퀀싱 데이터에서 4글자 단위로 읽은 값에 N 또는 U가 있을 경우 또는 상기 염기서열변환표 DB에 해당 값이 없을 경우에는, 유전자 삽입부위 정보 DB의 염기정보-오류테이블에 저장하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  9. 제5항에 있어서,
    상기 시퀀싱 작업정보 등록 단계는,
    상기 시퀀싱 데이터가 4의 배수+4인 레코드는 품질점수이므로 압축하고, 유전자 삽입부위 정보 DB(45)의 염기정보-품질점수 테이블에 저장하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  10. 제4항에 있어서,
    상기 유전자 삽입부위의 분석을 위한 데이터를 생성하고 계대배양별로 분석하여 유전자 삽입부위 정보 DB에 등록하고,
    계대배양별·염색체별 유전자들의 상관 관계를 분석하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  11. 제10항에 있어서,
    상기 유전자 삽입부위의 분석은, 골수에서 동시에 채취한 중간엽줄기세포와 중간엽줄기세포에 복수개의 유전자를 삽입한 중간엽줄기세포를 동일한 조건으로 계대배양을 실시하여 발현량 정보를 t-value 기법으로 비교 분석하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
  12. 제11항에 있어서,
    상기 발현량 정보는, 계대별 총 발현량, 총 유전자수, 바이오타입별 발현량, 염색체별 발현량, 염색체별 유전자수, 염색체별 바이오타입별 발현량, 유전자별 발현량, 삽입한 유전자의 발현량, 삽입한 유전자의 인근 유전자 및 상기 삽입한 유전자의 발현량을 비교분석 하는 것을 특징으로 하는 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 방법.
KR1020200170138A 2020-12-08 2020-12-08 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법 Active KR102247812B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020200170138A KR102247812B1 (ko) 2020-12-08 2020-12-08 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법
CN202180093173.0A CN116802739A (zh) 2020-12-08 2021-08-27 插入有特定基因的干细胞治疗剂的基因插入位点分析系统及分析方法
US18/251,138 US20240331802A1 (en) 2020-12-08 2021-08-27 Gene Insertion Location Analysis System and Method For Stem Cell Therapeutic Agent Having Specific Gene Inserted Therein
PCT/KR2021/011553 WO2022124529A1 (ko) 2020-12-08 2021-08-27 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입위치 분석 시스템 및 분석 방법
EP21903576.3A EP4261829A4 (en) 2020-12-08 2021-08-27 Gene insertion location analysis system and method for stem cell therapeutic agent having specific gene inserted therein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200170138A KR102247812B1 (ko) 2020-12-08 2020-12-08 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법

Publications (2)

Publication Number Publication Date
KR102247812B1 true KR102247812B1 (ko) 2021-05-04
KR102247812B9 KR102247812B9 (en) 2021-09-17

Family

ID=75913905

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200170138A Active KR102247812B1 (ko) 2020-12-08 2020-12-08 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법

Country Status (5)

Country Link
US (1) US20240331802A1 (ko)
EP (1) EP4261829A4 (ko)
KR (1) KR102247812B1 (ko)
CN (1) CN116802739A (ko)
WO (1) WO2022124529A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124529A1 (ko) * 2020-12-08 2022-06-16 (주)셀레브레인 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입위치 분석 시스템 및 분석 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0184987B1 (ko) 1995-10-12 1999-05-01 윤종용 캠코더의 자동 화각보정 방법
KR20060015550A (ko) 2003-05-07 2006-02-17 다카라 바이오 가부시키가이샤 유전자 도입 부위의 분석 방법
KR102056583B1 (ko) * 2018-06-25 2019-12-17 주식회사 테라젠이텍스 유전체 분석 업무의 워크 플로우 관리 장치, 방법 및 컴퓨터 프로그램
KR20200098189A (ko) 2019-02-12 2020-08-20 주식회사 꿀비 차세대 염기서열 분석 서비스 제공 시스템 및 그 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110057051A (ko) * 2009-11-23 2011-05-31 김학균 65 개의 유전자의 발현양상 측정을 통한 항암화학요법 반응성 예측법
KR101969848B1 (ko) * 2011-06-10 2019-04-17 삼성전자주식회사 유전자 데이터를 압축하는 방법 및 장치
CN106103711A (zh) * 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用
KR102247812B1 (ko) * 2020-12-08 2021-05-04 (주)셀레브레인 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0184987B1 (ko) 1995-10-12 1999-05-01 윤종용 캠코더의 자동 화각보정 방법
KR20060015550A (ko) 2003-05-07 2006-02-17 다카라 바이오 가부시키가이샤 유전자 도입 부위의 분석 방법
KR102056583B1 (ko) * 2018-06-25 2019-12-17 주식회사 테라젠이텍스 유전체 분석 업무의 워크 플로우 관리 장치, 방법 및 컴퓨터 프로그램
KR20200098189A (ko) 2019-02-12 2020-08-20 주식회사 꿀비 차세대 염기서열 분석 서비스 제공 시스템 및 그 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
S. Goodman 외, "Cell and Gene Theraphy Data Management: Solutions to Address Complex Challenges", Cell/Gene Theraphies, Information Technology, 2019.04. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124529A1 (ko) * 2020-12-08 2022-06-16 (주)셀레브레인 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입위치 분석 시스템 및 분석 방법

Also Published As

Publication number Publication date
EP4261829A4 (en) 2025-02-19
EP4261829A1 (en) 2023-10-18
WO2022124529A1 (ko) 2022-06-16
US20240331802A1 (en) 2024-10-03
CN116802739A (zh) 2023-09-22
KR102247812B9 (en) 2021-09-17

Similar Documents

Publication Publication Date Title
Liao et al. Current challenges and solutions of de novo assembly
Nicholls et al. Ultra-deep, long-read nanopore sequencing of mock microbial community standards
Navarro et al. ST Pipeline: an automated pipeline for spatial mapping of unique transcripts
CN114176582B (zh) 诊断方法
Zimin et al. An improved assembly of the loblolly pine mega-genome using long-read single-molecule sequencing
Farrell et al. BiSulfite Bolt: A bisulfite sequencing analysis platform
Grabherr et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome
Holt et al. Improved genome assembly and annotation for the rock pigeon (Columba livia)
Pipes et al. The non-human primate reference transcriptome resource (NHPRTR) for comparative functional genomics
KR102247812B1 (ko) 특정 유전자가 삽입된 줄기세포치료제의 유전자 삽입부위 분석 시스템 및 분석 방법
Espinoza et al. VEBA: a modular end-to-end suite for in silico recovery, clustering, and analysis of prokaryotic, microeukaryotic, and viral genomes from metagenomes
KR102056583B1 (ko) 유전체 분석 업무의 워크 플로우 관리 장치, 방법 및 컴퓨터 프로그램
Sevillya et al. Horizontal gene transfer phylogenetics: a random walk approach
Tellechea-Luzardo et al. Versioning biological cells for trustworthy cell engineering
US20180039728A1 (en) Operating method of apparatus for analyzing genome sequences using distributed processing
Courtine et al. Long-read only assembly of Drechmeria coniospora genomes reveals widespread chromosome plasticity and illustrates the limitations of current nanopore methods
Pavlova et al. Detecting T-cell clonal expansions and quantifying clone survival using deep profiling of immune repertoires
Fu et al. VIGA: a one-stop tool for eukaryotic virus identification and genome assembly from next-generation-sequencing data
Qin et al. Improving long-read somatic structural variant calling with pangenome and de novo personal genome assembly
CN116308209A (zh) 一种采购计划文件审查与核对方法及系统
Agavekar et al. A haplotype-resolved chromosome-scale genome assembly and annotation for the leafcutter ant, Acromyrmex octospinosus
Liao et al. De novo repeat detection based on the third generation sequencing reads
Papastolopoulou et al. Three novel genomes broaden the wild side of the Capsicum pangenome
Luo et al. SLHSD: hybrid scaffolding method based on short and long reads
Sobala LukProt: A database of eukaryotic predicted proteins designed for investigations of animal origins

Legal Events

Date Code Title Description
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

PA0302 Request for accelerated examination

St.27 status event code: A-1-2-D10-D17-exm-PA0302

St.27 status event code: A-1-2-D10-D16-exm-PA0302

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

G170 Re-publication after modification of scope of protection [patent]
PG1701 Publication of correction

St.27 status event code: A-5-5-P10-P19-oth-PG1701

Patent document republication publication date: 20210917

Republication note text: Request for Correction Notice (Document Request)

Gazette number: 1022478120000

Gazette reference publication date: 20210504

G170 Re-publication after modification of scope of protection [patent]
PG1701 Publication of correction

St.27 status event code: A-5-5-P10-P19-oth-PG1701

Patent document republication publication date: 20211116

Republication note text: Request for Correction Notice (Document Request)

Gazette number: 1022478120000

Gazette reference publication date: 20210504

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

R18 Changes to party contact information recorded

Free format text: ST27 STATUS EVENT CODE: A-5-5-R10-R18-OTH-X000 (AS PROVIDED BY THE NATIONAL OFFICE)

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000