[go: up one dir, main page]

TWI740415B - 藥物篩選系統與藥物篩選方法 - Google Patents

藥物篩選系統與藥物篩選方法 Download PDF

Info

Publication number
TWI740415B
TWI740415B TW109108552A TW109108552A TWI740415B TW I740415 B TWI740415 B TW I740415B TW 109108552 A TW109108552 A TW 109108552A TW 109108552 A TW109108552 A TW 109108552A TW I740415 B TWI740415 B TW I740415B
Authority
TW
Taiwan
Prior art keywords
drug
fabricated
ranking
expression
candidate
Prior art date
Application number
TW109108552A
Other languages
English (en)
Other versions
TW202124794A (zh
Inventor
林祺傑
蕭傑仁
王界人
Original Assignee
財團法人工業技術研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人工業技術研究院 filed Critical 財團法人工業技術研究院
Priority to CN202010522168.4A priority Critical patent/CN113053470B/zh
Publication of TW202124794A publication Critical patent/TW202124794A/zh
Application granted granted Critical
Publication of TWI740415B publication Critical patent/TWI740415B/zh

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • G16C20/64Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • G16C20/62Design of libraries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Medicinal Chemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一種藥物篩選系統,包括編碼模組、候選藥物生成模組與藥物排序模組。編碼模組對藥物表達式與至少一藥物排序指標進行編碼,以產生第一編碼變數。候選藥物生成模組依據第一編碼變數,訓練生成對抗網路,以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。藥物排序模組依據每一候選藥物的至少一生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。

Description

藥物篩選系統與藥物篩選方法
本發明關於一種藥物篩選系統與藥物篩選方法。
由篩選藥物到成為真正有用的新藥的過程可能會花費大量時程與經費。先導化合物優化(lead compound optimization)為藥物開發流程中之重要階段,且藥物開發流程的平均耗費為414百萬美元(約佔藥物開發流程23%)以及藥物開發流程的研發時程為2年(約佔藥物開發流程15%)。在過去,利用模擬軟體(simulation software)或專家經驗(expert experience)的優化模式,已難以應付現今日漸複雜的化合物結構,因為模擬軟體的操作將花費大量時程且成功率偏低。
據此,如何有效地降低藥物研發時程與經費是當前重要的課題。
本發明提供一種藥物篩選系統與藥物篩選方法,藉以有效地降低藥物開發時程與經費。
本發明提供一種藥物篩選系統,包括編碼模組、候選藥物生成模組與藥物排序模組。編碼模組對藥物表達式與至少一藥物排序指標進行編碼,以產生第一編碼變數。候選藥物生成模組依據第一編碼變數,訓練生成對抗網路,以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。藥物排序模組依據每一候選藥物的至少一生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。
本發明提供一種藥物篩選方法,包括下列步驟。對藥物表達式與至少一藥物排序指標進行編碼,以產生第一編碼變數。依據第一編碼變數,訓練生成對抗網路,以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。依據每一候選藥物的至少一生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。
本發明所揭露之藥物篩選系統與藥物篩選方法,透過對藥物表達式與藥物排序指標進行編碼,以產生第一編碼變數。依據第一編碼變數,訓練生成對抗網路,以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。依據每一候選藥物的生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。如此一來,本發明實施例可以有效地降低藥物開發的時程與經費,並加快開發流程。
本說明書的技術用語參照本技術領域之習慣用語,如本說明書對部分用語有加以說明或定義,該部分用語之解釋以本說明書之說明或定義為準。本揭露之各個實施例分別具有一或多個技術特徵。在可能實施的前提下,本技術領域具有通常知識者可選擇性地實施任一實施例中部分或全部的技術特徵,或者選擇性地將這些實施例中部分或全部的技術特徵加以組合。
在以下所列舉的各實施例中,將以相同的標號代表相同或相似的元件或組件。
第1圖為依據本發明之一實施例之藥物篩選系統的示意圖。請參考第1圖,藥物篩選系統100包括編碼模組110、候選藥物生成模組120與藥物排序模組130。
編碼模組110對藥物表達式與至少一藥物排序指標進行編碼,以產生第一編碼變數200。在本實施例中,編碼模組110可例如為編碼器。第一編碼變數例如為隱變數(latent variable)且包括藥物表達式與藥物排序指標,如第2圖所示。在第2圖中,藥物表達式編碼於區域210中,且藥物排序指標編碼於接續區域210的區域220中。藥物表達式與藥物排序指標可以從已知化合物取得。
在一實施例中,藥物表達式例如包括簡化分子線性輸入規範(simplified molecular input line entry specification,SMILES)或化合物指紋(molecular fingerprint),但本發明不限於此。簡化分子線性輸入規範是一種用ASCII字符串明確描述分子結構的規範。也就是說,簡化分子線性輸入規範表示為一字串(string),例如c1c(O)c1(NC(=O))。化合物指紋從簡化分子線性輸入規範提取重要結構特徵。也就是說,化合物指紋表示為一向量(vector),例如[1,1,0,1,0,0..........]。藥物表達式唯一對應到特定的化合物(particular compound),例如MCF-7(乳癌(Breast Cancer))之真實化合物或其他化合物。
另外,藥物排序指標包括藥物結構分布或藥理特性。在一實施例中,藥物結構分布可例如包括化合物之最近鄰居(nearest neighbor)的數量。舉例來說,如第3圖所示,計算每一化合物與鄰居節點(node)之間的相似度。接著,基於化合物310,計算落在相似度門檻值(similarity threshold)K中之化合物的數量N。對化合物的數量N進行二值化(binarization)。如果N>0,則 N的值設定為1。如第3圖所示,有6個化合物落在相似度門檻值K中,因此N的值為1。之後,N的值作為藥物結構分布。在另一實施例中,藥理特性例如包括IC50、GI等,但本發明不限於此。
候選藥物生成模組120耦接編碼模組110。在本實施例中,候選藥物生成模組120可例如為微處理器(microprocessor)或微控制器(microcontroller),本發明不限於此。候選藥物生成模組120依據第一編碼變數,訓練生成對抗網路(generative adversarial network,GAN),以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。在本實施例中,候選藥物可例如為先導化合物(lead compound)。生成藥物表達式例如分別包括簡化分子線性輸入規範(SMILES)或化合物指紋,但本發明不限於此。生成藥物排序指標分別包括藥物結構分布或藥理特性。生成藥物表達式與生成藥物排序指標的說明可參考如上藥物表達式與藥物排序指標的說明,故在此不再贅述。
在候選藥物生成模組120接收編碼模組110所產生的第一編碼變數後,候選藥物生成模組120依據第一編碼變數,訓練生成對抗網路。舉例來說,候選藥物生成模組120可以依據多個隨機值(random value),產生多個編造藥物(fake drug)表達式與多個編造藥物排序指標。在本實施例中,編造藥物表達式與其編造藥物排序指標彼此互不相同。編造藥物表達式例如分別包括簡化分子線性輸入規範(SMILES)或化合物指紋,但本發明不限於此。編造藥物排序指標分別包括藥物結構分布或藥理特性。編造藥物表達 式與編造藥物排序指標的說明可參考如上藥物表達式與藥物排序指標的說明,故在此不再贅述。
接著,候選藥物生成模組120會將編造藥物表達式與編造藥物排序指標傳送至編碼模組110。之後,編碼模組110對編造藥物表達式與編碼藥物排序指標進行編碼,以產生多個第二編碼變數。接著,編碼模組110將第二編碼變數傳送至候選藥物生成模組120。之後,候選藥物生成模組120可以比較第一編碼變數與第二編碼變數,以產生多個判斷值。上述判斷值用於指示包括在第一編碼變數中之藥物表達式及藥物排序指標與包括在第二編碼變數中之編造藥物表達式及編造藥物排序指標之間的相似度程度。
接著,候選藥物生成模組120可以判斷上述判斷值是否達到預設值。在本實施例中,上述判斷值例如為50%,但本發明不限於此。當判斷出上述判斷值達到預設值時,表示此判斷為收斂,並且包括在第二編碼變數中之編造藥物表達式及編碼藥物排序指標相似於包括在第一編碼變數中之藥物表達式與藥物排序指標。接著,候選藥物生成模組120可以依據對應於第二編碼變數之編造藥物表達式與編造藥物排序指標,產生候選藥物,其中生成藥物表達式對應於編造藥物表達式,且生成藥物排序指標對應於編造藥物排序指標。
當判斷出上述判斷值未達到預設值時,表示此判斷不為收斂,並且包括在第二編碼變數中之編造藥物表達式及編造藥物排序指標不相似於包括在第一編碼變數中之藥物表達式及藥物排 序指標。接著,候選藥物生成模組120可以對編造藥物表達式與編造藥物排序指標進行更新。舉例來說,候選藥物生成模組120可以依據上述判斷值修改編造藥物表達式與編造藥物排序指標,以便對編造藥物表達式與編造藥物排序指標進行更新。
接著,候選藥物生成模組120可以再次將更新後之編造藥物表達式及更新後之編造藥物排序指標傳送至編碼模組110。之後,編碼模組110對更新後之編造藥物表達式及更新後之編造藥物排序指標進行編碼,以產生更新後之第二編碼變數。接著,候選藥物生成模組120可以比較第一編碼變數與更新後之第二編碼變數,以產生判斷值。之後,候選藥物生成模組120可以再次判斷上述判斷值是否達到預設值。接著,候選藥物生成模組120可以重複執行上述方法,直到上述判斷值達到預設值且候選藥物生成模組120依據對應於第二編碼變數之編造藥物表達式與編造藥物排序指標產生候選藥物為止。
藥物排序模組130耦接候選藥物生成模組120。在本實施例中,藥物排序模組130可例如為微處理器或微控制器,本發明不限於此。藥物排序模組130依據每一候選藥物的生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。也就是說,當藥物排序模組130接收到候選藥物時,藥物排序模組130可以從候選藥物取得生成藥物表達式與候選藥物排序指標。
接著,藥物排序模組130可以對候選藥物之生成藥物表達式與生成藥物排序指標進行分析。舉例來說,藥物排序模組130 可以依據生成藥物排序指標,對候選藥物的強度進行分析。接著,藥物排序模組130會依據生成藥物排序指標的強度,對候選藥物的強度進行排序來篩選藥物,並且產生候選藥物的排序表單。因此,本發明實施例可以有效地降低藥物開發時程與經費,並加快藥物開發流程。
此外,藥物篩選系統100進一步包括顯示模組140。在本實施例中,顯示模組140可例如為顯示器或監視器,但本發明不限於此。顯示模組140耦接編碼模組110、候選藥物生成模組120與藥物排序模組130。顯示模組140透過圖形化使用者介面(graphic user interface)顯示第一編碼變數、候選藥物、生成藥物表達式、生成藥物排序指標與候選藥物的強度。因此,使用者可以快速地得知藥物篩選系統100的操作與候選藥物的產生,進而有效地降低藥物開發的時程及經費,並加快開發流程。
第4圖為第1圖之候選藥物生成模組的詳細示意圖。請參考第4圖。在本實施例中,候選藥物生成模組120包括編造藥物生成模組410與判斷模組420。
編造藥物生成模組410耦接編碼模組110。編造藥物生成模組410依據多個隨機值(random value),產生多個編造藥物表達式與編造藥物排序指標。舉例來說,編造藥物生成模組410可以透過一個隨機值,對應產生一個編造藥物表達式與編造藥物排序指標。也就是說,一個隨機值會對應一個編造藥物表達式與編造藥物排序指標。編造藥物生成模組410可以透過兩個隨機值,對應產 生兩個編造藥物表達式與編造藥物排序指標。也就是說,兩個隨機值會對應兩個編造藥物表達式與編造藥物排序指標。編造藥物生成模組410可以透過三個隨機值,對應產生三個編造藥物表達式與編造藥物排序指標。也就是說,三個隨機值會對應三個編造藥物表達式與編造藥物排序指標。其餘則類推。另外,編造藥物表達式與編造藥物排序指標用於訓練生成對抗網路。在本實施例中,上述隨機值可例如由使用者預設。接著,編造藥物生成模組410將編造藥物表達式與編造藥物排序指標傳送至編碼模組110。之後,編碼模組110可以對編造藥物表達式與編造藥物排序指標進行編碼,以產生第二編碼變數。
判斷模組420耦接編碼模組110與編造藥物生成模組410。判斷模組420接收第一編碼變數與第二編碼變數,並比較第一編碼變數與第二編碼變數,以產生判斷值。
在編造藥物生成模組410接收到上述判斷值之後,編造藥物生成模組410可以判斷上述判斷值是否達到預設值。當判斷出上述判斷值達到預設值時,表示包括在第二編碼變數中之編造藥物表達式與編造藥物排序指標相似於包括在第一編碼變數中之藥物表達式與藥物排序指標。接著,編造藥物生成模組410可以依據對應於第二編碼變數之編造藥物表達式與編造藥物排序指標,產生候選藥物,其中生成藥物表達式對應於編造藥物表達式,且生成藥物排序指標對應於編造藥物排序指標。
當判斷出上述判斷值未達到預設值時,表示包括在第二編碼變數中之編造藥物表達式與編造藥物排序指標不相似於包括在第一編碼變數中之藥物表達式與編造藥物排序指標。接著,編造藥物生成模組410可以對編造藥物表達式與編造藥物排序指標進行更新。舉例來說,編造藥物生成模組410可以依據上述判斷值,修改編造藥物表達式與編造藥物排序指標,以便對編造藥物表達式與編造藥物排序指標進行更新。
接著,編造藥物生成模組410可以再次將更新後之編造藥物表達式與更新後之編造藥物排序指標傳送至編碼模組110。之後,編碼模組110對更新後之編造藥物表達式與更新後之編造藥物排序指標進行更新,以產生更新後之第二編碼變數。接著,判斷模組420可以再次比較第一編碼變數與更新後之第二編碼變數,以產生判斷值。上述判斷值可以傳送至編造藥物生成模組410。之後,編造藥物生成模組410可以再次判斷上述判斷值是否達到預設值。接著,編造藥物生成模組410與判斷模組420可以重複上述方法,直到上述判斷值達到預設值且編造藥物生成模組410依據編造藥物表達式與編造藥物排序指標產生候選藥物為止。
此外,編造藥物生成模組410與判斷模組420耦接顯示模組140。據此,顯示模組140可進一步透過圖形化使用者介面顯示編造藥物表達式、編造藥物排序指標、第二編碼變數、上述判斷值與比較結果。因此,使用者可以快速地得知藥物篩選系統的操作及候選藥物的產生,進而有效地降低藥物開發的時程及經費,並加快開發流程。
藉由如上實施例的說明,本發明實施例提供一種藥物篩選方法。第5圖為依據本發明之一實施例之藥物篩選方法的流程圖。
在步驟S502中,對藥物表達式與至少一藥物排序指標進行編碼,以產生第一編碼變數。在步驟S504中,依據第一編碼變數,訓練生成對抗網路,以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。
在步驟S506中,依據每一候選藥物的至少一生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。在步驟S508中,顯示第一編碼變數、候選藥物、生成藥物表達式、生成藥物排序指標與候選藥物的強度。在本實施例中,藥物表達式與生成藥物表達式分別包括簡化分子線性輸入規範(SMILES)或化合物指紋,但本發明不限於此。另外,藥物排序指標與生成藥物排序指標分別包括藥物結構分布或藥理特性。藥物結構分布包括化合物之最近鄰居的數量,且藥理特性包括IC50、GI,但本發明不限於此。此外,藥物表達式唯一對應到特定的化合物(particular compound)。
第6圖為第5圖之步驟S504的詳細流程圖。在步驟S602中,依據多個隨機值,產生多個編造藥物表達式與多個編造藥物排序指標。在步驟S604中,對編造藥物表達式與編造藥物排序指標進行編碼,以產生多個第二編碼變數。
在步驟S606中,接收第一編碼變數與第二編碼變數,並比較第一編碼變數與第二編碼變數以產生多個判斷值。
在步驟S608中,判斷判斷值是否達到預設值。當判斷出判斷值到達預設值時,進入步驟S610,依據對應於第二編碼變數之編造藥物表達式與編造藥物排序指標,產生候選藥物。
當判斷出判斷值未達到預設值時,進入步驟612,對編造藥物表達式與編造藥物排序指標進行更新。接著,在執行步驟S612後,上述方法進入步驟S606,再次比較藥物表達式及藥物排序指標與更新後之編造藥物表達式及更新後之編造藥物排序指標,以產生判斷值。在本實施例中,編造藥物表達式分別包簡化分子線性輸入規範(SMILES)或化合物指紋,但本發明不限於此。另外,編造藥物排序指標分別包括藥物結構分布或藥理特性。藥物結構分布包括化合物之最近鄰居的數量,且藥理特性包括IC50、GI,但本發明不限於此。
綜上所述,本發明所揭露之藥物篩選系統與藥物篩選方法,透過對藥物表達式與藥物排序指標進行編碼,以產生第一編碼變數。依據第一編碼變數,訓練生成對抗網路,以產生多個候選藥物,其中每一候選藥物具有生成藥物表達式與至少一生成藥物排序指標。依據每一候選藥物的生成藥物排序指標,對候選藥物的強度進行排序來篩選藥物。如此一來,本發明實施例可以有效地降低藥物開發的時程與經費,並加快開發流程。
本發明雖以實施例揭露如上,然其並非用以限定本發明的範圍,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可做些許的更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100:藥物篩選系統 110:編碼模組 120:候選藥物生成模組 130:藥物排序模組 140:顯示模組 210,220:區域 310:化合物 410:編造藥物生成模組 420:判斷模組 S502~S508,S602~S612:步驟
第1圖為依據本發明之一實施例之藥物篩選系統的示意圖。 第2圖為依據本發明之一實施例之編碼變數的示意圖。 第3圖為依據本發明之一實施例之計算藥物結構分布的示意圖。 第4圖為第1圖之候選藥物生成模組的詳細示意圖。 第5圖為依據本發明之一實施例之藥物篩選方法的流程圖。 第6圖為第5圖之步驟S504的詳細流程圖。
100:藥物篩選系統 110:編碼模組 120:候選藥物生成模組 130:藥物排序模組 140:顯示模組

Claims (20)

  1. 一種藥物篩選系統,包括:一編碼模組,對一藥物表達式與至少一藥物排序指標進行編碼,以產生一第一編碼變數,其中該第一編碼變數為一隱變數且包括該藥物表達式與該至少一藥物排序指標;一候選藥物生成模組,依據該第一編碼變數,訓練一生成對抗網路,以產生多個候選藥物,其中每一該些候選藥物具有一生成藥物表達式與至少一生成藥物排序指標;以及一藥物排序模組,依據每一該些候選藥物的該至少一生成藥物排序指標,對該些候選藥物的強度進行排序來篩選藥物。
  2. 如請求項1所述之藥物篩選系統,其中該藥物表達式包括一簡化分子線性輸入規範或一化合物指紋,且該生成藥物表達式包括該簡化分子線性輸入規範或該化合物指紋。
  3. 如請求項1所述之藥物篩選系統,其中該至少一藥物排序指標與該至少一生成藥物排序指標分別包括一藥物結構分布或一藥理特性。
  4. 如請求項3所述之藥物篩選系統,其中該藥物結構分布包括一化合物之最近鄰居的數量,且該藥理特性包括IC50、GI。
  5. 如請求項1所述之藥物篩選系統,其中該候選藥物生成模組包括:一編造藥物生成模組,依據多個隨機值,產生多個編造藥物表 達式與多個編造藥物排序指標至該編碼模組;以及一判斷模組,接收該第一編碼變數與多個第二編碼變數,其中該些第二編碼變數為該編碼模組依據該些編造藥物表達式與該些編造藥物排序指標而產生的,且該判斷模組比較該第一編碼變數與該些第二編碼變數以產生多個判斷值;其中,該編造藥物生成模組判斷該些判斷值是否達到一預設值,當判斷出該些判斷值到達該預設值時,該編造藥物生成模組依據對應於該第二編碼變數之該些編造藥物表達式與該些編造藥物排序指標,產生該些候選藥物,且當判斷出該些判斷值未達到該預設值時,該編造藥物生成模組對該些編造藥物表達式與該些編造藥物排序指標進行更新。
  6. 如請求項5所述之藥物篩選系統,其中該些編造藥物表達式分別包括一簡化分子線性輸入規範或一化合物指紋。
  7. 如請求項5所述之藥物篩選系統,其中該些編造藥物排序指標分別包括一藥物結構分布或一藥理特性。
  8. 如請求項7所述之藥物篩選系統,其中該藥物結構分布包括一化合物之最近鄰居的數量,且該藥理特性包括IC50、GI。
  9. 如請求項1所述之藥物篩選系統,其中該藥物表達式唯一對應到一特定的化合物。
  10. 如請求項1所述之藥物篩選系統,更包括:一顯示模組,耦接該編碼模組、該候選藥物生成模組與該藥物 排序模組,該顯示模組顯示該第一編碼變數、該些候選藥物、該些生成藥物表達式、該些生成藥物排序指標與該些候選藥物的強度。
  11. 一種藥物篩選方法,包括:對一藥物表達式與至少一藥物排序指標進行編碼,以產生一第一編碼變數,其中該第一編碼變數為一隱變數且包括該藥物表達式與該至少一藥物排序指標;依據該第一編碼變數,訓練一生成對抗網路,以產生多個候選藥物,其中每一該些候選藥物具有一生成藥物表達式與至少一生成藥物排序指標;以及依據每一該些候選藥物的該至少一生成藥物排序指標,對該些候選藥物的強度進行排序來篩選藥物。
  12. 如請求項11所述之藥物篩選方法,其中該藥物表達式包括一簡化分子線性輸入規範或一化合物指紋,且該生成藥物表達式包括該簡化分子線性輸入規範或該化合物指紋。
  13. 如請求項11所述之藥物篩選方法,其中該至少一藥物排序指標與該至少一生成藥物排序指標分別包括一藥物結構分布或一藥理特性。
  14. 如請求項13所述之藥物篩選方法,其中該藥物結構分布包括一化合物之最近鄰居的數量,且該藥理特性包括IC50、GI。
  15. 如請求項11所述之藥物篩選方法,其中依據該第一編碼變數,訓練該生成對抗網路,以產生該些候選藥物的步驟包 括:依據多個隨機值,產生多個編造藥物表達式與多個編造藥物排序指標;對該些編造藥物表達式與該些編造藥物排序指標進行編碼,以產生多個第二編碼變數;接收該第一編碼變數與該些第二編碼變數,並比較該第一編碼變數與該些第二編碼變數以產生多個判斷值;判斷該些判斷值是否達到一預設值;當判斷出該些判斷值到達該預設值時,依據對應於該第二編碼變數之該些編造藥物表達式與該些編造藥物排序指標,產生該些候選藥物;以及當判斷出該些判斷值未達到該預設值時,對該些編造藥物表達式與該些編造藥物排序指標進行更新。
  16. 如請求項15所述之藥物篩選方法,其中該些編造藥物表達式分別包括一簡化分子線性輸入規範或一化合物指紋。
  17. 如請求項15所述之藥物篩選方法,其中該些編造藥物排序指標分別包括一藥物結構分布或一藥理特性。
  18. 如請求項17所述之藥物篩選方法,其中該藥物結構分布包括一化合物之最近鄰居的數量,且該藥理特性包括IC50、GI。
  19. 如請求項11所述之藥物篩選方法,其中該藥物表達式唯一對應到一特定的化合物。
  20. 如請求項11所述之藥物篩選方法,更包括: 顯示該第一編碼變數、該些候選藥物、該些生成藥物表達式、該些生成藥物排序指標與該些候選藥物的強度。
TW109108552A 2019-12-26 2020-03-16 藥物篩選系統與藥物篩選方法 TWI740415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010522168.4A CN113053470B (zh) 2019-12-26 2020-06-10 药物筛选系统与药物筛选方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/727,858 US11664094B2 (en) 2019-12-26 2019-12-26 Drug-screening system and drug-screening method
US16/727,858 2019-12-26

Publications (2)

Publication Number Publication Date
TW202124794A TW202124794A (zh) 2021-07-01
TWI740415B true TWI740415B (zh) 2021-09-21

Family

ID=76546582

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109108552A TWI740415B (zh) 2019-12-26 2020-03-16 藥物篩選系統與藥物篩選方法

Country Status (2)

Country Link
US (1) US11664094B2 (zh)
TW (1) TWI740415B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12368503B2 (en) 2023-12-27 2025-07-22 Quantum Generative Materials Llc Intent-based satellite transmit management based on preexisting historical location and machine learning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190018933A1 (en) * 2016-01-15 2019-01-17 Preferred Networks, Inc. Systems and methods for multimodal generative machine learning
US20190272468A1 (en) * 2018-03-05 2019-09-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation
US20190304568A1 (en) * 2018-03-30 2019-10-03 Board Of Trustees Of Michigan State University System and methods for machine learning for drug design and discovery
US10515715B1 (en) * 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130144584A1 (en) * 2011-12-03 2013-06-06 Medeolinx, LLC Network modeling for drug toxicity prediction
US10776712B2 (en) * 2015-12-02 2020-09-15 Preferred Networks, Inc. Generative machine learning systems for drug design
EP3646250A1 (en) 2017-05-30 2020-05-06 GTN Ltd Tensor network machine learning system
US20190010533A1 (en) * 2017-06-05 2019-01-10 The Methodist Hospital System Methods for screening and selecting target agents from molecular databases
CN108984811A (zh) 2017-06-05 2018-12-11 欧阳德方 一种药物制剂处方虚拟设计及评估的方法和系统
US11501429B2 (en) 2017-07-19 2022-11-15 Altius Institute For Biomedical Sciences Methods of analyzing microscopy images using machine learning
US11260078B2 (en) * 2017-07-25 2022-03-01 Insilico Medicine Ip Limited Method of treating senescence with multi-stage longevity therapeutics
US20190050537A1 (en) 2017-08-08 2019-02-14 International Business Machines Corporation Prediction and generation of hypotheses on relevant drug targets and mechanisms for adverse drug reactions
US20190114390A1 (en) * 2017-10-13 2019-04-18 BioAge Labs, Inc. Drug repurposing based on deep embeddings of gene expression profiles
CN108647489B (zh) 2018-05-15 2020-06-30 华中农业大学 一种筛选疾病药物靶标和靶标组合的方法及系统
US20200327963A1 (en) * 2019-04-11 2020-10-15 Accenture Global Solutions Limited Latent Space Exploration Using Linear-Spherical Interpolation Region Method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190018933A1 (en) * 2016-01-15 2019-01-17 Preferred Networks, Inc. Systems and methods for multimodal generative machine learning
US20190272468A1 (en) * 2018-03-05 2019-09-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation
US20190304568A1 (en) * 2018-03-30 2019-10-03 Board Of Trustees Of Michigan State University System and methods for machine learning for drug design and discovery
US10515715B1 (en) * 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Day 28:小學生談「生成對抗網路」(Generative Adversarial Network,GAN),2018年1月7日,https://ithelp.ithome.com.tw/articles/10196257
Kadurin A, Aliper A, Kazennov A, et al. The cornucopia of meaningful leads: Applying deep adversarial autoencoders for new molecule development in oncology. Oncotarget. 2017 Feb 14;8(7):10883-10890. doi:10.18632/oncotarget.14073
Kadurin A, Aliper A, Kazennov A, et al. The cornucopia of meaningful leads: Applying deep adversarial autoencoders for new molecule development in oncology. Oncotarget. 2017 Feb 14;8(7):10883-10890. doi:10.18632/oncotarget.14073 Day 28:小學生談「生成對抗網路」(Generative Adversarial Network,GAN),2018年1月7日,https://ithelp.ithome.com.tw/articles/10196257 *

Also Published As

Publication number Publication date
US20210202049A1 (en) 2021-07-01
TW202124794A (zh) 2021-07-01
US11664094B2 (en) 2023-05-30

Similar Documents

Publication Publication Date Title
Xu et al. Ordered weighted distance measure
CN111709244B (zh) 一种用于矛盾纠纷事件因果关系识别的深度学习方法
Li et al. Multi-attribute group decision-making considering opinion dynamics
CN104102762A (zh) 云模型模糊层次分析法在铁路信号系统风险分析中的应用
CN111626616A (zh) 一种众包任务推荐方法
CN105975457A (zh) 基于全自动学习的信息分类预测系统
TWI740415B (zh) 藥物篩選系統與藥物篩選方法
CN104537418A (zh) 一种自底向上的高维数据因果网络学习方法
Rabbi Factors influencing fertility preference of a developing country during demographic transition: Evidence from Bangladesh
CN106445908A (zh) 文本识别方法和装置
CN111729310B (zh) 游戏道具的整理方法、装置和电子设备
Xie et al. Dual probabilistic linguistic term set and its application on multi-criteria group decision making problems
CN113053470B (zh) 药物筛选系统与药物筛选方法
CN106778054A (zh) 基于数据挖掘的在校学生成绩预警方法
Zhao et al. [Retracted] Athleteʼs Physical Fitness Prediction Model Algorithm and Index Optimization Analysis under the Environment of AI
Zanghi et al. Strategies for online inference of model-based clustering in large and growing networks
CN111209399A (zh) 文本分类方法、装置和电子设备
Alsulami et al. Hybrid fuzzy sustainability assessment model: A case study of a regional infrastructure transport project
CN115147750B (zh) 一种基于构造式联邦学习的矿井人员违规动作识别方法
CN107545035A (zh) 一种信息搜索方法及装置
CN115018471B (zh) 数据处理方法及相关装置
Halavati et al. An artificial immune system with partially specified antibodies
CN108717587A (zh) 一种基于多面排序网络解决推文预测转发任务的方法
CN107886359A (zh) 一种基于机器学习的报价方法
CN115758527A (zh) 支护参数预测模型的训练方法、确定方法、装置及设备