Diplomová práce

Hyperparameter Optimization for Molecular Dynamics Calculations in Kubernetes

Adam Ondrejka
Anotace

Efektivita simulací molekulární dynamiky silně závisí na správné konfiguraci parametrů simulace, jako je počet výpočetních uzlů, počet procesů MPI, počet vláken v procesech a využití GPU při výpočtech. Nesprávné nastavení může vést k nízkému výkonu, plýtvání zdroji a časem výpočtu, což je běžné, protože optimalizace je pro mnoho uživatelů obtížná. Cílem této práce je implementovat službu pro automatizaci …více

Abstract

The efficiency of molecular dynamics simulations heavily depends on correctly configuring the simulation’s parameters, such as the number of computational nodes, the number of MPI processes, the number of threads in the processes, and whether GPUs are leveraged in the computation. Incorrect settings can lead to poor performance, wasted resources, and computational time, which is common because optimization …více

Zadání práce
Molekulární dynamika je dekádami prověřená technika simulace chování chemických systémů (mj. biomolekul) založená na integraci pohybových rovnic všech atomů v systému. Těch mohou být až miliony, proto je metoda výpočetně náročná.

Konfigurace výpočtu molekulární dynamiky v technickém smyslu, při zachování identického významu simulace jako takové, je tvořena řadou parametrů, zejména počet výpočetních uzlů, počet procesů MPI a vláken v jednom procesu, mapování jednotlivých fází výpočtu na GPU, sdílení GPU mezi více procesy atd. Jen část těchto parametrů je dána nastavením simulace, v ostatních má uživatel prakticky plnou volnost, a tedy potenciální počet možných kombinací je obrovský. Přitom vliv nastavení na výkon je významný a leckdy neintuitivní. Řada uživatelů si s tímto nastavením neví rady, což často vede ke zbytečně dlouhým výpočtům a plýtvání výpočetními zdroji.

Prvním cílem práce je navrhnout architekturu služby pro ladění těchto parametrů výpočtu. Vstupem zde bude zadání simulace, služba automaticky provede sérii experimentů s různým nastavením parametrů, změří jejich výkon a výsledky předá uživateli. Počítá se s nasazením v prostředí Kubernetes. Návrh musí být přiměřeně flexibilní, aby bylo možné jej v budoucnu rozšířit o další vzory výpočtu. Součástí návrhu bude i vhodné API, které bude použitelné z příkazové řádky i grafického rozhraní (implementace GUI už není povinnou částí této práce).


Implementace služby musí dovolit alespoň ladění počtu výpočetních uzlů, procesů MPI a vláken, a přiřazení částí výpočtu na GPU, včetně sdílení GPU více procesy. Kromě standardního nastavení výpočtu musí být pokryt i scénář tzv. "replica exchange" s hierarchickou strukturou procesů MPI.

Protože v reálných případech bude možných kombinací hyperparametrů vždy více, než by bylo realistické vyčerpávajícím způsobem vyzkoušet, práce se také zaměří na výběr vhodných algoritmů hledání optimální konfigurace.

Práce zkontrolována:
18. 12. 2024 09:27, Mgr. Aleš Křenek, Ph.D., učo 3086
Plný text práce
170,8 KB / soubor PDF
Jazyk práce
angličtina angličtina
Termín obhajoby
29. 1. 2025
Práce nebyla obhájena

Student v rámci svého studia diplomovou práci obhájil 18. 6. 2025.

Vedoucí

Mgr. Aleš Křenek, Ph.D., učo 3086
NCBR PřF MU

Oponent

doc. RNDr. David Svoboda, Ph.D., učo 2824
KVI FI MU

Masarykova univerzita Fakulta informatiky
Studijní program
Plán
Návrh a vývoj softwarových systémů
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.