AI infraštruktúra
UVT prevádzkuje v rámci svojho dátového centra systém Nvidia DGX, ktorý je primárne určený pre výskum a vývoj umelej inteligencie, strojového učenia a pokročilých techník analýzy dát. Systém je vybavený procesorom AMD EPYC 7742 s 64 jadrami a 128 vláknami, pracujúcim na frekvencii 2,25 GHz (boost do 3,4 GHz). Disponuje 1 TB DDR4 RAM s frekvenciou 3200 MHz a podporou ECC. Grafický výkon zabezpečuje osem kariet NVIDIA A100, každá s 40 GB HBM2e pamäte, 6 912 CUDA jadrami a 432 Tensor jadrami, s priepustnosťou 1,6 TB/s. Úložisko predstavuje NVMe disk s kapacitou 15 TB.
Systém využíva Python notebooky, konfigurované pomocou Docker kontajnerov, čo umožňuje efektívne nasadzovanie a správu aplikácií. Distribúciu a správu výpočtových úloh zabezpečuje plánovací systém SLURM (Simple Linux Utility for Resource Management), ktorý umožňuje efektívne prideľovanie výpočtových zdrojov na základe požiadaviek používateľov. SLURM poskytuje robustné riešenie pre plánovanie úloh, správu front a optimalizáciu výpočtového výkonu v prostredí s viacerými používateľmi. Vďaka tomuto systému je možné dynamicky prideľovať a spravovať dostupné výpočtové zdroje podľa aktuálnych potrieb, čím sa zaručuje optimálne využitie infraštruktúry.
Konfigurácia pomocou Docker kontajnerov zabezpečuje prenositeľnosť aplikácií tým, že umožňuje ich balenie so všetkými závislosťami do izolovaných prostredí. Tento prístup eliminuje problémy spojené s rozdielmi v prostrediach, v ktorých aplikácie bežia, a zaručuje konzistentné správanie na rôznych platformách. Vďaka tomu je možné aplikácie jednoducho nasadzovať a spúšťať na rôznych systémoch bez potreby dodatočných úprav alebo konfigurácií.
Bližšie informácie nájdete na https://slurm.website.tuke.sk/ (stránka sa bude postupne aktualizovať).
Svoje otázky smerujte na dgx@helpdesk.tuke.sk