
Senior NVIDIA GPU Cluster Engineer
ESTEN s.r.o.
Práca z domu
plný úväzok, skrátený úväzok, živnosť
Od 8 000 EUR/mesiac*v závislosti od relevantných skúseností
Informácie o pracovnom mieste
Náplň práce, právomoci a zodpovednosti
Hľadáme skúseného experta, ktorý prepája svet Linuxu, infraštruktúrnej automatizácie (Terraform/Ansible) a extrémneho výkonu NVIDIA GPU clusterov.
Budujeme strategickú dátovú platformu pre automatizáciu procesov v rámci EÚ trhu so silným dôrazom na škálovateľné AI a HPC riešenia. Naším cieľom je vytvoriť moderný bare-metal AI cloud, ktorý kombinuje surový výkon fyzického hardvéru s flexibilitou a automatizáciou cloudových prístupov.
Náplň práce (Tvoja misia)
Nejde o klasickú virtualizáciu – budeš pracovať s infraštruktúrou navrhnutou špeciálne pre AI workloady a vysokovýkonné výpočty postavené na NVIDIA GPU ekosystéme (CUDA, NCCL, GPU scheduling).
Orchestrácia infraštruktúry
Budeš zodpovedný za provisioning, správu a škálovanie stoviek bare-metal serverov a GPU nodov (PXE boot, OS deployment), optimalizovaných pre AI a HPC workloady.
Automatizácia ako štandard (IaC)
Navrhovanie, vývoj a správa pokročilých Ansible playbookov a Terraform konfigurácií pre plne automatizované nasadzovanie a správu infraštruktúry.
Optimalizácia výkonu GPU clusterov
Správa Debian-based prostredí, ladenie kernelu, driverov a firmware s cieľom maximalizovať výkon, stabilitu a efektivitu NVIDIA GPU infraštruktúry.
Monitoring & Observability
Implementácia a správa monitorovacích nástrojov (Prometheus/Grafana) so zameraním na GPU metriky, výkon clusterov a proaktívne riešenie incidentov.
Storage & Networking pre AI workloady
Správa high-performance úložísk (napr. WEKA) a optimalizácia sieťovej vrstvy (low-latency networking, RDMA) pre efektívne fungovanie GPU clusterov.
Identity & Access Management
Integrácia a správa autentifikačných a autorizačných systémov (napr. Keycloak, Entra ID) v rámci distribuovanej infraštruktúry.
Zamestnanecké výhody, benefity
Viac než len kód: Prečo sa k nám pridať?
Toto sú naše kľúčové benefity:
️ Hardcore Tech & Growth
- TechSpot Sessions: Pravidelné zdieľanie know-how o najnovších trendoch v AI infraštruktúre.
- Zlepšuj si angličtinu priamo v práci (1-2x týždenne).
Onsite & Team Vibes (Pre dni v office)
Keď zrovna neriešiš automatizáciu z domu, u nás ťa čaká:
ESTEN Liga: Turnaje v kalčete a brutálne XBOX sessions na reset hlavy.
Fuel for Brain: Kvalitná káva (Coffee time) a čerstvé ovocie (Fruitday).
Community: Od legendárnych „pív po práci“ (PPP) cez motokáry a splavy až po rodinný teambuilding.
️ Zdravie & Výkon
500 € Budget: Ročný príspevok na tvoje športové aktivity.
Endorfíny: Firemný florbal a podpora bežeckých tímov (Od Tatier k Dunaju).
Maratónska výzva: Preplatíme ti štartovné na MMM v Košiciach.
Impact (CSR)
Zmysluplná pomoc: Možnosť zapojiť sa do projektov neziskovky ESTEN príležitosť, ktorá mení životy v Tanzánii aj u nás na Slovensku.
Informácie o výberovom konaní
Náš výberový proces je rýchly a vecný:
Analýza CV – starostlivo posúdime prihlášky a rýchlo sa ozveme IBA vybraným kandidátom.
Krátky rozhovor (HR) – vysvetlíme rolu a ďalšie kroky.
Technické kolo – odborná diskusia zameraná na Linux, automatizáciu a NVIDIA GPU clustre.
Požiadavky na zamestnanca
Pozícii vyhovujú uchádzači so vzdelaním
vysokoškolské II. stupňa
vysokoškolské III. stupňa
Jazykové znalosti
Osobnostné predpoklady a zručnosti
Koho hľadáme
Táto rola je pre niekoho, kto má Linux „v rukách“, miluje automatizáciu a zároveň rozumie tomu, čo znamená prevádzkovať NVIDIA GPU clustre v produkčnom, vysoko výkonnom AI prostredí.
Nebojíš sa pracovať s bare-metal infraštruktúrou a keď treba, vieš ísť až „k racku“ v dátovom centre – pretože rozumieš celému stacku od hardvéru až po AI workloady.
Technické zručnosti (Hard Skills)
Advanced Linux Expert
Hlboká znalosť Linuxu v produkčnom prostredí (preferujeme Debian), vrátane ladenia výkonu pre GPU workloady a NVIDIA stack (drivers, CUDA, kernel tuning).
Automation & IaC (Ansible / Terraform)
Automatizácia je pre teba štandard – skúsenosti s návrhom a správou infraštruktúry ako kódu v prostredí škálovaných GPU clusterov.
GPU & Bare-Metal Infrastructure
Rozumieš životnému cyklu serverov (PXE boot, firmware, Redfish/IPMI) a máš skúsenosti s nasadzovaním a správou GPU nodov optimalizovaných pre NVIDIA architektúru.
Networking pre HPC/AI
Solídny prehľad v sieťach (L1/L2, VLAN, routing, DNS, firewally) so zameraním na low-latency a high-throughput komunikáciu (výhodou RDMA, InfiniBand).
Monitoring & Observability
Skúsenosti s Prometheus/Grafana, ideálne aj s monitoringom GPU metrík, výkonu a utilization NVIDIA clusterov.
Identity & Access Management
Práca so systémami ako Keycloak, Entra ID alebo LDAP v distribuovanom infra prostredí.
Mission-Critical Mindset
Skúsenosť s 24/7 produkciou, dôraz na stabilitu, dostupnosť a znalosť ITIL procesov (Incident/Change management).
Osobnostné predpoklady (Soft Skills)
Analytický Troubleshooter
Keď GPU cluster neškáluje alebo výkon padá, ideš po koreň problému – od aplikácie, cez scheduler až po hardware.
Zmysel pre detail a dokumentáciu
Vieš, že v prostredí s tisíckami NVIDIA GPU je presná dokumentácia (NetBox, runbooky) kritická pre stabilitu.
Tímový hráč s iniciatívou
Spolupracuješ s platform engineering a AI tímami – vieš prepájať infraštruktúru s potrebami modelov a workloadov.
Odolnosť voči stresu
Pracuješ v prostredí, kde „zero outage“ nie je cieľ, ale štandard – najmä pri AI/HPC výpočtoch.
Výhodou (nice to have)
Skúsenosť s veľkými NVIDIA GPU klastrami alebo HPC prostredím
Znalosť GPU ekosystému (CUDA, NCCL, GPU scheduling, multi-node training)
Skúsenosť s high-performance storage (napr. WEKA)
Znalosť high-speed networking (InfiniBand, RDMA)
Skúsenosť s GitOps princípmi
Inzerujúca spoločnosť
Stručná charakteristika spoločnosti
V ESTENE neposkytujeme len služby – meníme technológie na skutočný biznisový dopad. Našich klientov nevnímame ako položky v zozname, ale ako dlhodobých partnerov, ktorých biznis DNA potrebujeme stopercentne pochopiť, aby sme ho mohli posunúť vpred.
Prečo pracovať práve s nami?
Kvalita nad kvantitu: Sme cieľavedomý tím expertov, ktorí si zakladajú na otvorenej komunikácii a hovoria veci na rovinu.
Sila malého tímu: Máme ambíciu udržať si veľkosť pod 40 ľudí. Veríme totiž v silu úzkych vzťahov, priateľskú atmosféru a vysokú efektivitu, ktorú korporáty nepoznajú.