S rostoucí poptávkou po výpočetním výkonu – zejména kvůli rozvoji umělé inteligence – roste také spotřeba elektrické energie superpočítačů. Optimalizací energetické efektivity datových center se už deset let zabývají vědci z národního superpočítačového centra IT4Innovations při VŠB – Technické univerzitě Ostrava. Díky mezinárodní spolupráci a vlastním inovacím dnes patří české superpočítačové centrum mezi evropské lídry v oblasti optimalizace energetické efektivity výpočtů. Šetření energie přitom není jen otázkou nákladů, ale i aktivním příspěvkem k ochraně životního prostředí.
Vyšší spotřeba energie se netýká jen superpočítačů, ale i datových center určených pro umělou inteligenci. Společnosti jako Google, Amazon či Meta staví své areály přímo u elektráren, aby měly zajištěný dostatek energie. Odhady přitom naznačují, že spotřeba datových center pro AI může do konce desetiletí vzrůst až čtyřnásobně.
„Nejvíce elektřiny spotřebují samotné procesory a akcelerátory. Navíc se při práci zahřívají, takže je nutné i chlazení, které přidává 8 až 30 % energie navíc,“ vysvětluje Lubomír Říha vedoucí Laboratoře pro výzkum infrastruktury IT4Innovations. „Každá nová generace čipů dokáže z jednotky energie získat více výpočtů, ale poptávka po výkonu roste ještě rychleji – mluvíme zde o tzv. Jevonsově paradoxu.“
MERIC: český software, který šetří megawatty
Úspory energie v superpočítačových centrech se hledají nejen v hardwaru, ale i v softwaru. Jedním z klíčových nástrojů vyvíjených v IT4Innovations je open-source software MERIC – sada nástrojů pro monitorování, správu a optimalizaci spotřeby energie v datových centrech. MERIC umožňuje superpočítačům pracovat rychle a zároveň úsporně – měří spotřebu energie, sleduje využití procesorů (CPU) a výpočetních akcelerátorů (např. GPU) a podle aktuální zátěže dynamicky upravuje jejich nastavení. Uživatelé tak mohou měřit spotřebu energie na úrovni aplikací nebo jejich součástí, a navíc sami přizpůsobit nastavení systému pro maximální výkon bez plýtvaní elektrickou energií. Součástí MERIC Software Suite je i infrastruktura pro sledování spotřeby a teploty v datových sálech, včetně 3D vizualizace, která v reálném čase zobrazuje aktuální stav systémů. To umožňuje správcům lépe identifikovat problematická místa (např. v systému chlazení) a lépe pochopit vazby mezi jednotlivými částmi superpočítače. Na administrátorské úrovni poskytuje MERIC pravidly řízené omezení výkonu (tzv. power capping), které udržuje spotřebu pod stanovenými limity.
„Díky MERIC jsme u některých výpočtů snížili spotřebu elektrické energie až o 34 %, v průměru kolem 16 %, a to bez výrazného zpomalení výpočtů,“ uvádí Ondřej Vysocký vedoucí výzkumné skupiny, která stojí za vývojem MERIC. „Jeho modulární architektura navíc umožňuje snadnou integraci do stávajících systémů správy a monitoringu HPC center.“ Software je nasazen nejen na českém superpočítači Karolina, ale i na portugalském Deucalionu, které patří do sítě celoevropského společného podniku EuroHPC (EuroHPC JU). „V následujících týdnech vyjde nová verze MERIC. Runtime system bude nasazen na všech superpočítačích EuroHPC JU, a umožní tak uživatelům těchto strojů jednotným způsobem vyhodnocovat energetickou efektivitu jejich aplikací,“ dodává Ondřej Vysocký.
„MERIC nabízí rozhraní pro běžně používané programovací jazyky. Dokáže efektivně pracovat s paralelními aplikacemi a šetřit energii, aniž by snižoval jejich výkon, případně lze vliv na výkon plně kontrolovat. MERIC lze používat na různých typech počítačů – od běžných procesorů až po výkonné výpočetní (např. grafické) akcelerátory – a spolupracuje s většinou systémů pro sledování spotřeby energie,“ shrnuje Lubomír Říha.
Karolina: chytrý výkon, nižší emise
IT4Innovations v roce 2023 zavedlo i omezení provozních frekvencí procesorů superpočítače Karolina, čímž se podařilo snížit spotřebu energie a tím i uhlíkovou stopu. „Dopad na uživatele byl minimální – u úloh náročných na výkon procesoru nebo akcelerátoru se doba výpočtu prodloužila maximálně o 16 %, nicméně u úloh závislých na rychlosti paměti systému, které na našich systémech převažují z 80 %, ke zpomalení nedochází.“ doplňuje Lubomír Říha.
Dlouhodobý důraz na energetickou efektivitu se odráží i v mezinárodních žebříčcích. V žebříčku energetické efektivity největších superpočítačů světa Green500 se akcelerovaná část Karoliny po svém spuštění v roce 2021 umístila na 15. místě, o půl roku později díky optimalizaci nastavení parametrů ve spolupráci s HPE (dodavatelem počítače) postoupila na 8. příčku a i po více než čtyřech letech provozu si udržuje pozici v první stovce – aktuálně na 77. místě.
„Optimalizace superpočítače Karolina přinesla výrazné výsledky – oproti původnímu stavu se podařilo snížit příkon, což představuje roční finanční úsporu v řádu několika milionů korun. A ekologicky to odpovídá snížení emisí CO₂, jaké by zajistilo přes 12 600 vzrostlých stromů. Energetická účinnost superpočítačů je pro nás klíčová. Naším cílem není jen provozovat výkonné stroje, ale také je provozovat chytře a úsporně,“ dodává Lubomír Říha.
MERIC Energy Efficiency HPC SW Suite: https://code.it4i.cz/energy-efficiency/meric-suite
*Vývoj softwaru MERIC byl zahájen v roce 2015 díky projektu READEX a jeho další rozvoj je podpořen e-infrastrukturou pro výzkum a vývoj v ČR e-INFRA CZ a několika evropskými projekty, mimo jiné EUPEX, POP3 Centre of Excellence, SEANERGYS nebo DARE.