• Szerző: Peter Vnuk
A felhő gyorsan üzembe helyezi a vállalati AI-t, de a rendszeres használat pénzügyi kontrollt igényel. Amint a belső asszisztensek, a dokumentumkezelés vagy az ágensek fejlesztése hónapról hónapra hasonló számlát produkál, már nem elég azt kérdezni, mennyibe kerül egyetlen lekérdezés. Sokkal fontosabb, hogy hány hónap alatt fizetné ki magát ugyanez a terhelés saját eszközön.
Első ránézésre a saját AI infrastruktúra drágának tűnik, mert a teljes költsége egyszerre jelenik meg. A felhő ezzel szemben havi részletekre bomlik, ami kevésbé fáj a büdzsének, hosszabb távon viszont jóval magasabb összegre rúghat. A TCO számítás mindkét változatot ugyanarra az idővonalra vetíti: az egyszeri beszerzést és üzemeltetést az ismétlődő felhőfogyasztással állítja szembe.
A felhős oldalon a teljes AI üzemeltetési számla számít, nem csupán a modell ára. A vállalati megoldásoknál jellemzően fizetni kell a dokumentumkezelésért, az adattárolásért, a keresési rétegért, a naplózásért és a monitorozásért is. Kisebb pilot projektnél ezek mellékesnek tűnnek, de stabil éles üzemben hónapokkal tolhatják ki a saját eszköz megtérülését.
A helyi infrastruktúránál nem elég a beszerzési árat beírni. A cégnek kalkulálnia kell az áramköltséggel, az alapszintű üzemeltetéssel, a szervizkerettel és az IT csapat telepítésre fordított idejével is. A terhelés egy részének felhőből való áthozatala ráadásul egyszeri többletmunkát igényelhet: a környezet beállítását, az adatfolyamatok átalakítását és a biztonsági szabályok ellenőrzését.
| Költségtétel | Felhős üzemeltetés | Saját infrastruktúra |
|---|---|---|
| A számítás alapja | havi AI-szolgáltatási számla | az eszköz beszerzési ára |
| Rendszeres rezsiköltség | a modell körüli szolgáltatások és monitoring | áramfogyasztás és karbantartás |
| Egyszeri munka | induláskor jellemzően alacsonyabb | üzembe helyezés, integráció, biztonsági beállítások |
| Fő pénzügyi kockázat | korlátlan fogyasztásnövekedés fix plafon nélkül | kihasználatlan kapacitás a vásárlás után |
| Leginkább ajánlott felhasználás | forgatókönyvek gyors validálása | ismétlődő üzemeltetés ismert terhelés mellett |
A modellszámításhoz az NVIDIA DGX Spark 4TB munkaállomást használjuk, amelynek beszerzési ára 1 943 990 Ft. Ez egy helyi AI munkaállomás 128 GB memóriával, 4 TB-os SSD-vel és akár 1 PFLOP teljesítménnyel FP4 inferencia esetén, sparsity mellett. Az ismert beszerzési árnak köszönhetően jól bemutatható rajta, hogyan változik a megtérülés a rendszeres cloudköltségek nagyságától függően.
i
A megtérülési pont hónapokban = (az eszköz beszerzési ára + az egyszeri bevezetési költségek) ÷ (havi cloudköltségek – a saját infrastruktúra havi üzemeltetési költsége)
385 743 Ft-os havi cloudhasználat és 38 574 Ft-os modellszintű helyi üzemeltetési költség mellett a megtérülés körülbelül 5,6 hónapra jön ki. Ha ugyanaz a vállalat havi 154 297 Ft-ot fizet a cloudért, a megtérülés 16,8 hónapra hosszabbodik. A különbség nem az eszköz árából adódik, hanem abból, hogy mennyi ismétlődő munkát tud átvenni.
| Havi cloudszámla | Modellszintű helyi üzemeltetés | Megtérülés 1 943 990 Ft-os ár mellett |
|---|---|---|
| 154 297 Ft | 38 574 Ft | 16,8 hónap |
| 231 446 Ft | 38 574 Ft | 10,1 hónap |
| 385 743 Ft | 38 574 Ft | 5,6 hónap |
| 617 189 Ft | 38 574 Ft | 3,4 hónap |
A táblázat egy alapmodellt mutat be az eszköz beszerzési árával és a rendszeres helyi üzemeltetési költséggel. Ha a cég az üzembe helyezés egyszeri munkáját is beleszámolja – például a környezet beállítását, az adatfolyamatok átalakítását vagy a biztonsági ellenőrzést –, azt hozzáadja a kezdeti beruházáshoz, és a megtérülési pont kitolódik. Például 771 486 Ft egyszeri költség esetén a megtérülés havi 385 743 Ft felhőfogyasztásnál 5,6 hónapról nagyjából 7,8 hónapra nőne.
Ez a táblázat jóval alkalmasabb döntés-előkészítő anyag, mint egy általános vita a felhő és a hardver előnyeiről. Alacsony fogyasztás mellett a vásárlás még nem feltétlenül tűnik meggyőzőnek, különösen akkor, ha a cég még csak keresi a megfelelő AI-felhasználási területeket. Amint azonban a havi számla az alsó százezres tartományba kerül, és a kihasználtság kiszámítható ritmust követ, a beruházás már konkrét megtérülési horizonttal rendelkezik.
Az NVIDIA DGX Spark azoknak a cégeknek és csapatoknak készült, amelyek helyben szeretnék futtatni vagy tesztelni a nagyobb AI-modelleket anélkül, hogy a felhőköltségek folyamatosan nőnének. Kiválóan alkalmas belső asszisztensekhez céges dokumentáció felett, ágensek fejlesztéséhez, nyílt modellek teszteléséhez, valamint olyan adatokkal való munkához, amelyeknek a cég ellenőrzése alatt kell maradniuk. A lényeg elsősorban a nagy memóriakapacitás, a kompakt kialakítás és a kész szoftverkörnyezet kombinációja.
A 128 GB memóriakapacitás ebben a kategóriában fontosabb, mint a szokásos processzorteljesítmény. A helyi AI-feladatok ugyanis gyakran éppen a memórián és a modell méretén akadnak el, nem azon, hogy az eszköz képes-e irodai munkát végezni. A gyakorlatban tehát egy dedikált csomópontról van szó AI-terheléshez, amelyet a cég ismételten ki tud használni.
Ilyen vásárlásnál két határértéket érdemes figyelni. Az első a megtérülés a jelenlegi felhasználás mellett, a második a megtérülés reális növekedés esetén. Ha az AI egy sikeres pilot után újabb csapatra terjed ki, a felhőszámla azonnal nőni fog, míg a saját eszköz a költségvetésben már egyszer ki van fizetve – ami végső soron alapvető pénzügyi különbséget jelenthet.
A TCO-kalkuláció leginkább akkor lesz pontatlan, ha optimista kiindulóadatokra épül. A cég alábecsüli az IT-csapat idejét, megfeledkezik a monitoringról, vagy olyan kihasználtsággal számol, ami végül nem igazolódik be. A jóváhagyáshoz hasznosabb egy óvatosabb forgatókönyv, mint egy olyan táblázat, ami csak azért mutat szép megtérülést, mert valaki nem vette bele az összes költséget.
| Kalkulációs tétel | Gyakori hiba | Jobb megközelítés |
|---|---|---|
| Havi felhőszámla | csak a modell árát veszik figyelembe | a kapcsolódó szolgáltatásokat és a monitoringot is bele kell számolni |
| Helyi üzemeltetés | az áramot beleszámolják, az üzemeltetést nem | havi tartalékot kell képezni az IT-csapat idejére |
| IT-kapacitás | azzal számolnak, hogy az üzemeltetést valaki mellékesen megoldja | ellenőrizd, van-e a cégnél ember a telepítésre, frissítésekre és folyamatos felügyeletre |
| Egyszeri beüzemelés | a migrációt magától értetődőnek veszik | számold bele a projekt induló költségébe |
| Eszközkihasználtság | ideális kihasználtsággal számolnak | dolgozz gyengébb forgatókönyvvel is |
| Jövőbeli növekedés | figyelmen kívül hagyják a további csapatokra való kiterjesztést | számold ki a 6–12 hónapos variánst is |
| Rugalmasság | a felhőt csak költségként kezelik | értékeld a fogyasztás gyors csökkentésének lehetőségét |
A lekötött tőke kockázata ugyanúgy beletartozik a kalkulációba, mint az eszköz ára. Ha a tervezett kihasználtság nem igazolódik be, a helyi munkaállomás az idő egy részében kihasználatlanul áll majd, míg a felhőt egyszerűen le lehetne szűkíteni. Éppen ezért a kalkulációnak nemcsak az alap forgatókönyvvel kell dolgoznia, hanem egy óvatosabb variánssal is, ami megmutatja, hogy a vásárlás lassabb felfutás mellett is megállja-e a helyét.
A helyi AI munkaállomás jó első lépés, amikor a cégnek át kell vennie a felhős terhelés egy stabil részét, és saját környezetet kell kialakítania fejlesztéshez, inferenciához vagy belső adatokkal való munkához. Nagyobb léptékű alkalmazásoknál viszont előbb-utóbb beleütközhet a teljesítmény, a memória, a rendelkezésre állás vagy a több csapat számára történő kezelés korlátaiba. Ilyenkor már nem egyetlen eszköz beszerzéséről van szó, hanem egy átfogóbb AI infrastruktúra megtervezéséről az adott üzemeltetési igényekhez igazodva.
Köztes megoldás lehet több önálló, azonos kategóriájú munkaállomás, ha a cégnek el kell különítenie a csapatokat, projekteket vagy párhuzamos feladatokat. Gazdaságilag az ilyen forgatókönyvet az eszközök száma és üzemeltetési költségeik alapján kell kalkulálni, technikailag viszont ez nem jelenti a teljesítmény és a memória automatikus összevonását egyetlen nagyobb rendszerré. Több munkaállomás főleg ott indokolt, ahol a terhelés felosztható; egyetlen nagy, központi AI üzemeltetéshez inkább egyedi, magasabb szintű infrastruktúra tervezése a célravezető.
A döntő jelzés a terhelés volumene. Ha a cég hosszú távon havi több millió forintot fizet AI üzemeltetésre, több csapattal dolgozik, és elkülönített környezetekre van szüksége, érdemes egyedi kalkulációt készíteni egy magasabb szintű infrastruktúrára. A megtérülés alapképlete ugyanaz marad, de a számításba már konkrét ajánlat, pontosabb üzemeltetési költségbecslés és a felhős fogyasztás azon része kerül, amelyet az új megoldásnak kell kiváltania.
Alacsonyabb összegek esetén meggyőzőbb egy beárazott munkaállomással kezdeni, és mérni a tényleges kihasználtságot. Ezzel a cég saját adatokhoz jut a teljesítményről, az üzemeltetésről és a kihasználtságról, így az infrastruktúra esetleges későbbi bővítése nem becslésre, hanem valós üzemeltetési tapasztalatokra épül.
Első tájékozódáshoz négy szám is elegendő:
Az eredmény megmutatja a megtérülési pontot hónapokban, valamint a felhőhöz képesti különbséget hároméves időtávon. A három év a céges hardver esetében gyakorlatias időtáv, mert jobban tükrözi az eszköz élettartamát, mint egy egyszeri összehasonlítás egyetlen számlával.
| A számítás eredménye | Mit jelent | Javasolt következő lépés |
|---|---|---|
| Megtérülés 12 hónapon belül | erős gazdasági jelzés a beszerzés mellett | ellenőrizd az eszköz műszaki paramétereit, és készítsd elő a jóváhagyást |
| Megtérülés 12–24 hónap között | határzóna, ahol további tényezők döntenek | számold bele a felhasználás növekedését, az adatbiztonságot és az IT kapacitás rendelkezésre állását |
| Megtérülés 24 hónapon túl | önmagában a megtakarítás egyelőre nem feltétlenül indokolja a beszerzést | mérd tovább a felhőszámlát, és a terhelés növekedésekor térj vissza a kalkulációhoz |
| Negatív vagy nulla megtakarítás | a helyi üzemeltetés nem jön ki olcsóbban a felhőnél | tartsd meg a forgatókönyvet a felhőben, vagy módosítsd a számítás bemeneti adatait |
A 12 hónapon belüli megtérülés erős jelzés a vásárlás mellett, feltéve, hogy a helyi eszköz technikailag elbírja a szükséges terhelést. A 12 és 24 hónap közötti eredmény már további tényezőktől függ, elsősorban az érzékeny adatok kezelésétől és az AI-használat várható növekedésétől. A hosszabb időtáv nem zárja ki automatikusan a vásárlást, de a puszta megtakarításon túl egyértelmű indokot igényel – például belső biztonsági szabályzatot vagy a helyi fejlesztés szükségességét.
385 743 Ft-os havi cloudhasználat és 38 574 Ft-os modellszintű helyi üzemeltetési költség mellett az 1 943 990 Ft-os eszköz körülbelül 5,6 hónap alatt térül meg. 231 446 Ft-os havi összegnél a megtérülés nagyjából tíz hónapra tolódik, ami még mindig olyan időtáv, amely már megér egy költségvetési vitát. A döntő tényező nem maga a beszerzési ár, hanem a rendszeres cloudfizetés és a saját kapacitás üzemeltetése közötti különbség.
A következő lépés az utolsó cloudszámlák áttekintése, az ismétlődő AI-terhelés elkülönítése az egyszeri kísérletektől, majd egy konkrét eszköz beillesztése a számításba. Ha az eredmény hónapokban mérhető, a cégnek világos alapja van egy helyi AI munkaállomás megvásárlásához. Ha a számok egyelőre még nem kedvezőek, érdemes tovább figyelni a havi cloudszámlát, az aktív felhasználók számát és az ismétlődő terhelés arányát, mert éppen ezek az értékek mutatják meg a leggyorsabban, mikor válik gazdaságilag indokolhatóvá a saját AI-infrastruktúra beszerzése.
i
Az interaktív kalkulátor készülőben van. Addig is a fenti képlet és modellszituációk alapján becsülheted meg a megtérülést.