W dzisiejszym cyfrowym świecie, gdzie sztuczna inteligencja (AI) coraz śmielej wkracza do naszych biur i domów, kluczowym aspektem wykorzystania tych zaawansowanych technologii staje się zrozumienie i kontrola kosztów ich implementacji. Korzystanie z AI może przynieść niesamowite korzyści, ale równie ważne jest, aby nie dopuścić, by budżet na te innowacje wymknął się spod kontroli. W tym poście przyjrzymy się różnym podejściom do korzystania z AI, od modeli jako usługi po dedykowane rozwiązania, analizując przy tym ich potencjalny wpływ na finanse przedsiębiorstwa. Rozważmy, jak można efektywnie zarządzać kosztami związanymi z AI, aby maksymalizować korzyści przy jednoczesnym minimalizowaniu wydatków.
Zacznijmy naszą podróż od podstaw – czym właściwie jest AI? Termin “sztuczna inteligencja” może przywodzić na myśl sceny z filmów science fiction, ale rzeczywistość jest bardziej przyziemna, jednak równie fascynująca. AI to zdolność maszyn do wykonywania zadań, które tradycyjnie wymagały ludzkiej inteligencji. Obejmuje to takie umiejętności jak rozumowanie, uczenie się, planowanie i rozumienie języka.
AI nie ogranicza się wyłącznie do najbardziej zaawansowanych systemów, takich jak generatywne modele językowe typu ChatGPT. Nawet stosunkowo proste modele uczenia maszynowego, które pomagają w filtracji spamu czy rekomendacji produktów w sklepach internetowych, są także wartościowymi przykładami metod sztucznej inteligencji. Dodatkowo, w zależności od przypadku, warto również sięgnąć po algorytmy optymalizacyjne, symulacje i heurystyki.
Umiejętny dobór metod AI, potrafi znacząco poprawić efektywność i skuteczność biznesową, jednak jednocześnie może mieć znaczący wpływ na koszty firmy. W dalszej części posta przyjrzymy się bliżej, jak te różne formy AI wpisują się w strukturę kosztów i jak można nimi efektywnie zarządzać, aby zyskać przewagę konkurencyjną, nie nadwyrężając przy tym budżetu.
W ostatnich kilku latach najdynamiczniej rozwija się generatywna sztuczna inteligencja (GenAI). W tej dziedzinie największą użytecznością i uniwersalnością charakteryzują się duże modele językowe (LLM) pozwalające zautomatyzować czynności co do których automatyzacja wcześniej wydawała się niemożliwa. Równocześnie rozwinął się model dystrybucji tych algorytmów, który na potrzeby niniejszego posta określmy mianem GenAI-as-a-Service. Ten model, wykorzystywany przez platformy takie jak GPT-4 od OpenAI lub Claude od Anthropic, oferuje dostęp do potężnych narzędzi AI jako zarządzanych usług, dostępnych zwykle poprzez API. To rozwiązanie pozwala organizacjom na korzystanie z zaawansowanych funkcji AI bez potrzeby posiadania własnej infrastruktury czy specjalistycznej wiedzy technicznej.
GenAI-as-a-Service jest nie tylko wygodne, ale również najtańsze na początkowych etapach. Płaci się proporcjonalnie do użycia, co oznacza, że mniejsze projekty mogą korzystać z zaawansowanych możliwości AI bez ogromnych inwestycji początkowych. To idealne rozwiązanie dla start-upów i średnich przedsiębiorstw, które chcą eksperymentować z AI lub potrzebują elastyczności w skalowaniu usług w zależności od bieżących potrzeb.
Jednak, jak wszystko, co wygodne, GenAI-as-a-Service ma swoją cenę, szczególnie przy intensywnym użytkowaniu. Gdy liczba danych do przetworzenia rośnie, rosną także koszty. Dlatego, choć na początku może się wydawać atrakcyjne cenowo, w dłuższej perspektywie koszty mogą znacznie wzrosnąć. W dalszej części posta zastanowimy się, jak zarządzać tymi kosztami i kiedy warto rozważyć alternatywne opcje, które mogą okazać się bardziej opłacalne przy większej skali operacji.
Zacznijmy jednak od rzutu okiem na dostępne alternatywy. Jedną z nich jest samodzielne hostowanie modeli GenAI w infrastrukturze własnej lub chmurowej. To podejście, choć bardziej wymagające pod względem zasobów i kompetencji technicznych, może okazać się bardziej opłacalne przy dużej skali operacji. Przykładami modeli LLM, które można hostować samodzielnie, są LLama 3, Mixtral czy polski Bielik.
Hostowanie w ten sposób modeli AI daje pełną kontrolę nad ich działaniem i optymalizacją. Można dostosować model do specyficznych potrzeb organizacji, co często prowadzi do lepszej wydajności i niższych kosztów w dłuższej perspektywie. Aby hostować takie modele, potrzebna jest odpowiednio mocna infrastruktura, w tym maszyny wyposażone w GPU lub TPU, wspierające zaawansowane obliczenia.
Warto jednak pamiętać, że koszty związane z samodzielnym hostowaniem obejmują nie tylko infrastrukturę oraz czas pracy, ale wynagrodzenia dla ekspertów z odpowiednimi kompetencjami, aby uruchomić i utrzymać modele w ruchu. Więc, jest to rozwiązanie opłacalne dopiero przy większej ilości danych do przetworzenia. Początkowe inwestycje mogą być znaczące, ale samodzielne hostowanie modeli AI może dać większą elastyczność i potencjalnie niższe koszty operacyjne w długim okresie. To opcja szczególnie atrakcyjna dla większych firm lub tych, które przewidują intensywne wykorzystanie AI w swoich produktach lub procesach biznesowych.
W wielu przypadkach GenAI nie jest najlepszym rozwiązaniem. W takich sytuacjach z pomocą przychodzą klasyczne modele uczenia maszynowego (ML), przygotowane do konkretnych problemów. Te modele są znacznie mniejsze i prostsze w porównaniu do gigantycznych modeli GenAI, co sprawia, że ich wdrożenie i utrzymanie jest mniej kosztowne i bardziej efektywne.
Klasyczne modele ML są zazwyczaj skonstruowane do wykonywania jednego, konkretnego zadania. Mogą to być na przykład modele dedykowane klasyfikacji tekstów, które przypisują dokumenty do kategorii takich jak pozytywne, negatywne lub neutralne opinie.
Modele takie mogą również obsługiwać zupełnie inne zadania, jak prognozowanie szeregów czasowych, co pozwala przewidywać popyt na różne towary, albo segmentację obrazów pozwalającą znaleźć i zaznaczyć określone przez nas elementy na zdjęciach. A są to zadania nietekstowe, w związku z czym modele LLM, zwykle sobie z nimi nie radzą w ogóle, albo z wielkimi trudnościami.
Korzystanie z klasycznych modeli ML w większości przypadków nie oznacza obniżenia trafności działania. Mimo że są one prostsze, często osiągają bardzo dalej dobre, o ile nie lepsze, wyniki w zadaniach do których były wytrenowane. Skupiając się na jednym zadaniu, osiągają wysoką trafność mimo rzędy wielkości mniejszych rozmiarów.
W związku z tym, że wymagają znacznie mniej zasobów obliczeniowych niż GenAI, korzystanie z nich pozwala obniżyć koszty koniecznej infrastruktury. Oczywiście, wdrożenie takich rozwiązań wymaga także odpowiednich kompetencji w organizacji, ale korzyści wynikające z ich użycia, zwłaszcza w kontekście kosztów, są niezaprzeczalne.
W wielu przypadkach najlepszym rozwiązaniem nie jest ani GenAI, ani klasyczne uczenie maszynowe. Czasami najbardziej efektywnym rozwiązaniem okazuje się system algorytmiczny, opierający się na z góry określonych regułach i logice biznesowej. Te systemy, bazujące na wiedzy eksperckiej o zadaniu, mogą okazać się nie gorsze niż AI i ML, szczególnie tam, gdzie dobrze rozumiemy jego zawiłości i możemy precyzyjnie zdefiniować algorytm jego realizacji. Przykładem takiego systemu może być system wykrywający szkodliwe interakcje między lekami na recepcie w oparciu o bazę danych znanych interakcji.
Systemy algorytmiczne mają kilka kluczowych zalet. Po pierwsze, nie wymagają skomplikowanego procesu uczenia z danych, co znacząco upraszcza ich wdrożenie i utrzymanie. Ich działanie opiera się na znanej logice, która może być dostosowywana i aktualizowana w miarę zmieniających się potrzeb biznesowych. Są one też w pełni deterministyczne, co pozwala dużo lepiej przetestować tworzone oprogramowanie. To sprawia, że są one idealnym rozwiązaniem dla organizacji, które dysponują ekspercką wiedzą i potrafią przełożyć ją na konkretne instrukcje dla systemu.
Po drugie, koszty wdrożenia i utrzymania systemów algorytmicznych są zazwyczaj niższe w porównaniu z bardziej zaawansowanymi modelami AI. Brak potrzeby przetwarzania ogromnych ilości danych i ciągłego uczenia modelu sprawia, że są one mniej zasobożerne i bardziej przewidywalne pod względem kosztów operacyjnych.
Oczywiście, systemy algorytmiczne mają swoje ograniczenia i nie zawsze będą najlepszym wyborem. Jednak w sytuacjach, gdzie można precyzyjnie zdefiniować reguły i logikę działania w oparciu o znane algorytmy, mogą okazać się najbardziej efektywnym i ekonomicznym rozwiązaniem.

Przyjrzyjmy się przykładowej strategii budowy produktu lub automatyzacji procesu biznesowego z wykorzystaniem AI. Kluczowym elementem takiej strategii jest odpowiednie dobranie technologii do problemu, etapu rozwoju oraz skali operacji.
Na początek warto ocenić, czy dany problem można skutecznie rozwiązać algorytmicznie. Jeśli tak, warto skupić się na tym podejściu, ponieważ jest ono zazwyczaj najprostsze i najtańsze w utrzymaniu.
Gdy problem wymaga bardziej zaawansowanych metod, na początkowym etapie warto postawić na elastyczność i szybkie wdrożenie. W tym kontekście najlepszym wyborem jest podejście GenAI-as-a-Service, jak GPT od OpenAI, MS Azure lub Claude od Anthropic. Dzięki temu można szybko zintegrować zaawansowane funkcje AI, minimalizując czas i koszty początkowe. Pozwala to na szybkie przetestowanie naszej propozycji pod kątem rzeczywistych potrzeb użytkowników oraz ocenę, czy rzeczywiście optymalizuje ona proces biznesowy. Na tym etapie jest to również najtańsze rozwiązanie. Jednak w miarę jak rośnie aktywność użytkowników i ilość przetwarzanych danych, koszty mogą znacząco wzrosnąć.
Kiedy tak się stanie, warto rozważyć migrację na samodzielnie hostowane modele – zarówno GenAI/LLM, jak i klasyczne modele ML. Ze względu na koszty, w większości przypadków bardziej opłaca się korzystanie z klasycznych modeli ML. Modele LLM warto wykorzystywać tylko wtedy, gdy zadanie jest generatywne z natury lub wymaga bardzo wysokich zdolności kognitywnych modelu.
Taka strategia pozwala na elastyczne dostosowanie się do zmieniających się potrzeb i skali działalności, jednocześnie kontrolując koszty i zapewniając optymalne wykorzystanie dostępnych technologii AI. Dzięki temu można osiągnąć maksymalne korzyści z implementacji AI, minimalizując ryzyko eksplozji kosztów.
Jak wspomniano wcześniej, w niektórych przypadkach korzystanie z GenAI jest nieuniknione. Hostowanie modeli we własnej infrastrukturze jest zwykle kosztowne. Jest jednak kilka podejść, które mogą pomóc w obniżeniu tych wydatków, zapewniając jednocześnie zadowalającą skuteczność działania.
Przede wszystkim warto zadać sobie pytanie, czy rzeczywiście potrzebny jest model o jakości state-of-the-art. Wiele zadań można zrealizować za pomocą mniej zaawansowanych modeli, które są znacznie tańsze w hostowaniu i utrzymaniu. Korzystanie z mniejszych modeli może znacząco zmniejszyć koszty bez zauważalnego spadku jakości wyników.
Kolejną metodą redukcji kosztów jest wykorzystanie technik takich jak kwantyzacja. Kwantyzacja pozwala na zmniejszenie rozmiaru modelu i redukcję wykorzystania zasobów obliczeniowych, co przekłada się na niższe koszty operacyjne. Ta technika staje się coraz bardziej popularna w świecie AI, oferując znaczne oszczędności.
Warto również przemyśleć, jak szybkich odpowiedzi modelu potrzebujemy. Jeśli przetwarzanie w czasie rzeczywistym nie jest koniecznością, można rozważyć batchowe przetwarzanie danych. Zamiast utrzymywać maszyny z modelami działającymi non-stop, można zbierać dane i przetwarzać je w określonych interwałach czasowych. Takie podejście pozwala na efektywniejsze wykorzystanie zasobów i ograniczenie kosztów, szczególnie w środowiskach chmurowych, gdzie można skalować moce obliczeniowe w zależności od aktualnych potrzeb, unikając niepotrzebnych wydatków na nieużywane zasoby. Należy jednak pamiętać, że przetwarzanie batchowe ma swoje wyzwania, takie jak potencjalne trudności w dostępności maszyn z GPU w określonych momentach. Mimo to, w wielu przypadkach, korzyści z oszczędności kosztów mogą przewyższać te wyzwania.
Zarządzanie kosztami związanymi z implementacją sztucznej inteligencji to kluczowy element strategii każdej organizacji, która chce w pełni wykorzystać potencjał AI. Istnieje kilka skutecznych podejść, które mogą pomóc w optymalizacji wydatków, zapewniając jednocześnie wysoką jakość działania stworzonych rozwiązań.
Korzystanie z modeli na zasadzie GenAI-as-a-Service, np. jak w przypadku GPT-4 lub Claude, pozwala na szybkie i łatwe wdrożenie AI z niskimi kosztami początkowymi. To świetne rozwiązanie dla firm, które dopiero zaczynają swoją przygodę z AI, oferując elastyczność i płatność proporcjonalną do użycia.
Gdy skala operacji rośnie, warto rozważyć opracowanie klasycznych modeli ML, lub gdy nie jest to możliwe, hostowanie modeli GenAI we własnej infrastrukturze. Chociaż wymaga to nakładów na infrastrukturę i specjalistycznej wiedzy, może znacząco obniżyć koszty w dłuższej perspektywie, szczególnie przy dużym wolumenie przetwarzanych danych.
W wielu przypadkach, systemy algorytmiczne, bazujące na wiedzy eksperckiej i precyzyjnie zdefiniowanych regułach, mogą być najbardziej efektywnym i ekonomicznym rozwiązaniem. Są one najmniej zasobożerne pod względem kosztów, i najbardziej przewidywalne pod względem działania.
Gdy musimy korzystać z GenAI i hostować modele samodzielnie, istnieje wiele możliwości redukcji kosztów. Wykorzystanie mniejszych modeli, technik kwantyzacji oraz batchowe przetwarzanie danych może pozwolić znacząco obniżyć wydatki operacyjne, jednocześnie utrzymując wysoką jakość wyników.
Kluczem do sukcesu jest elastyczne podejście i umiejętne dostosowywanie wykorzystywanych rozwiązań do bieżących potrzeb i skali działalności. Dzięki temu można maksymalizować korzyści płynące z AI, jednocześnie kontrolując koszty i zapewniając sobie przewagę konkurencyjną na rynku.
Autor:
Krzysztof Jędrzejewski (https://www.linkedin.com/in/kjedrzejewski/)