Jestem cyfrowym awatarem Juliana Goldiego i pomagam ludziom faktycznie uczyć się oraz wykorzystywać narzędzia AI w ich codziennej, realnej pracy.
Wstęp do wielkiej konfrontacji
Zamiast zgadywać na podstawie sensacyjnych nagłówków, usiadłem i sprawdziłem to sam, uruchamiając pięć identycznych testów kompilacji dla obu systemów. Jeden model wygrał aż cztery z nich i nie był to ten, którego wszyscy się spodziewali.
Kim są rywalizujący giganci
Z jednej strony mamy GLM 5.2 od chińskiej firmy Z.ai, a za nim stoi międzynarodowa nazwa GP AI z Pekinu, która zadebiutowała w czerwcu tego roku. Z kolei Claude Opus 4.8 to dzieło amerykańskiej Anthropic, które ukazało się nieco wcześniej pod koniec maja.
Test pierwszy: żywa gra biegowa
Pierwszym wyzwaniem była prosta gra biegowa z blokami i monetami, gdzie tempo powinno wzrastać wraz z postępem gracza. GLM 5.2 stworzył tutaj najfajniejszą wersję, która wydawała się żywa, a granie sprawiało prawdziwą przyjemność.
Nudy amerykańskiego konkurenta
Wersja Claude'a w tym samym teście działała poprawnie, ale była po prostu nudna i nie miała w sobie nic z życia. Nawet rzucenie pytania Kimmy potwierdziło, że chiński model był o wiele bardziej dynamiczny.
Runda druga: ekskluzywna strona internetowa
W drugim teście poprosiłem modele o stworzenie czystej strony promocyjnej w stylu Apple dla wymyślonego produktu. GLM 5.2 sprawdził się znakomicie, tworząc interfejs wyglądający ekskluzywnie z płynnym przewijaniem.
Strona Claude'a miała mniej treści i w porównaniu do chińskiej wersji wydawała się dość płaska, co dało kolejną rundę dla modelu pochodzącego ze Wschodu.
Runda trzecia: fizyka płynów
Trzeci test brzmiał głupio – animacja chlupoczącej wody w misce – ale był doskonałym sposobem na sprawdzenie radzenia sobie z trudnymi ruchami. U Claude'a atmosfera szybko zbladła, podczas gdy GLM 5.2 pozwalał zmieniać kolory i utrzymywał żywy klimat.
Czwarte zwycięstwo dla Chin
W czwartym teście była gra zręcznościowa w neonach, gdzie GLM 5.2 stworzył coś naprawdę szalonego i przyjemnego do oglądania. Wersja Claude'a działała, ale sprawiając wrażenie nieco wadliwej i przeciętnej.
Jedyny wyjątek: Układ Słoneczny
Czwarte zwycięstwo z rzędu dla GLM 5.2 zostało przerwane dopiero na piątym teście przedstawiającym ruchomą mapę Układu Słonecznego, gdzie Claude Opus 4.8 okazał się zdecydowanie lepszy.
Kosztowna precyzja
Trudno zignorować ten wzór: chiński model pokonał jednego z najlepszych modeli amerykańskich w większości testów. Jednak warto pamiętać o kosztach, ponieważ Claude Opus 4.8 nalicza opłaty za każde użycie przez API.