Debian

Darmowy model StepFun 3.7 Flash i agenci Hermes: nowa era kodowania

Zaawansowany zespół hakerski AI z użyciem agenta Hermes na nowoczesnym serwerze z tablicą Kanban
Zaawansowany zespół hakerski AI z użyciem agenta Hermes na nowoczesnym serwerze z tablicą Kanban

Źródło: eccoapi

Firma StepFun przedstawiła najnowszy model Step 3.7 Flash, który jest obecnie dostępny w pełni za darmo przez platformę Hermes Agent. Jest to rozwiązanie przeznaczone specjalnie dla zaawansowanych agentów kodujących, które nie wymagają płacenia za korzystanie z ich mocy obliczeniowych. Taki dostęp otwiera nowe możliwości dla programistów, którzy chcą testować najnowsze technologie bez ponoszenia kosztów subskrypcji.

Witamy w kolejnym odcinku, w którym omawiamy najnowsze osiągnięcia w świecie sztucznej inteligencji. Firma StepFun właśnie wydała model Step 3.7 Flash, który jest w rzeczywistości bardzo interesującym narzędziem dla agentów kodujących. Głównym powodem, dla którego chcę omówić ten temat, nie są tylko wyniki w benchmarkach, lecz fakt, że model jest obecnie w pełni darmowy.

Darmowy dostęp do modelu StepFun 3.7 Flash

Najważniejszą sprawą jest to, że obecnie Step 3.7 Flash jest w pełni darmowy w ramach Hermes Agent. Możesz dosłownie uruchomić polecenie modelu Hermes, wybrać opcję portalu Hermes, zalogować się i następnie zobaczyć darmowy model StepFun 3.7/Flash jako dostępną opcję bezpłatną. Z moich obserwacji wynika również, że nie ma żadnych limitów w tym darmowym okresie.

Jest to w pewnym sensie fantastyczne, ponieważ zazwyczaj, gdy pojawia się nowy model kodujący dla agentów, ciekawa część jest zawsze zablokowana za ceną API, konfiguracją dostawcy, kredytami lub jakimś rodzajem limitu. Tutaj jednak, przynajmniej na razie, Hermes Agent daje możliwość faktycznego przetestowania Step 3.7 Flash w prawdziwym przepływie pracy agenta kodującego bez konieczności płacenia za to.

Czym jest model Step 3.7 Flash?

Step 3.7 Flash to nowy, wysoko wydajny model flash od StepFun przeznaczony dla rzeczywistych agentów. Został zaprojektowany do agentycznego kodowania, wielomodalnego rozumienia, korzystania z narzędzi do wyszukiwania w sieci i wizualnego, oraz długotrwałych przepływów pracy, w których model musi planować, wywoływać narzędzia, sprawdzać wyniki i kontynuować działanie.

Nie jest to więc zwykły model czatu, w którym zadajesz pytanie i otrzymujesz odpowiedź. Pozycjonowanie jest bardzo wyraźnie skupione na agentach. StepFun twierdzi, że model został zbudowany tak, aby rozumieć takie rzeczy jak interfejsy produktów, dokumenty, wykresy, zrzuty ekranu i naturalne obrazy, a następnie wykorzystywać to rozumienie do pisania kodu lub wywoływania narzędzi.

Architektura modelu i obsługa kontekstu

Z perspektywy architektury, Step 3.7 Flash to model z rzadko mieszanymi ekspertami. Posiada około 196 miliardów parametrów w sumie, plus komponent wizualny o 1,8 miliarda parametrów oraz około 11 miliardów aktywnych parametrów. Obsługuje również okno kontekstu o rozmiarze 256k.

Jest to ważne dla agentów kodujących, ponieważ kontekst jest w zasadzie całą grą. Model musi czytać pliki, pamiętać o poprzednich wywołaniach narzędzi, rozumieć logi, podążać za planem i jednocześnie nie zapominać, co chciał zrobić w połowie zadania. Ponieważ tylko około 11 miliardów parametrów jest aktywnych, celem jest zachowanie wydajności przy jednoczesnym uzyskiwaniu silnego zachowania agentycznego.

Wyniki w benchmarkach

Jeśli chodzi o wyniki w benchmarkach, liczby są całkiem solidne. Na SweetBench Pro Step 3.7 Flash osiąga wynik 56,3. Jest to wyższy wynik niż Step 3.5 Flash (51,3), nieco wyższy niż Deepseek V4 Flash (55,6) oraz nieco wyższy niż Gemini 3.5 Flash (55,1).

Nadal jest poniżej GPT 5.5 (58,6) i Claude Opus 4.7 (64,3). Jednak dla otwartego modelu w stylu flash jest to bardzo dobry wynik. Na Terminal Bench 2.1 osiąga wynik 59,5. Znowu jest to lepsze niż Step 3.5 Flash (53,4).

Porównanie z innymi modelami

Tutaj jednak jest poniżej niektórych większych lub silniejszych modeli, takich jak Gemini 3.5 Flash, GPT 5.5 i Claude Opus. Nie powiedziałbym, że nagle jest to numer jeden wśród modeli terminalowych, ale jest to wyraźna poprawa w stosunku do poprzedniego modelu Step Flash. Dla praktycznego kodowania agentycznego to jest to, o co mi chodzi.

Czy model idzie w dobrym kierunku? Czy może faktycznie działać wewnątrz agentów? Odpowiedź brzmi tak, zwłaszcza że dostęp jest darmowy. To zmienia zasady gry dla każdego programisty, który chce testować nowe możliwości bez ryzyka finansowego.

Podsumowanie

Model Step 3.7 Flash to prawdziwe szaleństwo, które oferuje darmowy dostęp do zaawansowanych technologii agentycznych. Warto skorzystać z tej okazji, aby przetestować możliwości modelu w swoim własnym środowisku pracy. Nie czekaj, aż firma wprowadzi opłaty, bo teraz masz szansę na pełny dostęp bez żadnych barier.

Słowa kluczowe