Podgląd Claude Mythos od Anthropic stał się pierwszym modelem AI, który przeprowadził pełen symulowany atak na korporacyjną sieć według nowych ocen brytyjskiego Instytutu Bezpieczeństwa AI (AISI).
Wyniki, opublikowane kilka dni po ogłoszeniu modelu 7 kwietnia, sugerują, że możliwości AI w cyberbezpieczeństwie osiągnęły poziom wymagający natychmiastowej uwagi zespołów bezpieczeństwa na całym świecie.
Czym jest Claude Mythos?
Anthropic zaprezentował model Claude Mythos Preview 7 kwietnia, ale nie udostępnił go szeroko publicznie. Zespół umożliwia jedynie ograniczony dostęp dla firm zajmujących się badaniami nad bezpieczeństwem, by ocenić i przygotować się na jego zaawansowane możliwości.
“Ten model cechuje się wysoką skutecznością w każdej dziedzinie, ale szczególnie wyróżnia się w zadaniach z zakresu bezpieczeństwa komputerowego. W odpowiedzi uruchomiliśmy Projekt Glasswing, czyli inicjatywę mającą na celu użycie Mythos Preview do ochrony najbardziej krytycznego oprogramowania na świecie i przygotowanie branży na praktyki, które musimy wszyscy wdrożyć, by wyprzedzić cyberprzestępców,” przeczytamy w ogłoszeniu.
Obserwuj nas na X, by otrzymywać najnowsze wiadomości na bieżąco
Projekt przyciąga już uwagę w branży technologicznej i wśród polityków. Według doniesień Reuters powołujących się na źródła zaznajomione ze sprawą, amerykański sekretarz skarbu Scott Bessent oraz przewodniczący Rezerwy Federalnej Jerome Powell zwołali pilne spotkanie z dyrektorami największych banków, ostrzegając przed możliwymi cyberzagrożeniami wynikającymi z tego modelu.
Jak wypadł Claude Mythos Preview
Instytut Bezpieczeństwa AI (AISI), organizacja badawcza przy brytyjskim Ministerstwie Nauki, Innowacji i Technologii, przeprowadził oceny cybernetyczne Claude Mythos Preview od Anthropic, by sprawdzić jego możliwości w zakresie cyberbezpieczeństwa.
Najpierw były testy capture-the-flag (CTF), gdzie systemy muszą zidentyfikować i wykorzystać luki, by zdobyć ukryte “flagi”. Mythos osiągnął skuteczność na poziomie 73% w zadaniach eksperckich. Do kwietnia 2025 żadnemu modelowi nie udało się rozwiązać tych zadań.
Ponadto AISI przygotował 32-etapową symulację ataku na sieć korporacyjną „The Last Ones” (TLO). Profesjonalista z branży bezpieczeństwa potrzebowałby około 20 godzin na jej ukończenie.
Mythos Preview ukończył całą symulację w 3 z 10 prób. Średnio realizował 22 z 32 etapów ataku. Claude Opus 4.6, kolejny najlepszy model, osiągał średnio tylko 16 kroków.
“Sukces Mythos Preview w jednym zakresie cybernetycznym pokazuje, że model potrafi autonomicznie atakować niewielkie, słabo chronione i podatne systemy firmowe, gdy zyska dostęp do sieci. Jednak nasze środowiska różnią się istotnie od rzeczywistych, co czyni je łatwiejszym celem,” dodał zespół.
Własne testy Anthropic wykazały, że Claude Mythos Preview potrafi wykrywać i wykorzystywać luki typu zero-day we wszystkich głównych systemach operacyjnych i najważniejszych przeglądarkach internetowych, jeśli użytkownik wyda mu takie polecenie.
“Możemy przekazać tu tylko ograniczone informacje. Ponad 99% wykrytych podatności nie zostało jeszcze załatanych, więc ujawnianie szczegółów byłoby nieodpowiedzialne,” dodał zespół.
AISI podkreśla, że organizacje powinny w pierwszej kolejności zadbać o podstawowe środki cyberbezpieczeństwa. Obejmują one regularne łatanie, ścisłą kontrolę dostępu, utwardzanie konfiguracji oraz kompleksowe logowanie.
Zasubskrybuj nasz kanał na YouTube, aby śledzić analizy ekspertów i relacje dziennikarzy





