Anthropic i OpenAI otworzyły nowy rozdział rywalizacji we wtorek, skupiając się na badaniach naukowych. Anthropic uruchomił Claude Science, narzędzie AI dla naukowców, a OpenAI wydało GeneBench-Pro, benchmark dla biologii obliczeniowej.
Obie premiery pokazują, że wyścig AI wykracza poza chatboty i programowanie. Teraz sięga pracy laboratoryjnej. Jedna firma wprowadziła narzędzie dostępne dla naukowców już dziś. Druga – punkt odniesienia pokazujący, ile technologii jeszcze brakuje.
Jak działa Claude Science od Anthropic
Claude Science łączy bazy danych, kod oraz moc obliczeniową w jednej aplikacji. Umożliwia dostęp do ponad 60 baz naukowych związanych z genomiką, proteomiką i chemoinformatyką.
Claude Science to aplikacja, a nie nowy model. Jej premiera następuje, gdy najpotężniejsze modele Anthropic Fable 5 i Mythos 5 pozostają objęte ograniczeniami amerykańskimi przepisami eksportowymi. Każdy wynik można prześledzić do kodu źródłowego.
To narzędzie rozwija inicjatywę Anthropic z zakresu nauk o życiu, która ruszyła w październiku 2025 roku. W fazie beta Jérôme Lecoq z Allen Institute wykorzystał je do skrócenia recenzji, które wcześniej trwały nawet dwa lata.
Anthropic sfinansuje także do 50 projektów badawczych. Każdy otrzyma do 30 000 USD w formie kredytów.
GeneBench-Pro od OpenAI podnosi poprzeczkę
Krótko po premierze Claude Science, OpenAI ogłosiło GeneBench-Pro. Ten benchmark sprawdza, czy AI potrafi podejmować decyzje wymagane w prawdziwych badaniach biologicznych.
Benchmark obejmuje 129 problemów z zakresu genomiki, biologii ilościowej i medycyny translacyjnej.
Najmocniejszy model OpenAI, GPT-5.6 Sol, rozwiązał 28,7% zadań na najwyższym poziomie rozumowania. W trybie Pro wynik wzrósł do 31,5%. Wcześniejsza premiera GPT-5.6 nastąpiła na żądanie Waszyngtonu.
Na pierwotnym GeneBench model GPT-5 osiągnął mniej niż 5%, podczas gdy Opus 4.8 od Anthropic uzyskał 16% w trudniejszym teście.
Śledź nas na X, aby być na bieżąco z najnowszymi wydarzeniami
Dwie strategie, jeden wyścig
Widać dwa podejścia do tego samego celu. Anthropic oferuje produkt do codziennej pracy w laboratorium. OpenAI mierzy, jak modele radzą sobie z nieuporządkowanymi danymi.
Obie premiery pojawiły się, gdy chińskie modele zyskują znaczenie w badaniach AI. Jednocześnie dane OpenAI studzą entuzjazm — ich najmocniejszy model wciąż nie radzi sobie z większością zadań GeneBench-Pro.
Presja ma charakter geopolityczny i naukowy. Amerykańskie limity eksportowe już zmusiły Anthropic do rozważenia nowych lokalizacji dla modeli.
Recenzenci szacują, że pojedynczy problem GeneBench-Pro wymaga od eksperta 20–40 godzin pracy. To koszt kilku tysięcy USD. OpenAI twierdzi, że ich model wykonuje tę analizę za kilka USD.
Aubrey de Grey, gerontolog biomedyczny, uważa, że AI likwiduje wąskie gardła badań, nawet jeśli postęp w szerszej skali wymaga czasu.
“Już bardzo niedługo zobaczymy, że AI sprawi, iż niektóre etapy procesu, zwłaszcza rozwój leków, nie będą już czynnikiem ograniczającym.”
De Grey ostrzega, że szybsze badania nie oznaczają automatycznie szybszej rejestracji leków. To nadal zależy od regulacji i akceptacji społecznej dla ryzyka.
Naukowcy przewidują szybszą adaptację
Niektórzy eksperci twierdzą, że zmiana już trwa. Dr Derya Unutmaz, profesor immunologii, powiedział w panelu BeInCrypto, że AI przewyższa już jego własny osąd.
“Osobiście bardziej ufam AI niż swoim pomysłom w mojej dziedzinie po 35 latach doświadczenia.”
Spodziewa się, że to zaufanie szybko rozprzestrzeni się w praktyce klinicznej.
“To nieetyczne i uważam, że wkrótce niekorzystanie z AI w medycynie będzie uznane za błąd w sztuce.”
Ten optymizm wyprzedza jednak wyniki benchmarków. Kolejne miesiące pokażą, czy naukowcy wdrożą te narzędzia, a wyniki GeneBench-Pro wzrosną.









