Efekt DeepSeek: Jak chiński start-up trwale zmienił przyszłość rozwoju sztucznej inteligencji

Powstanie DeepSeek wstrząsnęło wygodną pozycją gigantów technologicznych jako liderów napędzających innowacje w dziedzinie sztucznej inteligencji. Chiński start-up pokazał, jak można osiągnąć modelową wydajność przy mniejszych nakładach finansowych i mniejszych zasobach.

Wiadro lodowatej wody dla amerykańskich gigantów technologicznych

Powstanie DeepSeek i jego głęboki wpływ na rynek kryptowalut posłużyły jako sygnał ostrzegawczy dla zachodnich sektorów technologicznych, że nie mają one już daleko idącej przewagi w zakresie rozwoju sztucznej inteligencji.

Tylko dwa tygodnie temu chiński start-up opublikował dwa modele AI: R1 i V3. Systemy te okazały się równie wydajne, jak te opracowane przez gigantów technologicznych OpenAI i Google – nawet osiągając szczyt w niektórych wskaźnikach. Zostały one również wyprodukowane za ułamek kosztów.

Podczas gdy zapisy modeli uczenia się języków (LLM), takich jak Llama 3.1 firmy Meta, kosztują ponad 60 mln USD, DeepSeek zyskał rozgłos, zmniejszając koszt szkolenia modelu granicznego do zaledwie 6 mln USD.

Zaledwie kilka godzin po uruchomieniu DeepSeek, wiadomość ta zmiotła bilion dolarów z kapitalizacji rynkowej wiodących amerykańskich firm technologicznych. Nvidia, dominujący na świecie dostawca chipów AI, odnotowała spadek jego wartości o 600 mld USD.

Amerykańska giełda poniosła najgorszą stratę w historii w ciągu jednego dnia, a kryptowaluty odczuły jej skutki. Pojawienie się DeepSeek spowodowało znaczne spadki akcji wydobywczych, takich jak Marathon i Riot, które w dużym stopniu polegają na sprzęcie Nvidii.

Wiadomość ta wywołała również wyprzedaż kryptowalut o wartości 1 mld USD, przy czym Bitcoin spadł o 5%, a altcoiny odnotowały jeszcze bardziej gwałtowne spadki o 8-10%. Tymczasem kryptowaluty oparte na sztucznej inteligencji odnotowały 10% spadek kapitalizacji rynkowej w ciągu 24 godzin, a cztery z pięciu największych monet AI poniosły poważne straty.

Sponsored

Zmiana ceny kryptowalut AI w dniu 27 stycznia. Źródło: Messari.

Pojawienie się DeepSeek upokorzyło zbyt pewnych siebie gigantów technologicznych. Wzbudziło ono wątpliwości co do ich nadmiernego polegania na inwestycjach wartych miliardy dolarów i przyszłego wzrostu przychodów.

Pokazało ono również, że wszelkie przyszłe zakłócenia w wyścigu o innowacje nieuchronnie będą miały wpływ na rynek kryptowalut.

Chiny tworzą DeepSeek, mając wszystkich przeciwko sobie

DeepSeek wstrząsnął rynkami, ponieważ pokazał on, że Chiny nie są już tak daleko w tyle za Stanami Zjednoczonymi w wyścigu o najbardziej wydajne modele sztucznej inteligencji. Do czasu pojawienia się wiadomości 27 stycznia, akcje głównych graczy technologicznych, takich jak Microsoft, Google i OpenAI, wykazywały pozytywny sentyment.

Wrażenie to opierało się przede wszystkim na fakcie, że ci giganci technologiczni mają ugruntowaną pozycję i są dobrze finansowani. Mają już solidną pozycję rynkową i dostęp do najbardziej wyrafinowanego sprzętu i oprogramowania potrzebnego do napędzania innowacji w zakresie sztucznej inteligencji. Pavel Matveev, współzałożyciel Wirex powiedział:

„Firmy te mają nie tylko przewagę technologiczną, ale także infrastrukturę, ogromne zbiory danych i zasoby finansowe, aby prowadzić swoją dominację.”

W międzyczasie, podczas prezydentury Joe Bidena, Nvidia otrzymała zakaz sprzedaży swoich procesorów graficznych do Chin. Te ograniczenia eksportowe zmusiły Chiny do polegania na zapasach, które zgromadził on do tego momentu.

Pomimo tych wyzwań Chiny stworzyły DeepSeek.

Sebastian Pfeiffer, dyrektor zarządzający Impossible Cloud Network, przekazał:

„Ze względu na amerykańskie ograniczenia eksportowe, Chińczycy nie mieli dostępu do sprzętu, jaki miały firmy amerykańskie. Ale znowu, to jest ekonomia 101: niedobór zasobów prowadzi do innowacji lub „potrzeby muszą” dla reszty z nas. Chiny musiały zejść na bardzo głęboki poziom inżynierii i naprawdę wprowadzić innowacje. To naprawdę triumfalna historia.”

Dla Yang Tang, CEO QStarLabs, coś takiego musiało się wydarzyć.

„To naturalna ewolucja w rozwoju technologii: konkurent, który wykorzystał lepszy proces, aby osiągnąć lepsze wyniki. Warto zauważyć, że wszystko, co zrobił DeepSeek, zostało wcześniej opublikowane w badaniach akademickich i / lub branżowych. To zdecydowanie zmusi uznane laboratoria AI do innego myślenia, ponieważ wiele z nich było nadmiernie skoncentrowanych na badaniach.”

Dał on również cenną lekcję zachodowi.

Czasami mniej naprawdę znaczy więcej

Rok temu dyrektor generalny OpenAI, Sam Altman, przewidział, że branża sztucznej inteligencji będzie wymagać bilionów dolarów inwestycji w celu sfinansowania rozwoju specjalistycznych chipów. Chipy te są niezbędne do zasilania energochłonnych centrów danych, które wspierają coraz bardziej złożone modele sztucznej inteligencji w branży.

Inne wiodące firmy technologiczne podjęły ostatnio podobne inicjatywy. Meta już ogłosiła, że planuje on wydać w tym roku aż 65 mld dolarów na rozbudowę infrastruktury AI. Firma zamierza zakończyć rok z ponad 1,3 mln procesorów graficznych.

Microsoft ogłosił plany na około 80 mld USD na rozwój centrów danych w roku fiskalnym 2025. Tymczasem Amazon spodziewa się, że jego przewidywane wydatki na podobną infrastrukturę w 2025 r. przekroczą szacowane 75 mld USD inwestycji w 2024 r.

Wiele z tych firm gromadzi również procesory graficzne i powiązany sprzęt AI. Na przykład dyrektor generalny Mety, Mark Zuckerberg, powiedział, że jego firma zamierza zwiększyć podaż procesorów graficznych do 600 000 do końca 2024 roku.

Tymczasem DeepSeek wykorzystał nieco ponad 2000 jednostek GPU Nvidii i 6 mln USD do zasilenia swojego modelu R1.

Sponsored

Trevor Koverko, współzałożyciel Sapien.io, powiedział Beincrypto:

„Przełom DeepSeek w zmniejszaniu kosztów rozwoju i optymalizowaniu modeli sztucznej inteligencji przy minimalnych zasobach obliczeniowych sygnalizuje sejsmiczną zmianę w konkurencyjnym krajobrazie sztucznej inteligencji. Tradycyjni giganci, tacy jak Nvidia, OpenAI i Google, którzy polegają na ogromnej mocy obliczeniowej i drogiej infrastrukturze (tak jak na szczytowych procesorach graficznych i rozbudowanych usługach w chmurze), mogą odczuć, że ich tradycyjna przewaga w rozwoju sztucznej inteligencji wymagającej dużych zasobów maleje.”

Uświadomienie sobie przez zachodnie firmy, że Chiny nie są zbyt daleko w tyle w wyścigu, wystraszyło również inwestorów w tradycyjnych kręgach finansowych i na rynkach kryptowalut.

Wyjaśnienie wpływu DeepSeek na rynek kryptowalut

Szersze pogorszenie koniunktury rynkowej – zwłaszcza na tradycyjnych rynkach – odzwierciedlało raczej ponowną kalibrację oczekiwań dotyczących wycen technologii niż zwykłą korektę. Karan Sirdesai, CEO i współzałożyciel Mira Network, powiedział:

„Rynek wycenił agresywne założenia dotyczące wzrostu technologii sztucznej inteligencji, szczególnie w zakresie wymagań obliczeniowych, które przyniosłyby korzyści firmom takim jak Nvidia i głównym dostawcom usług w chmurze. Przełom DeepSeek w osiąganiu porównywalnych wyników przy mniejszej mocy obliczeniowej zmusił inwestorów do ponownej oceny tych założeń.”

Choć sektor kryptowalut nie ma bezpośrednich powiązań z DeepSeek, to jednak wniósł on swój wkład w rozwój sztucznej inteligencji. W rezultacie wiadomość o uruchomieniu R1 miała taki sam wpływ na kryptowaluty.

Według Sirdesai związek między rynkami kryptowalut i sztucznej inteligencji jest bardziej złożony niż prosta korelacja. Chociaż oba podlegają parasolowi technologicznemu, działają na zasadniczo różnych zasadach. Wyjaśnił:

„Wyceny Bitcoina i kryptowalut są zakorzenione w dynamice monetarnej, adopcji sieci i krajobrazach regulacyjnych, podczas gdy rozwój sztucznej inteligencji koncentruje się na możliwościach technologicznych i zastosowaniach komercyjnych.”

Niemniej jednak zarówno kryptowaluty, jak i sztuczna inteligencja mają dużą obecność w sektorze technologicznym. Sirdesai dodał:

„Oba sektory konkurują o zasoby obliczeniowe, zwłaszcza GPU, tworząc powiązania w łańcuchu dostaw. Ponadto wielu inwestorów jest aktywnych w obu przestrzeniach, więc nastroje mogą się przenosić. Kiedy główne firmy technologiczne dostrzegają zmienność związaną z rozwojem sztucznej inteligencji, może on przenieść się na rynki kryptowalut za pośrednictwem tej wspólnej bazy inwestorów.”

Ostatnie ruchy na rynku po opublikowaniu modelu R1 przez DeepSeek świadczą o tym, jak podatny jest rynek kryptowalut na ogólne nastroje w sektorze technologicznym. Forest Bai, współzałożyciel Foresight Ventures dodał:

„Ta interakcja odzwierciedla kulturową i technologiczną synergię między sztuczną inteligencją a kryptowalutami, sugerując, że rozwój w jednej sferze może znacząco wpłynąć na drugą.”

W rezultacie uważne śledzenie reakcji amerykańskich potęg technologicznych na najnowszą innowację DeepSeek będzie miało kluczowe znaczenie dla zrozumienia, w jaki sposób podobne wydarzenia mogą wpłynąć na rynek kryptowalut w przyszłości.

Sponsored

Okres rekonwalescencji dla amerykańskich firm technologicznych

Spadek zaufania inwestorów ujawnia niepewność co do przyszłości rynku sztucznej inteligencji. Wątpliwości te koncentrują się na tym, czy skala obliczeniowa pozostanie kluczem do konkurencji i jak innowacje w zakresie wydajności przekształcą sektor.

Ilan Rakhmanov, założyciel ChainGPT, powiedział BeInCrypto:

„W wyścigu sztucznej inteligencji nie chodzi już o to, kto ma najwięcej procesorów graficznych, ale o to, kto może trenować najmądrzejsze i najbardziej wydajne modele. Przełom DeepSeek dowodzi, że innowacje w szkoleniach mogą zakłócić monopol sztucznej inteligencji.”

Rakhmanov podkreślił kluczowe innowacje techniczne wdrożone przez DeepSeek w celu ominięcia barier w dostępie do procesorów graficznych. Wyjaśnił:

„Model R1 DeepSeek prawdopodobnie osiąga swoją wydajność dzięki połączeniu zoptymalizowanej architektury, alternatywnych metod szkolenia, specjalistycznego sprzętu i energooszczędnych strategii obliczeniowych. Dzięki udoskonaleniu wydajności transformatora, wykorzystaniu rzadkości modelu i włączeniu generowania wspomaganego wyszukiwaniem, DeepSeek zmniejsza wymagania obliczeniowe bez uszczerbku dla wydajności. Jego poleganie na samonadzorowanym uczeniu się, rozszerzaniu danych syntetycznych i uczeniu się ze wzmocnieniem minimalizuje zależność od ogromnych zbiorów danych, podczas gdy niestandardowe akceleratory sztucznej inteligencji lub alternatywy inne niż GPU pomagają obniżyć koszty obliczeń.”

Anthony Simonet, dyrektor ds. badań w iExec, dodał:

„Wykorzystuje on techniki takie jak architektura Mixture-of-Experts, szkolenie o najniższej precyzji i destylacja wiedzy, aby zmaksymalizować wydajność przy mniejszej ilości zasobów, umożliwiając płynne działanie sztucznej inteligencji na standardowym sprzęcie i czyniąc ją bardziej dostępną.”

Eksperci techniczni szybko zauważyli również, że DeepSeek opublikował badania stojące za jego modelem do publicznego wglądu.

Argumenty za zdecentralizowaną sztuczną inteligencją

W przeciwieństwie do tradycyjnej tajemnicy amerykańskich firm, takich jak OpenAI, DeepSeek w imponujący sposób opublikował swój model R1 jako całkowicie open-source. Wielu liderów branży przyklasnęło temu posunięciu, wskazując, że aby przyszłość sztucznej inteligencji pozostała w rękach społeczeństwa, ogólny dostęp musi pozostać zdecentralizowany. Rakhmanov. powiedział:

„DeepSeek był przełomem dla branży sztucznej inteligencji i uważam, że jest on dokładnie tym, czego potrzebują firmy takie jak OpenAI. OpenAI została pierwotnie założona, aby zaawansowana sztuczna inteligencja była dostępna dla wszystkich, ale z biegiem czasu widzieliśmy przejście w kierunku zamkniętych modeli. Przestrzeń sztucznej inteligencji ewoluuje, a DeepSeek przypomniał nam już o czymś ważnym – świetna technologia powinna być tworzona dla wszystkich, a nie tylko dla nielicznych.”

Mniejsi deweloperzy z mniejszymi zasobami z zadowoleniem przyjęli tę wiadomość. Dostęp do projektu DeepSeek i dokumentów badawczych pozwoli im udoskonalić swoje modele bez wyczerpywania budżetu na badania. Ron Bodkin, współzałożyciel Theoriq przekazał:

„Tańsze modele DeepSeek zmniejszają liczbę procesorów graficznych wymaganych do trenowania modeli AI, obniżając w ten sposób koszty obliczeniowe. Ta wydajność pozwala na skalowanie AI w bardziej przystępny sposób, czyniąc go dostępnym dla firm i naukowców z ograniczonymi zasobami.”

Ponieważ model start-upu jest teraz open-source, programiści będą go szeroko analizować, napędzając dalsze innowacje w zakresie sztucznej inteligencji. Steven Pu, współzałożyciel Taraxa, przekazał w wywiadzie dla BeInCrypto.

“Ponieważ DeepSeek jest open-source, zmiana w wyścigu AI nieodwołalnie przesunie się bardziej na arenę open-source, niszcząc narrację o zamkniętym modelu fundamentalnym. Bycie open-source przynosi korzyści wszystkim, firmom AI (każdemu graczowi w ekosystemie), innowatorom i konsumentom. Jedynymi przegranymi są ci, którzy trzymają się modelu zamkniętego oprogramowania, który w najbliższej przyszłości ulegnie szybkiemu załamaniu.”

Ponieważ sztuczna inteligencja staje się tańsza i bardziej dostępna, stanie się on bardziej towarem.

Sponsored

Komercjalizacja technologii sztucznej inteligencji

W dniu premiery DeepSeek, dyrektor generalny Microsoft, Satya Nadella, opublikował w mediach społecznościowych wpis o paradoksie Jevonsa. Nadella napisał na X:

“Paradoks Jevonsa uderza ponownie! W miarę jak sztuczna inteligencja staje się coraz bardziej wydajna i dostępna, jej wykorzystanie gwałtownie wzrośnie, zmieniając ją w towar, którego po prostu nie możemy mieć dość.”

Paradoks Jevonsa, znany również jako efekt odbicia, to zasada ekonomiczna ukuta przez angielskiego ekonomistę Williama Stanleya Jevonsa. Zwiększona efektywność wykorzystania zasobów może prowadzić do ich zwiększonego zużycia.

W odniesieniu do sztucznej inteligencji, w miarę jak systemy te stają się bardziej wydajne, popyt na ich zadania może wzrosnąć – zjawisko to może zostać spotęgowane przez rosnącą dostępność badań nad sztuczną inteligencją. Pu przekazał dla BeInCrypto:

“Obniżanie kosztów, zarówno na etapie szkolenia, jak i wnioskowania, jest dobre. W technologii, obniżenie kosztów zawsze prowadziło do szerszej adopcji i szczytu ogólnej konsumpcji, a nie mniejszej. Kiedy samochody stały się przystępne cenowo, więcej osób stało się ich właścicielami. Kiedy komputery mainframe zostały zmniejszone do przystępnych cenowo komputerów osobistych, doprowadziło to do rewolucji cyfrowej. W ten sam sposób zobaczymy więcej innowatorów i start-upów eksperymentujących ze sztuczną inteligencją teraz, gdy stała się ona bardziej przystępna cenowo, co prowadzi do większego wykorzystania sztucznej inteligencji i szczytu popytu na infrastrukturę związaną ze sztuczną inteligencją, tak jak sprzęt GPU.”

Zdaniem Pfeiffera utowarowienie infrastruktury sztucznej inteligencji zmieni również charakter innowacji, których będą teraz poszukiwać firmy technologiczne. Kiedyś programiści skupiali się na tworzeniu najbardziej wyrafinowanych modeli LLM. Teraz wysiłki przeniosą się na integrację tej technologii z różnymi branżami. Powiedział:

“DeepSeek trenował na OpenAI i był w stanie znacząco wykorzystać postępy innych. Krajobraz LLM zostanie utowarowiony i najprawdopodobniej w pełni otwarty. W rzeczywistości rozwój i ewolucja sztucznej inteligencji będą widoczne mniej po stronie rozwoju, ale poprzez integrację i wykorzystanie sztucznej inteligencji. Pionowe, głębokie integracje z branżami i dostęp do ich danych będą miały większe znaczenie niż wyrafinowane LLM, ponieważ są one utowarowione, a ich postęp innowacyjny spowolni.”

Paradoks ten może również dać amerykańskim gigantom technologicznym przewagę nad krajami o ograniczonym dostępie do zasobów obliczeniowych.

Przewaga USA

Chociaż najnowszy model DeepSeek wyraźnie zmniejszył lukę konkurencyjną między uznanymi amerykańskimi firmami, firma nie jest odporna na wyzwania.

Zgodnie z paradoksem Jevonsa, wzrost popytu na produkty AI nieuchronnie doprowadzi również do wzrostu zapotrzebowania na zasoby potrzebne do ich rozwoju. Chociaż wciąż badane są inne alternatywy, procesory graficzne będą nadal miały kluczowe znaczenie dla przyszłego rozwoju technologii sztucznej inteligencji. Bodkin powiedział:

„Wydaje się, że DeepSeek również osiąga przepustowość, która ogranicza ich zdolność do skalowania swojej oferty – ograniczyli liczbę rejestracji w swojej aplikacji do mieszkańców Chin, a ich API jest w większości wolniejsze niż w momencie uruchomienia. Uważam, że nie są w stanie zabezpieczyć dodatkowych procesorów graficznych, aby umożliwić im skalowanie swojej oferty.”

Przełom DeepSeek nie rozwiązuje również trwającego od dziesięcioleci zaangażowania Stanów Zjednoczonych w rozwój infrastruktury sztucznej inteligencji. Matveev powiedział w wywiadzie dla BeInCrypto:

“Pomimo przełomów w optymalizacji DeepSeek, wyścig AI jest nadal w dużej mierze podyktowany dostępem do ogromnych zbiorów danych, mocy obliczeniowej i kompleksowej kontroli ekosystemu. Firmy takie jak OpenAI i Google nie polegają tylko na brutalnym skalowaniu – mają również zastrzeżone dane, infrastrukturę chmurową i rozbudowane potoki wdrażania. Chociaż alternatywne metodologie są obiecujące, zakłócą status quo tylko wtedy, gdy będą w stanie konsekwentnie przewyższać tradycyjne podejścia w różnych przypadkach użycia. W tej chwili jest zbyt wcześnie, aby powiedzieć, czy DeepSeek reprezentuje zmianę w branży, czy po prostu stopniową poprawę w już konkurencyjnym krajobrazie.”

Biorąc pod uwagę tę rzeczywistość, Sirdesai uważa, że reakcja rynku na DeepSeek była nieco przesadzona.

“Reakcja rynku wydaje się pomijać złożoność komercjalizacji technologii AI. Bardziej wydajna architektura DeepSeek jest znacząca, ale udane wdrożenie sztucznej inteligencji wymaga solidnej infrastruktury, silnych środków bezpieczeństwa i sprawdzonej niezawodności w środowiskach produkcyjnych. Zachodnie firmy technologiczne spędziły lata na budowaniu tych możliwości.”

Wzrost DeepSeek niezaprzeczalnie zmienił wyścig sztucznej inteligencji, pokazując, że innowacje mogą wyłaniać się z nieoczekiwanych zakątków i rzucać wyzwanie uznanym gigantom.

W miarę rozwoju branży monitorowanie wzajemnych relacji między modelami open source, dostępnością zasobów i dynamiką konkurencji niewątpliwie ukształtuje przyszłość rozwoju sztucznej inteligencji i jej wpływu na świat.