Nowy model AI od Anthropic ma dodatkowe zdolności i długą pamięć. I funkcjonalność, której brakowało najbardziej w Claude.
Anthropic zaprezentował nową rodzinę modeli Claude 4. To nie tylko szybsza wersja starego czatu. Firma wprowadziła nowe funkcje, które sugerują, że zmierza w stronę pełnoprawnego wirtualnego współpracownika. W teorii brzmi dobrze. Ale co to oznacza w praktyce?
Z naszych testów i analiz wynika, że Claude 4 faktycznie wprowadza kilka realnych zmian. W tym artykule przyglądamy się najważniejszym z nich i sprawdzamy, czy robią różnicę dla codziennego użytkownika.
Claude myśli dłużej
Jedna z najciekawszych funkcji to tzw. tryb rozszerzonego myślenia. Model sam decyduje, czy daną sprawę warto przemyśleć dłużej. W prostych pytaniach odpowiada szybko. Gdy temat się komplikuje, zatrzymuje się, analizuje go w kilku krokach, czasem sięga po narzędzia i dopiero potem wraca z odpowiedzią. W skrócie: mniej zgadywania, więcej rozumowania.
W starszych wersjach Claude był bardziej impulsywny. To przydatne przy analizie kodu, tekstu lub planowaniu działań.
Używanie narzędzi
Claude 4 może korzystać z narzędzi zewnętrznych. Potrafi np. wyszukać informacje w sieci – czego najbardziej brakowało w produkcie Anthropica, ale także przeczytać plik PDF, wykonać kod lub wywołać API. Co więcej, może odpalać kilka takich narzędzi naraz i synchronizować ich wyniki.
Dla twórców aplikacji oznacza to możliwość budowania agentów AI, którzy zrobią coś za nas: przeszukają dane, wygenerują raport, przetestują kod. W testach, które prowadziliśmy, Claude samodzielnie sprawdził kilka stron internetowych i złożył odpowiedź z wycinków.
Pamięć, która działa
W modelu Opus 4 pojawia się też pamięć długoterminowa. Claude może zapamiętać informacje z wcześniejszych rozmów i korzystać z nich w przyszłości. Robi to w formie osobnych plików pamięci, do których ma dostęp tylko wtedy, gdy mu na to pozwolimy. Przykład? Kiedy rozmawialiśmy z nim o grze RPG, sam stworzył mapę świata i przewodnik, by pamiętać miejsca i wydarzenia. To nie tylko ciekawostka, ale realne ułatwienie przy dłuższych projektach.
Claude 4 potrafi przetworzyć bardzo dużo informacji na raz. Mowa o setkach stron tekstu lub całych repozytoriach kodu. Dla porównania: wiele modeli ma limit kilku tysięcy tokenów. Tutaj mowa nawet o milionie. Oczywiście, taka pojemność nie zawsze przekłada się na jakość odpowiedzi. Ale w naszych testach model radził sobie z przeglądem długich dokumentów, zestawianiem informacji i wyciąganiem wniosków.
Kodowanie i benchmarki
Nowe modele (Opus i Sonnet) zostały zoptymalizowane pod kątem kodowania. W benchmarkach wypadają lepiej niż poprzednie wersje i lepiej niż konkurencja (np. GPT-4). Potrafią debugować, refaktoryzować i rozwiązywać realne problemy z kodem.
Claude 4 rozumie obrazki. Może analizować wykresy, diagramy czy plany. W testach radził sobie z odczytem tabel i porównywaniem grafik. Nie jest to jeszcze poziom specjalisty, ale przydatne w edukacji czy analizie danych wizualnych.
Warto jednak uważać z danymi wrażliwymi. Model nie ma perfekcyjnej pamięci i może wyciągać złe wnioski z nieczytelnych obrazów.
Dostęp i ceny
Claude 4 dostępny jest przez stronę Claude.ai, Amazon Bedrock i Vertex AI. Sonnet 4 można testować za darmo. Za Opus 4 zapłacimy wg zużycia, podobnie jak w przypadku innych modeli. Dla programistów przygotowano Claude Code z integracją z GitHub Actions, VS Code i JetBrains.
Zmiany wprowadzone w Claude 4 pokazują, że Anthropic odchodzi od tradycyjnych czatbotów. Model nie tylko rozmawia, ale też planuje, wykonuje i zapamiętuje. To krok w stronę AI, które realnie współpracuje z człowiekiem.
Materiał powstał we współpracy z AI:
