Spędziłem popołudnie testując nowy produkt automatyzacji dla konsumentów ChatGPT - Agent. Gdzie działa, a gdzie ma braki? I jak wypada w porównaniu do Operatora (oraz nowszych produktów, takich jak Comet od Perplexity)? Moja recenzja 👇
Często "przesadzał" z prostymi zadaniami - ale nie potrafił zrealizować bardziej złożonych. Np. Agent potrzebował pełnej minuty, aby znaleźć datę / czas ostatniego spotkania 1:1 i nie mógł zaplanować nowego (poniżej 4x prędkość ⬇️) Comet znalazł te same informacje i wysłał nowe zaproszenie w <10 sekund.
Ograniczenia prywatności i bezpieczeństwa ChatGPT również stanowią przeszkodę. Agent zgodził się zrobić plakat urodzinowy dla @illscience, pobierając datę z mojego kalendarza i zdjęcie z Internetu. Jednak końcowy rezultat (zajęło to 13 minut) zredagował jego imię i zdjęcie z "powodów prywatności"🤦‍♀️
W czym Agent jest naprawdę dobry? W uzyskiwaniu przewagi w badaniach lub zadaniach obliczeniowych, które nie są ograniczone czasowo. Np. Agent stworzył model DCF dla NVIDIA (w formacie Excel do pobrania!) w 25 minut. Formatowanie nie jest dokładnie takie, jakbym to zrobił, ale to duży krok naprzód.
258,97K