🚨 WAŻNE: Princeton stworzył AI, które przeszło od prawie bezużytecznego do wysoce spersonalizowanego w zaledwie 36 rozmowach. Za każdym razem, gdy mówisz AI „to jest błędne” lub zadajesz mu to samo pytanie dwa razy, ponieważ nie zrozumiało, ta reakcja jest najcenniejszą informacją zwrotną, jaką kiedykolwiek mogłoby otrzymać. Każdy system AI zbudowany dzisiaj całkowicie to ignoruje. Princeton stworzył system o nazwie OpenClaw RL, który to naprawia. Pomysł jest prosty: gdy poprawiasz AI, uczy się z tej poprawki na miejscu. Żadnych inżynierów. Żadnego ponownego szkolenia. Tylko rozmowa, którą już prowadzisz. Model obserwuje, jak reagujesz po każdej odpowiedzi: > ponowne zadanie pytania oznacza, że się nie udało > gładka odpowiedź oznacza, że zadziałało Z czasem dowiaduje się dokładnie, czego chcesz i dostosowuje się do tego. W ich testach: > asystent AI przeszedł od bycia ledwo użytecznym do wysoce spersonalizowanego w zaledwie 36 rozmowach > asystent oceniający nauczył się pisać cieplejsze, bardziej szczegółowe informacje zwrotne po zaledwie 24 interakcjach Stało się lepsze po prostu przez używanie. > wynik personalizacji przed: 0.17 > po 36 rozmowach: 0.81 > brak ponownego szkolenia, brak inżynierów, brak przestojów > działa, gdy AI wciąż z tobą rozmawia Każde sfrustrowane „nie, nie o to mi chodziło” które kiedykolwiek napisałeś, było darmową lekcją. AI po prostu nigdy tego nie zapamiętywało. Aż do teraz.