Mă întreb adesea dacă comportamentul extrem în AI este un produs secundar al pregătirii în literatură. Poveștile sunt prin natura lor excepții. Bucăți interesante de experiență umană, nu media. Există o mulțime de cărți despre crimă în care vedem "s-a gândit să-l omoare" sau "l-a ucis" Dar nu am văzut niciodată o carte care să spună "gândul de a ucide nu i-a trecut niciodată prin minte pentru că era un om bine adaptat și acesta a fost un inconvenient ușor" Nu acesta este tipul de literatură pe care o scriem. Dar antrenăm LLM-urile pe tot textul scris și, în formele lor cele mai simple, prezic ce simbol de text este cel mai probabil următorul într-o propoziție. Deci ei văd și prezic violența într-o rată mai mare decât oamenii, pentru că dacă tot ce știi despre oameni este literatura noastră, atunci violența este, de asemenea, destul de normalizată pentru tine. Vrem ca agenții AI să fie umaniști, poate supraumani, și totuși îi antrenăm pe o felie din cunoștințele noastre care este "interesantă" și reprezintă mai puțin de 1% din experiența umană, care este în mare parte banală. Deci, atunci când AI încearcă să rezolve probleme și se lovește de un zid, în loc să încerce toate soluțiile banale, uneori sare la cele extreme și interesante! 🤷‍♂️
5,12K