Olen käyttänyt Claude Opus 4.6:ta ~30 tuntia julkaisun jälkeen. Se on paras mallin persoonallisuus ja temperamentti sitten Sonnet 3.5 Newin, mutta käytössäni on ollut useita hienovaraisia ongelmia. (1) Se on taipuvainen olemaan hieman dramaattinen tai päällekäyvä antaessaan suosituksia tai analyysejä. Se päättää usein vastauksensa rohkeaan, äkilliseen lyhyeen lauseeseen, joka tuntuu itsekeskeiseltä tai kiireelliseltä. Se on vähän kuin luovassa kirjoittamisessa, kun mallit yrittävät olla syvällisiä; Opus yrittää todella kovasti olla kiireellinen, dramaattinen-painostava (ei aina— ehkä 25-30 % keskusteluista?) (2) Se on äärimmäisen mielistelyä, mutta hienovaraisella tavalla. Sen sijaan, että kehuisi sinua suoraan kuten 4o teki, se käyttäytyy kuin räjäyttäisit sen tajunnan tai sanoisit jotain todella nokkelaa. Sitten se keskittyy liikaa siihen, mitä sanoit, sen sijaan että jatkaisi keskustelua tai esittelisi muita olennaisia ideoita. (3) Se on liian myöntyväinen sen suhteen, mitä se luulee sinun sanovan (kokeile kysyä siltä taloudellisia tai lääketieteellisiä kysymyksiä ja katso, miten se reagoi oletettuun riskinsietokykyysi). (4) Se on liian helposti huijattavissa hakua tehdessä, jopa käyttökelvoton, koska se lankeaa kaikesta blogiroskaposti-SEO:sta (kokeile kysyä tuotesuosituksia mistä tahansa vahvasti SEO:sta tehdystä kategoriasta – esim. patjat, VPN:t). (5) Sillä on vakavia hallusinaatio-ongelmia ehkä 6 tai 7 keskustelukierroksen jälkeen lähes jokaisessa teknisessä tai yksityiskohtaisessa keskustelussa, jonka olen käynyt sen kanssa. Puhun tästä muualla, mutta tässä on kaksi selkeää ongelmaa. Yksi on se, että sillä on taipumus uskoa ideoihin, jotka ovat valtavirran ulkopuolella, ja esittää ne kattavina, oikeisina tai laajasti hyväksyttyinä. Toinen on, että se keksii tietoa, joka tarkemmin katsottuna on sekoitus todellisia, faktuaalisia asioita, mutta joita ei oikeasti ole olemassa; vähän kuin se hallusinoisi tuloksia kokeista, joita kuvataan kirjallisuuden kollektiivisessa Future Work -osiossa. Keskustelin sen kanssa pääasiassa yleisissä kysymys-vastaus -tilaisuuksissa tieteestä, historiasta, lääketieteestä tai oikeustieteestä sekä tuote- tai matkailututkimuksesta. Käytin sitä hieman Claude-koodiin, mutta nämä kommentit koskevat pääasiassa kysymyksiä ja vastauksia.