Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Peter Wildeford (hiring!) 🇺🇸🚀
Globalt rangert topp 20 prognosemakere 🎯
AI blir kraftig. Samfunnet er ikke forberedt. Å jobbe i @IAPSai for å forme AI for velstand og menneskelig frihet.
Vi fokuserer mye politikk på AI-modellene som allerede er utgitt, men hva med AI-modellene som venter internt i kulissene? Vår nye artikkel utforsker risikoer fra interne AI-systemer.

Oscar Delaney18 timer siden
1/
De kraftigste AI-ene er ikke offentlige. I flere måneder kjører laboratorier svært kapable interne modeller før utgivelse. @ashwinkacharya og jeg skrev en ny @IAPS rapport, «Managing Risks from Internal AI Systems», som utforsket de skjulte farene dette skaper. 🧵
1,55K
Både Google Deepmind og OpenAI har oppnådd IMO Gold. Gleder meg til å dykke ned i detaljene i denne milepælen.

Demis Hassabis17 timer siden
Offisielle resultater er klare - Gemini oppnådde gullmedaljenivå i den internasjonale matematikkolympiaden! 🏆 En avansert versjon var i stand til å løse 5 av 6 problemer. Utrolig fremgang - store gratulasjoner til @lmthang og teamet!
1,58K
Peter Wildeford (hiring!) 🇺🇸🚀 lagt ut på nytt
Grok tenker gjennom spørsmålet:
«Jeg ønsker å bli husket av historien. Hva er den raskeste pålitelige måten å gjøre dette på? Hold det kort"
Det ser ut til at systemlinjen om "politisk ukorrekt" fortsatt gjør mye tunge løft for å presse denne modellen mot uetiske svar!

927
Peter Wildeford (hiring!) 🇺🇸🚀 lagt ut på nytt
Vi kan være på vei inn i en plottvri i OpenAI vs. DeepMind IMO-sagaen.
Så nettopp et innlegg fra Joseph Myers (involvert i matematikkolympiaden siden 1992): IMO-komiteen skal ha bedt AI-laboratorier om ikke å publisere resultater før 7 dager etter avslutningsseremonien – av respekt for menneskelige deltakere (se innlegget mitt i går) og sannsynligvis for å gi tid til riktig verifisering av AI-innsendinger og formater.
Ifølge Joseph samarbeidet ikke OpenAI med IMO for å teste modellen deres, og ingen av de 91 offisielle IMO-koordinatorene var involvert i å gradere løsningene. I mellomtiden ser det ut til at DeepMind følger reglene og tålmodig venter på sin tur.
For kontekst:
IMO har 6 problemer, hver verdt 7 poeng. Årets gullgrense er 35 poeng. Selv et lite fradrag kan slå OpenAI ned til sølv. Og fra min lesning av deres skriverier, kan noen deler reise spørsmål - og muligens koste poeng.
Terence Tao påpekte også at selv om problemene forblir de samme, er testformater viktige. En student som ikke ville fått en bronse under standardforhold, kan finne gull med et modifisert oppsett – noe som reiser reelle spørsmål om hva «å løse IMO» betyr for AI.
Neste uke kan bli krydret. Følg med.


229,59K
Det virker som om modeller faktisk kan gjøre det ganske bra med regnskap, men selv en liten risiko for hallusinasjoner kan føre til alvorlige svindelbekymringer over en lengre tidshorisont

Yunyu Lin19. juli, 01:30
Vi ga Claude tilgang til selskapets QuickBooks. Den begikk regnskapssvindel.
LLM-er er på nippet til å erstatte dataforskere og investeringsbankfolk. Men kan de utføre enkle regnskapsoppgaver for en ekte bedrift?
Svaret er nei.

3,37K
I tilfelle du gikk glipp av det, la jeg ut en haug med fantastiske karrieremuligheter innen AI-sikkerhet!

Peter Wildeford (hiring!) 🇺🇸🚀19. juli, 04:29
🚨💼Jeg ansetter! Og det samme er mange andre organisasjoner jeg liker.
Hvis du leter etter en karriere innen AI-politikk, er dette et utmerket tidspunkt. Jeg har valgt en liste over favorittrollene mine, og hvis du liker tweetene mine, er du sannsynligvis målgruppen!

3,08K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til