Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Mark Chen
Forskningssjef i @OpenAI. Trener for USAs IOI-lag.
Vi oppnådde gullmedaljenivå på årets IMO! Modellen vår tenker og skriver bevis på klart, vanlig engelsk - ingen formell kode kreves.
I motsetning til de smalere systemene som ble brukt i tidligere konkurranser, er modellen vår bygget for å resonnere bredt, langt utover konkurranseproblemer.

Alexander Wei19. juli, 15:50
1/N Jeg er glad for å dele at vår siste @OpenAI eksperimentelle resonnement LLM har oppnådd en langvarig stor utfordring innen AI: gullmedaljenivå på verdens mest prestisjefylte matematikkkonkurranse – International Math Olympiad (IMO).

124,36K
Vi konkurrerte live i @atcoder World Finals Heuristic Contest og kom på 2.-plass!
Modeller som o3 rangerer blant topp-100 i kodings-/matematikkkonkurranser, men AFAIK dette er den første topp-3-plasseringen i en førsteklasses kodings-/matematikkkonkurranse. Det er et stort gap mellom topp-100 og topp-3!

Ahmed El-Kishky17. juli, 02:52
Gratulerer @FakePsyho med en neglebitende forestilling! Flotte visninger også fra @bminaiev, @andresnds og @_lorenzkuhn som representerer OpenAI. Det har vært fantastisk å sponse AtCoder World Finals @atcoder. Vi er glade for å dele noen av modellløsningene med verden.
53,98K
Mark Chen lagt ut på nytt
Jeg er ekstremt begeistret for potensialet i tankekjedetrofasthet og tolkbarhet. Det har betydelig påvirket utformingen av resonneringsmodellene våre, og starter med o1-forhåndsvisning.
Ettersom AI-systemer bruker mer databehandling, for eksempel på langsiktige forskningsproblemer, er det avgjørende at vi har en måte å overvåke deres interne prosess på. Den fantastiske egenskapen til skjulte CoT-er er at selv om de starter forankret i språk vi kan tolke, er den skalerbare optimaliseringsprosedyren ikke i strid med observatørens evne til å verifisere modellens intensjon - i motsetning til for eksempel direkte tilsyn med en belønningsmodell.
Spenningen her er at hvis CoT-ene ikke var skjult som standard, og vi ser på prosessen som en del av AIs utdata, er det mye insentiv (og i noen tilfeller nødvendighet) til å sette tilsyn på den. Jeg tror vi kan jobbe mot det beste fra begge verdener her - trene modellene våre til å være gode til å forklare deres interne resonnement, men samtidig beholde evnen til å verifisere det av og til.
CoT-trofasthet er en del av en bredere forskningsretning, som er trening for tolkbarhet: å sette mål på en måte som trener i det minste deler av systemet til å forbli ærlig og overvåkelig med skala. Vi fortsetter å øke investeringene våre i denne forskningen ved OpenAI.
264,17K
Vi overansetter ikke på forskning. Og på talentbaren - det er noen virkelig fenomenale mennesker som blir med i løpet av den neste måneden!
Jeg tilbrakte år i handel til mangel på mening slet meg ned. Jeg har aldri følt det på OAI - det er så mye mer tilfredsstillende å bygge ting med innvirkning i den virkelige verden.

Iain Dunning17. mai 2025
Er du forsker ved OAI/Anthropic/etc og lei av overansettelser, orgchart-kaoset, den senkede talentlisten, ønsker å flytte til NYC, eller vil du bare gjøre noe annerledes? Send meg en e-post, send meg en DM, send et postkort. Vi har et nytt datasenter fullt av B200-er, tett team og veldig vellykket.
221,92K
Mark Chen lagt ut på nytt
Har nettopp lansert Codex, en programvareutviklingsagent som kan jobbe med mange oppgaver parallelt.
Den kjører på sin egen skybaserte databehandlingsinfrastruktur, og kan fikse feil, svare på spørsmål om koden din, kjøre tester osv.
Føles som et skritt mot fremtiden for programvareutvikling.
254,96K
Så spent på å jobbe med @fidjissimo - hun er en produktvisjonær!

Sam Altman8. mai 2025
Så spent på at @fidjissimo blir med i OpenAI i en ny rolle: administrerende direktør for applikasjoner, rapporterer til meg.
Jeg vil forbli administrerende direktør i OpenAI, men i denne nye konfigurasjonen vil jeg kunne øke fokuset mitt på forskning, databehandling og sikkerhet.
Disse er kritiske når vi nærmer oss superintelligens.
77,86K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til