Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Mark Chen
Diretor de Pesquisa na @OpenAI. Treinador da Equipa IOI dos EUA.
Alcançámos um desempenho ao nível da medalha de ouro na IMO deste ano! O nosso modelo pensa e escreve provas em inglês claro e simples - sem necessidade de código formal.
Ao contrário dos sistemas mais restritos utilizados em competições anteriores, o nosso modelo foi construído para raciocinar de forma ampla, muito além dos problemas do concurso.

Alexander Wei19/07, 15:50
1/N Estou entusiasmado por compartilhar que o nosso mais recente LLM experimental de raciocínio da @OpenAI alcançou um desafio grandioso de longa data em IA: desempenho de nível medalha de ouro na competição de matemática mais prestigiada do mundo— as Olimpíadas Internacionais de Matemática (IMO).

157,31K
Competimos ao vivo no @atcoder World Finals Heuristic Contest e ficamos em 2º lugar!
Modelos como o3 estão entre os 100 melhores em concursos de programação / matemática, mas, até onde sei, esta é a primeira colocação entre os 3 primeiros em um concurso de programação / matemática de prestígio. Há uma grande diferença entre os 100 melhores e os 3 primeiros!

Ahmed El-Kishky17/07, 02:52
Parabéns @FakePsyho por uma performance emocionante! Grandes apresentações também de @bminaiev, @andresnds e @_lorenzkuhn representando a OpenAI. Tem sido fantástico patrocinar as Finais Mundiais da AtCoder @atcoder. Estamos entusiasmados por compartilhar algumas das soluções modelo com o mundo.
54,05K
Mark Chen republicou
Estou extremamente entusiasmado com o potencial da fidelidade e interpretabilidade do chain-of-thought. Isso influenciou significativamente o design dos nossos modelos de raciocínio, começando com o o1-preview.
À medida que os sistemas de IA gastam mais recursos computacionais, por exemplo, em problemas de pesquisa de longo prazo, é crítico que tenhamos alguma forma de monitorar seu processo interno. A maravilhosa propriedade dos CoTs ocultos é que, enquanto eles começam ancorados em uma linguagem que podemos interpretar, o procedimento de otimização escalável não é adversarial à capacidade do observador de verificar a intenção do modelo - ao contrário, por exemplo, da supervisão direta com um modelo de recompensa.
A tensão aqui é que, se os CoTs não fossem ocultos por padrão, e víssemos o processo como parte da saída da IA, haveria um grande incentivo (e em alguns casos, necessidade) de colocar supervisão sobre isso. Acredito que podemos trabalhar para o melhor de ambos os mundos aqui - treinar nossos modelos para serem ótimos em explicar seu raciocínio interno, mas ao mesmo tempo ainda reter a capacidade de ocasionalmente verificá-lo.
A fidelidade do CoT é parte de uma direção de pesquisa mais ampla, que é o treinamento para interpretabilidade: definir objetivos de uma maneira que treine pelo menos parte do sistema para permanecer honesto e monitorável em escala. Estamos continuando a aumentar nosso investimento nessa pesquisa na OpenAI.
264,22K
Mark Chen republicou
O Episódio 2 do Podcast da OpenAI já está disponível!
@markchen90 e @nickaturley juntam-se a @andrewmayne para revelar os bastidores da criação do ChatGPT.
Eles também discutem como os produtos são desenvolvidos e o que vem a seguir para a codificação agentic e assistentes multimodais.
939,68K
Não contratamos demais na pesquisa. E na barra de talentos - há algumas pessoas realmente fenomenais se juntando ao longo do próximo mês!
Passei anos no comércio até que a falta de sentido me desgastou. Eu nunca senti isso na OAI - é muito mais gratificante construir coisas com impacto no mundo real.

Iain Dunning17/05/2025
Você é um pesquisador da OAI/Anthropic/etc e está cansado de contratações excessivas, do caos organizacional, da barra de talentos rebaixada, quer se mudar para Nova York ou apenas quer fazer algo diferente? Envie-me um e-mail, DM me, envie um cartão postal. Temos um novo datacenter cheio de B200s, equipe apertada e muito bem-sucedida.
221,98K
Mark Chen republicou
Acaba de lançar o Codex, um agente de engenharia de software que pode trabalhar em muitas tarefas em paralelo.
Ele é executado em sua própria infraestrutura de computação baseada em nuvem e pode corrigir bugs, responder a perguntas sobre seu código, executar testes, etc.
Parece um passo em direção ao futuro da engenharia de software.
255,01K
Tão animada para trabalhar com @fidjissimo - ela é uma visionária do produto!

Sam Altman8/05/2025
Tão animado que @fidjissimo está se juntando à OpenAI em uma nova função: CEO de aplicativos, reportando-se a mim.
Continuarei sendo CEO da OpenAI, mas nesta nova configuração poderei aumentar meu foco em pesquisa, computação e segurança.
Estes são críticos à medida que nos aproximamos da superinteligência.
77,92K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável