Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Salah satu pendiri dan CEO @Hyperbolic_Labs. mantan @avax & mantan @citsecurities. Menyelesaikan PhD Matematika dalam 2 tahun @UCBerkeley. Peraih Medali Emas Olimpiade Matematika. Kehormatan tertinggi @PKU1898
Kita mungkin menuju ke plot twist dalam saga OpenAI vs. DeepMind IMO.
Baru saja melihat postingan dari Joseph Myers (terlibat dalam Olimpiade Matematika sejak 1992): komite IMO dilaporkan meminta laboratorium AI untuk tidak mempublikasikan hasilnya sampai 7 hari setelah upacara penutupan — untuk menghormati kontestan manusia (lihat posting saya kemarin) dan kemungkinan akan memberikan waktu untuk verifikasi yang tepat dari kiriman dan format AI.
Menurut Joseph, OpenAI tidak berkolaborasi dengan IMO untuk menguji model mereka, dan tidak ada dari 91 koordinator resmi IMO yang terlibat dalam penilaian solusinya. Sementara itu, tampaknya DeepMind mengikuti aturan dan dengan sabar menunggu giliran mereka.
Untuk konteks:
IMO memiliki 6 masalah, masing-masing bernilai 7 poin. Batas emas tahun ini adalah 35 poin. Bahkan pengurangan kecil dapat menjatuhkan OpenAI menjadi perak. Dan dari pembacaan saya tentang tulisan mereka, beberapa bagian mungkin menimbulkan pertanyaan - dan mungkin poin biaya.
Terence Tao juga menunjukkan bahwa meskipun masalahnya tetap sama, format pengujian itu penting. Seorang siswa yang tidak akan mendapatkan perunggu dalam kondisi standar mungkin mendapatkan emas dengan pengaturan yang dimodifikasi - yang menimbulkan pertanyaan nyata tentang apa arti "memecahkan IMO" bagi AI.
Minggu depan mungkin menjadi pedas. Menantikan.


68,07K
DeepMind mendapatkan medali emas di IMO pada Jumat sore. Tetapi mereka harus menunggu pemasaran untuk menyetujui tweet itu - hingga Senin.
@OpenAI membagikan mereka pertama kali pada pukul 1 pagi pada hari Sabtu dan mencuri perhatian.
Dalam game ini, kecepatan > birokrasi. Lewatkan momen, hilangkan narasinya.
214,94K
Baru saja pulang kerja dan mencoba Grok-4 pada masalah topologi sarjana. Butuh 9 menit untuk berpikir dan kemudian dengan percaya diri memberikan jawaban 😅 yang bersih, masuk akal, tetapi benar-benar salah
Jangan berpikir yang satu ini memenuhi syarat sebagai "permusuhan yang terampil." Model AI menghancurkan tolok ukur — tetapi masih jauh ke depan untuk AGI matematika nyata.



Elon Musk10 Jul, 16.47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
662,97K
Grok mendapat skor penuh di AIME 🤯 Kami pasti membutuhkan tolok ukur matematika yang lebih baik untuk AI sekarang


xAI10 Jul, 12.01
Memperkenalkan Grok 4, model AI paling kuat di dunia. Tonton siaran langsungnya sekarang:
2,96K
Masa depan AI adalah kolaboratif

Yuchen Jin9 Jul, 06.09
Sam Altman was asked how he felt about Zuck and Meta poaching OpenAI’s top talent.
“Fine... good...” he said.
Behind Jony Ive–designed glasses, I couldn’t see his eyes. But I could feel the pain.
It's not hard for Zuck to poach OpenAI talent, not just because he has the money, but because open-source AI is fulfilling the original OpenAI mission.
1,42K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal