Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Salah satu pendiri dan CEO @Hyperbolic_Labs. mantan @avax & mantan @citsecurities. Menyelesaikan PhD Matematika dalam 2 tahun @UCBerkeley. Peraih Medali Emas Olimpiade Matematika. Kehormatan tertinggi @PKU1898
Kita mungkin menuju ke plot twist dalam saga OpenAI vs. DeepMind IMO.
Baru saja melihat postingan dari Joseph Myers (terlibat dalam Olimpiade Matematika sejak 1992): komite IMO dilaporkan meminta laboratorium AI untuk tidak mempublikasikan hasilnya sampai 7 hari setelah upacara penutupan — untuk menghormati kontestan manusia (lihat posting saya kemarin) dan kemungkinan akan memberikan waktu untuk verifikasi yang tepat dari kiriman dan format AI.
Menurut Joseph, OpenAI tidak berkolaborasi dengan IMO untuk menguji model mereka, dan tidak ada dari 91 koordinator resmi IMO yang terlibat dalam penilaian solusinya. Sementara itu, tampaknya DeepMind mengikuti aturan dan dengan sabar menunggu giliran mereka.
Untuk konteks:
IMO memiliki 6 masalah, masing-masing bernilai 7 poin. Batas emas tahun ini adalah 35 poin. Bahkan pengurangan kecil dapat menjatuhkan OpenAI menjadi perak. Dan dari pembacaan saya tentang tulisan mereka, beberapa bagian mungkin menimbulkan pertanyaan - dan mungkin poin biaya.
Terence Tao juga menunjukkan bahwa meskipun masalahnya tetap sama, format pengujian itu penting. Seorang siswa yang tidak akan mendapatkan perunggu dalam kondisi standar mungkin mendapatkan emas dengan pengaturan yang dimodifikasi - yang menimbulkan pertanyaan nyata tentang apa arti "memecahkan IMO" bagi AI.
Minggu depan mungkin menjadi pedas. Menantikan.


68,08K
DeepMind mendapatkan medali emas di IMO pada Jumat sore. Tetapi mereka harus menunggu pemasaran untuk menyetujui tweet itu - hingga Senin.
@OpenAI membagikan mereka pertama kali pada pukul 1 pagi pada hari Sabtu dan mencuri perhatian.
Dalam game ini, kecepatan > birokrasi. Lewatkan momen, hilangkan narasinya.
214,95K
Baru saja pulang kerja dan mencoba Grok-4 pada masalah topologi sarjana. Butuh 9 menit untuk berpikir dan kemudian dengan percaya diri memberikan jawaban 😅 yang bersih, masuk akal, tetapi benar-benar salah
Jangan berpikir yang satu ini memenuhi syarat sebagai "permusuhan yang terampil." Model AI menghancurkan tolok ukur — tetapi masih jauh ke depan untuk AGI matematika nyata.



Elon Musk10 Jul, 16.47
Grok 4 berada pada titik di mana pada dasarnya tidak pernah salah soal ujian matematika/fisika, kecuali jika mereka bermusuhan dengan terampil.
Itu dapat mengidentifikasi kesalahan atau ambiguitas dalam pertanyaan, kemudian memperbaiki kesalahan dalam pertanyaan atau menjawab setiap varian pertanyaan ambigu.
662,97K
Grok mendapat skor penuh di AIME 🤯 Kami pasti membutuhkan tolok ukur matematika yang lebih baik untuk AI sekarang


xAI10 Jul, 12.01
Memperkenalkan Grok 4, model AI paling kuat di dunia. Tonton siaran langsungnya sekarang:
2,96K
Masa depan AI adalah kolaboratif

Yuchen Jin9 Jul, 06.09
Sam Altman ditanya bagaimana perasaannya tentang Zuck dan Meta yang memburu talenta terbaik OpenAI.
"Baiklah... bagus ..." Katanya.
Di balik kacamata yang dirancang Jony Ive, saya tidak bisa melihat matanya. Tapi saya bisa merasakan sakitnya.
Tidak sulit bagi Zuck untuk memburu bakat OpenAI, bukan hanya karena dia punya uang, tetapi karena AI sumber terbuka memenuhi misi OpenAI asli.
1,42K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal