Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Możemy zmierzać w kierunku zwrotu akcji w sagi OpenAI vs. DeepMind IMO.
Właśnie zobaczyłem post od Josepha Myersa (zaangażowanego w Olimpiadę Matematyczną od 1992 roku): podobno komitet IMO poprosił laboratoria AI, aby nie publikowały wyników przez 7 dni po ceremonii zamknięcia — z szacunku dla ludzkich uczestników (zobacz mój post z wczoraj) i prawdopodobnie, aby dać czas na odpowiednią weryfikację zgłoszeń i formatów AI.
Według Josepha, OpenAI nie współpracowało z IMO, aby przetestować swój model, a żaden z 91 oficjalnych koordynatorów IMO nie był zaangażowany w ocenianie jego rozwiązań. Tymczasem wydaje się, że DeepMind przestrzega zasad i cierpliwie czeka na swoją kolej.
Dla kontekstu:
IMO ma 6 problemów, z których każdy wart jest 7 punktów. W tym roku próg złota wynosi 35 punktów. Nawet małe odjęcie mogłoby zepchnąć OpenAI do srebra. A z tego, co przeczytałem w ich opisach, niektóre części mogą budzić wątpliwości — i potencjalnie kosztować punkty.
Terence Tao również zauważył, że chociaż problemy pozostają te same, formaty testów mają znaczenie. Uczeń, który nie zdobyłby brązu w standardowych warunkach, może zdobyć złoto w zmodyfikowanym ustawieniu — co rodzi prawdziwe pytania o to, co oznacza „rozwiązywanie IMO” dla AI.
Następny tydzień może być pikantny. Bądźcie czujni.



20 lip, 03:15
DeepMind zdobył złoty medal na IMO w piątek po południu. Ale musieli czekać na zatwierdzenie tweeta przez marketing — aż do poniedziałku.
@OpenAI podzielił się swoim pierwszym o 1:00 w sobotę i skradł show.
W tej grze, szybkość > biurokracja. Przegap moment, stracisz narrację.
@swierk Znaleźli 3 byłych medalistów IMO, którzy nie są oficjalnymi koordynatorami IMO: „Dla każdego problemu trzech byłych medalistów IMO niezależnie oceniło przesłany dowód modelu, a wyniki zostały sfinalizowane po jednogłośnym konsensusie.”

19 lip, 15:50
6/N W naszej ocenie model rozwiązał 5 z 6 problemów na IMO 2025. Dla każdego problemu trzech byłych medalistów IMO niezależnie oceniło przedstawiony przez model dowód, a wyniki zostały sfinalizowane po jednogłośnym konsensusie. Model zdobył 35/42 punkty w sumie, co wystarczyło na złoto! 🥇
Mój poprzedni post na temat prośby komitetu IMO

20 lip, 05:42
Wyjaśnienie: Powiedziano mi przez kogoś z Google, że ich wyniki IMO są nadal weryfikowane wewnętrznie. Gdy to się skończy, planują je oficjalnie ogłosić — ciekaw jestem ich podejścia.
Inne źródło wspomniało, że komitet IMO poprosił, aby nie omawiać publicznie zaangażowania AI w ciągu tygodnia po ceremonii zamknięcia. Sprawy stały się trochę bardziej interesujące 🧐
@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.

20 lip, 05:42
Wyjaśnienie: Powiedziano mi przez kogoś z Google, że ich wyniki IMO są nadal weryfikowane wewnętrznie. Gdy to się skończy, planują je oficjalnie ogłosić — ciekaw jestem ich podejścia.
Inne źródło wspomniało, że komitet IMO poprosił, aby nie omawiać publicznie zaangażowania AI w ciągu tygodnia po ceremonii zamknięcia. Sprawy stały się trochę bardziej interesujące 🧐
@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang, który stworzył AlphaGeometry, również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.

19 godz. temu
Tak, istnieje oficjalna wytyczna dotycząca oceniania od organizatorów IMO, która nie jest dostępna publicznie. Bez oceny opartej na tej wytycznej nie można zgłosić roszczenia o medal. Z jednym punktem odjętym, to Srebro, a nie Złoto.
@swierk Tak, pojawia się coraz więcej pytań stawianych przez ludzi zajmujących się matematyką i AI.

15 godz. temu
@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang, który stworzył AlphaGeometry, również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.
87,31K
Najlepsze
Ranking
Ulubione