DeepMind zdobył złoty medal na IMO w piątek po południu. Ale musieli czekać na zatwierdzenie tweeta przez marketing — aż do poniedziałku. @OpenAI podzielił się swoim pierwszym o 1:00 w sobotę i skradł show. W tej grze, szybkość > biurokracja. Przegap moment, stracisz narrację.
Jasper
Jasper19 lip, 06:25
Zaledwie 20 minut temu ogłoszono wyniki IMO 2025. Chiny zajęły 1. miejsce, a @GoogleDeepMind zdobyło złoty medal 🥇 Przyszłe zawody matematyczne będą polegały na rywalizacji drużyny Chin z drużyną USA oraz drużyną chińską z AI.
Wyjaśnienie: Powiedziano mi przez kogoś z Google, że ich wyniki IMO wciąż są weryfikowane. Gdy ten proces się zakończy, planują je oficjalnie udostępnić. Czekam z niecierpliwością na ich podejście.
Wyjaśnienie: Powiedziano mi przez kogoś z Google, że ich wyniki IMO są nadal weryfikowane wewnętrznie. Gdy to się skończy, planują je oficjalnie ogłosić — ciekaw jestem ich podejścia. Inne źródło wspomniało, że komitet IMO poprosił, aby nie omawiać publicznie zaangażowania AI w ciągu tygodnia po ceremonii zamknięcia. Sprawy stały się trochę bardziej interesujące 🧐
@OpenAI Kilka aktualizacji tutaj
Jasper
Jasper6 godz. temu
Możemy zmierzać w kierunku zwrotu akcji w sagi OpenAI vs. DeepMind IMO. Właśnie zobaczyłem post od Josepha Myersa (zaangażowanego w Olimpiadę Matematyczną od 1992 roku): podobno komitet IMO poprosił laboratoria AI, aby nie publikowały wyników przez 7 dni po ceremonii zamknięcia — z szacunku dla ludzkich uczestników (zobacz mój post z wczoraj) i prawdopodobnie, aby dać czas na odpowiednią weryfikację zgłoszeń i formatów AI. Według Josepha, OpenAI nie współpracowało z IMO, aby przetestować swój model, a żaden z 91 oficjalnych koordynatorów IMO nie był zaangażowany w ocenianie jego rozwiązań. Tymczasem wydaje się, że DeepMind przestrzega zasad i cierpliwie czeka na swoją kolej. Dla kontekstu: IMO ma 6 problemów, z których każdy wart jest 7 punktów. W tym roku próg złota wynosi 35 punktów. Nawet małe odjęcie mogłoby zepchnąć OpenAI do srebra. A z tego, co przeczytałem w ich opisach, niektóre części mogą budzić wątpliwości — i potencjalnie kosztować punkty. Terence Tao również zauważył, że chociaż problemy pozostają te same, formaty testów mają znaczenie. Uczeń, który nie zdobyłby brązu w standardowych warunkach, może zdobyć złoto w zmodyfikowanym ustawieniu — co rodzi prawdziwe pytania o to, co oznacza „rozwiązywanie IMO” dla AI. Następny tydzień może być pikantny. Bądźcie czujni.
214,94K