Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arthur Douillard
Nauczanie rozproszone @ deepmind | DiLoCo, DiPaCo. Doktorat z ustawicznej nauki @ Sorbona
Użytkownik Arthur Douillard udostępnił ponownie
Zmiany algorytmiczne, takie jak GSPO dla Qwen, są głównie odzwierciedleniem subtelnych różnych potrzeb nowego połączenia modelu bazowego i zbioru danych RL, a nie dużą innowacją w fundamentach.
Infrastruktura i dane mają znacznie większe znaczenie niż drobne poprawki algorytmu RL.
7,84K
Dane w internecie po tym, jak GPT stały się jeszcze bardziej radioaktywne

Anthropic23 lip, 00:32
W wspólnym artykule z @OwainEvans_UK w ramach programu Anthropic Fellows badamy zaskakujące zjawisko: uczenie się subliminalne.
Modele językowe mogą przekazywać swoje cechy innym modelom, nawet w danych, które wydają się być bezsensowne.
758
Użytkownik Arthur Douillard udostępnił ponownie
Osiągnęliśmy złoty medal na Międzynarodowej Olimpiadzie Matematycznej 🥇 🥳 To pierwszy ogólny system, który to zrobił poprzez oficjalny udział i ocenianie, i cieszę się, że mogłem wnieść mały wkład w ten kamień milowy w rozumowaniu matematycznym 🌈🫶
33,75K
Użytkownik Arthur Douillard udostępnił ponownie
Czy masz doktorat (lub równoważny) lub będziesz go mieć w nadchodzących miesiącach (tj. za 2-3 miesiące ukończysz studia)? Chcesz pomóc w budowaniu agentów otwartego końca, którzy pomagają ludziom lepiej wykonywać ludzkie zadania, zamiast ich zastępować? Zatrudniamy 1-2 naukowców badawczych! Sprawdź 🧵👇
52,95K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi