Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Новий допис у блозі про асиметрію верифікації та "закон верифікатора": Асиметрія верифікації – ідея про те, що деякі завдання набагато легше перевірити, ніж вирішити – стає важливою ідеєю, оскільки ми маємо РЛ, який нарешті працює в цілому. Чудовими прикладами асиметрії верифікації є такі речі, як головоломки судоку, написання коду для веб-сайту на кшталт instagram та проблеми BrowseComp (потрібно ~100 веб-сайтів, щоб знайти відповідь, але легко перевірити, як тільки ви отримаєте відповідь). Інші завдання мають майже симетрію верифікації, наприклад, підсумовування двох 900-значних чисел або деякі сценарії обробки даних. Проте для інших завдань набагато простіше запропонувати можливі рішення, ніж перевірити їх (наприклад, перевірка фактів у довгому есе або заява про нову дієту на кшталт «їжте лише зубра»). Важливо розуміти про асиметрію верифікації те, що ви можете покращити асиметрію, попередньо виконавши певну роботу. Наприклад, якщо у вас є ключ відповіді на математичну задачу або якщо у вас є тест-кейси для задачі Leetcode. Це значно збільшує набір проблем з бажаною асиметрією верифікації. «Закон верифікатора» стверджує, що легкість навчання ШІ для вирішення завдання пропорційна тому, наскільки це завдання піддається перевірці. Всі завдання, які можливо вирішити і легко перевірити, будуть вирішені за допомогою штучного інтелекту. Можливість навчити ШІ вирішувати завдання пропорційно тому, чи має завдання такі властивості: 1. Об'єктивна істина: всі згодні з тим, що таке хороші рішення 2. Швидка перевірка: будь-яке рішення можна перевірити за кілька секунд 3. Масштабується для верифікації: багато рішень можна перевірити одночасно 4. Низький рівень шуму: верифікація максимально тісно корелює з якістю рішення 5. Безперервна винагорода: легко оцінити ефективність багатьох рішень для однієї проблеми Одним з очевидних проявів закону верифікатора є той факт, що більшість контрольних показників, запропонованих в ШІ, легко перевірити і поки що вирішені. Зверніть увагу, що практично всі популярні бенчмарки за останні десять років підходять під критерії #1-4; Бенчмарки, які не відповідають критеріям #1-4, будуть боротися за те, щоб стати популярними. Чому верифікованість така важлива? Обсяг навчання в ШІ, що відбувається, максимізується, коли задовольняються вищезазначені критерії; Ви можете зробити багато градієнтних кроків, де кожен крок має багато сигналу. Швидкість ітерацій має вирішальне значення — це причина того, що прогрес у цифровому світі був набагато швидшим, ніж прогрес у фізичному світі. AlphaEvolve від Google є одним із найкращих прикладів використання асиметрії верифікації. Він зосереджений на установках, які відповідають усім вищезазначеним критеріям, і призвів до низки досягнень у математиці та інших галузях. На відміну від того, що ми робили в штучному інтелекті протягом останніх двох десятиліть, це нова парадигма, яка полягає в тому, що всі проблеми оптимізуються в умовах, коли набір поїздів еквівалентний тестовому набору. Асиметрія верифікації є скрізь, і це захоплююче розглядати світ зубчастого інтелекту, де все, що ми можемо виміряти, буде вирішено.

298,77K

Найкращі

Рейтинг

Вибране

Актуальне ончейн

Популярні в X

Нещодавнє найкраще фінансування

Найбільш варте уваги