Третина дорослих американців використовує штучний інтелект «багато разів на день або майже постійно», а ще третина – кілька разів на тиждень.
Я не можу додати багато до дискусій про бульбашки оцінки, але якщо «бульбашка» означає невтішну технологію, яка є надмірно розкрученою та не корисною, це не відповідає даним
Одним із небагатьох показників здатності штучного інтелекту, який охоплює GPT-3, GPT-4 і GPT-5, є тест METER на те, як довго ШІ може працювати незалежно.
Усі контрольні показники недосконалі, але це є ключовим фактором для економічної роботи штучного інтелекту. Експоненціальний приріст від GPT-3 до GPT-5 дуже стабільний.
Я думаю, що значення цього недооцінене: часто припускалося, що агенти штучного інтелекту є крихкими, оскільки одна невдача в ланцюжку розриває завдання
Але ця стаття показує, що розумні моделі самовиправляються, і що невеликий приріст точності призводить до експоненціального зростання горизонтів завдань
У статті стверджується, що зменшення віддачі від масштабу ШІ є ілюзією
Економічна цінність походить від виконання довгих проектів, а не окремих питань. А точність визначає, як довго триватиме проєкт зі штучним інтелектом: малі прибутки складаються в геометричній прогресії!
Аргументатори набагато точніші, з великими наслідками.