Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Я хочу переконатися, що це зрозуміло:
Коли ви приєднуєтеся до моєї когорти AI/ML Engineering, ви також отримуєте доступ до кожної майбутньої когорти.
Це довічний доступ, тому поки я викладаю когорту, ви можете приєднатися до неї, не заплативши жодного цента.
Щомісячні платежі відсутні. Тут немає ніяких «апгрейдів» або «додаткових продажів».
Все просто: ви платите один раз, щоб приєднатися, і отримуєте доступ до *всього* назавжди. Без обмежень. Вам просто потрібно з'являтися на заняттях, коли ви цього хочете.
До речі, багато студентів зробили так:
• Об'єднання однієї когорти для розминки
• Приєднуйтесь до наступної когорти, щоб піти ва-банк
• Приєднання до третьої когорти з надздібностями
Звичайно, це необов'язково, але це дуже важливо для тих з вас, хто хоче гнучкості.
Моя наступна когорта починається через 2 тижні (4 серпня), і ви можете приєднатися, відвідавши школу ml dot.
17
Таким чином, ви пишете в 10 разів кращий код з 10-кратним меншим зусиллям.
Спеціальні, спеціалізовані агенти, які перевіряють ваш код на кожному кроці.
Я вже бачив автоматизовані рев'ю коду, але ніколи не мав можливості визначити ваших агентів користувацького рецензента. @baz_scm перший, хто це зробив, і це дуже круто.
Існує три типи агентів-рецензентів:
1. Ті, що виходять з коробки.
Ці агенти охоплюють найпоширеніші шаблони, які всі хочуть перевірити: дубльований код, зламаний код, складний код тощо.
2. Рекомендовані агенти-рецензенти, яких Baz створює для вас автоматично.
Baz аналізує вашу історію відгуків і попередні коментарі, щоб виявити шаблони, які вас цікавлять, а потім автоматично створює агентів, що спеціалізуються на перевірці цих шаблонів.
Наприклад, якщо ви завжди просите своїх розробників зберігати файли до 100 рядків коду, Baz виявить це та створить користувацького агента, який перевірить це.
3. Агенти користувацьких рецензентів, яких ви визначаєте.
Ось мої улюблені: Напишіть підказку з поясненням ваших правил, і ваш агент почне перевіряти ваш код, щоб позначити все, що відповідає правилам.
Я створив простого агента-рецензента у прикріпленому відео.
Чесно кажучи, на даний момент у вас немає виправдання за доставку поганого коду.
Ось посилання, за яким ви можете спробувати цих агентів користувацьких рецензентів:
Дякую команді @baz_scm за співпрацю зі мною над цією посадою.
31,43K
Чесно кажучи, більшість розробників ШІ все ще застрягли в минулому столітті.
Мене вражає, як мало людей знають про аналіз помилок.
Це *буквально* найшвидший і найефективніший спосіб оцінити програми штучного інтелекту, і більшість команд все ще застрягли в гонитві за привидами.
Будь ласка, припиніть відстежувати загальні показники та виконайте такі дії:
1. Зберіть зразки несправностей
Почніть переглядати відповіді, згенеровані вашою заявкою. Записуйте нотатки про кожну відповідь, особливо ті, в яких були помилки. Вам не потрібно форматувати свої нотатки якимось особливим чином. Зосередьтеся на описі того, що пішло не так з відповіддю.
2. Розподіліть нотатки за категоріями
Після того, як ви ознайомилися з хорошим набором відповідей, візьміть LLM і попросіть його знайти загальні закономірності у ваших нотатках. Попросіть його класифікувати кожну ноту на основі цих зразків.
У підсумку ви отримаєте категорії, що охоплюють кожен тип помилок, допущених у вашій заявці.
3. Діагностуйте найчастіші помилки
Почніть з того, що зосередьтеся на найпоширенішому типі помилки. Ви ж не хочете витрачати час на роботу з рідкісними помилками.
Детально вивчіть розмови, вхідні дані та журнали, що призводять до цих неправильних зразків. Спробуйте зрозуміти, що може спричинити проблеми.
4. Створюйте цільові виправлення
На цьому етапі ви хочете визначити, як усунути помилки, які ви діагностували на попередньому кроці, якомога швидше і дешевше.
Наприклад, ви можете налаштувати свої підказки, додати додаткові правила перевірки, знайти більше даних про тренування або змінити модель.
5. Автоматизуйте процес оцінювання
Вам потрібно впровадити простий процес, щоб повторно запустити оціночний набір через вашу програму та оцінити, чи були ваші виправлення ефективними.
Моя рекомендація полягає в тому, щоб використовувати LLM-as-a-Judge для прогону зразків через додаток, оцінювання їх за допомогою тегу PASS/FAIL та обчислення результатів.
6. Слідкуйте за своїми показниками
Кожна категорія, яку ви визначили під час аналізу помилок, – це показник, який ви хочете відстежувати в динаміці.
Ви нікуди не приведете, зациклюючись на «релевантності», «правильності», «повноті», «послідовності» та будь-яких інших нестандартних метриках. Забудьте про це і зосередьтеся на реальних проблемах, які ви виявили.

49,29K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги