Економіка штучного інтелекту досягає критичної точки перегину. Згідно з дослідженнями, прогнозується, що до 2027 року витрати на навчання передових моделей штучного інтелекту досягнуть понад 1 мільярд доларів. Генеральний директор @AnthropicAI Даріо Амодей спрогнозував, що наступного року витрати на навчання моделей штучного інтелекту зростуть до кількох мільярдів доларів за пробіг. "У 2026 році це може бути понад 10 мільярдів доларів на навчання однієї моделі. Він передбачає, що до 2027 року модельні компанії матимуть амбіції побудувати навчальні кластери на суму 100 мільярдів доларів».
Апаратний бар'єр вражає: лише придбання обладнання, яке використовується для навчання GPT-4, коштувало приблизно 800 мільйонів доларів, порівняно з 40 мільйонами доларів за амортизовані витрати. З огляду на те, що витрати на навчання зростають на ~2,4× на рік, неефективна обчислювальна інфраструктура стає екзистенційною загрозою для компаній зі штучним інтелектом, які не можуть оптимізувати свої витрати.
Давайте розіб'ємо реальні витрати: навчання LLM з параметром 7B на 1-2 трильйонах токенів вимагає ~60 000 H100 GPU-годин. За нашим курсом ($1,49/год) це загалом $89 400. Таке ж навантаження на AWS на вимогу? Приголомшливі 405 000 доларів. Інші хмарні провайдери коштують від $179 400 до $209 400, тоді як локальні рішення коштують близько $300 000 при повній амортизації.
Наша платформа має явну перевагу: у 2,5× дешевше, ніж AWS зі знижкою, і в 3-4× дешевше, ніж у звичайних хмарних провайдерів. On-prem інфраструктура коштує на 6-9× більше при обліку всіх витрат. Для команд, які прагнуть до бюджетного, прозорого масштабування основних тренінгів LLM, наша пропозиція забезпечує миттєву економію та простоту роботи.
У міру того, як моделі продовжують зростати, ефективність обчислень не просто приємно мати - це ваш конкурентний рів. Питання не в тому, чи можете ви дозволити собі оптимізацію, а в тому, чи можете ви дозволити собі цього не робити. Почніть максимізувати свій бюджет на штучний інтелект вже сьогодні з .
Посилання Епоха ІІ. «Тенденції в ціні-продуктивності GPU». Епоха аі, 2022, . Гоббхан, Маріус і Тамай Бесіроглу. «Тенденції в ціні-продуктивності GPU». Епоха аі, 2022, . Дата-центри TRG. «Економія на розблокуванні: чому графічні процесори NVIDIA H100 перевищують витрати на оренду AWS». Дата-центри TRG, 2023 рік, Коттьє, Бен та ін. «Зростання витрат на навчання моделей передового штучного інтелекту». arXiv, 2024,
Ознайомтеся з повним текстом блогу тут:
1,64K