мультимодальні додатки через студію deepmind AI ДУЖЕ недооцінені За допомогою лише одного запиту я створив цей додаток за <10 хвилин, який записував, як я гортаю записи, і виводить кожен показаний виконавець + альбом. Раніше відео було однією з найскладніших речей для роботи, тепер це підказка.
Для тих, хто цікавиться, ось підказка, яку я використовував: «Створіть програму, яка знімає відео, на якому людина гортає свою колекцію записів, і витягує альбоми та імена виконавців кожного показаного альбому. Ви можете зробити це, взявши відео і спочатку витягнувши кадри, на яких видно різні вінілові платівки, а потім попросити модель Vision проаналізувати ці кадри, щоб витягнути інформацію».
1,97K