мультимодальные приложения через Deepmind AI Studio ОЧЕНЬ мало разрекламированы С помощью всего одной подсказки я создал это приложение за <10 минут, которое записывало, как я пролистывал записи и выводил каждого исполнителя + альбом. Раньше видео было одной из самых сложных вещей в работе, теперь это подсказка.
для тех, кто интересуется, вот подсказка, которую я использовал: "создайте приложение, которое снимает видео человека, пролистывающего свою коллекцию пластинок, и извлекает названия альбомов и имена исполнителей каждого показанного альбома. вы можете сделать это, сняв видео и сначала извлекая кадры, на которых видны отдельные виниловые пластинки, а затем заставив модель зрения проанализировать эти кадры, чтобы извлечь информацию"
1,95K