aplicativos multimodais via deepmind AI studio são MUITO subestimados Com apenas um único prompt, construí este aplicativo em <10 minutos que me gravou folheando discos e saídas de cada artista + álbum mostrado. O vídeo costumava ser uma das coisas mais difíceis de trabalhar, agora é um prompt.
Para aqueles que estão se perguntando, este é o prompt que usei: "Crie um aplicativo que faça um vídeo de uma pessoa folheando sua coleção de discos e extraia os nomes dos álbuns e artistas de todos os álbuns exibidos. Você pode fazer isso pegando o vídeo e primeiro extraindo os quadros que mostram discos de vinil distintos e, em seguida, fazendo com que o modelo de visão analise esses quadros para extrair as informações"
1,96K