le app multimodali tramite deepmind AI studio sono MOLTO poco pubblicizzate Con un solo prompt ho creato questa app in <10 minuti che mi ha registrato mentre sfogliavo i dischi e ha emesso ogni artista + album mostrato. Il video era una delle cose più difficili con cui lavorare, ora è un prompt.
per coloro che si chiedono, questo è il prompt che ho usato: "crea un'app che prenda un video di una persona che sfoglia la sua collezione di dischi e estrae i nomi degli album e degli artisti di ogni album mostrato. puoi farlo prendendo il video e prima estraendo i fotogrammi che mostrano dischi in vinile distinti, e poi far analizzare quei fotogrammi dal modello di visione per estrarre le informazioni"
1,97K