las aplicaciones multimodales a través de deepmind AI studio están MUY poco promocionadas Con solo un mensaje, construí esta aplicación en <10 minutos que me grabó hojeando discos y salidas de cada artista + álbum mostrado. El video solía ser una de las cosas más difíciles de trabajar, ahora es un aviso.
Para aquellos que se preguntan, este es el mensaje que utilicé: "Cree una aplicación que tome un video de una persona hojeando su colección de discos y extraiga los nombres de álbumes y artistas de cada álbum mostrado. Podrías hacer esto tomando el video y extrayendo primero los fotogramas que muestran distintos discos de vinilo, y luego haciendo que el modelo de visión analice esos fotogramas para extraer la información".
1.97K