aplicațiile multimodale prin deepmind AI studio sunt FOARTE submediatizate Cu o singură solicitare, am construit această aplicație în <10 minute care m-a înregistrat răsfoind înregistrările și scoate fiecare artist + album afișat. Videoclipul a fost unul dintre cele mai dificile lucruri cu care să lucrezi, acum este o solicitare.
Pentru cei care se întreabă, acesta este promptul pe care l-am folosit: "Creați o aplicație care face un videoclip cu o persoană care răsfoiește colecția de discuri și extrage numele albumelor și artiștilor fiecărui album afișat. Ai putea face acest lucru luând videoclipul și extragând mai întâi cadrele care arată discuri de vinil distincte, apoi modelul de viziune analizează acele cadre pentru a extrage informațiile"
1,97K