multimodální aplikace prostřednictvím deepmind AI studia jsou VELMI podceňované S jedinou výzvou jsem vytvořil tuto aplikaci v <10 minut, která mě zaznamenala listování nahrávkami a výstupy každého zobrazeného umělce + alba. Dříve se s videem pracovalo jednou z nejtěžších věcí, nyní je to výzva.
Pro ty, kteří se diví, toto je výzva, kterou jsem použil: "Vytvořte aplikaci, která pořídí video osoby, která listuje svou sbírkou nahrávek a extrahuje jména alb a interpretů z každého zobrazeného alba. Můžete to udělat tak, že vezmete video a nejprve extrahujete snímky, které ukazují odlišné vinylové desky, a poté necháte model vidění analyzovat tyto snímky a extrahovat informace."
1,97K