🎶 Audio-Flamingo 3 は、サウンド、音声、音楽のデータセットでトレーニングされた完全にオープンな LALM です。🎶 10 分間の音声、長文テキスト、音声会話を処理します。音声QA、対話、推論に最適です。 @huggingface➡️について #NVIDIAResearch から。
26.23K