Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Vaibhav (VB) Srivastav
Officier en chef de la merde @huggingface | Fan de F1 | Ici pour la sagesse de @at_sofdog | *opinions les miennes
Vaibhav (VB) Srivastav a reposté
Je suis notoire pour refuser 99 % des centaines de demandes chaque mois pour participer à des appels (parce que je déteste les appels !). L'équipe de @huggingface a vu une opportunité et m'a forcé à accepter de faire un appel Zoom avec les utilisateurs qui passent à la version pro. Je n'ai cédé qu'à une condition stricte : tout le monde est entassé dans un seul appel de groupe chaotique. Donc… nous y voilà :
S'il vous plaît, ne passez pas à la version pro. Je ne veux toujours pas faire d'appels Zoom 😂😂😂

17,26K
Vaibhav (VB) Srivastav a reposté
Présentation de la transcription en temps réel avec Nvidia Parakeet
- Même précision optimale que la transcription de fichiers
- Latence de 160 ms entre les lèvres et l'écran, la meilleure du marché
- 744 fois plus rentable par rapport aux API cloud
- Disponible dans Argmax Pro SDK à partir d'aujourd'hui !
Lien dans les commentaires
16,75K
Inspiré par Shrek, génération multi-personnes (avec clonage vocal) - c'est maintenant possible avec un *seul* modèle TTS !

Vaibhav (VB) Srivastav23 juil., 20:29
NOUVEAU : Higgs Audio V2 de @boson_ai, modèle TTS unifié et ouvert avec clonage vocal, surpasse GPT 4o mini tts et ElevenLabs v2 🔥
> Entraîné sur 10 millions d'heures (discours, musique, événements)
> Basé sur Llama 3.2 3B
> Fonctionne en temps réel et en périphérie
> Surpasse GPT-4o-mini-tts, ElevenLabs v2 en prosodie et émotion dans le dialogue multi-locuteur
> Clonage vocal zéro-shot 🤩
> Disponible sur Hugging Face
Bravo aux équipes de Boson AI pour avoir publié un travail aussi brillant et tous les détails autour du modèle ! 🤗
13,19K
NOUVEAU : Higgs Audio V2 de @boson_ai, modèle TTS unifié et ouvert avec clonage vocal, surpasse GPT 4o mini tts et ElevenLabs v2 🔥
> Entraîné sur 10 millions d'heures (discours, musique, événements)
> Basé sur Llama 3.2 3B
> Fonctionne en temps réel et en périphérie
> Surpasse GPT-4o-mini-tts, ElevenLabs v2 en prosodie et émotion dans le dialogue multi-locuteur
> Clonage vocal zéro-shot 🤩
> Disponible sur Hugging Face
Bravo aux équipes de Boson AI pour avoir publié un travail aussi brillant et tous les détails autour du modèle ! 🤗
71,27K
J'adore vraiment jouer avec ça ! ❤️

Vaibhav (VB) Srivastav22 juil., 22:12
NOUVEAU : Expérience d'intégration sur Hugging Face ! - Découvrez les modèles SoTA LLMs et Text to Image directement 🤩
Cela aide vraiment à contextualiser comment utiliser ces modèles et ce dont ils sont capables aujourd'hui.
Bien sûr, alimenté par nos fournisseurs d'inférence !
2,83K
Clarification : C'était une manière espiègle de dire que la dernière sortie de @Alibaba_Qwen fixe un nouveau jalon/colline à gravir pour le reste du domaine.
Nous avons maintenant un modèle à poids ouverts en concurrence avec Opus 4 - les modèles ne feront que s'améliorer à partir d'ici.

Vaibhav (VB) Srivastav22 juil., 02:33
C'est le modèle open source le plus stupide qui ait jamais existé.
9,52K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables