Hello
Vous auriez des pistes à me recommander pour du TTS de qualité en auto hebergé.
Jai testé un peu toutes les solutions du marché type eleven labs, play.ht, resemble et autre mais les tarifs sont exhorbitants… impossible de développer un projet sur cette techno sans bouffer 90% de la marge en api.
Jai testé rapidement coqui avec les modèles de base fournis mais le resultat est médiocre comparé à du eleven labs par exemple.
Avez vous deja tenté de créer votre propre modele de voix sur bark, coqui ou tortoise ? Quelle serait la bonne approche pour de l’auto hébergement ?
Bref je suis à la recherche d’informations pour savoir si ça s’envisage en se basant sur des solutions opensource ou si les boîtes privées ont vraiment un gros gap d’avance
Hello
Merci pour vos reponses.
J’étais la tete dans le guidon et ce nième side project est re en pause.
Néanmoins j’ai testé le systeme proposé par azure qui à le mérité d’être gratuit sur les voix preconfigurées jusqu’à 500k caractères par mois.
La qualité est correcte pour la plupart des usages mais dans mon cas, je cherche à faire des voix avec un vrai timbre/caractère, et ça n’est pas suffisant.
Tu peux entrainer ton propre modele sur azure mais ça va vite couter un bras.
Donc bien pour un proto mais, pas plus.
Je vais explorer vos pistes, je vous tiendrai informé si je trouve quelque chose de bien