Vous feriez mieux d’écouter un robot plutôt que la jeune femme dans son bain…
Vous vous souvenez ? C’était y a un peu plus d’un an, pendant la saison du Super Bowl aux Etats-Unis. Amazon diffusait alors une publicité pour vanter les mérites d’Alexa et d’Amazon Echo.
“Vous feriez mieux d’écouter un robot plutôt qu’un jeune femme dans son bain…” C’est en substance la conclusion de ce spot de pub - et on comprend le message clairement lorsqu’on entend la jeune femme en question, qui tente d’interpréter Alexa dans son bain.
En plus d’être très réussie et hilarante, cette pub véhicule un message très particulier : en clair, mieux vaut faire confiance au robot et à sa voix de synthèse qu’aux humains qui n’arrivent même pas à la remplacer !
Et il faut bien admettre que les voix de synthèse et les text-to-speech se sont considérablement améliorés ces dernières années grâce aux technologies de réseaux de neurones, à la base de l’intelligence artificielle qui gère ces nouveaux type de voix (on pense notamment aux travaux entrepris par Google et Baidu sur ces sujet).
Et il faut bien admettre que les voix de synthèse et les text-to-speech se sont considérablement améliorés ces dernières années grâce aux technologies de réseaux de neurones, à la base de l’intelligence artificielle qui gère ces nouveaux type de voix (on pense notamment aux travaux entrepris par Google et Baidu sur ces sujet).
Chez Elocance, nous pensons qu’une voix de synthèse bien paramétrée, un text-to-speech boosté, peuvent se rapprocher très sensiblement d’une voix de narrateur humain. A condition qu’elle soit bien contextualisée (et ce n’est pas très difficile technologiquement parlant).
Et bien sûr aussi à condition que la voix soit capable de lire le texte pertinent sur des documents ou des pages web qui peuvent parfois être complexes dans leur composition. Un peu comme le ferait un narrateur humain : en éliminant tous les textes annexes et accessoires, pour se concentrer sur ce qui mérite d’être lu à voix haute.
Et bien sûr aussi à condition que la voix soit capable de lire le texte pertinent sur des documents ou des pages web qui peuvent parfois être complexes dans leur composition. Un peu comme le ferait un narrateur humain : en éliminant tous les textes annexes et accessoires, pour se concentrer sur ce qui mérite d’être lu à voix haute.
Qu’en pensez vous ?
Pensez-vous aussi que les voix de synthèse - dépendamment des circonstances bien entendu (ce n’est pas la même chose si on souhaite véhiculer des émotions ou juste de l’information !) - puisse remplacer des voix humaines, voire être plus fiables ?
Est-ce souhaitable ?
Le débat est ouvert ;)
Pensez-vous aussi que les voix de synthèse - dépendamment des circonstances bien entendu (ce n’est pas la même chose si on souhaite véhiculer des émotions ou juste de l’information !) - puisse remplacer des voix humaines, voire être plus fiables ?
Est-ce souhaitable ?
Le débat est ouvert ;)
Alexis, member of Elocance Team
elocance, c’est votre nouveau super pouvoir audio. Vous n’avez pas le temps de lire des contenus importants pendant la journée - articles d'actualité, newsletters, emails, documents...? Stockez-les dans l’app et écoutez les dès que vous avez 5 min, comme un podcast personnalisé.