Saltar al contenido

Tacotron 2, la voz artificial de Google más humana que nunca

28 diciembre, 2017

Tacotron 2 es el nombre del innovador sistema de texto a voz desarrollado por Google utilizando inteligencia artificial, cuyo funcionamiento se describe detalladamente en un artículo publicado por la Universidad de Cornell. Esta es una solución extremadamente avanzada, capaz de reproducir perfectamente la voz humana, incluyendo la entonación.

Tacotron 2 se basa en redes neuronales, traduciendo el texto en un espectrograma y luego insertándolo en WaveNet, un sistema implementado por el laboratorio de investigación en el AI DeepMind adquirido por Alphabet en 2016 capaz de interpretar el gráfico espectrográfico traduciéndolo en una pista de audio.

Tacotron 2 es una voz humana “real”

Google garantiza que Tacotron 2 no sólo es casi indistinguible de una voz humana “real” (sólo femenina en este momento, pero estamos seguros de que en el futuro habrá desarrollos de voces masculinas), sino que también es capaz de leer palabras y nombres “en voz alta” complejos, así como interpretar signos de puntuación y letras mayúsculas, utilizados en el texto para enfatizar una palabra específica de especial importancia dentro de la oración.

La empresa Mountain View utilizará el nuevo sistema de texto a voz para mejorar aún más el asistente de voz Google Assistant. Te invitamos a consultar esta página para escuchar algunos ejemplos de frases pronunciadas por una voz humana e inteligencia artificial. Reconocer la diferencia parece ser realmente difícil!

vía

>>> Si usas Telegram te interesa apuntarte a nuestro Canal de Telegram, con todos los artículos del blog y mucho más.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *