Synthesia es una plataforma que hace uso de inteligencia artificial para la generación de vídeos con avatares hiperrealistas a partir de un texto escrito, prescindiendo de cámaras, micrófonos y actores humanos. O dicho de otra manera, pasa del guion escrito a un vídeo de aspecto profesional en cuestión de minutos, con presentadores virtuales que parecen seres humanos reales.
Creada por un equipo con sede en Londres y con una fuerte base académica en deep learning y en procesamiento del lenguaje natural, Synthesia (https://www.synthesia.io) es capaz de crear vídeos en más de 120 idiomas, utilizando redes neuronales para dar una calidad de realismo sorprendente en los movimientos labiales, expresiones faciales y entonación. Esta tecnología es buena muestra del modelo de síntesis audiovisual, combinando voz sintética, modelado 3D y animación facial súperrealista.
Lo más interesante a destacar acerca de Synthesia AI es su poder para democratizar la creación de contenido audiovisual. Empresas del sector de la formación, marketing y la comunicación interna ya están utilizándola para poder crear contenido de un modo más rápido, barato y personalizado en comparación con los métodos tradicionales.
Eso sí, también subrayamos la importancia del uso responsable: la creación de contenidos hiperrealistas plantea retos éticos importantes en lo que respecta a la veracidad, el consentimiento y a la posible desinformación.
¿Synthesia es gratis o de pago?
Synthesia es una plataforma bajo pago, pero dispone de opciones bastante restringidas para quienes deseen hacer una pequeña prueba antes de tener que pagar.
Técnicamente y de manera profesional, lo tiene. Y es que crear vídeos con avatares realistas que hablen con sincronización de labios en múltiples idiomas requiere una infraestructura compleja, modelos de deep learnings suficientemente entrenados con enormes volúmenes de datos y una capacidad de computación no nada despreciable. Y eso no es una tontería ni mucho menos algo que sea mantener barato.
Synthesia (https://www.synthesia.io) presenta un modelo de suscripción en el que cuenta con una serie de planes que son diferenciables en función del tipo de usuario y se puede ser individual, empresa o gran empresa. El plan más básico, que está llamado Personal, permite generar un número restringido de minutos de vídeo al mes y con acceso a una serie de avatares prediseñados. Para empresas existen planes para ellas con características personalizadas que permiten en el uso de avatares propios, su integración con otras plataformas externas y atención al cliente personal.
También existe una opción de prueba gratuita que es muy restringida donde se puede hacer un vídeo corto que tiene más el carácter de ayudar a mostrar el potencial de la herramienta que una propuesta de servicio en el sentido más estricto de la propuesta de servicio.
¿Cómo genera los vídeos Synthesia?
Desde un punto de vista técnico, el funcionamiento de la plataforma combina varias disciplinas punteras del ámbito de la inteligencia artificial que son las siguientes: síntesis de voz, visión por ordenador, deep learning y modelado 3D.
El proceso comienza con la entrada de un texto que redacta el usuario en el editor de la plataforma para su posterior procesamiento dentro de un modelo de text-to-speech (TTS). El texto es transformado en una voz artificial que sigue los patrones de la voz humana: la entonación es la adecuada, las pausas están bien colocadas y el acento se puede configurar según la lengua o estilo deseados. Este, no obstante, no es un TTS como el que encontramos con frecuencia, sino un tipo de TTS que se ha entrenado para sonar lo más parecido posible a una voz humana, incluso en función del contexto, con matices emocionales si así lo requiere.
Luego entra en juego el avatar. En el caso de los avatares de Synthesia AI, los avatares están construidos a partir de grabaciones reales de actores humanos las cuales facilitan, mediante redes neuronales convolucionales, obtener unas características de movimiento y de habla propias de los actores. Con este se mapean los movimientos de las intervenciones faciales y patrones de habla para sincronizar la voz generada con los movimientos labiales y las expresiones faciales del avatar. El resultado es un formato de video en que parece que una persona real habla frente a la cámara pero que, aunque imprevisible, ha generado su totalidad la digitalización.
Fuentes informativas
- Portal web oficial de Synthesia: https://www.synthesia.io
- Versión web de Synthesia AI en español: https://www.synthesia.io/es
Publicaciones relacionadas
Marzo 16, 2025
Krea AI es una plataforma innovadora como Synthesia que se ha desarrollado en el ámbito de la inteligencia artificial pero, ante todo, destaca en la faceta de la generación de imágenes desde una especificación en forma de texto.…
Marzo 17, 2025
Chat GPT, cuya traducción es Generative Pre-trained Transformer, es un modelo de IA de OpenAI que ha cambiado el modo en el que interactuamos con las máquinas. Es un sistema de procesamiento del lenguaje natural…
Marzo 18, 2025
Google Bard es una original herramienta de inteligencia artificial de Google, que se ha creado para el contacto conversacional con el usuario y facilitar información amplia, en tiempo real. A diferencia de los buscadores…
Leonardo AI: Generador de imágenes y vídeos
Marzo 24, 2025
Leonardo AI se presenta como una innovadora aplicación que ha transformado la forma de crear imágenes y vídeos de los marketeros y creadores de contenido como Synthesia. Esta aplicación incorpora un complejo modelo de inteligencia artificial que…
Invideo AI: Generador de vídeos
Abril 15, 2025
Invideo AI es una plataforma innovadora para crear vídeos que utiliza inteligencia artificial para simplificar y optimizar el proceso de producción de vídeo. Si somos críticos con el mundo en que nos encontramos, en el…
Marzo 25, 2025
Kits AI se posiciona como una plataforma innovadora que ha transformado la forma en la que nos relacionamos con la inteligencia artificial en lo que se refiere a la creación de audio. Este sistema pivota…