La inteligencia artificial en el mundo musical y la comunicación

La IA ha optimizado el proceso de desarrollo, masterización y categorización de audio, y también crea experiencias personalizadas para los oyentes

En los últimos años, la inteligencia artificial (IA) se ha utilizado en el mundo de la industria musical para automatizar el proceso de desarrollo, masterización, categorización de audio, y también para crear experiencias personalizadas para los oyentes en aplicaciones de música en streaming y, en el futuro, continuará desarrollándose todavía más para ofrecer más opciones dentro de la industria de la música.

Existen numerosas aplicaciones de inteligencia artificial en campos y sectores de lo más diverso, no siendo la música una excepción de la industria creativa en la que se está utilizando esta tecnología.

No obstante, su uso es un tema controversial debido a que si se emplea de forma  inadecuada puede generar problemas, por ejemplo, este desarrollo es capaz de recrear las voces de los famosos, y un ejemplo de esto fue la ocasión en la que David Guetta utilizó el desarrollo para simular la voz de Eminem.

La preocupación que existe por el uso de este tipo de desarrollos sin una regulación existente, se incrementa a medida que crece su popularidad, ya que podría suplantar o reemplazar el trabajo que realizan los artistas.

En la actualidad, la inteligencia artificial se está usando para reemplazar voces y hasta traducir doblajes de importantes producciones audiovisuales y musicales, por lo que muchos se preguntan si este será el fin de esta labor.

Los desarrollos que reproducen voces de famosos utilizan, en su mayoría, técnicas de inteligencia artificial conocidas como síntesis de voz basada en IA.

Una plataforma muy utilizada para crear audios de este estilo es FakeYou. Dentro de ella, lo único que hay que hacer es entrar, elegir una categoría de voces y allí escoger la voz concreta que se quiera, y después utilizar el cajón de texto para escribir lo que queremos que esa voz diga.

Estas técnicas pueden emplear redes neuronales profundas y modelos de aprendizaje automático. En particular, la síntesis de voz basada en IA utiliza modelos generativos, como las Redes Neuronales de Transformador (Transformer Neural Networks) o las Redes Neuronales Generativas Antagónicas (Generative Adversarial Networks, GAN) para aprender a convertir texto escrito en voz sintetizada con características específicas, como el tono, el estilo o incluso la voz de una persona famosa.

Estos sistemas suelen entrenarse con grandes cantidades de datos de audio de la persona cuya voz se desea emular. La IA aprende las características de la voz y los patrones de habla específicos de esa persona. Luego, cuando se proporciona texto como entrada, el sistema genera una voz sintetizada que se asemeja a la del famoso en cuestión.

Como resultado del uso de estas tecnologías, se han viralizado vídeos de famosos cantando o hablando como si en verdad fueran ellos, aunque en verdad no lo eran.

Otros programas similares

También se puede utilizar cambiador de voz con efectos, que es una aplicación gratis en Android muy simple de utilizar: se debe pulsar en el botón de la app y grabar lo que se quiera, y luego se puede elegir entre diferentes filtros que se le aplicarán a la voz para que suene de determinada manera.

Otra alternativa es la app de Voz del Narrador – TTS para Android. En ella, también se debe escribir un texto y luego se podrá elegir entre varios tipos de voces para que sean los narradores del escrito.

Datos a destacar

En la actualidad, la inteligencia artificial se utiliza para reemplazar voces y hasta traducir doblajes de importantes producciones audiovisuales y musicales, por lo que muchos se preguntan si este será el fin de esta labor.

Estos sistemas suelen entrenarse con grandes cantidades de datos de audio de la persona cuya voz se desea emular. La IA aprende las características de la voz y los patrones de habla específicos de esa persona.

Texto y fotos: Manuel Pool