Nvidia presenta "Fugatto", su modelo de IA para transformar voces y crear sonidos innovadores

Nvidia, líder mundial en el desarrollo de chips y software para sistemas de inteligencia artificial (IA), anunció este lunes el lanzamiento de su innovador modelo de IA denominado "Fugatto" (abreviatura de Foundational Generative Audio Transformer Opus 1). Diseñada para productores de música, películas y videojuegos, esta tecnología destaca por su capacidad para transformar voces, modificar audio existente y generar sonidos completamente novedosos.

Fugatto permite, por ejemplo, convertir una línea tocada en piano en una interpretación vocal o transformar una palabra hablada alterando su acento y estado de ánimo. También puede generar música y efectos sonoros únicos a partir de descripciones de texto, como hacer que una trompeta suene como un ladrido de perro.

"Si pensamos en el audio sintético de los últimos 50 años, la música suena diferente ahora gracias a los sintetizadores", comentó Bryan Catanzaro, vicepresidente de investigación aplicada en aprendizaje profundo de Nvidia. "La IA generativa abrirá nuevas posibilidades para la música, los videojuegos y cualquier persona creativa".

A diferencia de otras tecnologías similares desarrolladas por empresas como Meta o startups como Runway, Fugatto tiene una capacidad avanzada para captar y modificar audio preexistente. Sin embargo, Nvidia no tiene planes inmediatos de lanzar esta herramienta al público, destacando los riesgos asociados con las tecnologías generativas.

"Cualquier tecnología de este tipo puede ser mal utilizada", señaló Catanzaro. "Por eso estamos evaluando cuidadosamente cómo y cuándo podría hacerse accesible". El modelo fue entrenado con datos de código abierto y, de momento, está dirigido exclusivamente a entornos profesionales y experimentales.

Fuente: Reuters