Juliana Rueda, Fundadora de Miut y MiVoz, Especialista enproducción de audiolibros e innovación en audio con IA
El concepto de IA ética lleva circulando en el sector editorial desde el auge de la inteligencia artificial en 2022. Se presenta como un estándar de referencia, casi como una tierra prometida a la que las editoriales deberían aspirar. Pero ¿qué significa realmente en la práctica de la producción de audiolibros?
¿Y es verdaderamente alcanzable?
A comienzos de 2024, una editorial me planteó un dilema muy concreto. Contaban con un catálogo de fondo de no ficción que querían producir en audio. El problema era el presupuesto: no disponían de recursos suficientes para asumir una producción con narración humana tradicional y estaban explorando soluciones basadas en IA. Sin embargo, las opciones que encontraban les generaban dudas. Algunas ofrecían resultados de calidad discutible; otras planteaban cuestiones éticas que no eran claras sobre el origen de las voces utilizadas o las condiciones bajo las cuales habían sido entrenados los sistemas.
Como fundadora de Miut, una productora de audiolibros para el mercado hispanohablante con más de una década de experiencia, me preguntaron si conocía una alternativa fiable. No la conocía. Esa pregunta me llevó a investigar más a fondo el mercado de la narración con inteligencia artificial.
«Los editores necesitaban modelos económicamente sostenibles para determinados segmentos del catálogo, y muchos narradores querían participar en la conversación sobre cómo integrar esta tecnología sin perder el control sobre su identidad profesional.»
Lo que encontré fue un escenario inmaduro y alarmante. Existían algunas alternativas en las que el origen de la voz no era transparente o donde se habían utilizado voces sin consentimiento explícito. En otras, la compensación a los narradores resultaba poco clara o insuficiente. En paralelo a esta oferta, se detectaba una demanda creciente: los editores necesitaban modelos económicamente sostenibles para determinados segmentos del catálogo, y muchos narradores querían participar en la conversación sobre cómo integrar esta tecnología sin perder el control sobre su identidad profesional.
En ese contexto creé MiVoz, una productora de audiolibros basada en inteligencia artificial cuyo modelo de producción se sustenta en el uso de Réplicas de Voz Autorizadas (Authorized Voice Replicas, AVR) de actores ya consolidados en el mercado del audiolibro en español. La intención no era sustituir la narración humana, sino explorar una vía intermedia y complementaria que combinara tres principios: consentimiento explícito, trazabilidad y estándares de calidad comparables a los de la producción tradicional.
Las AVR parten de muestras grabadas por el propio narrador, con autorización contractual específica para generar una réplica digital de su voz. A diferencia de las voces sintéticas genéricas creadas a partir de grandes bases de datos anónimas, este modelo permite identificar claramente el origen de la voz y establecer condiciones de uso y compensación previamente acordadas de manera transparente.
Durante el proceso de pruebas técnicas, se hizo evidente que las réplicas autorizadas ofrecían una naturalidad y una coherencia interpretativa superiores a muchas soluciones de voz sintética estándar. Sin embargo, la tecnología por sí sola no garantiza un resultado satisfactorio. La pre-producción, la edición, el control de calidad y la supervisión humana, siguen siendo elementos fundamentales para mantener el estándar que los oyentes asocian con el audiolibro, situándolo dentro de un producto cultural de calidad.
«La pre-producción, la edición, el control de calidad y la supervisión humana, siguen siendo elementos fundamentales para mantener el estándar que los oyentes asocian con el audiolibro.»
La puesta en marcha de este modelo ha sido un proceso de aprendizaje. No todas las decisiones iniciales fueron perfectas, y ha sido necesario ajustar procedimientos, contratos y flujos de trabajo. El diálogo constante con narradores y otros profesionales del sector resultó clave para definir un marco que equilibrara innovación y protección.
Pero incluso con estas precauciones, cabe preguntarse si podemos afirmar que hemos alcanzado una “IA ética”. La respuesta, probablemente, no es definitiva. Más que un estado, la ética es un proceso continuo de revisión. Aunque un modelo específico establezca condiciones claras de consentimiento y remuneración, sigue siendo imprescindible examinar las bases tecnológicas sobre las que se construye. ¿Con qué datos se entrenan los sistemas? Qué transparencia ofrecen los proveedores tecnológicos? ¿Qué mecanismo de auditoría existen?
En este sentido, iniciativas sectoriales como las directrices de etiquetado para audiolibros narrados con IA lanzadas en 2024 por asociaciones profesionales del Reino Unido, representan un paso importante. La correcta identificación de los contenidos generados con IA no solo contribuye a la transparencia, sino que también fomenta la educación del consumidor y refuerza la confianza en el producto.
Los datos disponibles subrayan la relevancia de este debate. En una encuesta reciente realizada por Audible a oyentes europeos, el 80 % afirmaba elegir un audiolibro en función del narrador, y el 90 % percibía el audiolibro como un contenido “premium”. Estas cifras reflejan hasta qué punto la voz no es un elemento accesorio, sino central en la experiencia de escucha.
Precisamente por ello, los modelos de IA que se desarrollen deberán tener en cuenta esta realidad: no se trata únicamente de generar audio, sino de preservar la identidad y la calidad interpretativa que el público ya reconoce y valora. En este sentido, alternativas basadas en réplicas autorizadas de actores consolidados pueden alinearse mejor con las expectativas del oyente, que soluciones genéricas desvinculadas del mercado profesional.
Si el sector opta por una carrera hacia el abaratamiento extremo, el riesgo es erosionar esa percepción de valor. La tecnología puede facilitar la ampliación del catálogo y la llegada a nuevos públicos, pero solo si se mantiene un compromiso claro con la calidad y la transparencia.
La integración de la IA en la producción de audiolibros no es una cuestión de “y si”, sino de “cómo”. Negarla no parece realista; adoptarla sin criterios, tampoco. El momento actual ofrece una oportunidad limitada para definir estándares que protejan a los narradores, den seguridad a los editores y mantengan la confianza de los oyentes.
«La integración de la IA en la producción de audiolibros no es una cuestión de “y si”, sino de “cómo”. Negarla no parece realista; adoptarla sin criterios, tampoco.»
Quizá la pregunta más adecuada no sea si la IA puede ser ética, sino bajo qué condiciones estamos dispuestos a considerarla como tal. La respuesta dependerá de la capacidad del sector para establecer marcos claros, exigir responsabilidad a los proveedores tecnológicos y evitar soluciones opacas o improvisadas.
El futuro del audiolibro seguirá estando profundamente vinculado a la voz. La cuestión es cómo decidimos integrar las nuevas herramientas en ese ecosistema. Las decisiones que tomemos ahora contribuirán a definir no solo los modelos de negocio, sino también la percepción cultural del formato en los próximos años.
En MiVoz creemos que esta transformación puede y debe construirse desde el consentimiento, la calidad y la transparencia. No se trata de que nuestras AVR sustituyan la narración humana, muy al contrario, sino de integrarlas de forma responsable dentro del ecosistema del audiolibro. Tampoco tiene sentido ignorar la tecnología actual: ha llegado para quedarse y, con las decisiones que tomemos ahora, tendremos la oportunidad de dar forma al sector que queremos construir en el futuro.

