El pasado 20 de mayo, Open AI anunciaba la suspensión temporal de la voz de Sky, su nuevo asistente de voz, ante la denuncia de Johansson por utilizar una voz sorprendentemente parecida a la suya. Al parecer, el CEO de Open AI, Sam Altman, había mencionado haberse inspirado en la película de Spike Jonze, “Her”, para la generación del nuevo asistente de voz conversacional de ChatGPT. La actriz había prestado su voz, entonces, a Samantha, el asistente de voz seductora y poco amenazante, de la que se enamora Theodore Twombly (interpretado por Joaquin Phoenix). Unos meses antes, Johansson había recibido una llamada de Sam Altman ofreciéndole ser la voz de su nueva aplicación, oferta que ella había declinado. La compañía asegura no haber copiado ni imitado la voz de la actriz, sino haber contratado a otra profesional para usar su propia voz natural. La falta de evidencias ha desencadenado la sospecha de muchos usuarios de que Open AI simplemente ha entrenado su nueva aplicación con los múltiples registros orales disponibles de la actriz.
La tecnología capaz de generar voz sintética no es nueva. Su perfeccionamiento, no obstante, ha permitido producir temas musicales completamente generados por IA, con la voz de artistas que ni siquiera los han interpretado en la realidad, como el tema “Heart on my sleeve”, que utiliza las voces de los artistas canadienses de Drake and the Weeknd, cuya propietaria de los derechos intentaba, sin pleno éxito, hace más de un año, retirarla de las plataformas. No es, por tanto, con Johansson, la primera vez que los juristas se enfrentan al problema de la generación sintética de la voz de una persona sin la debida autorización; tampoco, a la imitación “analógica” de la voz de algún cantante para fines comerciales (STS de 30 mayo 1984 (ES:TS:1984:1003)). Sin embargo, sí puede ser la primera vez que la IA “imita” la voz de una persona famosa para fines comerciales.
En EEUU, cuando estalló la noticia de Johansson, ya se estaba trabajando en la reforma de la vigente Personal Rights Protection Act de 1984, para adecuar la normativa a los nuevos desafíos planteados por la IA en este ámbito, pues, entre otras cosas, dejaba fuera de su ámbito de protección la voz como parte de los rasgos identificativos de los individuos. El 21 de marzo de 2024 se firmaba por el gobernador del Estado de Tennessee, conocida como “Ley Elvis”, en honor al cantante y actor Elvis Presley, una de las voces más icónicas y extraordinarias del mundo, que entrará en vigor el próximo 1 de julio. La nueva norma extiende la protección a la voz, que define como “el sonido en un soporte que sea fácilmente identificable y atribuible a una persona determinada, con independencia de que el sonido contenga la voz o una simulació conversacional n de la voz del individuo”. De modo que la protección ahora se extiende no solo a la voz del individuo, sino también a su imitación, confiriendo a su titular una acción civil contra quien, de mala fe, los utilice sin la pertinente autorización para fines publicitarios, de merchandising, recaudación de fondos, solicitud de donaciones, etc.
En Europa la voz y la imagen se protegen en tanto que datos personales (Art. 4.1 del REGLAMENTO (UE) 2016/679 DEL PARLAMENTO EUROPEO Y DEL CONSEJO de 27 de abril de 2016.). Sin embargo, su protección podría resultar insuficiente frente a la utilización no consentida de la voz de una persona cuando ha sido procesada de modo que no permita identificarla (Considerando 26 RPDP.), y (aunque no sin discusión), frente a las imitaciones. Esto, a priori, permite su tratamiento para el entrenamiento de sistemas de inteligencia artificial siempre y cuando la persona no pueda identificarse (Ni, dependiendo de la doctrina, el registro a partir del cual se produce el entrenamiento estuviera protegido por derechos de propiedad intelectual.), que es, precisamente, lo que sucede con los deepfakes o ultrafalsos. Por cierto, el reciente Reglamento de Inteligencia Artificial europeo impone una serie de obligaciones de transparencia a los proveedores de sistemas y a los responsables del despliegue del sistema de IA que genere ultrafalsos –deepfakes– de personas, cosas, lugares y sucesos reales, pero no se ocupa de este tema, antes bien, lo regula garantizando un elevado nivel de protección de, entre otros, los derechos fundamentales consagrados en la Carta de Derechos Fundamentales de la UE, en cuyo art. 8 se encuentran los datos personales (art. 8) pero, también, la libertad de expresión (art. 11) y la libertad de las artes (art. 13). De manera que, sobre todo en el caso de las personas con relevancia pública, casi siempre se generará el clásico conflicto entre libertad de expresión (comprendiendo en ella la libertad de expresarse creativamente) y derecho a la propia imagen.
Además, a nivel nacional, la voz cuenta con la protección específica de la LO 1/1982, de 5 de diciembre, de protección al honor, Intimidad personal y familiar y propia imagen, cuyo art. 7.6 considera ilegítima la utilización no consentida «del nombre, de la voz o de la imagen de una persona para fines publicitarios, comerciales o de naturaleza análoga». Esta protección, a diferencia de la nueva ley estadounidense, no se extendería a los casos de imitación (si la actriz contratada por Altman imitó la voz de Johansson) para entrenar a Sky) ni, por supuesto, de similitud (en el caso de que la voz de aquella se pareciera naturalmente a la de la actriz) aunque, en uno y otro caso, las conductas podrían eventualmente encajar en los actos de competencia desleal.
Conclusión
Casos como el de Scarlett Johansson ponen de manifiesto la insuficiencia de nuestro marco regulatorio para proteger la voz (y la imagen) de las personas, dada la facilidad tecnológica actual para generarla y manipularla. Las respuestas legislativas, como la Ley Elvis en Estados Unidos, nos pueden servir de referencia a la hora de acometer nuestra futura y necesaria reforma.