[ad_1]
OpenAI dice que planea detener el uso de una de sus voces ChatGPT después de que algunos usuarios dijeran que sonaba como Scarlett Johansson, quien dio voz a una asistente de IA ficticia y en ese momento futurista en la película de 2013. Su.
En una publicación en la plataforma de redes sociales X Monday, OpenAI dijo que está «trabajando para pausar» Sky, el nombre de una de las cinco voces con las que los usuarios de ChatGPT pueden elegir hablar. La compañía dijo que había «escuchado preguntas» sobre cómo selecciona las opciones de audio realistas disponibles para su chatbot insignia de inteligencia artificial, particularmente Sky, y quería abordarlas.
OpenAI también desacreditó rápidamente las teorías de Internet sobre Johansson en una publicación de blog adjunta que detalla cómo se eligieron las voces de ChatGPT.
«Creemos que las voces de IA no deben imitar deliberadamente la voz distintiva de una celebridad; la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que usa su propia voz natural», escribió la compañía. Dijo que no podía compartir el nombre de sus actores de doblaje por razones de privacidad.
Pero Johansson emitió un comunicado el lunes diciendo que el CEO de OpenAI, Sam Altman, se había acercado a ella en septiembre para preguntarle si prestaría su voz al sistema, diciendo que sentía que sería «reconfortante para las personas» que no se sentían cómodas con la tecnología. Ella dijo que rechazó la oferta.
«Cuando escuché la demostración publicada, quedé sorprendido, enojado e incrédulo de que el Sr. Altman usara una voz que sonaba tan inquietantemente similar a la mía que mis amigos más cercanos y los medios de comunicación no podían notar la diferencia», dijo Johansson.
Dijo que OpenAI aceptó «a regañadientes» eliminar la voz de Sky después de que contrató a abogados que escribieron cartas a Altman preguntando sobre el proceso mediante el cual la compañía creó la voz.
OpenAI, con sede en San Francisco, no hizo más comentarios sobre por qué decidió suspender el uso de Sky.
OpenAI implementó por primera vez capacidades de voz para ChatGPT, que incluían cinco voces diferentes, en septiembre, lo que permitió a los usuarios entablar conversaciones con el asistente de IA. El «Modo de voz» originalmente solo estaba disponible para suscriptores pagos, pero en noviembre, OpenAI anunció que la función sería gratuita para todos los usuarios con la aplicación móvil.
Y las interacciones de ChatGPT son cada vez más sofisticadas. La semana pasada, OpenAI dijo que la última actualización de su modelo de IA generativa puede imitar las cadencias humanas en sus respuestas verbales e incluso puede intentar detectar el estado de ánimo de las personas.
OpenAI dice que el modelo más nuevo, apodado GPT-4o, funciona más rápido que las versiones anteriores y puede razonar en texto, audio y video en tiempo real. En una demostración durante el anuncio de OpenAI el 13 de mayo, el robot de IA conversó en tiempo real, añadiendo emoción -específicamente «más dramatismo»- a su voz según lo solicitado. También intentó extrapolar el estado emocional de una persona al mirar un video de selfie de su rostro, con la ayuda de traducciones de idiomas, problemas matemáticos paso a paso y más.
GPT-4o, abreviatura de «omni», aún no está ampliamente disponible. Llegará progresivamente a usuarios seleccionados en las próximas semanas y meses. Las capacidades de texto e imagen del modelo ya han comenzado a implementarse y están listas para llegar incluso a algunos de aquellos que usan el nivel gratuito de ChatGPT, pero el nuevo modo de voz solo estará disponible para suscriptores pagos de ChatGPT Plus.
Si bien la mayoría aún no tiene en sus manos estas características recientemente anunciadas, las capacidades han evocado aún más comparaciones con el romance distópico de Spike Jonze. Suque sigue a un hombre introvertido (Joaquin Phoenix) que se enamora de un sistema operativo de IA (Johansson), lo que le lleva a muchas complicaciones.
Altman también pareció aprovechar esto: simplemente publicó la palabra «ella» en la plataforma de redes sociales X el día de la presentación de GPT-4o.
Muchos de los que reaccionaron a las demostraciones de la modelo la semana pasada también encontraron que algunas de las interacciones tenían un tono extrañamente coqueto. En un vídeo publicado por OpenAI, un ChatGPT con voz femenina felicita a un empleado de la empresa por «llevar una sudadera con capucha OpenAI», por ejemplo, y en otro, el chatbot dice «oh, basta, me estás haciendo sonrojar» después de que le dijeran que es asombroso.
Esto ha provocado cierta conversación sobre las formas de género que los críticos dicen que las empresas de tecnología han utilizado durante mucho tiempo para desarrollar e interactuar con asistentes de voz, que se remontan a mucho antes de que la última ola de IA generativa avanzara las capacidades de los chatbots de IA. En 2019, la organización cultural y científica de las Naciones Unidas señaló la «subordinación programada» incorporada en los asistentes predeterminados con voz femenina (como Siri de Apple o Alexa de Amazon), incluso cuando se enfrentan a insultos y acoso sexistas.
«Esto está claramente programado para alimentar el ego de los tipos», dijo el corresponsal principal del Daily Show, Desi Lydic, sobre GPT-4o en un segmento la semana pasada. «Realmente se nota que un hombre construyó esta tecnología».
[ad_2]
Source link