Google I/O 2024: Se presenta el modelo de IA de texto a imagen Imagen 3 y obtiene capacidades mejoradas de generación de imágenes

[ad_1]

Google hizo varios anuncios nuevos en su reunión anual centrada en desarrolladores. Google I/O 2024 evento. Entre muchos inteligencia artificial (AI) se centró en los anuncios realizados durante la sesión principal, uno fue particularmente sorprendente. El gigante tecnológico presentó la próxima generación de su modelo de IA de texto a imagen, Imagen 3. El nuevo modelo de IA se presentó pocos meses después del lanzamiento de su predecesor Imagen 2, que salió en diciembre de 2023 y fue más tarde. actualizado el mes pasado. La compañía dijo que el nuevo modelo puede generar imágenes fotorrealistas detalladas mientras sigue de cerca las indicaciones.

Imagen 3 fue presentada por Douglas Eck, director senior de investigación de Google DeepMind. Al revelarlo, dijo: “Hoy estoy muy emocionado de presentar Imagen 3. Es nuestro modelo de generación de imágenes más capaz hasta el momento. Entiende indicaciones escritas de la misma manera que escribe la gente. Cuanto más creativo y detallado seas, mejor. Además, este es nuestro mejor modelo hasta ahora para representar texto, lo que ha sido un desafío para los modelos de generación de imágenes”.

Se dice que la capacidad del modelo de IA para comprender las indicaciones ha mejorado considerablemente, lo que ahora le permite seguir de cerca la indicación para capturar pequeños detalles y generar una imagen fiel. Esta también parece ser una dirección común para la mayoría de los anuncios relacionados con la IA durante el evento, ya que la mayoría de los modelos de IA ahora son capaces de comprender mejor las indicaciones. Google Agregó que Imagen 3 estará disponible en múltiples versiones donde cada modelo está optimizado para un tipo específico de tarea que puede ir desde generar bocetos rápidos hasta crear imágenes de alta resolución.

Para permitir que Imagen 3 capture pequeños detalles e instrucciones específicas, como ángulos de cámara o composiciones en indicaciones largas y complejas, Google ha entrenado el modelo de IA con imágenes que contienen descripciones detalladas en sus títulos, lo que le permite captar matices aún más pequeños. También puede generar una variedad de texturas y representar imágenes basadas en texto.

Centrándonos en la seguridad, cada imagen generada por Imagen 3 contendrá la etiqueta de marca de agua de SynthID. Incorpora una marca de agua digital directamente en los píxeles de la imagen, lo que hace imposible eliminarla recortando, compartiendo o modificando la imagen. Se espera que el modelo de IA llegue en una vista previa pública en los próximos meses. En este momento, Google está trabajando para agregar opciones de edición de pintura interna y externa. Imagen 3 está actualmente disponible en vista previa privada dentro de ImageFX para creadores seleccionados. Pronto estará disponible para los clientes empresariales del gigante tecnológico.

Los enlaces de afiliados pueden generarse automáticamente; consulte nuestra Declaración de Ética para detalles.

[ad_2]

Source link

Comparte NdS

Google I/O 2024: Se presenta el modelo de IA de texto a imagen Imagen 3 y obtiene capacidades mejoradas de generación de imágenes

Entrada relacionada

¿Qué es el elemento GameFi en el mundo de los juegos Blockchain?

Scarlett Johansson dice que OpenAI le arrancó la voz

Precio del Samsung Galaxy Z Flip 5 con descuento en Amazon: esto es por cuánto puede obtenerlo

Deja una respuesta Cancelar la respuesta

Te has perdido

¿Ataque terrorista propicia oportunismo electoral?

Alcaldía de San José de Cúcuta decreta toque de queda y suspende clases presenciales tras atentados terroristas

Volqueteros de Chinácota protestan exigiendo pago millonario a empresa constructora morosa

Ucrania necesita elecciones si quiere un lugar en la mesa de negociaciones — Trump