[ad_1]
Google hizo varios anuncios nuevos en su reunión anual centrada en desarrolladores. Google I/O 2024 evento. Entre muchos inteligencia artificial (AI) se centró en los anuncios realizados durante la sesión principal, uno fue particularmente sorprendente. El gigante tecnológico presentó la próxima generación de su modelo de IA de texto a imagen, Imagen 3. El nuevo modelo de IA se presentó pocos meses después del lanzamiento de su predecesor Imagen 2, que salió en diciembre de 2023 y fue más tarde. actualizado el mes pasado. La compañía dijo que el nuevo modelo puede generar imágenes fotorrealistas detalladas mientras sigue de cerca las indicaciones.
Imagen 3 fue presentada por Douglas Eck, director senior de investigación de Google DeepMind. Al revelarlo, dijo: “Hoy estoy muy emocionado de presentar Imagen 3. Es nuestro modelo de generación de imágenes más capaz hasta el momento. Entiende indicaciones escritas de la misma manera que escribe la gente. Cuanto más creativo y detallado seas, mejor. Además, este es nuestro mejor modelo hasta ahora para representar texto, lo que ha sido un desafío para los modelos de generación de imágenes”.
Se dice que la capacidad del modelo de IA para comprender las indicaciones ha mejorado considerablemente, lo que ahora le permite seguir de cerca la indicación para capturar pequeños detalles y generar una imagen fiel. Esta también parece ser una dirección común para la mayoría de los anuncios relacionados con la IA durante el evento, ya que la mayoría de los modelos de IA ahora son capaces de comprender mejor las indicaciones. Google Agregó que Imagen 3 estará disponible en múltiples versiones donde cada modelo está optimizado para un tipo específico de tarea que puede ir desde generar bocetos rápidos hasta crear imágenes de alta resolución.
Para permitir que Imagen 3 capture pequeños detalles e instrucciones específicas, como ángulos de cámara o composiciones en indicaciones largas y complejas, Google ha entrenado el modelo de IA con imágenes que contienen descripciones detalladas en sus títulos, lo que le permite captar matices aún más pequeños. También puede generar una variedad de texturas y representar imágenes basadas en texto.
Centrándonos en la seguridad, cada imagen generada por Imagen 3 contendrá la etiqueta de marca de agua de SynthID. Incorpora una marca de agua digital directamente en los píxeles de la imagen, lo que hace imposible eliminarla recortando, compartiendo o modificando la imagen. Se espera que el modelo de IA llegue en una vista previa pública en los próximos meses. En este momento, Google está trabajando para agregar opciones de edición de pintura interna y externa. Imagen 3 está actualmente disponible en vista previa privada dentro de ImageFX para creadores seleccionados. Pronto estará disponible para los clientes empresariales del gigante tecnológico.
[ad_2]
Source link