Google RealFill podría ser la última apuesta del gigante tecnológico para innovar inteligencia artificial Generación de imágenes impulsada por (IA) en una aplicación centrada en el usuario. Recientemente, se detectó en línea un trabajo de investigación y un sitio web llamado RealFill que completa y pinta imágenes basándose en imágenes de referencia y crea una imagen de destino. La empresa parece haber solicitado también marcas comerciales para el logotipo diseñado para el producto basado en el modelo de IA. En particular, el nuevo modelo de IA utiliza visión por computadora y algoritmos de reconocimiento de patrones y fue entrenado utilizando técnicas de enmascaramiento aleatorio.

Un github página y una preimpresión papel del modelo de IA fueron manchado Recientemente por Android Authority. La publicación también encontró solicitudes de marcas registradas bajo el nombre de Google LLC en la Oficina Comercial y de Patentes de EE. UU. (USPTO) y la Oficina de Propiedad Intelectual de la Unión Europea (EUIPO) listados. Según ellos, parece que el gigante tecnológico no sólo ha llegado al final de la fase de investigación del modelo de IA, sino que también tiene planes de presentarlo como producto comercial.

Según su página de GitHub, RealFill ha sido descrito como un «enfoque generativo novedoso para completar imágenes que rellena las regiones faltantes de una imagen con el contenido que debería haber estado allí». Básicamente, el modelo de IA puede escanear múltiples imágenes de un sujeto en el mismo entorno y luego usar esa referencia para generar una imagen preespecificada. Como herramienta, se puede utilizar cuando un usuario hace clic en varias imágenes de un objeto pero no logra obtener la toma perfecta. La IA puede procesar esas imágenes y generar una imagen que ni siquiera existe.

RealFill es un modelo de IA generativa que utiliza visión por computadora para comprender el sujeto y el entorno de las fotografías de referencia y puede procesar varios aspectos de las mismas, incluidas especificaciones técnicas como dimensiones, colores y formas, así como la comprensión contextual de los distintos objetos. Con esta información, puede crear una imagen de destino en un nuevo plano y completar detalles que podrían no haber estado presentes en las imágenes de referencia.

Si bien es difícil predecir los planes de Google con RealFill, el año pasado la compañía lanzó una función en el Google Píxel 8 serie denominada Best Take que podría procesar múltiples tomas de una foto grupal y permitir a los usuarios elegir la mejor expresión de cada imagen para crear la foto final. En comparación con RealFill, esa función parece muy básica, pero según su aplicación, el gigante tecnológico podría estar preparando el modelo de IA para convertirlo en una función para los teléfonos Pixel.


Los enlaces de afiliados pueden generarse automáticamente; consulte nuestra Declaración de Ética para detalles.

Para lo último noticias tecnicas y opinionessigue Gadgets 360 en X, Facebook, WhatsApp, Hilos y noticias de Google. Para ver los últimos vídeos sobre gadgets y tecnología, suscríbete a nuestro Canal de Youtube. Si quieres saber todo sobre los principales influencers, sigue nuestro interno. ¿Quién es ese 360? en Instagram y YouTube.


IIT-Madras comienza el borrador del trabajo sobre ‘Políticas y estándares de Metaverse India’ con veteranos de la industria





Source link

Comparte NdS

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *