Connect with us

Ciencia y tecnología

El nuevo generador de imágenes de IA de OpenAI traspasa los límites en cuanto a detalle y rápida fidelidad – Ars Technica

Published

on

El nuevo generador de imágenes de IA de OpenAI traspasa los límites en cuanto a detalle y rápida fidelidad – Ars Technica

Miércoles, OpenAI anuncio DALL-E 3, la última versión de su modelo de síntesis de imágenes AI que ofrece integración total con ChatGPT. DALL-E 3 renderiza imágenes siguiendo de cerca descripciones complejas y manejando la generación de texto en la imagen (como etiquetas y letreros), lo que desafió a los modelos anteriores. Actualmente en vista previa de búsqueda, estará disponible para los clientes de ChatGPT Plus y Enterprise a principios de octubre.

Al igual que su predecesor, DALLE-3 es un generador de texto a imagen que crea nuevas imágenes basadas en descripciones escritas llamadas indicaciones. Aunque OpenAI no ha publicado ningún detalle técnico sobre DALL-E 3, el modelo de IA en el corazón de versiones anteriores de DALL-E se entrenó en millones de imágenes creadas por artistas y fotógrafos humanos, incluidas algunas con licencia de sitios web como Shutterstock. . Es probable que DALL-E 3 siga esta misma fórmula, pero con nuevas técnicas de entrenamiento y más tiempo de entrenamiento con la computadora.

A juzgar por los ejemplos proporcionados por OpenAI en su blog promocional, DALL-E 3 parece ser un modelo de síntesis de imágenes radicalmente mejor que cualquier otro modelo disponible en términos de siguientes indicaciones. Aunque los ejemplos de OpenAI fueron seleccionados por su efectividad, parecen seguir fielmente las instrucciones rápidas y representar objetos de manera convincente con distorsiones mínimas. En comparación con DALL-E 2, OpenAI afirma que DALL-E 3 refina pequeños detalles como las manos de manera más efectiva, creando imágenes atractivas de forma predeterminada «sin necesidad de piratería ni ingeniería rápida».

En comparación, Midjourney, un modelo de síntesis de imágenes de IA de otro proveedor, reproduce bien los detalles fotorrealistas, pero aún requiere muchos retoques contrarios a la intuición con indicaciones para obtener control sobre la salida de imágenes.

READ  Calendario de lanzamiento de M4 Mac: aquí es cuando se esperan nuevas Mac

DALL-E 3 también parece manejar texto en imágenes de una manera que su predecesor no podía (algunos modelos de la competencia como Stable Diffusion XL y DeepFloyd nos estamos mejorando a nosotros mismos). Por ejemplo, un mensaje que incluía las palabras «Una ilustración de un abogado sentado en la silla de un terapeuta, diciendo ‘Me siento tan vacío por dentro’ con un agujero del tamaño de un hoyo en el centro » creó perfectamente un abogado de dibujos animados con la cita del personaje. encapsulado en una burbuja.

En particular, OpenAI dice que DALL-E 3 fue «construido de forma nativa» en ChatGPT y llegará como una característica incorporada de ChatGPT Plus, lo que permitirá ajustar el chat de imágenes para utilizar el asistente de IA como socio de lluvia de ideas. Esto también significa que ChatGPT podrá generar imágenes basadas en el contexto de la conversación actual, lo que podría dar lugar a nuevas funciones. El asistente Bing Chat AI de Microsoft, también basado en tecnología OpenAI, puede generar imágenes durante una conversación desde marzo.

La tetera que creó una tormenta

Una imagen generada por la IA DALL-E 3 de
Agrandar / Una imagen generada por IA DALL-E 3 de “Una representación 3D de una taza de café colocada en el alféizar de una ventana durante un día de tormenta. La tormenta fuera de la ventana se refleja en el café, con relámpagos en miniatura y olas turbulentas visibles dentro de la taza. «La habitación está poco iluminada, lo que contribuye a la atmósfera dramática».

Abierto AI

La versión original de DALL-E. surgió en enero de 2021, y OpenAI lanzó su suite considerablemente más capaz en abril de 2022, lanzando una nueva era de imágenes generadas por IA con una explosión sorprendente que cautivó a sus primeros probadores beta cerrados. Los modelos DALL-E utilizan una técnica llamada difusión latente que refina el ruido en imágenes que «reconoce» a partir del conocimiento adquirido mediante el entrenamiento en un conjunto de datos y la guía de un mensaje. La misma tecnología permitió la aparición del modelo de difusión estable de peso abierto en agosto del año pasado.

READ  5 razones por las que no deberías comprar el iPhone 15 Pro

Debido a la forma en que DALL-E aprendió conceptos sobre imágenes durante el entrenamiento mediante la recuperación de un conjunto masivo de datos de obras de arte producidas por humanos, la tecnología de generación de imágenes de IA ha sido extremadamente controvertida desde su introducción generalizada el año pasado. La tecnología ha generado protestas de artistas que temen que reemplace o reproduzca de manera poco ética sus estilos, demandas por infracción de derechos de autor basadas en imágenes extraídas utilizadas como datos de entrenamiento sin consultar a los titulares de derechos de autor, y nuevas resoluciones de derechos de autor de la Oficina de Derechos de Autor de EE. UU. y una agencia estadounidense. juez del tribunal superior.

En un guiño a estas controversias, OpenAI dice que DALL-E 3 está diseñado para satisfacer solicitudes que requieren una imagen al estilo de un artista vivo. OpenAI también proporciona un formulario donde los creadores pueden optar por no utilizar sus imágenes para entrenar futuros modelos. Parece poco probable que estas medidas satisfagan a los artistas que generalmente creen que el entrenamiento en IA debería ser voluntario en lugar de incluirse por defecto en los conjuntos de datos de imágenes.

una comparación de
Agrandar / Une comparaison de «Une peinture à l’huile expressive d’un joueur de basket-ball en train de plonger, représentée comme une explosion d’une nébuleuse» telle que générée par DALL-E 2 (à gauche) et DALL-E 3 (a la derecha).

AbiertoAI

Actualmente, la política de derechos de autor de EE. UU. establece que las obras de arte puramente generadas por IA no pueden recibir protección de derechos de autor. Por lo tanto, técnicamente cualquier imagen creada con DALL-E 3 será de dominio público. Aunque OpenAI no lo reconoce explícitamente, sí dice que «las imágenes que crea con DALL-E 3 le pertenecen y no necesita nuestro permiso para reimprimirlas, venderlas o comercializarlas». Este es un cambio marcado con respecto al año pasado, cuando OpenAI uso restringido de imágenes DALLE-2 basado en una licencia que dice que OpenAI «es dueño de todas las generaciones».

READ  La actualización N64 de Switch Online está activa (versión 2.6.0), esto es lo que incluye

En cuanto a la seguridad, OpenAI dice que, al igual que DALL-E 2, ha implementado filtros de detección de imágenes y palabras clave en DALL-E 3 para limitar su capacidad de producir contenido violento, sexual u odioso. El sistema también está programado para rechazar solicitudes que generen imágenes de figuras públicas por su nombre, lo que causó problemas con el generador de imágenes de IA rival Midjourney cuando generó imágenes falsas del arresto de Donald Trump.

OpenAI dice que ha trabajado con expertos conocidos como “equipos rojos” para identificar y mitigar riesgos potenciales, como sesgos dañinos o la generación de propaganda y desinformación. OpenAI no ha dicho nada sobre el potencial de su herramienta para doblar el récord histórico con fabricaciones convincentes, aunque afirma estar experimentando con una herramienta de «clasificador de procedencia» que puede ayudar a identificar si una imagen fue generada o no por DALL-E 3.

Tal como están las cosas, todavía no tenemos acceso a DALL-E 3 para realizar pruebas, pero OpenAI dice que el generador de imágenes de IA se encuentra actualmente en pruebas cerradas. Planea ponerlo a disposición de los clientes de ChatGPT Plus y Enterprise «en octubre a través de la API y en laboratorios a finales de este otoño».

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

Published

on

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

Está a punto de tener otra oportunidad si se perdió la breve ventana de reserva de Sony para su Consola PS5 30 aniversario. El hardware de temática retro se agotó en un instante durante su período de pedido anticipado inicial el 26 de septiembre, dejando a los fanáticos furiosos con el predecible y frustrante proceso de pedido de Sony. Una alerta en la página del producto Sony (a través de kotaku) indica que la segunda ronda se llevará a cabo el martes 29 de octubre al mediodía ET.

Las consolas y accesorios de edición limitada tienen una apariencia retro que recuerda a la PlayStation original, que se lanzó en Japón en 1994. Esto incluye una elegante combinación de colores grises que le da espacio al logotipo de Playstation de la vieja escuela para resaltar.

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

sony

El mensaje (“Verifique nuevamente el 29 de octubre a partir de las 9:00 a. m. PDT”) solo aparece en las páginas de productos del 30.° aniversario de la Paquete delgado de PS5 de $ 500 Y Controlador DualSense de $ 80. Desafortunadamente, no aparece ningún mensaje de este tipo al revertir Paquete profesional de PS5 O Portal de PlayStation páginas de productos.

Suponiendo que solo esté disponible el paquete Slim, esta será su segunda (y posiblemente última) oportunidad de obtener la más barata de las dos consolas. Incluye la PS5 Slim digital (¡sin unidad de disco!), un controlador DualSense estándar (también temático para la ocasión), una carcasa de conector de cable retro, bridas para cables con forma de PlayStation y un soporte vertical. Ah, y hay algunos obsequios adicionales como una calcomanía, un póster y un clip de PlayStation, que solo podemos imaginar se venderán por tres cifras en eBay después de que llegue el paquete el 21 de noviembre.

READ  5 razones por las que no deberías comprar el iPhone 15 Pro
Continue Reading

Ciencia y tecnología

Google ahora vende teléfonos Pixel a precios con grandes descuentos gracias a su nuevo programa de reacondicionado certificado

Published

on

Google ahora vende teléfonos Pixel a precios con grandes descuentos gracias a su nuevo programa de reacondicionado certificado

Lo que necesitas saber

  • Google ha anunciado el lanzamiento y la disponibilidad de varios Pixel de generación anterior en su tienda a través del programa Teléfono reacondicionado certificado.
  • Los consumidores pueden obtener un Pixel 7, 7 Pro, 6, 6 Pro o 6a en Google Store hoy (28 de octubre) con piezas nuevas y originales y el último sistema operativo Android.
  • Google dice que trabajará para incorporar más generaciones de Pixel a este programa, pero probablemente pasará mucho tiempo antes de que aparezca el Pixel 9.

Google lanza un programa de teléfonos reacondicionados para consumidores que ofrece píxeles «asequibles»

en un Publicación de palabras claveGoogle ha anunciado el lanzamiento de su programa de teléfonos reacondicionados certificados para consumidores estadounidenses. Con el lanzamiento del programa, la compañía dice que los consumidores pueden explorar una selección de dispositivos Pixel 7, 7 Pro, 6, 6 Pro y 6a reacondicionados en Google Store. Sin embargo, esto parece ser solo el comienzo, ya que Google dice que la gente podrá volver más tarde para ver qué otras generaciones de Pixel se han agregado.

Continue Reading

Ciencia y tecnología

El nuevo Magic Mouse USB-C todavía tiene el puerto de carga en la parte inferior

Published

on

El nuevo Magic Mouse USB-C todavía tiene el puerto de carga en la parte inferior

Hay muchos memes en Internet sobre el Magic Mouse de Apple porque los usuarios tienen que darle la vuelta para enchufarlo al cargador. Pero si pensaba que Apple cambiaría eso con el lanzamiento del nuevo Magic Mouse hoy, tenemos malas noticias. Aunque ahora tiene USB-C, el puerto de carga todavía está en la parte inferior del mouse.

El puerto USB-C del nuevo Magic Mouse todavía está en la parte inferior

Junto con el nuevo iMac M4, Apple anunció el lunes nuevas versiones de sus accesorios «Magic» para Mac, incluidos un nuevo mouse, teclado y trackpad Magic. Como predijimos, las nuevas versiones son prácticamente iguales a las anteriores, excepto que ahora tienen un puerto de carga USB-C en lugar de Lightning.

Pero ¿qué pasa con uno de los aspectos más criticados del Magic Mouse? Aunque las imágenes de marketing de Apple no muestran el nuevo mouse desde muchos ángulos, el archivo 3D utilizado para obtener una vista previa del nuevo iMac en realidad aumentada confirma que el puerto de carga del Magic Mouse todavía está en la parte inferior.

Parte inferior del Magic Mouse USB-C

El primer Magic Mouse se presentó en 2009 y se distinguía por su superficie multitáctil. En ese momento, el mouse funcionaba con baterías extraíbles, por lo que los usuarios podían simplemente reemplazar las baterías y continuar usando el mouse. En 2015, Apple lanzó el Magic Mouse 2 con el mismo diseño, pero ahora con una batería interna recargable.

El puerto Lightning para cargar se ha colocado en la parte inferior del ratón, lo que ha generado muchas críticas por parte de los usuarios. No es posible utilizar el Magic Mouse 2 mientras se está cargando. Aunque muchos afirman que cargar el mouse solo toma unos minutos, este tiempo puede ser crítico cuando la batería se agota mientras está en funcionamiento.

READ  Un asteroide rompe un récord de acercarse a la Tierra y solo se detecta al día siguiente

A lo largo de los años, muchas personas han propuesto diferentes soluciones para el diseño del Magic Mouse, entre ellas Cajas con el puerto en el lateral. o con Soporte para cargador Qi. El problema es que Apple impide que el Magic Mouse funcione cuando está encendido. Este no es el caso del Magic Keyboard o Trackpad, que se pueden utilizar mientras se carga.

Apple vende el nuevo Magic Mouse USB-C por 79 dólares en su sitio weby hay una versión en negro por $99 (aunque tienen el mismo hardware). La empresa no vende las versiones en color, que se envían con el iMac, por separado. Aún puedes comprar la versión Lightning con descuento en Amazon.

Leer también

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Trending