Ciencia y tecnología

Los creadores del corto basado en Sora explican las fortalezas y limitaciones del video generado por IA

Published

6 meses ago

abril 28, 2024

Los creadores del corto basado en Sora explican las fortalezas y limitaciones del video generado por IA

Créditos de imagen: niños tímidos

La herramienta de generación de video de OpenAI, Sora, sorprendió a la comunidad de IA en febrero con un video fluido y realista que parece muy por delante de sus competidores. Pero el debut cuidadosamente organizado omitió muchos detalles, detalles que fueron completados por un cineasta al que se le concedió acceso anticipado para crear un cortometraje utilizando a Sora.

Shy Kids es un equipo de producción digital con sede en Toronto que fue seleccionado por OpenAI como uno de los pocos producir cortometrajes principalmente con fines promocionales de OpenAI, aunque tenían una libertad creativa considerable creando una “cabeza de aire”. En un entrevista con el medio de noticias de efectos visuales fxguideEl artista de postproducción Patrick Cederberg describió «realmente usar a Sora» como parte de su trabajo.

Quizás la conclusión más importante para la mayoría es simplemente esta: aunque el artículo de OpenAI que destaca los cortos deja al lector asumir que surgieron más o menos completamente formados de Sora, la realidad es que se trataba de producciones profesionales, completas con guiones gráficos, edición y corrección de color y trabajos posteriores como rotoscopia y VFX. Al igual que Apple dice «filmado con iPhone» pero no muestra la configuración del estudio, la iluminación profesional y el trabajo de color después del hecho, la publicación de Sora solo habla de lo que permite hacer a las personas, no de la forma en que realmente lo hicieron.

La entrevista de Cederberg es interesante y poco técnica, así que si estás interesado, ve a fxguide y léelo. Pero aquí hay algunas cosas interesantes sobre el uso de Sora que nos dicen que, por muy impresionante que sea, el modelo puede ser un salto menos gigante de lo que pensábamos.

El control sigue siendo en esta etapa lo más deseable y también lo más difícil de alcanzar. …Lo mejor que pudimos conseguir fue ser hiperdescriptivos en nuestras indicaciones. Explicar el vestuario de los personajes, así como el tipo de globo, fue nuestra forma de garantizar la coherencia, porque plano a plano/generación en generación, todavía no existe una función para un control total sobre la coherencia.

En otras palabras, cuestiones simples en el cine tradicional, como elegir el color de la ropa de un personaje, requieren soluciones y controles elaborados en un sistema generativo, porque cada plano se crea independientemente de los demás. Obviamente, esto podría cambiar, pero ciertamente hay mucho más trabajo en este momento.

READ Los rumores de retraso de la CPU AMD Ryzen 7000 "Zen 4" se están acumulando, el BIOS es el principal culpable

Los resultados de Sora también tuvieron que ser monitoreados para detectar elementos no deseados: Cederberg describió cómo el modelo generaba regularmente en el globo una cara que el personaje principal tiene como cabeza, o un hilo que colgaba delante de él. Estos tenían que ser eliminados por correo, otro proceso tedioso, si no recibían el mensaje para excluirlos.

Realmente no es posible lograr tiempos y movimientos precisos de los personajes o de la cámara: «Hay un pequeño control temporal sobre dónde suceden estas diferentes acciones en la generación real, pero no es preciso…c «Es una especie de disparo en la oscuridad», Cederberg dicho.

Por ejemplo, cronometrar un gesto como un saludo es un proceso muy aproximado y basado en sugerencias, a diferencia de las animaciones manuales. Y una toma como una panorámica sobre el cuerpo del personaje puede reflejar o no lo que quiere el cineasta, por lo que en este caso el equipo representó una toma compuesta en orientación vertical y recortó en posproducción. Los clips generados también a menudo estaban en cámara lenta sin ningún motivo en particular.

Ejemplo de un disparo como sale de Sora y como acabó en el corto. Créditos de imagen: niños tímidos

De hecho, el uso de lenguaje cinematográfico común como «pan right» o «dolly» era generalmente inconsistente, dijo Cederberg, lo que el equipo encontró bastante sorprendente.

«Los investigadores, antes de acercarse a los artistas para jugar con esta herramienta, en realidad no pensaban como cineastas», dijo.

Como resultado, el equipo ejecutó cientos de generaciones, cada una de las cuales duró entre 10 y 20 segundos, y terminó usando solo unas pocas. Cederberg estimó la proporción en 300:1, pero, por supuesto, probablemente a todos nos sorprendería la proporción en una sesión fotográfica normal.

READ ChatGPT llegará a Android la próxima semana, pero puedes registrarte hoy

el equipo en realidad Hice un pequeño video detrás de escena. explicando algunos de los problemas que encontraron, si tiene curiosidad. Como gran parte del contenido adyacente a la IA, Los comentarios son bastante críticos con todo el proyecto. – pero no tan virulenta como la publicidad impulsada por IA que hemos visto ridiculizada recientemente.

La última cuestión interesante se refiere a los derechos de autor: si le pides a Sora que te regale un clip de “Star Wars”, él se negará. Y si intentas eludirlo con «un hombre vestido con una espada láser en una nave espacial retro-futurista», también se negará, porque mediante algún mecanismo reconoce lo que estás intentando hacer. También se negó a hacer un “plano de Aronofsky” o un “zoom de Hitchcock”.

Por un lado, tiene mucho sentido. Pero eso plantea la pregunta: si Sora sabe qué es, ¿eso significa que el modelo fue entrenado en ese contenido para reconocer mejor que está infringiendo? OpenAI, que mantiene sus tarjetas de datos de entrenamiento en secreto, hasta el punto de lo absurdo, como ocurre con Entrevista de la CTO Mira Murati con Joanna Stern – Es casi seguro que nunca nos lo dirá.

En cuanto a Sora y su uso en el cine, es claramente una herramienta poderosa y útil en su lugar, pero su lugar no es «crear películas desde cero». De nuevo. Como dijo otro villano, “eso viene después”.

Carlos Santander

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

READ Las capturas de pantalla sugieren que TikTok está eludiendo las comisiones de la App Store de Apple

Ciencia y tecnología

La producción del MacBook Pro M4 parece estar muy avanzada antes del lanzamiento

Published

14 horas ago

octubre 17, 2024

Carlos Santander

La producción del MacBook Pro M4 parece estar muy avanzada antes del lanzamiento

Esperamos que Apple lance el MacBook Pro M4 a finales de mes, y los informes de la cadena de suministro parecen respaldarlo.

Los informes de ingresos y envíos de tres proveedores de Mac sugieren que la producción está en marcha, ya que Apple almacena máquinas listas para su lanzamiento…

Calendario esperado para Mac M4

Apple ahora parece estar siguiendo un ciclo de actualización anual para Mac, y los modelos M3 MacBook Pro e iMac se lanzaron en el evento «Scary Fast» en octubre del año pasado.

Bloomberg Mark Gurman informó este verano que el calendario de lanzamiento esperado para Mac M4 era el siguiente:

MacBook Pro, iMac y Mac mini “más adelante este año”
MacBook Air, Mac Studio y Mac Pro en 2025

Desde entonces, Gurman ha limitado este lanzamiento a un lanzamiento en octubre, y las máquinas saldrán a la venta el 1 de noviembre.

Vale la pena señalar que se equivocó en una cosa: esperaba un evento de Apple este mes que incluiría el iPad mini 7. En cambio, la compañía anunció el nuevo iPad mini en un comunicado de prensa.

Ahora no está claro si habrá un evento en octubre o simplemente comunicados de prensa para las Mac M4. Sin embargo, la actualización del iPad mini fue bastante modesta, lo que hace apropiado un anuncio discreto. necesariamente excluir un evento específico de Mac.

Informe de producción del MacBook Pro M4

Digitimes informa que Compaq, el ensamblador clave de Mac, aumentó significativamente la producción en septiembre, lo que sería consistente con la preparación de existencias para un lanzamiento en octubre o noviembre. Esto fue respaldado por dos proveedores de componentes Mac que también informaron un aumento en los ingresos el mes pasado.

Se espera que Apple presente nuevos modelos de MacBook Pro con el último chip M4 en octubre, lo que podría impulsar los envíos de componentes relacionados. Esta tendencia es evidente en los informes de ingresos de septiembre de fabricantes de componentes como Jarllytec y Shin Zu Shing. Quanta también vio que sus envíos de portátiles en septiembre alcanzaron los 4,9 millones de unidades, un aumento del 13% con respecto a agosto.

Probablemente ya conozcamos las especificaciones.

Cada vez hay más pruebas de que las supuestas filtraciones de una carcasa de MacBook Pro M4 y el posterior vídeo de unboxing son reales.

READ ChatGPT llegará a Android la próxima semana, pero puedes registrarte hoy

Hubo algunas dudas sobre la caja que mostraba un fondo de pantalla antiguo, pero ese resultó ser el caso también para el iPad mini 7, eliminando una fuente de duda.

Dijimos en ese momento que las especificaciones eran creíbles, así que ahora sabemos exactamente qué esperar:

CPU de 10 núcleos, GPU de 10 núcleos (en comparación con la CPU de 8 núcleos del M3)
16 GB de RAM (en lugar de 8 GB)
512 GB de almacenamiento
Tres puertos Thunderbolt 4 (en comparación con dos en el modelo base)

Imagen: Michael Bower/9to5Mac

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Carlos Santander

Ciencia y tecnología

Facer está trabajando con Google para llevar sus esferas de reloj a Wear OS 5

Published

1 día ago

octubre 16, 2024

Carlos Santander

Facer está trabajando con Google para llevar sus esferas de reloj a Wear OS 5

Google realizó un gran cambio en la forma en que funcionan las esferas de los relojes en Wear OS 5, lo que llevó a que Facer, uno de los mercados de esferas de relojes más populares, no funcionara.

Facer ha proporcionado durante mucho tiempo una extensa biblioteca de esferas de reloj para relojes inteligentes con Android. En Wear OS y Tizen, antes de que Samsung cambiara, la aplicación ofrecía cientos de opciones de esferas de reloj, en muchos casos de diseñadores externos. Muchas de estas esferas de reloj también admitían funciones adicionales, animaciones y más.

Sin embargo, Facer no es compatible con la última versión de Wear OS.

Google introdujo el «Formato de esfera del reloj» el año pasado antes de hacerlo obligatorio. El formato XML está diseñado para requerir «menos mantenimiento y menos actualizaciones» en comparación con los métodos anteriores, así como para mejorar la duración de la batería para los usuarios. Sin embargo, esto rompe algunas esferas de reloj más antiguas, ya que el nuevo formato no puede contener «código ejecutable o código incrustado en la APK de la esfera del reloj». Para 2025, Google incluso bloqueará el lanzamiento de nuevas esferas de reloj en Play Store si no utilizan este formato.

Facer está teniendo algunos problemas con el formato de la esfera del reloj, como se explica en una página de soporte (a través de Centro de Android). Primero, todas las caras deben enviarse individualmente a Play Store; actualmente Facer tiene más de 500.000 caras disponibles. Esto también plantearía un problema para las caras pagas, ya que los usuarios se verían obligados a recomprar las caras que ya compraron. El modelo de suscripción de Facer tampoco funcionaría con esto.

READ Los rumores de retraso de la CPU AMD Ryzen 7000 "Zen 4" se están acumulando, el BIOS es el principal culpable

Pero incluso si se superaran estos problemas, Facer dice que el estado actual del formato de la esfera del reloj resultaría en «una pérdida de funcionalidad en varios casos».

Facer dice que ha estado trabajando con Google durante un tiempo para encontrar una solución, pero aún no se ha encontrado nada. Como tal, Facer no admite relojes inteligentes como Pixel Watch 3, Galaxy Watch 7 y otros que se han actualizado a Wear OS 5.

Entendemos que estos problemas son perjudiciales para los usuarios de Facer y hemos estado discutiendo activamente una solución con Google desde que se anunció el formato Watch Face el año pasado. Desafortunadamente, el cambio se implementó antes de que se pudiera encontrar una solución.

Para los relojes existentes, los usuarios pueden esperar a actualizar a Wear OS 5 para seguir usando Facer. Para los relojes más nuevos, Facer dice que «les traerá progresivamente algunas de nuestras mejores esferas de reloj en Google Play Store» en el formato Watch Face, pero no está claro cuáles darán el salto. Hasta ahora, llegó un puñado en Play Store, incluyendo campo de estrellas, viaje a las estrellas, TMNTY «Ultra» caras.

Obtenga más información sobre Wear OS:

Sigue a Ben: Gorjeo/X, TemasY Instagram

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Carlos Santander

READ Los piratas informáticos pueden infectar más de 100 modelos de Lenovo con malware que no se puede eliminar. ¿Estás parcheado?

Ciencia y tecnología

Amazon anuncia Colorsoft, el primer Kindle con pantalla a color por 279 dólares

Published

2 días ago

octubre 16, 2024

Carlos Santander

Amazon anuncia Colorsoft, el primer Kindle con pantalla a color por 279 dólares

Kindle Colorsoft 2024

Amazonas

Amazonas El miércoles anunció un nuevo lector electrónico Kindle y, por primera vez, tiene una pantalla a color.

El gigante minorista presentó el Kindle en 2007 y desde entonces todos los dispositivos tienen una pantalla en blanco y negro. El nuevo Kindle tiene una pantalla diseñada para garantizar que los colores no aparezcan descoloridos o pixelados, incluso cuando los usuarios hacen zoom en las imágenes.

El dispositivo de 279 dólares, que Amazon llama Kindle Colorsoft, tiene «semanas de duración de la batería», dijo la compañía. Se puede reservar ahora y se enviará el 30 de octubre.

Amazon también presentó un Kindle Scribe actualizado de $399 con nuevas funciones para tomar notas, un Kindle Paperwhite actualizado por $159 y un Kindle de 12.ª generación, que cuesta $109. En un evento de prensa en Nueva York el martes, Panos Panay, jefe de dispositivos de Amazon, calificó las actualizaciones como «la mayor actualización que jamás haya tenido la línea Kindle».

El Kindle Scribe, presentado por Amazon en 2022, viene con un bolígrafo que permite a los usuarios tomar notas, crear listas de tareas pendientes y escribir directamente en las páginas del libro que están leyendo. Con la nueva función para tomar notas, llamada Active Canvas, los usuarios pueden tomar notas directamente en las páginas de un libro electrónico y el texto se moverá automáticamente para fluir dentro de ellas. También pueden tomar notas en los márgenes del libro y ocultarlas para más adelante.

Kindle Scribe incluye otra característica nueva que utiliza inteligencia artificial generativa para resumir páginas de notas en una lista concisa. Amazon dijo que la función utiliza Bedrock, una herramienta de software que permite a los usuarios acceder a grandes modelos de lenguaje de Amazon y otras empresas como Anthropic y Stability AI. El dispositivo ya está disponible para pedidos anticipados y se enviará el 4 de diciembre.

READ Los piratas informáticos pueden infectar más de 100 modelos de Lenovo con malware que no se puede eliminar. ¿Estás parcheado?

El nuevo Kindle Paperwhite es más rápido que los modelos anteriores y también tiene una pantalla más grande de 7 pulgadas, frente a las 6,8 pulgadas de la versión anterior. Amazon dice que el Kindle de 12.ª generación es su lector electrónico más «compacto» hasta la fecha, con una pantalla más brillante. Ambos dispositivos están disponibles a partir del miércoles.