El lunes, un grupo de investigadores de inteligencia artificial de Google y la Universidad Técnica de Berlín dio a conocer PALMEADOun modelo multimodal de lenguaje visual incorporado (VLM) con 562 mil millones configuraciones que integra visión y lenguaje para control robótico. Afirman que es el VLM más grande jamás desarrollado y puede realizar una variedad de tareas sin necesidad de volver a capacitarse.
Según Google, cuando se le da un comando de alto nivel, como «tráeme los chips de arroz del cajón», PaLM-E puede generar un plan de acción para una plataforma de robot móvil con un brazo (desarrollado por Google Robotics) y realizar el acciones mismas.
PaLM-E hace esto mediante el análisis de datos de la cámara del robot sin necesidad de una representación de escena preprocesada. Esto elimina la necesidad de que un ser humano preprocese o anote los datos y permite un control robótico más autónomo.
También es resistente y puede reaccionar a su entorno. Por ejemplo, el modelo PaLM-E puede guiar a un robot para obtener una bolsa de papas fritas de una cocina, y con PaLM-E integrado en el circuito de control, se vuelve resistente a las interrupciones que pueden ocurrir durante la tarea. En un ejemplo de video, un investigador agarra las fichas del robot y las mueve, pero el robot localiza las fichas y las recupera.
Dentro otro ejemplo, el mismo modelo PaLM-E controla de forma autónoma un robot a través de tareas con secuencias complejas que antes requerían la guía humana. de Google trabajo de investigación explica cómo PaLM-E transforma las instrucciones en acciones:
Demostramos el rendimiento de PaLM-E en tareas de manipulación móvil desafiantes y diversas. Seguimos en gran medida la configuración de Ahn et al. (2022), donde el robot tiene que planificar una secuencia de acciones de navegación y manipulación en base a una instrucción de un humano. Por ejemplo, dada la instrucción «Derramé mi bebida, ¿puedes traerme algo para limpiarla?», el robot debe planificar una secuencia que contenga «1. Encuentra una esponja, 2. Recoge la esponja, 3. Trae al usuario, 4. Deja la esponja». Inspirándonos en estas tareas, desarrollamos 3 casos de uso para probar las capacidades de razonamiento incorporadas de PaLM-E: predicción de disponibilidad, detección de fallas y planificación a largo plazo. Las políticas de bajo nivel provienen de RT-1 (Brohan et al., 2022), un modelo de transformador que toma imágenes RGB e instrucciones en lenguaje natural, y genera comandos de control de efectores finales.
PaLM-E es un próximo predictor de token, y se llama «PaLM-E» porque se basa en el modelo de lenguaje extendido (LLM) existente de Google llamado «Palmera(que es similar a la tecnología detrás de ChatGPT). Google hizo que PaLM se «incorporara» agregando información sensorial y control robótico.
Dado que se basa en un modelo de lenguaje, PaLM-E toma observaciones continuas, como imágenes o datos de sensores, y las codifica en una secuencia de vectores que tienen el mismo tamaño que los tokens de lenguaje. Esto permite que el modelo «entienda» la información sensorial de la misma manera que procesa el lenguaje.
Ademas de Transformador robótico RT-1PaLM-E se basa en el trabajo anterior de Google en Vit-22B, un modelo de Vision Transformer revelado en febrero. ViT-22B ha sido entrenado en varias tareas visuales, como clasificación de imágenes, detección de objetos, segmentación semántica y subtítulos de imágenes.
Google Robotics no es el único grupo de investigación que trabaja en control robótico con redes neuronales. Este trabajo en particular se parece al reciente artículo «ChatGPT for Robotics» de Microsoft, que experimentó con la combinación de datos visuales y modelos de lenguaje grandes para el control robótico de una manera similar.
Dejando a un lado la robótica, los investigadores de Google observaron varios efectos interesantes que aparentemente se derivan del uso de un modelo de lenguaje grande como núcleo de PaLM-E. Por un lado, exhibe una «transferencia positiva», lo que significa que puede transferir el conocimiento y las habilidades que ha adquirido de una tarea a otra, lo que resulta en un «rendimiento significativamente superior» en comparación con los modelos de robots de una sola tarea.
Además, ellos observado una tendencia en todo el modelo: «Cuanto más grande es el modelo de lenguaje, más conserva sus capacidades lingüísticas cuando se entrena en lenguaje visual y tareas robóticas; cuantitativamente, el Modelo 562B PaLM-E conserva casi todas sus habilidades lingüísticas».
PaLM-E es el VLM más grande reportado hasta la fecha. Vemos habilidades emergentes como el razonamiento en cadena de pensamiento multimodal y la inferencia de múltiples imágenes, aunque solo hemos sido entrenados en indicaciones de una sola imagen. Aunque no es el foco de nuestro trabajo, PaLM-E establece una nueva SOTA en la referencia OK-VQA. pic.twitter.com/9FHug25tOF
Y los investigadores afirmar que PaLM-E presenta capacidades emergentes como la cadena multimodal de razonamiento de pensamiento (que permite que el modelo analice una secuencia de entradas que incluyen información tanto lingüística como visual) e inferencia de múltiples imágenes (usando múltiples imágenes como entrada para hacer una inferencia o predicción) aunque se entrenó solo en indicaciones de una sola imagen. En este sentido, PaLM-E parece continuar la tendencia surgen sorpresas a medida que los modelos de aprendizaje profundo se vuelven más complejos con el tiempo.
Los investigadores de Google planean explorar más aplicaciones de PaLM-E para escenarios del mundo real, como la automatización del hogar o la robótica industrial. Y esperan que PaLM-E inspire más investigaciones sobre el razonamiento multimodal y la IA incorporada.
“Multimodal” es una palabra de moda que escucharemos cada vez más a medida que las empresas busquen una inteligencia artificial general que aparentemente pueda realizar tareas generales como un ser humano.
Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.
Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.
Está a punto de tener otra oportunidad si se perdió la breve ventana de reserva de Sony para su Consola PS5 30 aniversario. El hardware de temática retro se agotó en un instante durante su período de pedido anticipado inicial el 26 de septiembre, dejando a los fanáticos furiosos con el predecible y frustrante proceso de pedido de Sony. Una alerta en la página del producto Sony (a través dekotaku) indica que la segunda ronda se llevará a cabo el martes 29 de octubre al mediodía ET.
Las consolas y accesorios de edición limitada tienen una apariencia retro que recuerda a la PlayStation original, que se lanzó en Japón en 1994. Esto incluye una elegante combinación de colores grises que le da espacio al logotipo de Playstation de la vieja escuela para resaltar.
Suponiendo que solo esté disponible el paquete Slim, esta será su segunda (y posiblemente última) oportunidad de obtener la más barata de las dos consolas. Incluye la PS5 Slim digital (¡sin unidad de disco!), un controlador DualSense estándar (también temático para la ocasión), una carcasa de conector de cable retro, bridas para cables con forma de PlayStation y un soporte vertical. Ah, y hay algunos obsequios adicionales como una calcomanía, un póster y un clip de PlayStation, que solo podemos imaginar se venderán por tres cifras en eBay después de que llegue el paquete el 21 de noviembre.
Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.
Google ha anunciado el lanzamiento y la disponibilidad de varios Pixel de generación anterior en su tienda a través del programa Teléfono reacondicionado certificado.
Los consumidores pueden obtener un Pixel 7, 7 Pro, 6, 6 Pro o 6a en Google Store hoy (28 de octubre) con piezas nuevas y originales y el último sistema operativo Android.
Google dice que trabajará para incorporar más generaciones de Pixel a este programa, pero probablemente pasará mucho tiempo antes de que aparezca el Pixel 9.
Google lanza un programa de teléfonos reacondicionados para consumidores que ofrece píxeles «asequibles»
en un Publicación de palabras claveGoogle ha anunciado el lanzamiento de su programa de teléfonos reacondicionados certificados para consumidores estadounidenses. Con el lanzamiento del programa, la compañía dice que los consumidores pueden explorar una selección de dispositivos Pixel 7, 7 Pro, 6, 6 Pro y 6a reacondicionados en Google Store. Sin embargo, esto parece ser solo el comienzo, ya que Google dice que la gente podrá volver más tarde para ver qué otras generaciones de Pixel se han agregado.
Estos teléfonos reacondicionados de generaciones anteriores recibirán envío gratuito y son elegibles para devoluciones gratuitas. Los dispositivos mencionados anteriormente son disponible en Google Play Store hoy (28 de octubre). En su listado, el Pixel 7 Pro cuesta $629 (menos $270) mientras que el Pixel 6 Pro cuesta $339 (menos $260).
Además, Google no ha dado una fecha (o qué teléfonos esperar), por lo que probablemente habrá un anuncio futuro sobre esta disponibilidad.
Luego, Google detalló qué hace que un teléfono sea elegible para la etiqueta «reacondicionado». Según su mensaje, inspeccionará la batería, la «carcasa» y las pantallas de un Pixel. Si algún aspecto requiere cuidados adicionales, enviará el teléfono a sus técnicos quienes reemplazarán las áreas dañadas con piezas “genuinas”. Además, Google garantiza que cada uno de sus Pixel reacondicionados recibe «el último software de Android».
Los consumidores que compren un Pixel reacondicionado también recibirán una garantía limitada de un año y acceso a su atención al cliente.
En aras de un planeta más limpio, Google dice que cualquier teléfono reacondicionado que los consumidores puedan comprar estará empaquetado en cajas 100% libres de plástico.
Recibe las últimas noticias de Android Central, tu compañero de confianza en el mundo de Android
El enfoque de Google en teléfonos reacondicionados con un programa es algo bueno, especialmente porque Samsung (y Apple) lideraron la carga en este departamento hace unos años. Además, Google está siguiendo los pasos de Samsung al ofrecer una garantía limitada de un año para estos teléfonos actualizados. Samsung también continuó expandiendo su programa Certified Re-Newed para teléfonos inteligentes al agregar el Galaxy S23 Ultra a principios de este año.
Es probable que pase un tiempo antes de que los usuarios vean un dispositivo de la serie Pixel 9 en Google Store con una etiqueta de «reacondicionado». De todos modos, quienes compraron la serie más nueva recibieron aún más asistencia con las reparaciones del hogar. Google ofrece manuales de reparación de Pixel 9 en un sitio web de soporte que los usuarios pueden descargar. Aunque los manuales que se ofrecen no son cortos (a menudo cientos de páginas), aparentemente son fáciles de digerir.
La llegada de dichos manuales probablemente sea el resultado de que los ejecutivos de Google hayan declarado anteriormente que «quieren que todos» puedan reparar su dispositivo.
Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.
Hay muchos memes en Internet sobre el Magic Mouse de Apple porque los usuarios tienen que darle la vuelta para enchufarlo al cargador. Pero si pensaba que Apple cambiaría eso con el lanzamiento del nuevo Magic Mouse hoy, tenemos malas noticias. Aunque ahora tiene USB-C, el puerto de carga todavía está en la parte inferior del mouse.
El puerto USB-C del nuevo Magic Mouse todavía está en la parte inferior
Junto con el nuevo iMac M4, Apple anunció el lunes nuevas versiones de sus accesorios «Magic» para Mac, incluidos un nuevo mouse, teclado y trackpad Magic. Como predijimos, las nuevas versiones son prácticamente iguales a las anteriores, excepto que ahora tienen un puerto de carga USB-C en lugar de Lightning.
Pero ¿qué pasa con uno de los aspectos más criticados del Magic Mouse? Aunque las imágenes de marketing de Apple no muestran el nuevo mouse desde muchos ángulos, el archivo 3D utilizado para obtener una vista previa del nuevo iMac en realidad aumentada confirma que el puerto de carga del Magic Mouse todavía está en la parte inferior.
El primer Magic Mouse se presentó en 2009 y se distinguía por su superficie multitáctil. En ese momento, el mouse funcionaba con baterías extraíbles, por lo que los usuarios podían simplemente reemplazar las baterías y continuar usando el mouse. En 2015, Apple lanzó el Magic Mouse 2 con el mismo diseño, pero ahora con una batería interna recargable.
El puerto Lightning para cargar se ha colocado en la parte inferior del ratón, lo que ha generado muchas críticas por parte de los usuarios. No es posible utilizar el Magic Mouse 2 mientras se está cargando. Aunque muchos afirman que cargar el mouse solo toma unos minutos, este tiempo puede ser crítico cuando la batería se agota mientras está en funcionamiento.
A lo largo de los años, muchas personas han propuesto diferentes soluciones para el diseño del Magic Mouse, entre ellas Cajas con el puerto en el lateral. o con Soporte para cargador Qi. El problema es que Apple impide que el Magic Mouse funcione cuando está encendido. Este no es el caso del Magic Keyboard o Trackpad, que se pueden utilizar mientras se carga.
Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.