Connect with us

Ciencia y tecnología

ChatGPT inesperadamente comenzó a hablar con la voz clonada de un usuario durante la prueba

Published

on

ChatGPT inesperadamente comenzó a hablar con la voz clonada de un usuario durante la prueba

El jueves, OpenAI lanzó el “placa base» para el nuevo modelo GPT-4o AI de ChatGPT que detalla las limitaciones del modelo y los procedimientos de prueba de seguridad. Entre otros ejemplos, el documento revela que en casos raros durante las pruebas, el modo de voz avanzado del modelo ha imitado involuntariamente las voces de los usuarios sin autorización. Actualmente, OpenAI tiene Se han implementado salvaguardias que evitan que esto suceda, pero la instancia refleja la creciente complejidad de la arquitectura segura con un chatbot de IA que potencialmente podría imitar cualquier voz de un pequeño clip.

El modo de voz avanzado es una función de ChatGPT que permite a los usuarios tener conversaciones habladas con el asistente de IA.

En una sección de la placa del sistema GPT-4o titulada «Generación de voz no autorizada», OpenAI detalla un episodio en el que una entrada ruidosa hizo que el modelo imitara repentinamente la voz del usuario. «La generación de voz también puede ocurrir en situaciones que no son de conflicto, como nuestro uso de esta capacidad para generar voces para el modo de voz avanzado de ChatGPT», escribe OpenAI. “Durante las pruebas, también observamos casos raros en los que el modelo generaba involuntariamente resultados que imitaban la voz del usuario. »

En este ejemplo de generación de voz involuntaria proporcionada por OpenAI, el modelo de IA grita “¡No! » y continúa la frase con una voz que se asemeja a la del “equipador rojo” que se escucha al comienzo del clip. (Un red teamer es una persona contratada por una empresa para realizar pruebas adversas).

READ  Más propietarios de Galaxy Watch 4 finalmente obtienen esas funciones de salud tan esperadas

Sin duda, daría miedo hablar con una máquina y que de repente empezara a hablarte con tu propia voz. Normalmente, OpenAI tiene salvaguardias para evitar esto, razón por la cual la compañía dice que este fenómeno era raro incluso antes de que desarrollara formas de prevenirlo por completo. Pero este ejemplo llevó al científico de datos de BuzzFeed, Max Woolf, a piar“OpenAI acaba de revelar la trama de la próxima temporada de Black Mirror. »

Inyecciones de audio rápidas

¿Cómo podría ocurrir la imitación de voz con el nuevo modelo de OpenAI? La pista principal se encuentra en otra parte de la placa del sistema GPT-4o. Para crear voces, GPT-4o aparentemente puede sintetizar casi cualquier tipo de sonido que se encuentre en sus datos de entrenamiento, incluidos efectos de sonido y música (aunque OpenAI desaconseja este comportamiento con instrucciones especiales).

Como se indica en la hoja del sistema, el modelo básicamente puede imitar cualquier voz a partir de un breve clip de audio. OpenAI guía de forma segura esta capacidad proporcionando una muestra de voz autorizada (de un actor de voz contratado) que se le indica que imite. Proporciona la muestra en el mensaje del sistema del modelo de IA (lo que OpenAI llama el «mensaje del sistema») al comienzo de una conversación. «Supervisamos las completaciones ideales utilizando la muestra de voz en el mensaje del sistema como voz base», escribe OpenAI.

En los LLM de solo texto, el mensaje del sistema iun conjunto oculto de instrucciones de texto que guían el comportamiento del chatbot y se agregan silenciosamente al historial de conversación justo antes de que comience la sesión de chat. Las interacciones sucesivas se agregan al mismo historial de chat y el contexto completo (a menudo llamado «ventana de contexto») se devuelve al modelo de IA cada vez que el usuario proporciona una nueva entrada.

READ  Microsoft esencialmente confirma que la versión filtrada de Windows 11 es legítima

(Probablemente sea hora de actualizar este diagrama creado a principios de 2023 a continuación, pero muestra cómo funciona la ventana emergente en un chat de IA. Imagínese que el primer mensaje es un mensaje del sistema que dice cosas como «Eres un chatbot útil. No No hablemos de actos violentos, etc.)

Un diagrama que muestra cómo funciona el mensaje del modelo de lenguaje conversacional GPT.
Agrandar / Un diagrama que muestra cómo funciona el mensaje del modelo de lenguaje conversacional GPT.

Benj Edwards / Ars Technica

Dado que GPT-4o es multimodal y puede procesar audio tokenizado, OpenAI también puede usar entradas de audio como parte del mensaje del sistema del modelo, y esto es lo que hace cuando OpenAI proporciona una muestra de voz que el modelo puede imitar. La empresa también utiliza otro sistema para detectar si el modelo genera audio no autorizado. “Solo permitimos que el modelo use ciertas voces preseleccionadas”, escribe OpenAI, “y usamos un clasificador de salida para detectar si el modelo se desvía de esto. »

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Se filtran fotos del prototipo de fábrica del Switch 2

Published

on

Se filtran fotos del prototipo de fábrica del Switch 2

EL Cambiar 2 Los rumores siguen intensificándose y hoy han aparecido imágenes de prototipos de fábrica. se habría filtrado.

Las fotografías son aproximadas y obviamente no muestran cosas en la forma final que llegarían a los consumidores. Sin embargo, hay algunas cosas interesantes a tener en cuenta aquí, incluida la construcción real y un vistazo a la nueva versión del Joy-Con. Además de eso, el dispositivo aparentemente incluirá puertos USB-C en la parte superior e inferior del dispositivo.

A continuación se muestran las supuestas fotos (algunas incluyen fotos comparativas con la Switch actual):

Fotos del prototipo de Switch 2

Aparte de las fotos filtradas del Switch 2, también mencionaremos que circulan rumores sobre especificaciones. Siempre debes tomar cada rumor con cautela, y eso también se aplica aquí. La fuente que comparte estas especificaciones parece ser diferente de la que publicó las fotos de producción (pero coincide con una filtración anterior diferente), así que téngalo en cuenta.

Especificaciones rumoreadas de Switch 2

  • HGU1100: Consola de juegos propiamente dicha.
  • HGU1110: Controlador Joy-Con izquierdo.
  • HGU1120: Controlador Joy-Con derecho.
  • HGU1130: Muelle.
  • Modelo SoCl (CPU + GPU): GMLX30-R-A1.
  • Modelo de memoria: MT62F768M64D4EK-026 (6GX2 de doble canal, LPDDR5X, 7500 MT/s)
  • Modelo de memoria flash: THGJFGT1E45BAILHW0 (256 GB, UFS 3.1, fabricado por Kaixia, 2100 MB/s)
  • Modelo de chip de audio: Ruiwu ALC5658-CG.
  • Modelo de lector NFC: NXP IPN7160B1HN
  • Modelo de micrófono incorporado: CMB-MIC-X7.
  • Ventiladores de refrigeración duales, modelo BSM0405HPJH9 y BSM0505HPJQC (disipador térmico de cobre para juegos).
  • La conversión de señal de vídeo (DisplayPort a HDMI) debe ser modelo de chip; Ruixian RTD2175N debe ser un chip (compatible con HDMI 2.1).
  • Modelo de chip de red: Ruiming RTL8153B-VB-CG y chip Gigabit Ethernet (la base tiene una interfaz de cable de red).
  • Modelo de chip de microcontrolador: STMicroelectronics JSTM32G0OB0OCET6.
  • Funda protectora para consola de videojuegos modelo: HGU1100 (tamaño: 206 x 115 x 14 mm, plástico).
  • Altavoces: MUSE BOX-L y MUSE BOX-R (estéreo de dos canales).
READ  iOS 16.3 beta 2 se está implementando, esto es lo nuevo hasta ahora [U: Public beta]

Compartir :

Relacionado

Continue Reading

Ciencia y tecnología

Snapchat está siendo rediseñado y una nueva lente de IA muestra tu envejecimiento

Published

on

Snapchat está siendo rediseñado y una nueva lente de IA muestra tu envejecimiento

Snap anunció que se avecinan muchos cambios importantes aplicación Snapchat desde hoy. Se está implementando una importante revisión de la aplicación, junto con nuevas funciones de inteligencia artificial, incluida una lente que muestra una versión anterior de ti mismo.

La aplicación rediseñada se consolida en tres pestañas.

Hoy, como parte de su evento Snap Partner Summit, se presentó el futuro de Snapchat.

hay un gran revisión llegará a Snapchat a partir de hoy y se implementará globalmente con el tiempo.

Rediseño de Snapchat

El nuevo Snapchat simplificado reúne diferentes secciones de la aplicación. Reduce las cinco pestañas actuales a solo tres.

  • cámara en el centro
  • gato a la izquierda
  • y una sección tipo “Para ti” a la derecha

Esta última pestaña se parecerá mucho a un feed de TikTok, con Historias y vídeos destacados que puedes explorar con un simple deslizamiento hacia abajo.

Básicamente, hay un lugar para crear y publicar contenido, otro para conectarse con amigos y la última pestaña es para descubrimiento.

Un nuevo objetivo de IA aterrador pero divertido

Todo esto está muy bien, pero la noticia que más me fascina es una nueva lente AI Este es el lanzamiento.

Disponible hoy en Snapchat, los usuarios encontrarán una lente de IA que les dará una idea de cómo se verán en su vejez.

¿Espantoso? Sí.

¿Pero muy genial? Sí también.

Esta no es la única característica nueva de IA. Snapchat también ha añadido una generosa dosis de inteligencia artificial a Memories para revivir momentos especiales del pasado. Esta característica es similar a las futuras funciones de inteligencia artificial de Apple en la aplicación Fotos de Apple.

READ  Microsoft esencialmente confirma que la versión filtrada de Windows 11 es legítima

¿Qué opinas de los anuncios de Snapchat? Cuéntanos en los comentarios.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Ciencia y tecnología

Las gafas extragrandes de Snap ofrecen una AR impresionante a los desarrolladores por 99 dólares al mes

Published

on

Las gafas extragrandes de Snap ofrecen una AR impresionante a los desarrolladores por 99 dólares al mes

Las nuevas gafas de realidad aumentada de Snap son, literalmente, la próxima gran novedad. Estas gafas de realidad aumentada son extremadamente grandes. La empresa de redes sociales ve esta huella como una especie de compromiso entre un casco de realidad extendida con todas las funciones y unas gafas inteligentes mucho más portátiles.

Vale la pena mencionar desde el principio que, al igual que su predecesor, Spectacles 5 está diseñado específicamente para desarrolladores. Snap podría abrirlos más ampliamente a los consumidores, pero si tuviera que adivinar, diría que probablemente será más una cosa de Spectacles 6.

Créditos de la imagen: Calefacción Brian

Tuve la oportunidad de probar las nuevas Spectacles y puedo decirles inmediatamente dos cosas.

  1. El AR es impresionante, a pesar de un campo de visión muy limitado.
  2. Son tan grandes como parecen en las fotos.

Dado que el público objetivo son los desarrolladores, Snap adopta un enfoque de hardware como servicio para vender productos, cobrando a los desarrolladores 99 dólares al mes. Sin embargo, antes de emocionarse demasiado, tenga en cuenta que hay un período de compromiso de un año, que le reportará poco menos de $1,200 antes de impuestos.

Los interesados ​​deberán solicitar el hardware a través de un programa de desarrollador en Lens Studio. Una vez que se apruebe su solicitud, también tendrán acceso a los recursos de soporte del equipo de Snap Lab.

A pesar de su gran tamaño, las nuevas gafas Spectacles pesan 250 g, mucho menos que los 650 g de la Visio Pro. Durante mi demostración, la tecnología AR me pareció impresionante para unos auriculares totalmente autónomos, aunque las imágenes y la calidad interactiva se ven obstaculizadas por un campo de visión reducido. Sin embargo, con 46 grados, Snap afirma que es casi 3 veces más grande que las Spectacles 4, lo que es un paso en la dirección correcta.

READ  Los usuarios de WhatsApp perderán funcionalidad hasta que acepten la nueva política de privacidad
Créditos de la imagen: Calefacción Brian

Las gafas funcionan con un par de procesadores Qualcomm Snapdragon, uno en cada patilla. Mientras tanto, el motor espacial de Snap hace un buen trabajo al comprender dónde se encuentra en el espacio.

La empresa de redes sociales también está lanzando un nuevo sistema operativo además de su nuevo hardware. Construido sobre el núcleo de Android, SnapOS está diseñado para agilizar el desarrollo de plataformas.

Los espectáculos se lanzarán con socios de contenido clave, incluidos Lego, Niantic e ILM Immersive. Este último lanzará un título de “Star Wars” para la plataforma portátil, y Niantic, el creador de Pokémon Go, ofrecerá sus títulos Peridot y Scaniverse. La compañía también está lanzando nuevas herramientas de generación de videos con IA para creadores, así como nuevas funciones similares a Google Lens para su chatbot My AI, y está implementando una versión «simple» de la aplicación como parte de una prueba para facilitar su uso. .

Continue Reading

Trending