Ciencia y tecnología

La nueva IA de Microsoft puede simular la voz de cualquiera con 3 segundos de audio

Published

2 años ago

enero 10, 2023

Carlos Santander

La nueva IA de Microsoft puede simular la voz de cualquiera con 3 segundos de audio

Agrandar / Una imagen generada por IA de la silueta de una persona.

Ars-Technica

El jueves, los investigadores de Microsoft anunciaron un nuevo modelo de IA de texto a voz llamado VALLE-E que puede simular de cerca la voz de una persona cuando se le da una muestra de audio de tres segundos. Una vez que aprende una voz específica, VALL-E puede sintetizar el audio de esa persona diciendo cualquier cosa y hacerlo de una manera que intente preservar el tono emocional del hablante.

Sus creadores creen que VALL-E podría usarse para aplicaciones de texto a voz de alta calidad, edición de voz en la que la grabación de una persona podría editarse y modificarse a partir de una transcripción de texto (haciendo que diga algo que no dijo originalmente), y creación de contenido de audio cuando se combina con otros modelos generativos de IA como GPT-3.

Microsoft llama a VALL-E un «modelo de lenguaje de códec neuronal» y se basa en una tecnología llamada EnCodec, que Meta anunció en octubre de 2022. A diferencia de otros métodos de síntesis de voz que normalmente sintetizan el habla mediante la manipulación de formas de onda, VALL-E genera códigos de códec de audio discretos a partir de indicaciones textuales y acústicas. Esencialmente, analiza el sonido de una persona, divide esa información en componentes discretos (llamados «tokens») a través de EnCodec y utiliza datos de entrenamiento para comparar lo que «sabe» acerca de cómo sonaría esa voz si pronunciara cualquier otra oración además de la muestra de tres segundos. O, como dice Microsoft en el papel VAL-E:

Para sintetizar voz personalizada (por ejemplo, zero-shot TTS), VALL-E genera los tokens acústicos correspondientes condicionados por los tokens acústicos de la grabación inscrita de 3 segundos y el indicador de fonema, que restringen respectivamente al hablante y la información del contenido. Finalmente, los tokens acústicos generados se utilizan para sintetizar la forma de onda final con el decodificador de códec neuronal correspondiente.

Microsoft entrenó las capacidades de texto a voz de VALL-E en una biblioteca de audio, ensamblada por Meta, llamada LibriLuz. Contiene 60.000 horas de habla inglesa de más de 7.000 hablantes, en su mayoría extraídos de LibriVox audiolibros de dominio público. Para que VALL-E genere un buen resultado, la voz en la muestra de tres segundos debe coincidir estrechamente con una voz en los datos de entrenamiento.

READ Apple amplía su programa de reparación hágalo usted mismo a Mac M3

En el VAL-E sitio web de muestra, Microsoft proporciona docenas de ejemplos de audio del modelo de IA en acción. De las muestras, el «Speaker Prompt» es el audio de tres segundos proporcionado a VALL-E que debe imitar. La «Verdad básica» es una grabación preexistente de ese mismo orador pronunciando una frase en particular con fines de comparación (al igual que el «control» en el experimento). La «línea de base» es un ejemplo de síntesis proporcionada por un proceso de síntesis de texto a voz convencional, y la muestra «VALL-E» es el resultado del modelo VALL-E.

Agrandar / Un diagrama de bloques de VALL-E proporcionado por investigadores de Microsoft.

microsoft

Mientras usaban VALL-E para generar estos resultados, los investigadores ingresaron solo la muestra de «Indicador del hablante» de tres segundos y una cadena de texto (lo que querían que dijera la voz) en VALL-E. Así que compare la muestra «Ground Truth» con la muestra «VALL-E». En algunos casos, las dos muestras son muy cercanas. Algunos resultados de VALL-E parecen generados por computadora, pero otros podrían confundirse con el habla humana, que es el objetivo del modelo.

Además de preservar el timbre vocal y el tono emocional de un hablante, VALL-E también puede imitar el «ambiente acústico» de la muestra de audio. Por ejemplo, si la muestra es de una llamada telefónica, la salida de audio simulará las propiedades acústicas y de frecuencia de una llamada telefónica en su salida sintetizada (esta es una forma elegante de decir que también sonará como una llamada telefónica). Y el de Microsoft muestras (en la sección «Síntesis de diversidad») demuestran que VALL-E puede generar variaciones en el tono de voz modificando la semilla aleatoria utilizada en el proceso de generación.

READ Aleatorio: alguien imprimió en 3D el supuesto diseño del “Switch 2”

Tal vez debido a la capacidad de VALL-E de generar travesuras y engaños, Microsoft no proporcionó el código de VALL-E para que otros lo experimentaran, por lo que no pudimos probar las capacidades de VALL-E. Los investigadores parecen conscientes del daño social potencial que podría traer esta tecnología. Para la conclusión del artículo escriben:

“Dado que VALL-E podría sintetizar el habla que mantiene la identidad del hablante, puede conllevar riesgos potenciales de mal uso del modelo, como la suplantación de identidad de la voz o la suplantación de un hablante específico. Para mitigar estos riesgos, es posible construir un modelo de detección para discriminar si un clip de audio ha sido sintetizado por VALL-E. Principios de IA de Microsoft en la práctica durante el desarrollo posterior de los modelos».

Carlos Santander

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España.
Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Ciencia y tecnología

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

Published

2 semanas ago

octubre 29, 2024

Carlos Santander

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

Está a punto de tener otra oportunidad si se perdió la breve ventana de reserva de Sony para su Consola PS5 30 aniversario. El hardware de temática retro se agotó en un instante durante su período de pedido anticipado inicial el 26 de septiembre, dejando a los fanáticos furiosos con el predecible y frustrante proceso de pedido de Sony. Una alerta en la página del producto Sony (a través de kotaku) indica que la segunda ronda se llevará a cabo el martes 29 de octubre al mediodía ET.

Las consolas y accesorios de edición limitada tienen una apariencia retro que recuerda a la PlayStation original, que se lanzó en Japón en 1994. Esto incluye una elegante combinación de colores grises que le da espacio al logotipo de Playstation de la vieja escuela para resaltar.

El mensaje (“Verifique nuevamente el 29 de octubre a partir de las 9:00 a. m. PDT”) solo aparece en las páginas de productos del 30.° aniversario de la Paquete delgado de PS5 de $ 500 Y Controlador DualSense de $ 80. Desafortunadamente, no aparece ningún mensaje de este tipo al revertir Paquete profesional de PS5 O Portal de PlayStation páginas de productos.

Suponiendo que solo esté disponible el paquete Slim, esta será su segunda (y posiblemente última) oportunidad de obtener la más barata de las dos consolas. Incluye la PS5 Slim digital (¡sin unidad de disco!), un controlador DualSense estándar (también temático para la ocasión), una carcasa de conector de cable retro, bridas para cables con forma de PlayStation y un soporte vertical. Ah, y hay algunos obsequios adicionales como una calcomanía, un póster y un clip de PlayStation, que solo podemos imaginar se venderán por tres cifras en eBay después de que llegue el paquete el 21 de noviembre.

READ Chromatic es una Game Boy basada en FPGA de Palmer Luckey

Carlos Santander

Ciencia y tecnología

Google ahora vende teléfonos Pixel a precios con grandes descuentos gracias a su nuevo programa de reacondicionado certificado

Published

2 semanas ago

octubre 29, 2024

Carlos Santander

Google ahora vende teléfonos Pixel a precios con grandes descuentos gracias a su nuevo programa de reacondicionado certificado

Lo que necesitas saber

Google ha anunciado el lanzamiento y la disponibilidad de varios Pixel de generación anterior en su tienda a través del programa Teléfono reacondicionado certificado.
Los consumidores pueden obtener un Pixel 7, 7 Pro, 6, 6 Pro o 6a en Google Store hoy (28 de octubre) con piezas nuevas y originales y el último sistema operativo Android.
Google dice que trabajará para incorporar más generaciones de Pixel a este programa, pero probablemente pasará mucho tiempo antes de que aparezca el Pixel 9.

Google lanza un programa de teléfonos reacondicionados para consumidores que ofrece píxeles «asequibles»

en un Publicación de palabras claveGoogle ha anunciado el lanzamiento de su programa de teléfonos reacondicionados certificados para consumidores estadounidenses. Con el lanzamiento del programa, la compañía dice que los consumidores pueden explorar una selección de dispositivos Pixel 7, 7 Pro, 6, 6 Pro y 6a reacondicionados en Google Store. Sin embargo, esto parece ser solo el comienzo, ya que Google dice que la gente podrá volver más tarde para ver qué otras generaciones de Pixel se han agregado.

Estos teléfonos reacondicionados de generaciones anteriores recibirán envío gratuito y son elegibles para devoluciones gratuitas. Los dispositivos mencionados anteriormente son disponible en Google Play Store hoy (28 de octubre). En su listado, el Pixel 7 Pro cuesta $629 (menos $270) mientras que el Pixel 6 Pro cuesta $339 (menos $260).

Además, Google no ha dado una fecha (o qué teléfonos esperar), por lo que probablemente habrá un anuncio futuro sobre esta disponibilidad.

Luego, Google detalló qué hace que un teléfono sea elegible para la etiqueta «reacondicionado». Según su mensaje, inspeccionará la batería, la «carcasa» y las pantallas de un Pixel. Si algún aspecto requiere cuidados adicionales, enviará el teléfono a sus técnicos quienes reemplazarán las áreas dañadas con piezas “genuinas”. Además, Google garantiza que cada uno de sus Pixel reacondicionados recibe «el último software de Android».

READ Chromatic es una Game Boy basada en FPGA de Palmer Luckey

Los consumidores que compren un Pixel reacondicionado también recibirán una garantía limitada de un año y acceso a su atención al cliente.

En aras de un planeta más limpio, Google dice que cualquier teléfono reacondicionado que los consumidores puedan comprar estará empaquetado en cajas 100% libres de plástico.

(Crédito de la imagen: Harish Jonnalagadda / Android Central)

El enfoque de Google en teléfonos reacondicionados con un programa es algo bueno, especialmente porque Samsung (y Apple) lideraron la carga en este departamento hace unos años. Además, Google está siguiendo los pasos de Samsung al ofrecer una garantía limitada de un año para estos teléfonos actualizados. Samsung también continuó expandiendo su programa Certified Re-Newed para teléfonos inteligentes al agregar el Galaxy S23 Ultra a principios de este año.

Es probable que pase un tiempo antes de que los usuarios vean un dispositivo de la serie Pixel 9 en Google Store con una etiqueta de «reacondicionado». De todos modos, quienes compraron la serie más nueva recibieron aún más asistencia con las reparaciones del hogar. Google ofrece manuales de reparación de Pixel 9 en un sitio web de soporte que los usuarios pueden descargar. Aunque los manuales que se ofrecen no son cortos (a menudo cientos de páginas), aparentemente son fáciles de digerir.

La llegada de dichos manuales probablemente sea el resultado de que los ejecutivos de Google hayan declarado anteriormente que «quieren que todos» puedan reparar su dispositivo.

Carlos Santander

READ PlayStation Player descubre la genialidad y una forma fácil de personalizar la PS5

Ciencia y tecnología

El nuevo Magic Mouse USB-C todavía tiene el puerto de carga en la parte inferior

Published

2 semanas ago

octubre 29, 2024

Carlos Santander

El nuevo Magic Mouse USB-C todavía tiene el puerto de carga en la parte inferior

Hay muchos memes en Internet sobre el Magic Mouse de Apple porque los usuarios tienen que darle la vuelta para enchufarlo al cargador. Pero si pensaba que Apple cambiaría eso con el lanzamiento del nuevo Magic Mouse hoy, tenemos malas noticias. Aunque ahora tiene USB-C, el puerto de carga todavía está en la parte inferior del mouse.

El puerto USB-C del nuevo Magic Mouse todavía está en la parte inferior

Junto con el nuevo iMac M4, Apple anunció el lunes nuevas versiones de sus accesorios «Magic» para Mac, incluidos un nuevo mouse, teclado y trackpad Magic. Como predijimos, las nuevas versiones son prácticamente iguales a las anteriores, excepto que ahora tienen un puerto de carga USB-C en lugar de Lightning.

Pero ¿qué pasa con uno de los aspectos más criticados del Magic Mouse? Aunque las imágenes de marketing de Apple no muestran el nuevo mouse desde muchos ángulos, el archivo 3D utilizado para obtener una vista previa del nuevo iMac en realidad aumentada confirma que el puerto de carga del Magic Mouse todavía está en la parte inferior.

El primer Magic Mouse se presentó en 2009 y se distinguía por su superficie multitáctil. En ese momento, el mouse funcionaba con baterías extraíbles, por lo que los usuarios podían simplemente reemplazar las baterías y continuar usando el mouse. En 2015, Apple lanzó el Magic Mouse 2 con el mismo diseño, pero ahora con una batería interna recargable.

El puerto Lightning para cargar se ha colocado en la parte inferior del ratón, lo que ha generado muchas críticas por parte de los usuarios. No es posible utilizar el Magic Mouse 2 mientras se está cargando. Aunque muchos afirman que cargar el mouse solo toma unos minutos, este tiempo puede ser crítico cuando la batería se agota mientras está en funcionamiento.

READ PlayStation Player descubre la genialidad y una forma fácil de personalizar la PS5

A lo largo de los años, muchas personas han propuesto diferentes soluciones para el diseño del Magic Mouse, entre ellas Cajas con el puerto en el lateral. o con Soporte para cargador Qi. El problema es que Apple impide que el Magic Mouse funcione cuando está encendido. Este no es el caso del Magic Keyboard o Trackpad, que se pueden utilizar mientras se carga.

Apple vende el nuevo Magic Mouse USB-C por 79 dólares en su sitio weby hay una versión en negro por $99 (aunque tienen el mismo hardware). La empresa no vende las versiones en color, que se envían con el iMac, por separado. Aún puedes comprar la versión Lightning con descuento en Amazon.

Leer también

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Carlos Santander

Horóscopo: ¿qué dice tu ascendente para hoy y el fin de semana del 27 de noviembre?

Horoscopo4 años ago

Horóscopo: ¿qué dice tu ascendente para hoy y el fin de semana del 27 de noviembre?

¿Britney Spears y Sam Asghari están casados? Planes después de la conservación

Entretenimiento3 años ago

¿Britney Spears y Sam Asghari están casados? Planes después de la conservación

Reguladores federales investigan bolsas de aire en vehículos 30M

Negocios3 años ago

Reguladores federales investigan bolsas de aire en vehículos 30M

Eva Longoria, Shonda Rhimes y Jurnee Smollett abandonan la junta de Time’s Up: «Listos para un nuevo liderazgo»

Entretenimiento3 años ago

Eva Longoria, Shonda Rhimes y Jurnee Smollett abandonan la junta de Time’s Up: «Listos para un nuevo liderazgo»

Paseo espacial estadounidense fuera de la Estación Espacial Internacional pospuesto debido a un problema médico con el astronauta

Horoscopo3 años ago

Paseo espacial estadounidense fuera de la Estación Espacial Internacional pospuesto debido a un problema médico con el astronauta

Publicación abierta: Presentado por el documental Abercrombie & Fitch de Netflix que explica qué es un centro comercial

Entretenimiento3 años ago

Publicación abierta: Presentado por el documental Abercrombie & Fitch de Netflix que explica qué es un centro comercial

Localizan la región de Marte más apropiada para la existencia de vida.

Ciencia y tecnología4 años ago

Localizan la región de Marte más apropiada para la existencia de vida.

Vista previa: Perú vs Brasil – predicciones, noticias del equipo, alineaciones

Deportes11 meses ago

Vista previa: Perú vs Brasil – predicciones, noticias del equipo, alineaciones

elpalco.com.sv

La nueva IA de Microsoft puede simular la voz de cualquiera con 3 segundos de audio

Ciencia y tecnología

La nueva IA de Microsoft puede simular la voz de cualquiera con 3 segundos de audio

Leave a Reply

Ciencia y tecnología

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

Ciencia y tecnología

Google ahora vende teléfonos Pixel a precios con grandes descuentos gracias a su nuevo programa de reacondicionado certificado

Lo que necesitas saber

Ciencia y tecnología

El nuevo Magic Mouse USB-C todavía tiene el puerto de carga en la parte inferior

El puerto USB-C del nuevo Magic Mouse todavía está en la parte inferior

Leer también

Trending

elpalco.com.sv

La nueva IA de Microsoft puede simular la voz de cualquiera con 3 segundos de audio

You may like

Leave a Reply

Ciencia y tecnología

Tendrás otra oportunidad de reservar la PS5 con temática retro hoy

Ciencia y tecnología

Google ahora vende teléfonos Pixel a precios con grandes descuentos gracias a su nuevo programa de reacondicionado certificado

Lo que necesitas saber

Ciencia y tecnología

El nuevo Magic Mouse USB-C todavía tiene el puerto de carga en la parte inferior

El puerto USB-C del nuevo Magic Mouse todavía está en la parte inferior

Leer también

Trending