inteligencia artificial

Una IA puede hacer videos de famosos y hasta ponerle voces

La voz también se puede editar de manera gratuita. D-ID es un software que genera voces artificiales en base a texto

Una nueva inteligencia artificial llamada “Studio D-ID” genera videos y voces artificiales que pueden incluir los rostros de personajes famosos como Shakira, para hacerles decir lo que sea con un guion escrito; además, el contenido puede ser descargado y compartido en redes sociales.

La página web es de acceso libre y luego de un proceso de registro gratuito, cualquier persona puede seleccionar la imagen estática de una persona, asignarle el texto y listo, queda el video. La IA puede hacer este material sin importar el idioma o si es una voz masculina o femenina.

Para crear un video básico, los usuarios deberán dirigirse hacia la página web “studio.d-id.com/editor” y pulsar el botón “Crear video” ubicado en la parte superior izquierda de la pantalla. En la sección Creación, el sistema de D-ID ofrecerá diferentes presentadores con diversos géneros y edades.

D-ID es un software que genera voces artificiales en base a texto

Con la fotografía seleccionada, en el extremo derecho de la pantalla, se puede ver un recuadro en blanco para introducir el texto que se desea integrar a la imagen. También, se puede seleccionar el idioma en el que se va a hablar, el tipo de voz (en español la selección está limitada a una voz por género) y en ocasiones se puede establecer el estilo de la voz (feliz, molesto, asustado, etc.).

Luego configurar los detalles del video, se deberá hacer clic sobre el botón “Generate video” para iniciar el proceso de creación que tarda unos segundos o minutos dependiendo de la cantidad de palabras que se ha pedido. Generalmente, las pruebas gratuitas del programa permiten 3.875 caracteres en el guion.

Todos los videos generados por la inteligencia artificial se almacenarán en la sección “Video Library” bajo el nombre “New creative video” donde se descargan en formato MP4 cuantas veces sea necesario. El resultado, además de incluir la imagen y la voz, añade movimiento en los labios de la fotografía y en la cabeza del personaje.

Le puede interesar: Google presenta “Bard”, un nuevo servicio de inteligencia artificial parecido a Chat GPT

Para tener la imagen adecuada cuando no se quieren usar imágenes predeterminadas, se tendrá que cumplir con algunos requisitos:

- Tener una fotografía frontal y con encuadre medio.

- Que haya una expresión facial neutral y boca cerrada.

- Buena iluminación.

- El rostro no debe estar obstruido por ningún accesorio o cabello.

Luego de seleccionar la foto adecuada para crear el video, los pasos son los mismos que en el proceso anterior. En el caso de que se desee añadir la voz del usuario al sistema, se puede subir un archivo de audio y este será incluido en el video, aunque no será preciso al momento de mover los labios de la fotografía en sincronía con las palabras. Este movimiento solo será referencial, pero no realista.

El acceso a este software se produce dentro de una prueba gratuita de 14 días en los que el usuario tendrá 20 “créditos” con los que se podrán generar solo 20 videos cortos. Los planes de pago varían de precio entre los 5.99 dólares hasta 299.99 dólares, y dependerá de características premium como mayor variedad de presentadores, voces y límite de caracteres en el guion.