Header Ad

Evolución | ¿Harto de las videollamadas? La IA las hará más reales

Después de 16 meses, prender la computadora y conectarse a una plataforma de videollamadas se convirtió en un proceso que ya resulta insoportable para muchos.

Las apps de reuniones virtuales han tenido crecimientos estratosféricos por la necesidad de mantener el contacto para las reuniones de trabajo, así como ver a familiares y amigos.

Sólo en septiembre del año pasado, Zoom registró más de 46.2 millones de descargas, una cifra récord para la empresa.

Pero el aburrimiento también está presente en el uso de estas herramientas.

Sin embargo, las empresas buscan alternativas para que las videollamadas pierdan esa sensación de aburrimiento.

Una de estas compañías es Nvidia. La Inteligencia Artificial (IA) desarrollada por los investigadores de la empresa permite a los usuarios encender la laptop, conectarse a la reunión y lucir una imagen limpia y perfecta sin necesidad de quitarse la pijama.

Vid2Vid Cameo, es uno de los modelos utilizados por la tecnología deep learning, que forma parte del programa SDK de Nvidia Maxine, especializado en videoconferencias.

El aplicativo del programa permite generar una especie de máscara en segunda dimensión que refleja imágenes realistas de cabezas parlantes.

“Eso significa que un asistente a una reunión con el cabello desarreglado y la pijama puesta puede aparecer como si estuviera vestido con una camisa formal, mientras la IA mapea los movimientos faciales del usuario con una foto previamente cargada del individuo, con un atuendo apropiado para el trabajo. Si el sujeto está mirando hacia la izquierda, la tecnología puede ajustar el punto de vista para que el asistente parezca estar haciendo contacto visual con la cámara web”, señala la compañía.

Además, un tema constante en las reuniones es quedarse trabado durante la junta, ante la necesidad de una conexión más poderosa, pero Nvidia asegura que esta técnica de IA también reduce el ancho de banda necesario para las videoconferencias hasta en 10 veces, lo que evita el retraso en la recepción de la imagen.

“Muchas personas tienen un ancho de banda de Internet limitado, pero aun así quieren tener una videollamada sin problemas con amigos y familiares», dijo Ming-Yu Liu, coautor del proyecto. «Además de ayudarlos, esta tecnología también podría usarse para ayudar al trabajo de animadores, editores de fotos y desarrolladores de juegos».

Vid2Vid Cameo requiere dos elementos para crear una cabeza parlante de IA realista para videoconferencias: una toma de la apariencia de la persona y una transmisión de video que dicta cómo se debe animar esa imagen.

Para su desarrollo, los investigadores utilizaron un conjunto de datos de 180 mil videos de cabezas parlantes de alta calidad.

La red aprendió a identificar 20 puntos clave que se pueden utilizar para modelar el movimiento facial sin anotaciones humanas.

Pero Nvidia no es la única empresa que experimenta con la Inteligencia Artificial y la Realidad Aumentada.

Otra Big Tech que se subió a este tipo de proyectos es Google, a través de un dispositivo que no logró el éxito esperado: Google Lens.

Los lentes que integran una cámara de video y una pantalla en los cristales frente a los ojos cambió su objetivo y ahora se puede utilizar en la app Google Meet.

La empresa californiana señaló que todos los clientes de Workspace podrán pedir usar Google Meet a través de su dispositivo Glass en un programa que todavía está en fase de pruebas, pero que ya es funcional.

El uso industrial de los lentes permite a los usuarios ver información virtual sobre objetos reales, como los requerimientos para el mantenimiento de equipos industriales. Los lentes permiten ver instrucciones escritas directamente en la línea de visión, sin distracciones.

El objetivo de este nuevo programa es permitir que las personas puedan hacer una videollamada en Google Meet sin distraerse de otras actividades, por lo que podría ser muy útil para solicitar ayuda o comentarios sobre un problema técnico.

La desarrolladora de software, TeamViewer, también lanzó una app de videollamadas con realidad aumentada. LifeAR es un servicio de videoconferencias, aunque su función se parece más a la de una red social, que a una aplicación de juntas virtuales.

A través de ella, dice la empresa, se puede recibir ayuda en tiempo real para solucionar problemas técnicos y hasta consultar la opinión de otras personas para realizar compras.