ByteDance, la empresa matriz de TikTok, ha desarrollado un nuevo modelo de inteligencia artificial (IA) llamado OmniHuman-1, capaz de crear videos hiperrealistas de cuerpo completo a partir de una única imagen.
Este avance tecnológico permite replicar los gestos, movimientos corporales y la voz de una persona con una precisión impresionante.
Aunque no está disponible para el público general, su potencial ha despertado inquietudes sobre el impacto de los deepfakes en la seguridad y la desinformación.
OmniHuman-1, la nueva IA de TikTok, se basa en un transformador y modelos de difusión, diseñados para agregar sonido a una imagen y combinar ambos elementos hasta lograr una apariencia natural.
Su arquitectura avanzada le permite analizar múltiples elementos de una escena a lo largo del tiempo, procesando tanto detalles específicos como el contexto general.
El modelo ha sido entrenado con más de 19,000 horas de video mediante una técnica conocida como “entrenamiento mixto de condicionamiento de movimiento multimodal”. Este método combina materiales de distintas calidades y niveles de detalle, lo que permite mejorar su rendimiento y superar la escasez de datos de entrenamiento.
Según los ingenieros de ByteDance, OmniHuman-1 supera a los modelos actuales en la generación de videos humanos realistas, incluso cuando la entrada es una imagen de baja calidad o una pista de audio débil. Además, admite imágenes de cualquier relación de aspecto, ya sean retratos, imágenes de medio cuerpo o cuerpo completo.
Las funcionalidades de OmniHuman-1 permiten:
Sin embargo, el modelo aún tiene algunas limitaciones. Las imágenes de baja calidad pueden generar videos con movimientos poco naturales o detalles borrosos en el rostro. Además, enfrenta dificultades al procesar secuencias de movimiento muy complejas o inusuales.
Aunque OmniHuman-1 no está disponible para el público general debido a su alto costo de entrenamiento y ejecución, su desarrollo ha avivado el debate sobre los riesgos de los deepfakes.
Según la organización de seguridad en línea Home Security Heroes, la producción de videos falsos con inteligencia artificial creció un 550% entre 2019 y 2023. En el mismo periodo, los casos de suplantación de identidad aumentaron en un 3,000%.
Este fenómeno ha sido impulsado por la falta de regulación y la rápida evolución de la tecnología, generando impactos en las esferas sociales, culturales y económicas. Los expertos advierten que las redes sociales tienen un papel clave en la prevención de estos riesgos.
TikTok, consciente de esta problemática, ha implementado medidas como la integración de la tecnología Content Credentials, que permite etiquetar los contenidos generados con IA mediante metadatos. Este sistema facilita la identificación de videos manipulados, ayudando a los usuarios a diferenciar entre contenido real y deepfakes.
OmniHuman-1 es un avance impresionante en la generación de videos realistas con inteligencia artificial. Su capacidad para crear deepfakes hiperrealistas con solo una foto y un audio plantea tanto oportunidades como desafíos en el ámbito digital.
Mientras la tecnología sigue evolucionando, la regulación y las medidas de control serán clave para mitigar los riesgos asociados a la manipulación de contenido audiovisual.
Si te agrada nuestro contenido no olvides seguir visitando nuestro sitio Web Ellipsis Mx al igual seguirnos en nuestras redes sociales Facebook , Twitter e Instagram.