¿Qué es la inteligencia artificial generativa?

In Blogfest, Data & Applied AI by Baufest

La inteligencia artificial (IA) puede permitir que las máquinas utilicen datos textuales o visuales para crear contenido nuevo a través de lo que se denomina inteligencia artificial generativa.

lunes 21 - marzo - 2022
Baufest
Equipo multiétnico construye red neural con aprendizaje automático integrado.

Esta disciplina, siguiendo a la consultora Gartner, “tiene el potencial de crear nuevas formas de contenido creativo, como videos, y acelerar los ciclos de I+D en campos que van desde la medicina hasta la creación de productos”. La IA generativa aprende sobre los artefactos a partir de los datos y genera nuevas creaciones innovadoras que son similares al original pero que no lo repiten.

Hasta aquí estábamos acostumbrados a que los modelos de aprendizaje automático (machine learning) o aprendizaje profundo (deep learning)  interpretaran y clasificaran principalmente los datos existentes y de ese modo favorecieran la optimización de procesos: por ejemplo, que reconocieran rostros o identificaran fraudes. La inteligencia artificial generativa, en cambio, es un campo nuevo de rápido crecimiento que se centra en la creación de contenido novedoso. Se ejecuta en algoritmos que identifican el patrón subyacente (i.e. la distribución de probabilidad inherente que representa al conjunto de datos) de una entrada para generar plausibles similares (i.e. nuevas muestras de esa distribución). Es decir que opera con programas que pueden usar contenido existente como texto, archivos de audio o imágenes para crear contenido nuevo, que a nuestros propios ojos y sentidos, parece y luce realista. Esta evolución lleva la IA más allá de la percepción e identificación, lleva la IA hacia la creatividad.

Optimización de contenido

Las organizaciones pueden aplicar IA generativa para crear contenido multimedia original, datos sintéticos y modelos de objetos físicos. Esta disciplina ofrece distintos beneficios, entre los que cuentan la posibilidad de generar resultados (y productos) de mayor calidad mediante el entrenamiento con un conjunto de datos, y  permitir una mejor localización/regionalización del contenido, una mejor personalización.

Por ejemplo, la IA generativa se puede utilizar para el procesamiento de imágenes, ya que ayuda en la ampliación inteligente de imágenes de baja resolución a otras de alta resolución. Ayuda a restaurar películas, al re-escalar las imágenes antiguas a 4K y más allá, al eliminar el ruido, agregar colores y sumar nitidez. También permite convertir cualquier voz generada por computadora en una que suene como una voz humana.

Por ejemplo, en casos de enfermedades neurodegenerativas que pueden comprometer eventualmente el habla, permiten la posibilidad a cada persona de generar y grabar sus propios registros de voz, para luego utilizando algoritmos generativos, disponer de la posibilidad de generar en el eventual futuro su propia voz sintetizada.  De haber estado disponible esta tecnología en el pasado, hubiesemos escuchado al genial Stephen Hawking con su voz natural, la que tenía de jóven, y no con la voz metálica característica que su dispositivo de asistencia le permitía generar.

Asimismo, puede emplearse para renderizar prótesis, moléculas orgánicas y otros elementos. Y adicionalmente se ha utilizado para proteger la identidad (i.e. en vez de ocultar una cara en una entrevista mediante borroneo o pixelado, directamente se reemplaza por otra cara que no existe pero que es realista).

Redes Neuronales Profundas Generativas

En el corazón de la IA generativa hay hoy dos técnicas claves: las redes generativas antagónicas (GAN Generative Adversarial Networks, por sus siglas en ingles) y los autoencoders variacionales (VAE).

Las GAN se diseñan con dos redes neuronales separadas que operan en un juego de suma cero enfrentadas entre sí, que trabajan iterativamente una contra la otra y perfeccionan las capacidades mutuas. Una de las redes genera la muestra “falsa” que intenta hacer pasar por realista, y la segunda determina si la muestra falsa se parece o no a las realistas.  Por su parte, los VAE son autoencoders, los cuales pueden verse también como dos redes, donde una es un codificador y la otra un decodificador, acoplados uno después del otro. 

Cada dato en sí mismo se codifica a un código más simple, de menor dimensión, en tanto que el decodificador regenera el dato tal cual es (como un algoritmo de comprensión). La parte variacional, permite a ese código interno simplificado tener estructura y estocasticidad, que es justamente lo que permite generar nuevas muestras, simplemente moviendose por ese código (i.e. genero un nuevo código al azar y me fijo que da el decodificador).

La inteligencia artificial generativa está encontrando aplicaciones en campos como la salud y la seguridad. Esta disciplina tiene su lado positivo, pero también tiene su lado potencialmente peligroso. Por el lado beneficioso, uno de los casos de uso más prometedores está relacionado con los datos sintéticos, que permiten a los profesionales aumentar digitalmente los conjuntos de datos  que necesitan para entrenar modelos de IA. Esto ayuda a mejorar la eficiencia de los métodos de inferencia y de predicción, particularmente cuando la obtención de datos es compleja o costosa, típico de casos de uso médicos.

Del lado amenazante, la inteligencia artificial generativa habilita a crear DeepFakes (archivos de voz, imagen o video manipulados mediante un software de IA de manera que parezcan originales, auténticos y reales). Es decir que permite  la generación de fotos y videos de apariencia realista en los cuales las personas pueden decir y hacer cosas que en realidad no dijeron ni hicieron.