A medida que el año se aproxima a su final es imposible no pensar en los hitos que ha dejado, como el final de la larga pandemia y la guerra entre Ucrania y Rusia, pero nosotros nos concentraremos en una temática específica: el progreso alucinante de la inteligencia artificial y su masificación definitiva como un recurso accesible a cualquier persona con acceso a internet.

Primero sucedió con los generadores de imágenes como DALL-E 2 y Stable Diffusion que a esta altura ya producen millones de imágeners por día a partir de un simple comando textual, plasmando las imaginaciones más delirantes de cualquiera de nosotros, y, por otro lado, también la relevancia y el impacto cada vez mayor de los chat bot. El último ejemplo en esta línea es el ChatGPT de la compañía sin fines de lucro Open AI, responsable de DALL-E 2 y GPT-3 el modelo de lenguaje natural en que se basa este chat bot. Recientemente liberaron la versión beta de esta tecnología para que cualquier persona pueda interactuar con ésta y los asombrosos resultados no se hicieron esperar.

A través de las redes sociales, la gente ha estado compartiendo historias sobre el uso de ChatGPT para escribir código, redactar entradas de blog, componer ensayos universitarios, compilar informes de trabajo y realizar Excel, entre muchas otras cosas. Casi es innecesario decir que es imposible mantenerse al día de todo lo que está sucediendo, pero hay una tendencia general que ha llamado la atención: La IA se está generalizando y apenas estamos empezando a ver el efecto que tendrá en el mundo.

Hay un concepto de IA que puede ayudar a explicar lo que está ocurriendo. Se llama "exceso de capacidad" y se refiere a las capacidades ocultas de la IA: habilidades y aptitudes latentes en los sistemas que los investigadores aún no han empezado a investigar. Es posible que haya oído antes que los modelos de IA son "cajas negras", es decir, que son tan enormes y complejos que no entendemos del todo cómo funcionan ni llegamos a conclusiones concretas. Esto es cierto en líneas generales y es lo que crea este problema.

"Los modelos actuales son mucho más capaces de lo que pensamos, y nuestras técnicas disponibles para explorarlos son muy jóvenes", así describía el concepto el experto en política de IA Jack Clark en una edición reciente de su boletín. "¿Qué pasa con todas las capacidades que desconocemos porque no hemos pensado en probarlas?".

Capability overhang es un término técnico, pero también describe perfectamente lo que está ocurriendo ahora mismo, cuando la IA entra en el dominio público. Durante años, los investigadores no han dejado de producir nuevos modelos más rápido de lo que pueden comercializarse. Pero en 2022, un exceso de nuevas aplicaciones y programas ha puesto de repente estas habilidades a disposición del público en general, y en 2023, a medida que sigamos escalando este nuevo territorio, las cosas empezarán a cambiar cada vez a mayor velocidad.  El cuello de botella siempre ha sido la accesibilidad, como demuestra ChatGPT.

Los fundamentos de este programa no son totalmente nuevos (se basa en GPT-3.5, un gran modelo de lenguaje que OpenAI ha lanzado este año, pero que en sí mismo es una actualización de GPT-3, de 2020). OpenAI ya había vendido anteriormente el acceso a GPT-3 como API, pero la capacidad de la empresa para mejorar la capacidad del modelo para hablar en un diálogo natural y luego publicarlo en la web para que cualquiera pueda jugar con él lo ha llevado a un público mucho más amplio. Y por muy imaginativos que sean los investigadores de IA a la hora de sondear las habilidades y debilidades de un modelo, nunca podrán igualar la inteligencia masiva y caótica de Internet en general. De repente, el voladizo es accesible.

La misma dinámica se observa también en el auge de los generadores de imágenes por IA. Una vez más, estos sistemas llevan años desarrollándose, pero su acceso estaba restringido de diversas formas. Este año, sin embargo, sistemas como Midjourney y Stable Diffusion han permitido a cualquiera utilizar la tecnología de forma gratuita, y de repente el arte de la IA está en todas partes. Gran parte de ello se debe a Stable Diffusion, que ofrece una licencia de código abierto para que las empresas se basen en ella. De hecho, es un secreto a voces en el mundo de la IA que cada vez que una empresa lanza una nueva función de imagen de IA, es muy probable que se trate de una versión reempaquetada de Stable Diffusion. Esto incluye desde la aplicación viral de "avatares mágicos" Lensa hasta la herramienta de conversión de texto en imagen de Canva o la "máquina del tiempo de IA" de MyHeritage. En el fondo, se trata de la misma tecnología.

Sin embargo, como sugiere la metáfora, la perspectiva de un exceso de capacidades no es necesariamente una buena noticia. Además de capacidades ocultas y emergentes, existen amenazas ocultas y emergentes. Y estos peligros, al igual que nuestras nuevas capacidades, son casi demasiado numerosos para nombrarlos. ¿Cómo se adaptarán, por ejemplo, las universidades a la proliferación de redacciones escritas con inteligencia artificial? ¿Se verán diezmadas las industrias creativas por la propagación de la IA generativa? ¿Creará el aprendizaje automático un tsunami de spam que arruinará la web para siempre? ¿Y qué hay de la incapacidad de los modelos lingüísticos de IA para distinguir la realidad de la ficción o de los sesgos demostrados de los generadores de imágenes de IA que sexualizan a las mujeres y a las personas de color? Algunos de estos problemas son conocidos, otros se ignoran y otros apenas empiezan a notarse.

Este año quedará marcado como el comienzo de una fiebre por el uso masivo de plataformas potenciadas por la inteligencia artificial, liberando un potencial enorme que recién estamos comenzando a descubrir y antes estaba confinado solo al ámbito de los investigadores informáticos y desarrolladores de universidades y compañías líderes en tecnología. Las paradojas y problemáticas, éticas y técnicas, que esto conlleva irán perfilándose cada vez más claramente y debemos estar atentos para ir resolviéndolas con presteza a medida que vayan emergiendo, con el propósito que estas tecnologías no copien lo peor de nosotros, sino lo mejor, y nos permitan ir varios pasos más adelante en las áreas más diversas, desde el arte a la eficiencia laboral y el diseño de nuevas tecnologías o medicinas. Las posibilidades son tan complejas como fascinantes.