Cuando tiras una pelota de tenis hacia arriba con la mano tusentido común te dice que más temprano que tarde la pelota alcanzará una alturamáxima y comenzará a bajar. Y donde dice sentido común debería decir tucerebro, el engranaje del sistema visual y la forma en que percibimos larealidad. No hay nada dado en todo esto. La fuerza de gravedad siempre nos haacompañado, pero no fue hace mucho que empezamos a pensar en ella, tratando dedescifrarla como Newton viendo caer una manzana del árbol.

Teniendo eso en mente pregúntate que pasaría si de repente,sin previo aviso, cambiamos tu cerebro por el de un bebé recién nacido. ¿Sabrádistinguir una naranja de un chupete? ¿Intuirá dónde debe tomar la leche en lospechos maternos? ¿Qué le parecerá cuando ve un jarro de agua vertida en un vasotransparente?

Los cerebros de los bebes son como planetas en pleno procesode formación. Una tormenta creativa de nuevas neuronas generando multitudes deconexiones, registrando el entorno, los objetos, los movimientos. Todo cambia acada segundo. No hay seguridades o repetición. O ¿sí? A los tres meses losbebes ya sobrentienden mucho de lo que pasa a su alrededor. Pese tener uncontrol mínimo de su cuerpo se dan cuenta que todo lo que sube tiene que bajar,hay objetos más grandes y otros más pequeños, pesados o livianos.

A esto llamamos “física intuitiva”, una noción primigenia decómo funcionan las leyes físicas de este mundo que para ellos es un territorionuevo y fascinante, pero no del todo desconocido. En el disco duro de suscerebros hay algo que les dice que las cosas son de una manera, y cuando noresponden a sus expectativas, como en el caso de las ilusiones ópticas, sesorprenden ante una variación que no estaba incluida en el marco de referencia.

Pese a que la inteligencia artificial ya nos supera en unaserie cada vez más grande de actividades, como jugar al ajedrez, diseñarimágenes digitales o incluso reconstruir antiguos textos griegos, la noción delas leyes físicas que rigen nuestro mundo ha sido una piedra de toque para sudesarrollo. Después de todo carecen de cuerpo, habitan un espacio digital, nouno tridimensional. Qué es la gravedad para un algoritmo sino una ecuación.

AI Learns What an Infant Knows about the Physical World - GLOBAL TECHNOLOGY

Es por esto que el equipo de DeepMind, la división deinteligencia artificial de Google, decidió entrenar una IA con el fin de queaprendiera física intuitiva al modo de los bebés, siguiendo los principios dela psicología del desarrollo temprano. El modelo de IA sólo aprendió las reglasde nuestro mundo físico cuando se le dio una idea básica de los objetos, comocuáles son sus límites, dónde están y cómo se mueven.

Bautizadacomo PLATO (Physics Learning through Auto-encoding and Tracking Objects), la IAresult ser sorprendentemente versatil. Sólo necesitó un conjuntorelativamente pequeño de ejemplos para desarrollar su "intuición".Una vez aprendida, el software podía generalizar sus predicciones sobre cómo semovían las cosas e interactuaban con otros objetos, así como sobre escenariosnunca antes encontrados.

 

En cierto modo, PLATO da en el clavo entre la naturaleza yla educación. Los psicólogos del desarrollo llevan mucho tiempo discutiendo siel aprendizaje en los bebés puede lograrse a partir de la búsqueda de patronesen los datos de las experiencias. PLATO sugiere que la respuesta es no, almenos no para esta tarea en particular. Tanto el conocimiento incorporado comola experiencia son fundamentales para completar la historia del aprendizaje.

 

No confundamos peras con robots, PLATO no es una réplicadigital de un bebé de tres meses, y nunca fue diseñado con ese propósito. Sinembargo, ofrece una visión de cómo se desarrollan potencialmente nuestraspropias mentes. Podríamos decir que trata de responder la pregunta que se hizoAlan Turing, uno de los padres de la teoría computacional, en 1950: "Enlugar de intentar producir un programa que simule la mente del adulto, ¿por quéno intentar producir uno que simule la del niño?"

 

"El trabajo... está ampliando los límites de lo que laexperiencia cotidiana puede y no puede explicar en términos deinteligencia", comentaronlas doctoras Susan Hespos y Apoorva Shivaram, de la Universidad Northwestern yla Universidad Western Sydney, respectivamente, que no participaron en elestudio. Puede "indicarnos cómo construir mejores modelos informáticos quesimulen la mente humana".

Lo que tienen en común la IA y los bebés

Pese a que las IA habiten una dimensión casi totalmente a lade las criaturas que vivimos en este espacio tridimensional que llamamosplaneta Tierra, hay algo que tienen en común con los bebés. Durante sus primerosmeses de vida ellos no hacen mucho más que tomar leche, dormir y hacer susnecesidades en los pañales. Pero todo lo que hacen y aprenden es en gran medidagracias a su capacidad de observación.

Así es como entienden que una pelota que roda por la mesa nodesaparece cuando la dejan de ver, sino que cae. Lo extraño para ellos seríaver que esa pelota se quede levitando en el aire frente a sus ojos abiertoscomo platos. De hecho, cuando ocurre algo que no tiene sentido, una ilusiónóptica, por ejemplo, los bebés se quedan mirando más tiempo eso que otrascosas, como tratando de registrar lo que está pasando, precisamente porque nocumple con sus expectativas.

Esto significa que hay territorio común entre bebés y IA:los estímulos visuales. Es por esto que los vídeos son un gran método paraentrenar a estos modelos de IA de un modo similar al que se enfrentan los bebésdía a día. Gracias a este método las IA pueden aprender la física intuitiva queestá codificada en el cerebro de los infantes.

Y hay una teoría que ayuda precisamente a medir cómo se daeste proceso de aprendizaje en los más pequeños de nosotros. "Por suertepara nosotros, los psicólogos del desarrollo llevan décadas estudiando lo quelos bebés saben sobre el mundo físico", escribió el Dr. Luis Piloto,científico principal del proyecto. La prueba por excelencia aquí es elparadigma de la violación de las expectativas (VoE). Si se le muestra a un bebéuna pelota que rueda por una colina, que desaparece al azar o que de repente vaen dirección contraria, el bebé se mirará la anomalía durante más tiempo delque lo haría en condiciones normales, como mencionamos antes.

Entrenamiento visual

En el nuevo estudio, el equipo adaptó el VoE para probar laIA. Abordaron cinco conceptos físicos diferentes para construir PLATO. Entreellos se encuentran la solidez, es decir, que dos objetos no pueden atravesarsemutuamente; y la continuidad, la idea de que las cosas existen y no se apaganincluso cuando están ocultas por otro objeto.

 

Para construir PLATO, el equipo comenzó con un métodoestándar en IA con un enfoque doble. Un componente, el modelo perceptivo, tomalos datos visuales para analizar los objetos discretos de una imagen. Elsiguiente es el predictor de dinámica, que utiliza una red neuronal para teneren cuenta el historial de objetos anteriores y predecir el comportamiento delsiguiente. En otras palabras, el modelo construye una especie de "motor defísica" que mapea objetos o escenarios y adivina cómo se comportaría algoen la vida real. Esta configuración dio a PLATO una idea inicial de laspropiedades físicas de los objetos, como su posición y la velocidad a la que semueven.

 

Finalmente pasaron a la fase de pruebas. El equipo mostró aPLATO unas 30 horas de vídeos sintéticos procedentes de un conjunto de datos decódigo abierto. No se trata de vídeos de la vida real. Más bien, imagina animacionesde bloques de la vieja escuela de Nintendo de una bola rodando por una rampa,rebotando en otra bola, o desapareciendo de repente. Con el tiempo, PLATOaprendió a predecir cómo se movería un solo objeto en el siguiente fotograma devídeo, y también actualizó su memoria para ese objeto. Con el entrenamiento,sus predicciones sobre la siguiente "escena" se hicieron másprecisas.

 

Para entrar en tierra derecha el desafío siguiente consistióen presentar a PLATO una escena normal y otra imposible, como la desapariciónrepentina de una pelota. Al medir la diferencia entre el evento real y laspredicciones de PLATO, el equipo pudo medir el nivel de "sorpresa" dela IA, que se disparó en los eventos mágicos.

 

El aprendizaje se generalizó a otros objetos en movimiento.Al desafiarlo con un conjunto de datos completamente diferente desarrollado porel MIT, que incluía, entre otros elementos, conejos y bolos, PLATO discriminó de forma experta entre eventos imposibles y realistas. PLATO nunca había"visto" un conejo antes, y, sin embargo, sin ningún tipo dereentrenamiento, mostró sorpresa cuando un conejo desafió las leyes de lafísica. Al igual que los bebés, PLATO fue capaz de captar su intuición físicacon tan sólo 28 horas de entrenamiento en vídeo.

Fig. 6
Conceptos físicos, nivel de sorpresa y exactitud de PLATO - DeepMind

Intuición física en clave digital

Hasta ahora PLATO demostró que simular el proceso deaprendizaje que ocurre en los cerebros de bebé puede inspirar a los ordenadoresuna sensación de fisicalidad, incluso cuando el "cerebro" delsoftware está literalmente atrapado dentro de una caja. Esto no se trata sólode construir robots humanoides. Hay mucho más por cosechar: desde las prótesishasta los coches autodirigidos, una comprensión intuitiva del mundo físico esel puente definitivo para que la transición de lenguaje binario que construyela dimensión digital pueda entender y traducir de una manera mucho más fluidalo que ocurre en nuestra realidad cotidiana.

Esta no es la primera vez que los científicos de la IApiensan en potenciar las mentes de las máquinas con una pizca de ingenioinfantil. Unade las ideas es dotar a la IA de un sentido de la teoría de la mente, esdecir, de la capacidad de distinguirse a sí misma de los demás y ser capaz deponerse en el lugar de otros. Se trata de una capacidad que surge de formanatural en los niños de cuatro años y que, si se incorpora a los modelos de IA,podría ayudarles a entender las interacciones sociales.

 

Gracias a este estudio hay un punto de partida, un método aexplorar con el cual poder construir sistemas de IA con un conocimientointuitivo de las leyes físicas. Este campo, como los cerebros que lo inspiran,está recién en su infancia. En el mejor espíritu colaborativo de la ciencia losautores publicaron su conjunto de datos para que otros se basen en ellos yexploren la capacidad de un modelo de IA para interactuar con conceptos físicosmás complejos, incluidos los vídeos del mundo real. Por el momento, "estosestudios podrían servir como oportunidad de sinergia entre la IA y la cienciadel desarrollo", afirman Hespos y Shivaram.

En esta década y las siguientes es probable que lainteligencia artificial siga aprendiendo nuevas destrezas y superándonos enaquellas que aún podemos celebrar que los humanos, y otros animales, son losmáximos exponentes, como el descenso en bicicleta de montañas o la habilidad delos tiburones para encontrar una presa a kilómetros de distancia gracias alolfato y la ecolocación.

El futuro ideal sería uno en que la IA aprenda a aprendercómo nosotros a la vez que nosotros cosechamos lo mejor de sus potenciales, enuna suerte de simbiosis en dos direcciones que podría generar una comunicacióny comprensión más fluida entre hombres y máquinas. Un objetivo similar al quepersigue Elon Musk con Neuralink, la empresa de interfaces cerebro-computador,con la que busca crear una tercera capa de súper inteligencia digital en elcerebro. Las cartas no están descubiertas, pero al menos las mejores mentestrabajan en esa dirección.

 

Bibliografía:

https://www.nature.com/articles/s41562-022-01395-7

https://singularityhub.com/2018/09/19/thinking-like-a-human-what-it-means-to-give-ai-a-theory-of-mind/

https://www.nature.com/articles/s41562-022-01394-8