Computación y robótica
Hacia robots cuya inteligencia artificial los dote de una conducta más humana
Unos científicos han desarrollado un nuevo principio de comportamiento para robots físicos o circunscritos solo al ciberespacio, que puede conllevar un gran avance para desarrollar agentes virtuales que se comporten cada vez de forma más parecida a como lo hacemos los humanos y sean capaces de interactuar con las personas para ayudarlas a satisfacer sus necesidades en múltiples campos (educación, salud, movilidad…).
El nuevo principio de comportamiento se basa en modelos de inteligencia artificial generativa, cuya vertiente más conocida son las aplicaciones generadoras de texto, video o audio, pero que también se está utilizando para reproducir el comportamiento humano.
Este avance es obra de un equipo encabezado por Jorge Ramírez-Ruiz, de la Universidad Pompeu Fabra (UPF) en Barcelona.
Para que los agentes virtuales sean cada vez más parecidos a las personas, es fundamental determinar qué paradigma se ajusta mejor a la conducta humana y tenerlo en cuenta para diseñar los algoritmos y los sistemas de aprendizaje profundo (una modalidad de inteligencia artificial) con redes neuronales artificiales con los que se crean estos robots. En este sentido, un grupo de investigadores del CBC (Center for Brain and Cognition, o Centro del Cerebro y la Cognición) de la UPF ha elaborado un nuevo paradigma neurocientífico sobre el comportamiento humano que desafía la teoría mayoritaria hasta el momento, según la cual las personas actúan para maximizar las recompensas externas. Han definido el nuevo Principio de Ocupación Máxima (MOP por sus siglas en inglés), según la cual las personas tienen motivaciones intrínsecas que las llevan a ocupar el máximo de espacios posibles y a experimentar el mayor número de estados. Las recompensas externas (comida, dinero…) serían un medio para poder seguir viviendo nuevas experiencias, no un objetivo per se.
Si bien el MOP se asemeja a paradigmas ya teorizados en psicología o estudios de conducta, esta es la primera vez que se demuestra en el campo de la neurociencia, a partir de agentes virtuales con redes neuronales artificiales basadas en la estructura del cerebro humano. De hecho, el equipo de investigación ha puesto a prueba y demostrado este nuevo paradigma neurocientífico con un agente virtual, cuyos algoritmos le permitían hacer lo que quisiera, en función de las reacciones de sus redes neuronales artificiales a los estímulos del entorno, salvo por los límites marcados por los tradicionales principios de la robótica de Isaac Asimov (que fundamentalmente prohíben que los robots puedan dañar a los seres humanos).
Los investigadores, del grupo de Neurociencia Teórica y Cognitiva (TCN) del CBC de la UPF, han examinado la conducta de este agente virtual en diversos entornos virtuales donde se le presentaban diversos estímulos (objetos, juguetes…). Este estudio les ha permitido constatar que el agente no actuaba para maximizar sus recompensas, sino que fundamentalmente experimentaba, probando la mayor cantidad de acciones y estados posibles (saltar, hacer volteretas, bailar de diferentes formas, tocar y usar los objetos o juguetes virtuales de diferentes formas…). También se desplazaba al máximo de lugares posibles en función de las condiciones y limitaciones del entorno.
![[Img #73888]](https://noticiasdelaciencia.com/upload/images/09_2024/2742_hacia-robots-cuya-inteligencia-artificial-los-dote.jpg)
Recreación artística de robot humanoide. (Ilustración: Amazings / NCYT)
Un principio que explica la curiosidad humana
Más allá del mundo de la robótica, los investigadores defienden que el MOP da una explicación más racional y plausible a la curiosidad y variabilidad del comportamiento humano, en función de las condiciones del contexto. Este modelo de comportamiento se pone claramente de manifiesto con la conducta de los bebés, ya que durante los primeros meses de vida no dejan de explorar constantemente su entorno, mover su cuerpo de distintas formas, balbucear para probar diferentes sonidos… Esta curiosidad y capacidad de exploración es fundamental para su proceso de desarrollo y aprendizaje.
En el caso de los adultos, este afán por explorar y probar nuevas experiencias sigue existiendo. Pero, dado los condicionantes del contexto social y económico del mundo en el que vivimos, las personas adultas comprenderían que necesitan medios, recursos y energía (trabajo, dinero, comida…) para poder seguir probando nuevas experiencias o viajar a diferentes lugares.
Así pues, si este nuevo principio neurocientífico explica mejor el comportamiento humano, también debería servir para diseñar agentes virtuales que reproduzcan mejor su conducta. Para Rubén Moreno-Bote, director del grupo de investigación en Neurociencia Teórica y Cognitiva (TCN) del CBC de la UPF, “el Principio de Ocupación Máxima constituye un avance relevante para mejorar los modelos de inteligencia artificial generativa del comportamiento humano, cuyo potencial de futuro es enorme en múltiples campos”. En el futuro, los agentes no solo podrán interactuar con una persona para identificar y satisfacer sus necesidades concretas (para moverse, aprender, hacer ejercicio físico, organizar la economía doméstica…), sino que también podrán servir para hacer experimentos sociológicos. Por ejemplo, se podrían agrupar a diversos agentes virtuales en un contexto concreto para analizar si colaborarían, competirían, etcétera. Así pues, también puede tener aplicaciones en el campo de la sociología o la economía, entre otras disciplinas.
Ramírez-Ruiz y sus colegas exponen los detalles técnicos de sus últimos avances en esta línea de investigación y desarrollo en la revista académica Nature Communications, bajo el título “Complex behavior from intrinsic motivation to occupy future action-state path space”. (Fuente: Universitat Pompeu Fabra)



