Un experto en inteligencia artificial explica por qué es difícil dar a las computadoras algo que se da por sentado: sentido común.

Un experto en inteligencia artificial explica por qué es difícil dar a las computadoras algo que se da por sentado: sentido común
Marcador de posición de contenido de terceros de Mendel.  Categorías: Geografía y viajes, Salud y medicina, Tecnología y ciencia
Marcador de posición de contenido de terceros de Google Images Mendel. Categorías: Geografía y viajes, Salud y medicina, Tecnología y ciencia

Este artículo se vuelve a publicar desde The Conversation bajo una licencia Creative Commons. Lea el artículo original, que se publicó el 17 de agosto de 2021.

Imagina que invitas a almorzar a unos amigos y planeas pedir una pizza de pepperoni. Recuerdas que Amy mencionó que Susie había dejado de comer carne. Intentas llamar a Susie, pero cuando ella no contesta, decides ir a lo seguro y pedir una pizza margarita.

La gente da por sentada la capacidad de afrontar situaciones como ésta de forma regular. En realidad, para lograr estas hazañas, los humanos dependen no de una sola, sino de un poderoso conjunto de habilidades universales conocidas como sentido común.

Como investigador de inteligencia artificial, mi trabajo es parte de un amplio esfuerzo para darle a las computadoras una apariencia de sentido común. Es un esfuerzo extremadamente desafiante.

Rápido: define el sentido común

A pesar de ser universal y esencial para la forma en que los humanos comprenden y aprenden el mundo que los rodea, el sentido común ha desafiado una definición única y precisa. GK Chesterton, filósofo y teólogo inglés, escribió a principios del siglo XX que “el sentido común es algo salvaje, salvaje y que está más allá de las reglas”. Las definiciones modernas actuales coinciden en que, como mínimo, es una habilidad humana natural, más que enseñada formalmente, la que permite a las personas navegar la vida diaria.

El sentido común es inusualmente amplio e incluye no sólo habilidades sociales, como gestionar las expectativas y razonar sobre las emociones de otras personas, sino también un sentido ingenuo de la física, como saber que una piedra pesada no se puede colocar de forma segura sobre una endeble mesa de plástico. Ingenuo, porque la gente sabe esas cosas a pesar de no trabajar conscientemente con ecuaciones físicas.

El sentido común también incluye conocimientos previos de nociones abstractas, como el tiempo, el espacio y los acontecimientos. Este conocimiento permite a las personas planificar, estimar y organizar sin tener que ser demasiado exactos.

El sentido común es difícil de calcular

Curiosamente, el sentido común ha sido un desafío importante en la frontera de la IA desde los primeros días de este campo en la década de 1950. A pesar de los enormes avances en la IA, especialmente en los juegos y la visión por computadora, el sentido común de las máquinas con la riqueza del sentido común humano sigue siendo una posibilidad lejana. Esta puede ser la razón por la que los esfuerzos de IA diseñados para problemas complejos del mundo real con muchas partes entrelazadas, como el diagnóstico y la recomendación de tratamientos para pacientes con COVID-19, a veces fracasan.

La IA moderna está diseñada para abordar problemas muy específicos, en contraste con el sentido común, que es vago y no puede definirse mediante un conjunto de reglas. Incluso los últimos modelos cometen a veces errores absurdos, lo que sugiere que falta algo fundamental en el modelo mundial de la IA. Por ejemplo, dado el siguiente texto:

“Te serviste un vaso de jugo de arándano, pero luego, distraídamente, le echaste aproximadamente una cucharadita de jugo de uva. Se ve bien. Intentas olerlo, pero estás muy resfriado y no puedes oler nada. Tienes mucha sed. Vos tambien"

el muy promocionado generador de texto AI GPT-3 suministrado

“bébelo. Ahora estás muerto”.

Esfuerzos ambiciosos recientes han reconocido que el sentido común de las máquinas es un problema de inteligencia artificial de nuestros tiempos, que requiere colaboraciones concertadas entre instituciones durante muchos años. Un ejemplo notable es el programa Machine Common Sense de cuatro años de duración lanzado en 2019 por la Agencia de Proyectos de Investigación Avanzada de Defensa de EE. UU. para acelerar la investigación en el campo después de que la agencia publicara un documento que describe el problema y el estado de la investigación en el campo.

El programa Machine Common Sense financia muchos esfuerzos de investigación actuales en sentido común de las máquinas, incluido el nuestro, Multi-modal Open World Grounded Learning and Inference (MOWGLI). MOWGLI es una colaboración entre nuestro grupo de investigación de la Universidad del Sur de California e investigadores de IA del Instituto de Tecnología de Massachusetts, la Universidad de California en Irvine, la Universidad de Stanford y el Instituto Politécnico Rensselaer. El proyecto tiene como objetivo construir un sistema informático que pueda responder una amplia gama de preguntas de sentido común.

¿Transformers al rescate?

Una razón para ser optimistas acerca de descifrar finalmente el sentido común de las máquinas es el reciente desarrollo de un tipo de IA avanzada de aprendizaje profundo llamado transformadores. Los transformadores pueden modelar el lenguaje natural de una manera poderosa y, con algunos ajustes, pueden responder preguntas simples de sentido común. Responder preguntas con sentido común es un primer paso esencial para crear chatbots que puedan conversar de forma humana.

En los últimos años se ha publicado un prolífico conjunto de investigaciones sobre transformadores, con aplicaciones directas al razonamiento de sentido común. Este rápido progreso como comunidad ha obligado a los investigadores en este campo a enfrentar dos preguntas relacionadas en el borde de la ciencia y la filosofía: ¿qué es exactamente el sentido común? ¿Y cómo podemos estar seguros de que una IA tiene sentido común o no?

Para responder a la primera pregunta, los investigadores dividen el sentido común en diferentes categorías, incluidas la sociología, la psicología y el conocimiento previo del sentido común. Los autores de un libro reciente sostienen que los investigadores pueden ir mucho más allá dividiendo estas categorías en 48 áreas detalladas, como planificación, detección de amenazas y emociones.

Sin embargo, no siempre está claro con qué limpieza se pueden separar estas áreas. En nuestro artículo reciente, los experimentos sugirieron que una respuesta clara a la primera pregunta puede resultar problemática. Incluso los anotadores humanos expertos (personas que analizan textos y clasifican sus componentes) dentro de nuestro grupo no estaban de acuerdo sobre qué aspectos del sentido común se aplicaban a una oración específica. Los anotadores coincidieron en categorías relativamente concretas como tiempo y espacio, pero no estuvieron de acuerdo en conceptos más abstractos.

Reconocer el sentido común de la IA

Incluso si se acepta que es inevitable cierta superposición y ambigüedad en las teorías del sentido común, ¿podrán los investigadores estar realmente seguros de que una IA tiene sentido común? A menudo hacemos preguntas a las máquinas para evaluar su sentido común, pero los humanos navegamos en la vida diaria de maneras mucho más interesantes. Las personas emplean una variedad de habilidades, perfeccionadas por la evolución, incluida la capacidad de reconocer causas y efectos básicos, resolución creativa de problemas, estimaciones, planificación y habilidades sociales esenciales, como la conversación y la negociación. Por más larga e incompleta que sea esta lista, una IA no debería lograr menos antes de que sus creadores puedan cantar victoria en la investigación de sentido común sobre máquinas.

Ya está resultando dolorosamente claro que incluso la investigación en transformadores está dando resultados decrecientes. Los transformadores son cada vez más grandes y consumen más energía. Un transformador reciente desarrollado por el gigante chino de los motores de búsqueda Baidu tiene varios miles de millones de parámetros. Se necesita una enorme cantidad de datos para entrenar eficazmente. Sin embargo, hasta ahora ha demostrado ser incapaz de captar los matices del sentido común humano.

Incluso los pioneros del aprendizaje profundo parecen pensar que puede ser necesaria nueva investigación fundamental antes de que las redes neuronales actuales puedan dar tal salto. Dependiendo del éxito de esta nueva línea de investigación, no se sabe si faltan cinco años o cincuenta para el sentido común de las máquinas.

Escrito por Mayank Kejriwal, profesor asistente de investigación de Ingeniería Industrial y de Sistemas, Universidad del Sur de California .