Google presenta Minerva, una IA capaz de resolver problemas matemáticos paso a paso


En los últimos años hemos visto avances impresionantes en el mundo de la inteligencia artificial y, en particular, en el contexto del procesamiento del lenguaje natural. GPT-3 es el mejor ejemplo de esto, pero también BERT. El «problema» es que estos son modelos brillantes en áreas de lenguaje natural, seguir la cola en el razonamiento cuantitativo. En compañeros, por ejemplo.

Resolver cuestiones matemáticas y científicas únicamente en proceso, que requieran análisis de matemáticas, notación matemática, aplicación de fórmulas y uso de símbolos. Está compilado, sin duda, por algunos investigadores de Google que publicaron lo que dicen que es un «modelo de capacidad lingüística». Resuelve preguntas de matemáticas y ciencias a través del razonamiento paso a paso.«. Sobre el nombre: Minerva.

Un viaje en tren desde Madrid a una velocidad de 250 km/h otro desde Barcelona a…

Seguan explica a Ethan Dyer y Guy Gur-Ari, investigadores en cargo del papel «Resolución de problemas de razonamiento cuantitativo con modelos de lenguaje«, Minerva resuelve problemas de razonamiento cuantitativo generando soluciones que incluyen Cálculos numéricos y manipulación simbólica sin dependencia de activos externos, como una calculadora.

El modelo analiza y responde a las cuestiones matemáticas combinando lenguaje natural y notación matemática, de forma que el resultado es un Explicación completa y comprensible del problema.. Por ejemplo, el problema son estas líneas, aunque en GitHub puedes encontrar muchos otros tipos de apps diferentes.

Problema de matemáticas

Minerva se basa en PaLM (Pathaways Language Model), aunque ha agregado una capacitación adicional consistente en 118 GB arXiv artículos científicos y páginas web que contienen expresiones matemáticas en LaTeX y MathJax, entre otros formatos. Básicamente, el modelo ha aprendido a «conversar utilizando la noción matemática de estar de pie», según los investigadores.

El funcionamiento, por el momento, es muy similar a otros modelos del lenguaje: hay varias soluciones y Minerva asignar probabilidades a los resultados resultantes. Todas las soluciones son legibles (siempre) de la misma manera, pero con diferentes pasos. Lo que quiere el modelo es usar el voto de la mayoría para elegir el resultado más común y esperar hasta la respuesta final.

compañeros2
compañeros2

Resultados de referencia.

La imagen superior, publicada por Google, puede mostrar el resultado de Minerva de forma diferente puntos de referencia STEM (Matemáticas, MMLU-STEM y GSM8k). Según Google, «Minerva obtiene resultados de vanguardia, teniendo margen». Sin vergüenza, el modelo no es perfecto y también comete errores.

Fuimos entrevistados por GPT-3 sobre cómo estaremos vivos en 2030 y es aquí donde tenemos la historia de Marte y el futuro (y digamos que se llama Luis)

Detalles de Google, Minerva equivale al tiempo cuando, aunque sus errores son «fácilmente interpretables». En palabras de los investigadores, “aproximadamente la media de sus errores de cálculo, y la otra de sus errores de razonamiento, en que los pasos de la solución no siguen un camino lógico de pensamiento”. Otra opción es que el modelo tenga la respuesta correcta con un razonamiento defectuoso (falso positivo). La continuación tiene un par de ejemplos.

Ejemplo de falso positivo.
Ejemplo de falso positivo.

Ejemplo de falso positivo.

Ejemplo de pregunta incorrecta
Ejemplo de pregunta incorrecta

Ejemplo de pregunta incorrecta.

Finalmente, los investigadores señalan que el modelo tiene algunas restricciones, ya que las respuestas del modelo no se pueden verificar automáticamente. La razón es que Minerva genera respuestas usando lenguaje natural y expresiones matemáticas LaTeX, “sin una estructura matemática explícita explicada”.

Más información | Google



Fuente