
Image by ThisisEngineering, from Unsplash
Investigadores Afirman que el Bot de OpenAI Muestra Signos de Genialidad Matemática
Treinta destacados matemáticos de todo el mundo se reunieron en secreto en la UC Berkeley para poner a prueba la poderosa inteligencia artificial “o4-mini” de OpenAI. El bot recibió sus problemas matemáticos más desafiantes durante una competencia de fin de semana, que dejó a los participantes asombrados por sus respuestas.
¿Apurado? Aquí están los datos rápidos:
- Los matemáticos utilizaron Signal para evitar contaminar los datos de entrenamiento de la IA.
- La IA aprendió nuevos conceptos durante sesiones de resolución de problemas en vivo.
- O4-mini imitó estrategias de razonamiento similares a las humanas y de revisión de literatura.
“Tengo colegas que literalmente dijeron que estos modelos se acercan al genio matemático”, dijo Ken Ono, un matemático de la Universidad de Virginia y juez en el evento, según lo informado por Scientific American (SCI AM).
Las desarrolladoras entrenaron a O4-mini como una versión compacta pero potente de ChatGPT para manejar tareas complejas de resolución de problemas, según informó SCI AM.
Los investigadores se asombraron cuando O4-mini resolvió el 20% de 300 preguntas de matemáticas inéditas durante la prueba FrontierMath, que Epoch AI desarrolló como una organización sin fines de lucro. Los modelos tradicionales resolvieron menos del 2%, destacó SCI AM.
“Se me ocurrió un problema que los expertos en mi campo reconocerían como una pregunta abierta en teoría de números”, dijo Ono, según informó SCI AM. El bot pasó dos minutos revisando la literatura, probó una versión más sencilla primero y luego la resolvió, agregando, “¡No es necesaria ninguna cita porque el número misterioso fue calculado por mí!”
“Estaba empezando a ponerse realmente descarado […] Eso da miedo”, añadió Ono, según informó SCI AM.
El grupo descubrió diez problemas que el sistema de IA no pudo resolver, pero muchos participantes se asombraron por el rápido avance de la tecnología. “Esto es lo que un muy, muy buen estudiante de posgrado estaría haciendo, de hecho, aún más”, dijo Yang Hui He del Instituto de Londres, según lo informado por SCI AM.
Los matemáticos exploraron escenarios potenciales donde los humanos dirigirían los sistemas de IA en lugar de realizar soluciones matemáticas de forma independiente. Como advirtió Ono, “Es un grave error decir que la inteligencia artificial generalizada nunca llegará […] Estos modelos ya están superando a la mayoría de nuestros mejores estudiantes de posgrado”, según lo informado por SCI AM.