El SEAL del MIT Permite a la IA Autoenseñarse y Adaptarse Continuamente

Image by Freepik

El SEAL del MIT Permite a la IA Autoenseñarse y Adaptarse Continuamente

Tiempo de lectura: 4 min.

Investigadores del Improbable AI Lab del MIT desarrollaron un marco innovador llamado SEAL (Self-Adapting LLMs). SEAL permite a los sistemas de inteligencia artificial aprender nuevas habilidades después de su formación inicial a través de la autoenseñanza.

¿Apurado? Aquí están los datos rápidos:

  • El MIT desarrolló SEAL, un marco de trabajo que permite a la IA enseñarse a sí misma nuevas habilidades.
  • SEAL reescribe su propio entrenamiento usando resúmenes, cuestionarios y notas generados por sí mismo.
  • Logró un 40% mejor en retención y un 72.5% de éxito en tareas de razonamiento.

El nuevo sistema supera a los grandes modelos de lenguaje existentes, incluyendo ChatGPT, que los investigadores explican que generalmente permanecen fijos una vez entrenados y requieren un reentrenamiento extenso para aprender nueva información.

El principal avance de SEAL reside en su capacidad para permitir que la IA genere sus propios materiales de entrenamiento y luego utilice estos materiales para ajustarse a sí misma. De hecho, cuando se le presenta nuevos datos, como un artículo de noticias o tareas de ejemplo, el sistema crea explicaciones simplificadas, hechos relacionados o preguntas de práctica.

Los investigadores explican que este proceso imita los métodos de aprendizaje humano, donde las personas suelen escribir notas y tarjetas de memoria para mejorar su comprensión y retención de nueva información.

Durante la fase de “bucle interno”, SEAL realiza una pequeña actualización conocida como “autoedición”. El sistema lleva a cabo una evaluación de “bucle externo” para verificar la mejora de su rendimiento después de la actualización. Cuando la IA identifica un cambio positivo, recuerda la modificación; de lo contrario, intenta nuevos enfoques.

Los investigadores dicen que este proceso iterativo permite a la IA mejorar continuamente su conocimiento y adaptarse a nuevos desafíos sin la necesidad de un reentrenamiento completo.

Los investigadores señalan que el método utilizado por SEAL se diferencia de todos los enfoques de aprendizaje por refuerzo (AR) tradicionales. Los agentes en entornos de AR estándar aprenden a través de prueba y error para maximizar sus recompensas cuando interactúan con su entorno.

SEAL usa el AR como herramienta para entrenar su sistema de IA para crear e implementar sus propios recursos de aprendizaje, lo que convierte al modelo de lenguaje en un instructor y un estudiante a la vez. El sistema produce “autoediciones”, que incluyen instrucciones personalizadas junto con datos sintéticos para su proceso de refinamiento. Este enfoque permite actualizaciones persistentes y autodirigidas que los métodos convencionales de AR, que no ajustan directamente los parámetros del modelo, no pueden lograr.

Investigadores del MIT pusieron a prueba SEAL en dos frentes. En primer lugar, en el aprendizaje de nuevos hechos, SEAL transformó el texto bruto en implicaciones y formatos de preguntas y respuestas, resultando en una mejora de precisión del 47% que superó incluso los materiales de entrenamiento de GPT-4.1. En segundo lugar, en tareas de razonamiento abstracto, SEAL alcanzó una tasa de éxito del 72.5%, superando a los modelos sin aprendizaje reforzado o entrenamiento estándar.

Los investigadores sostienen que las posibles aplicaciones son muy variadas. SEAL puede habilitar diversas aplicaciones que van desde tutores de IA personalizados, colaboradores de investigación autoevolutivos, hasta agentes autónomos que mejoran a través de la experiencia.

La tecnología tiene el potencial de transformar los sistemas de IA empresariales al permitirles desarrollar capacidades de pensamiento interno, que reemplazan la necesidad de costosos procesos de reciclaje para manejar rápidos cambios de datos y requerimientos de los usuarios.

Sin embargo, aún existen desafíos, por ejemplo, SEAL puede sufrir de lo que los investigadores llaman “olvido catastrófico”, donde el nuevo aprendizaje sobrescribe el conocimiento previo, y el proceso de autoedición requiere significativos recursos informáticos.

Para mitigar estos problemas, el equipo propone sistemas híbridos que combinan SEAL con herramientas externas para la memoria temporal, reservando las actualizaciones de SEAL para conocimientos esenciales y a largo plazo.

A pesar de estos obstáculos, los investigadores del MIT creen que esta tecnología ayudará a las máquinas a alcanzar una adaptabilidad similar a la humana y habilidades de aprendizaje permanente.

¿Te ha gustado este artículo?
¡Puntúalo!
No me ha gustado nada No me gusta Ha estado bien ¡Muy bueno! ¡Me ha encantado!

¡Nos alegra que te guste nuestro trabajo!

Eres importante para nosotros, por eso, nos gustaría que nos dejaras una opinión en Trustpilot, ¿te animas? Se tarda muy poco y significa mucho para nosotros. ¡Gracias por todo!

Valóranos en Trustpilot
0 Votado por 0 usuarios
Título
Comentar
Gracias por tu opinión