Rllama

Empoderando a LLM con aprendizaje de refuerzo de memoria a la memoria

Rllama media 1
Rllama media 2
Rllama media 3

Descripción

Un marco de aprendizaje de refuerzo de refuerzo de memoria que acompaña a la memoria que enseña a LLM a aprender y recordar como humanos. Con memoria episódica, memoria de trabajo y seis algoritmos RL, es su navaja suiza para entrenar modelos de idiomas más inteligentes.

Productos recomendados