Rllama
LLMS empowerment met geheugen-augmented versterking leren



Beschrijving
Een geheugen-geëgaliseerd versterkingskader dat LLMS leert om te leren en te onthouden zoals mensen. Met episodisch geheugen, werkgeheugen en zes RL -algoritmen, is het je Zwitserse zakmes voor het trainen van slimmer taalmodellen.