rllama
เพิ่มขีดความสามารถ LLM ด้วยการเรียนรู้การเสริมแรงแบบหน่วยความจำ



คำอธิบาย
กรอบการเรียนรู้การเสริมแรงแบบเสริมความทรงจำที่สอน LLM ให้เรียนรู้และจดจำเหมือนมนุษย์ นำเสนอความทรงจำตอนฉากความทรงจำที่ทำงานและอัลกอริทึม RL หกอัลกอริทึมมันเป็นมีดกองทัพสวิสของคุณสำหรับการฝึกอบรมแบบจำลองภาษาที่ชาญฉลาด