step-video-T2V
การสร้างวิดีโอโอเพนซอร์ซ, 204 เฟรมจากข้อความ







คำอธิบาย
STEP-VIDEO-T2V เป็นซีรี่ส์โมเดล Text-To-Video แบบโอเพ่นซอร์สจาก StepFun การสร้างวิดีโอการบีบอัดวิดีโอสูงถึง 204 เฟรมและ DPO ที่ใช้วิดีโอเพื่อเพิ่มคุณภาพ บรรลุ SOTA ในขั้นตอน VIDEO-T2V-EVAL