Omniparser v2
เปลี่ยน LLM ใด ๆ ให้เป็นตัวแทนการใช้คอมพิวเตอร์


คำอธิบาย
Omniparser 'Tokenizes' ภาพหน้าจอ UI จากช่องว่างพิกเซลเป็นองค์ประกอบที่มีโครงสร้างในภาพหน้าจอที่สามารถตีความได้โดย LLMS สิ่งนี้ช่วยให้ LLM สามารถทำนายการดำเนินการตามการดำเนินการต่อไปได้โดยได้รับชุดองค์ประกอบที่มีปฏิสัมพันธ์ที่แยกวิเคราะห์ได้