Omniparser v2

เปลี่ยน LLM ใด ๆ ให้เป็นตัวแทนการใช้คอมพิวเตอร์

Omniparser v2 media 2
Omniparser v2 media 3

คำอธิบาย

Omniparser 'Tokenizes' ภาพหน้าจอ UI จากช่องว่างพิกเซลเป็นองค์ประกอบที่มีโครงสร้างในภาพหน้าจอที่สามารถตีความได้โดย LLMS สิ่งนี้ช่วยให้ LLM สามารถทำนายการดำเนินการตามการดำเนินการต่อไปได้โดยได้รับชุดองค์ประกอบที่มีปฏิสัมพันธ์ที่แยกวิเคราะห์ได้

ผลิตภัณฑ์แนะนำ