Omniparser V2
Herhangi bir LLM'yi bir bilgisayar kullanım aracısına dönüştürün


Açıklama
Omniparser piksel boşluklarından UI ekran görüntülerini ekran görüntüsünde LLMS tarafından yorumlanabilen yapılandırılmış öğelere 'tokenize eder'. Bu, LLM'lerin bir dizi ayrıştırılmış etkileşime girebilir öğe göz önüne alındığında, bir sonraki eylem tahminine dayalı bir sonraki eylem tahmini yapmasını sağlar.