Omniparser V2

Herhangi bir LLM'yi bir bilgisayar kullanım aracısına dönüştürün

Omniparser V2 media 2
Omniparser V2 media 3

Açıklama

Omniparser piksel boşluklarından UI ekran görüntülerini ekran görüntüsünde LLMS tarafından yorumlanabilen yapılandırılmış öğelere 'tokenize eder'. Bu, LLM'lerin bir dizi ayrıştırılmış etkileşime girebilir öğe göz önüne alındığında, bir sonraki eylem tahminine dayalı bir sonraki eylem tahmini yapmasını sağlar.

Önerilen Ürünler