Omniparser v2
Verwandeln Sie jeden LLM in einen Computer -Use -Agent


Beschreibung
Omniparser „Tokenizes“ UI -Screenshots aus Pixelräumen in strukturierte Elemente im Screenshot, die durch LLMs interpretierbar sind. Auf diese Weise können die LLMs angesichts einer Reihe von analysierbaren Elementen abgerufen werden.