微软悄悄发布了全新纯视觉AI工具!一张屏幕截图,即可精准操作你的电脑! 上午8时 2025/02/18 作者 开源星探 微软发布OmniParser V2版本,能将屏幕截图转化为LLM可读懂的结构化元素,提高多模态大模型的视觉识别准确度。适用于自动化测试、操作等场景任务。通过像素级屏幕理解能力,支持多种大型语言模型。