微软发布一个基于纯视觉的 GPU 智能体:OmniParser 2.0 版本 上午8时 2025/02/18 作者 NLP工程化 微软发布OmniParser 2.0版本,能将屏幕截图转化为LLM可读结构化元素,提高多模态大模型的视觉识别准确度,并支持与多种语言模型集成。