微软悄悄发布了全新纯视觉AI工具!一张屏幕截图,即可精准操作你的电脑!

微软发布OmniParser V2版本,能将屏幕截图转化为LLM可读懂的结构化元素,提高多模态大模型的视觉识别准确度。适用于自动化测试、操作等场景任务。通过像素级屏幕理解能力,支持多种大型语言模型。

4.6k星星!微软开源AI数据迭代转换和可视化工具,让图表设计更简单。

微软开源的Data Formulator是一款AI可视化工具,通过多模态交互、强大的迭代支持和智能数据处理等特性,帮助用户高效创建复杂数据可视化作品。

喝点VC|光速美国:Deepseek仍未能全面赶超最强基础模型,迈向下一个前沿需要大量资本

DeepSeek仅用600万美元训练出强大AI模型引起广泛关注,但其真正的价值在于推动技术发展。文章指出,美国的大型AI实验室应将AI的安全研究和开发作为优先事项,强调迈向AGI(通用人工智能)才是关键目标。