Qwen 2.5 Omni 果然没让人失望,7B 全模态模型拿下全球第一!
通义千问团队发布了Qwen 2.5 Omni,一个革命性的全模态AI模型。它不仅能看、能听、会写还能实时对话,性能卓越,支持语音和视频通话。同时开放共享代码和技术报告。
通义千问团队发布了Qwen 2.5 Omni,一个革命性的全模态AI模型。它不仅能看、能听、会写还能实时对话,性能卓越,支持语音和视频通话。同时开放共享代码和技术报告。
Browser Use 在短短数天内完成原型开发,并在4个月内获得1700万美元融资。它通过直接控制浏览器来自动化网页任务,解决了用户痛点,同时提供开源支持和合理价格策略。团队正在开发新功能,包括语音控制和定时任务功能。
最近OpenAI宣布支持MCP,通过MCPServerStdio和MCPServerSse类连接服务器。此消息受到广泛好评,用户可以通过示例在OpenAI Agents SDK中使用ChatGPT桌面应用和支持的API。
阿里云千问团队发布了Qwen2.5-VL-32B-Instruct模型。该模型在多个方面实现了重要突破:优化了模型规模、提升了性能,并在视觉理解和数学推理等方面取得了显著进步。
DeepSeek发布V3-0324版本,推理性能大幅提升,并在多项基准测试中超越GPT-4.5。这次更新还增强了前端开发能力、工具调用能力和中文写作能力,同时采用了更高效的训练方法。