日期: 2025 年 3 月 26 日
GPT-4o多模态生图正式上线 – 用嘴改图,此为王道。
今日OpenAI发布GPT-4o原生多模态模型,其生图能力震撼亮相,超越Gemini等竞品。作为200刀的Pro会员,用户可直接用嘴实现生图和改图需求。
DeepSeek与Qwen组团开源了模型,冲!
阿里通义千问和DeepSeek分别开源了Qwen2.5-VL-32B-Instruct和DeepSeek-V3-0324两个模型,前者主要提升了数学推理、细粒度图像理解与推理能力,并且调整输出样式以提供更符合人类偏好的答案;后者则强调编程能力和前端开发功能。
Gemini 2.5 Pro与OpenAI 多模态模型生图齐发,创意类工作将要变天?
Google DeepMind发布的新模型Gemini 2.5在推理能力、多模态处理及精度方面表现出色,特别是在处理文本、图像和音频数据时表现出强大的灵活性与高效性。
三个实用的mcp server,Openai和google分别更新大模型
文章介绍了多个Claude相关的工具和模型,包括Desktop Commander MCP、mcp-hfspace MCP Server、Code Runner MCP Server等,详细描述了它们的功能和应用场景,并介绍了一个新的图像生成模型GPT-4o及其改进之处。同时还提到了Google最新智能AI模型Gemini 2.5的性能提升和多模态能力。
DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型
DeepSeek发布V3-0324版本升级,强调推理能力、前端开发能力、中文写作能力和搜索能力提升。此次更新注重实用性和用户需求,特别是代码生成和前端视觉设计能力显著增强,模型免费使用且参数较小。
Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型
港科大与趣丸科技合作推出Kiss3DGen模型,利用成熟图像生成模型和LoRA技术创建高质量三维资产。无需额外训练即可即插即用,并成功减少对大规模数据依赖。